新智元报道 编辑:桃子润【新智元导读】谷歌DeepMind再次在科学细分领域——天气预报迈出重要的一步。全新AI模型GraphCast可在1分钟内,精准预测10天全球天气,甚至还可以预测极端天气事
read more新智元报道 编辑:拉燕【新智元导读】最近,来自哈尔滨工业大学和华为的研究团队发表了一篇长达50页的综述,细致地盘点了有关LLM幻觉问题你该知道的所有事。幻觉,老朋友了。自打LLM进入我们的视野,幻觉
read more引言简介预训练数据模型结构对齐监督微调奖励模型PPO安全预训练阶段对齐阶段总结引言今天开始以2篇小作文(整成一篇的话,略长)详细介绍百川2模型,上篇主要介绍百川2的技术细节,包括如何做预训练、如何做对
read more引言本地部署单轮对话多轮对话网页部署13B-base13B-chat量化部署模型微调引言紧接前文百川2模型解读、服务部署、微调(上篇),今天这篇小作文作为下篇侧重于实战,介绍如何本地部署百川2模型、模
read more本文旨在让无大模型开发背景的工程师或者技术爱好者无痛理解大语言模型应用开发的理论和主流工具,因此会先从与LLM应用开发相关的基础概念谈起,并不刻意追求极致的严谨和完备,而是从直觉和本质入手,结合笔者调
read more梦晨发自凹非寺量子位公众号QbitAI如今很多大模型都声称擅长数学,谁有真才实学?谁是靠背测试题“作弊”的?有人在今年刚刚公布题目的匈牙利全国数学期末考试上做了一把全面测试。很多模型一下子
read more