AI文摘

blog-thum
LLM训练指南-Token及模型参数准备

引言在当今AI领域,大型预训练语言模型已成为一种关键技术,推动了自然语言处理领域的进步。本文旨在提供一个辅助指南,如何准备预训练模型大小、数据集大小,以及帮助读者了解如何提升预训练模型的表现。本文将分

read more
blog-thum
图解大模型推理优化之KVCache

此前,我们更多专注于大模型训练方面的技术分享和介绍,然而在完成模型训练之后,上线推理也是一项非常重要的工作。后续,我们将陆续撰写更多关于大模型推理优化的技术文章,包括但不限于KVCache、Page

read more
blog-thum
【手撕LLM+RLHF】通关指南

我是小冬瓜AIGC,原创超长文知识分享微信公众号【手撕LLM】知乎小🍠也可以找到我【小冬瓜AIGC】原创课程已帮助多名同学速成上岸LLM赛道一、课程概况课程内容:直播+往期录播 +手撕级Not

read more