本书通过严谨简明的预备知识介绍,首先帮助读者掌握有关大模型架构、分布式训练等理论知识;然后围绕造首先行业智能助手这一有重大价值的实际问题,向读者展示如何将该问题分解为一系列大模型技术,并展示完整的技术实施和优化过程。 本书侧重于行业实践。同时对涉及的相关理论、框架原理行一定深度的讲解。这样既降低了门难度,又提升了实践的高度。
售 价:¥
纸质售价:¥46.60购买纸书
6.6
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐

内容简介
作者简介
前言
第1章 大模型导论
1.1 大模型概念
1.2 大模型的过去、现在与未来
1.3 本书的读者对象与内容
参考文献
第2章 大模型基础知识
2.1 分词
2.2 位置编码
2.3 网络结构
2.4 长上下文
参考文献
第3章 大语言模型分布式训练
3.1 大语言模型高效训练技术要点
3.2 并行模式
3.3 集合通信
3.4 DeepSpeed训练加速框架
3.5 DeepSpeed训练方案建议
参考文献
第4章 继续预训练
4.1 继续预训练的必要性
4.2 数据预处理
4.3 实战:行业大模型的继续预训练
参考文献
第5章 对齐(上)——指令微调
5.1 指令微调的必要性
5.2 微调方法
5.3 指令集的自动构造
5.4 实战:打造具有多轮对话能力的行业智能助手
参考文献
第6章 对齐(下)——强化学习微调
6.1 强化学习微调的必要性
6.2 人类偏好对齐的强化学习建模
6.3 RLHF
6.4 RLAIF
6.5 实战:DeepSpeed-Chat代码解析
6.6 DPO算法
参考文献
第7章 推理与部署
7.1 推理加速
7.2 量化
7.3 部署
7.4 实战:使用FastChat部署Qwen 14B
参考文献
第8章 多模态大模型
8.1 多模态技术路线
8.2 桥接多模态大模型
8.3 原生多模态大模型
参考文献
第9章 AI智能体
9.1 AI智能体架构
9.2 开发框架
参考文献
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜