为你推荐
内容简介
前 言
第1章 DeepSeek初探
1.1 大模型的定义
1.2 从GPT到DeepSeek
1.2.1 GPT模型的发展脉络
1.2.2 DeepSeek模型的发展脉络
1.2.3 技术突破:从全球竞速到本土创新
1.2.4 应用生态的进化:从工具到生态伙伴
1.3 DeepSeek的核心能力和独特优势
1.3.1 核心能力
1.3.2 独特优势
1.4 DeepSeek的应用场景
1.4.1 智能客服
1.4.2 辅助办公
1.4.3 智能家居
1.4.4 医疗诊断
1.4.5 教育学习
1.4.6 金融投资
1.4.7 智能政务
1.5 DeepSeek带来的机遇
1.5.1 DeepSeek模型带给个人的机遇
1.5.2 DeepSeek带给中小企业的机遇
小 结
第2章 DeepSeek的模型架构
2.1 DeepSeek-V3/R1模型的架构
2.2 混合专家
2.2.1 稠密MoE架构和稀疏MoE架构
2.2.2 DeepSeekMoE
2.2.3 无辅助损耗负载均衡
2.3 多头潜在注意力
2.3.1 键值缓存简介
2.3.2 RoPE简介
2.3.3 传统MHA的缓存机制的不足
2.3.4 低秩键值联合压缩的注意力机制
2.4 多Token预测
2.4.1 块级并行解码策略
2.4.2 Meta的MTP方法
2.4.3 DeepSeek的MTP方法
小 结
第3章 DeepSeek的训练架构
3.1 DeepSeek的训练
3.1.1 基础技术
3.1.2 训练过程
3.2 DeepSeek在硬件层面的训练亮点
3.2.1 FP8混合精度训练
3.2.2 DualPipe算法
3.3 DeepSeek在算法层面的训练亮点
3.3.1 组相对策略优化
3.3.2 知识蒸馏
3.4 DeepSeek的数据优化手段
小 结
第4章 高质量提示词
4.1 提示词概述
4.1.1 提示词的定义
4.1.2 提示词的种类
4.2 新手常见误区和陷阱
4.3 提示词的设计技巧
4.3.1 STAR法则:让问题更有条理
4.3.2 5W2H法则:全面提问的利器
4.3.3 CO-STAR框架:精准表达需求
4.3.4 CRISPE框架:激发创意和拓展深度
4.3.5 BROKE框架:目标导向和持续优化
4.3.6 借助大模型优化提示词
4.4 企业层面的提示词应用场景
4.4.1 传播策略制定
4.4.2 执行发展制定
4.4.3 品牌故事生成
4.4.4 产品定位
小 结
第5章 面向个人的DeepSeek部署
5.1 DeepSeek的模型
5.1.1 DeepSeek模型的常见版本
5.1.2 DeepSeek模型的版本说明
5.1.3 DeepSeek模型的开源协议
5.2 硬件需求和配置建议
5.2.1 存储精度
5.2.2 显存占用估算
5.3 软件环境安装和配置
5.3.1 Ollama安装
5.3.2 使用Ollama部署DeepSeek模型
5.3.3 Ollama常用API
5.4 DeepSeek模型下载和部署
5.4.1 Hugging Face社区简介
5.4.2 模型下载
5.4.3 常见大模型文件类型
5.5 使用Web UI构建对话界面
5.5.1 Open-WebUI
5.5.2 Hollama
5.5.3 ChatBox
小 结
第6章 面向企业的DeepSeek API调用
6.1 API调用的优势
6.2 常用DeepSeek API调用方式
6.2.1 DeepSeek官方开放平台
6.2.2 DMXAPI
小 结
第7章 面向企业的DeepSeek云服务部署
7.1 本地部署与云服务部署的对比
7.1.1 本地部署的特点
7.1.2 云服务部署的特点
7.2 模型推理加速框架
7.2.1 推理加速框架的必要性
7.2.2 BladeLLM
7.2.3 SGLang
7.2.4 vLLM
7.3 常用DeepSeek云服务部署方式
7.3.1 阿里云
7.3.2 腾讯云
7.3.3 华为云
7.3.4 火山引擎
7.3.5 AutoDL
小 结
第8章 DeepSeek模型训练
8.1 常用训练框架
8.1.1 Unsloth
8.1.2 TRL
8.2 DeepSeek模型的SFT训练
8.2.1 算力租用
8.2.2 模型下载和部署
8.2.3 数据预处理
8.2.4 模型训练
8.2.5 模型推理
8.3 DeepSeek模型的GRPO训练
8.3.1 加载模型
8.3.2 配置PEFT模型
8.3.3 数据集准备
8.3.4 模型训练
8.3.5 模型推理
小 结
第9章 DeepSeek的RAG实战
9.1 用LangChain构建简单的RAG本地系统
9.1.1 RAG管道构建
9.1.2 向量数据库构建
9.1.3 Web页面启动
9.2 开源DeepSeek RAG应用案例
9.2.1 Local PDF Chat RAG
9.2.2 RAG Flow
小 结
第10章 DeepSeek的Agent实战
10.1 基于LlamaIndex项目构建简单的智能体应用
10.1.1 软件安装和模型下载
10.1.2 构建本地知识库
10.1.3 实现基于本地知识库的智能体问答
10.2 基于Swarm框架构建智能体应用
10.2.1 Swarm框架介绍
10.2.2 DeepSeek模型接入
10.2.3 调用外部工具
10.3 开源Agent应用框架
10.3.1 Browser Use
10.3.2 Camel
小 结
参考文献
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜