万本电子书0元读

万本电子书0元读

顶部广告

深入理解自然语言处理电子书

资深算法工程师多年从事NLP算法与模型研究的经验总结。 基于任务视觉详解深度学习与大模型在各类NLP任务中的应用。 详解深度学习在9种NLP任务中的应用并给出大模型实现示例。 详细介绍实现NLP任务的多种模型,并详细分析每种模型的创新。 从基本原理、数学推导和应用场景三个方面介绍NLP的相关算法和模型。 每章都给出基于ChatGPT或BERT等大模型实现NLP相关任务的示例。

售       价:¥

纸质售价:¥70.90购买纸书

0人正在读 | 0人评论 6.6

作       者:宋文峰

出  版  社:清华大学出版社

出版时间:2025-03-01

字       数:22.9万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
《深理解自然语言处理:从深度学习到大模型应用》从自然语言处理(NLP)的任务视角分门别类地介绍深度学习与大模型在现阶段各NLP任务中的应用。以任务视角是指以一个个场景项目为视角,这样可以让读者获得更多的实战经验。《深理解自然语言处理:从深度学习到大模型应用》的每章都有核心模型的先验条,这对读者理解和掌握NLP模型非常有帮助。 《深理解自然语言处理:从深度学习到大模型应用》分为9章,对应9种NLP任务。第1章介绍分词和词性标注任务。第2章介绍文本分类任务,如情感分析、文章分类与标签等。第3章介绍命名实体识别任务,如提取内容中的姓名和公司名等,在知识图谱、内容结构化和智能对话等场景中也有该类任务的具体应用。第4章介绍神经机器翻译任务,该类任务是NLP最先商用的独立场景。第5章介绍文本纠错任务,该类任务的应用非常广泛,涉及用户输的场景一般需要用到纠错任务,否则用户体验会很差。第6章介绍机器阅读理解任务,该类任务偏学术,在实践中往往属于某个大任务下的子任务。第7章介绍句法分析任务,该类任务比较传统,基于深度学习的应用场景还不多。第8章介绍文本摘要任务,该类任务在新闻类业务场景中应用较多。第9章介绍信息检索和问答系统任务,凡是类似搜索和输类需要等待回复的场景都会用到该类任务。 《深理解自然语言处理:从深度学习到大模型应用》内容丰富,讲解深浅出,适合有一定机器学习基础的NLP门和阶人员阅读,也适合NLP领域的从业人员作为解决具体业务问题的参考书,还适合高等院校人工智能等相关专业作为教材。<br/>【推荐语】<br/>资深算法工程师多年从事NLP算法与模型研究的经验总结。 基于任务视觉详解深度学习与大模型在各类NLP任务中的应用。 详解深度学习在9种NLP任务中的应用并给出大模型实现示例。 详细介绍实现NLP任务的多种模型,并详细分析每种模型的创新。 从基本原理、数学推导和应用场景三个方面介绍NLP的相关算法和模型。 每章都给出基于ChatGPT或BERT等大模型实现NLP相关任务的示例。 结合200余幅原理图行讲解,让抽象的知识变得更加直观和易懂。 基于9种NLP任务组织内容,每种任务都可以视为一个具体的实战项目,各个任务之间依赖度较低,读者可以基于兴趣选择自己感兴趣的内容行学习,或者基于当前遇到的问题直查阅相关的解决方案和思路。 不但介绍NLP任务的传统实现方法,而且重介绍其深度学习实现方法,并在每章后给出基于ChatGPT或者BERT等大模型实现相关任务的示例,从而帮助读者全面掌握NLP任务的实现方法和应用。 详细介绍实现NLP任务的多种模型,不但对相关模型的理论知识行详细介绍,而且辅以大量的原理图,帮助读者更加高效、直观地理解。 以深度学习的前后发展逻辑展讲解,详细分析每种模型的创新,不仅可以让读者快速掌握深度学习模型的核心逻辑,而且可以收获前人总结的先验知识。 不仅可以让读者对NLP的相关任务有清楚的认识和深的理解,而且还可以对读者阅读NLP相关论文提供很大的帮助。<br/>【作者】<br/>宋文峰, 毕业于中山大学,获计算机硕士学位。先后担任百度、联想和趣头条等互联网大厂的算法团队负责人。熟悉自然语言处理的相关算法和模型,有多年的算法发、推荐系统发和自然语言处理项目经验。业余时间兼职自然语言处理讲师,从事相关课程的讲授工作,积累了丰富的经验。<br/>
目录展开

内容简介

作者简介

前言

第1章 分词和词性标注

1.1 为什么要学习分词

1.2 分词的传统算法

1.2.1 正向最大匹配

1.2.2 Trie树

1.2.3 反向最大匹配

1.2.4 最短路径

1.2.5 分词工具jieba的实现流程

1.3 深度学习在分词中的应用

1.3.1 Bi-LSTM模型

1.3.2 基于词向量的分词

1.3.3 简易融合语料分词

1.3.4 分词的多标准集成学习

1.3.5 分词的多标准融合学习1

1.3.6 分词的多标准融合学习2

1.4 为什么要学习已经过时的模型

1.5 BERT之后的中文分词还有必要用吗

1.6 如何做词性标注

1.7 大模型时代的分词和词性标注

1.8 小结

第2章 文本分类

2.1 文本分类的应用

2.2 文本分类的词向量方法

2.2.1 Word2vec模型

2.2.2 fastText模型

2.2.3 Doc2vec模型

2.2.4 softmax加速

2.3 文本分类的深度学习方法

2.3.1 LSTM简介

2.3.2 Tree-LSTM简介

2.3.3 DCNN模型

2.3.4 TextCNN模型

2.3.5 胶囊网络应用于文本分类

2.3.6 层级注意力网络HAN

2.4 分类任务数据集

2.5 大模型时代的文本分类

2.5.1 使用BERT进行文本分类

2.5.2 使用ChatGPT进行文本分类

2.6 小结

第3章 命名实体识别

3.1 什么是NER

3.1.1 中文NER的难点

3.1.2 NER的主要应用场景

3.1.3 NER的评估方法

3.2 传统的NER方法

3.2.1 HanLP的中文人名的NER实现

3.2.2 HanLP的其他NER识别

3.3 深度学习在NER中的应用

3.3.1 使用深度学习处理NER问题的原因

3.3.2 Bi-LSTM+CRF模型

3.3.3 CharNER模型

3.3.4 Bi-LSTM+CNN模型

3.3.5 ID-CNN模型

3.3.6 序列标注的半监督多任务模型

3.3.7 Lattice LSTM模型

3.3.8 PLTE模型

3.4 大模型时代的命名实体识别

3.4.1 使用ChatGPT提示词进行实体识别

3.4.2 使用ChatGPT API进行实体识别

3.5 小结

第4章 神经机器翻译

4.1 神经机器翻译的发展

4.2 评估指标

4.2.1 BLEU指标

4.2.2 Rouge-L指标

4.3 神经机器翻译概述

4.4 注意力机制

4.4.1 注意力机制简介

4.4.2 注意力机制的具体应用

4.5 NMT经典模型——Transformer

4.6 NMT前沿研究

4.6.1 NMT的新方向1:多语言交叉翻译

4.6.2 NMT的新方向2:全文翻译

4.6.3 层级RNN

4.6.4 记忆网络

4.7 大模型时代的神经机器翻译

4.7.1 使用BERT进行神经机器翻译

4.7.2 使用ChatGPT进行神经机器翻译

4.8 小结

第5章 文本纠错

5.1 纠错概述

5.1.1 中文错误的主要类型

5.1.2 纠错的应用场景

5.1.3 纠错的两类方案和噪声信道模型

5.2 英文纠错

5.2.1 编辑距离

5.2.2 编辑距离的使用

5.2.3 BK-Tree结构

5.3 拼音纠错

5.3.1 拼音输入法

5.3.2 拼音的错误类型

5.4 中文纠错

5.4.1 错误检测

5.4.2 候选字词召回

5.4.3 错误纠正

5.5 中文纠错实践

5.5.1 pycorrector的纠错实现

5.5.2 拼音编辑距离召回及纠错示例

5.5.3 一个句子的纠错示例

5.5.4 错误模式的挖掘

5.6 基于NMT的纠错简介

5.7 大模型时代的文本纠错

5.7.1 使用ChatGPT提示词进行文本纠错

5.7.2 使用ChatGPT API进行文本纠错

5.8 小结

第6章 机器阅读理解

6.1 MRC综述

6.2 MRC数据集

6.2.1 SQuAD数据集

6.2.2 DuReader数据集

6.3 常见的MRC模型

6.3.1 词向量训练方法——GloVe

6.3.2 Match-LSTM模型

6.3.3 DCN模型

6.3.4 Highway Network模型

6.3.5 Bi-DAF模型

6.3.6 Ruminating Reader模型

6.3.7 FastQA模型

6.4 大模型时代的机器阅读理解

6.4.1 使用BERT进行机器阅读理解

6.4.2 使用ChatGPT进行机器阅读理解

6.5 小结

第7章 句法分析

7.1 句法分析概述

7.1.1 句法分析常见的3个类别

7.1.2 句法分析在现代NLP任务中的作用

7.1.3 句法分析的几个应用场景

7.2 短语句法分析

7.3 依存句法分析

7.3.1 依存分析器的性能评价

7.3.2 依存分析数据库及其工具

7.3.3 依存树库

7.4 依存句法分析方法

7.5 深度学习与句法分析的结合

7.5.1 基于转移的神经网络分析器

7.5.2 联合汉语分词和依存句法分析的统一模型

7.5.3 DIORA模型

7.6 依存句法分析在评论分析中的一种应用

7.7 深度学习模型在NLP中何时需要树形结构

7.8 大模型时代的句法分析

7.8.1 使用ChatGPT API进行句法分析

7.8.2 使用ChatGPT提示语进行句法分析

7.9 小结

第8章 文本摘要

8.1 文本摘要概述

8.2 传统的摘要方法

8.2.1 PageRank算法

8.2.2 TextRank算法

8.3 抽取式模型

8.3.1 CNNLM模型

8.3.2 PriorSum模型

8.3.3 NN-SE模型

8.3.4 SummaRuNNer模型

8.4 生成式模型

8.4.1 ABS模型

8.4.2 RAS-LSTM模型

8.4.3 HierAttRNN模型

8.4.4 PGN模型

8.5 大模型时代的文本摘要

8.5.1 使用ChatGPT API进行文本摘要

8.5.2 使用ChatGPT提示语进行文本摘要

8.6 小结

第9章 信息检索和问答系统

9.1 传统的检索方法

9.1.1 TF-IDF方法

9.1.2 Elasticsearch的BM25算法

9.2 QA概述

9.2.1 QA数据集

9.2.2 QA评估方法

9.2.3 QA系统的结构

9.3 用神经网络计算问题与答案的相关性

9.4 表征式模型

9.4.1 CNNQA模型

9.4.2 HDLSTM模型

9.4.3 ImpRrepQA模型

9.4.4 ABCNN模型

9.5 交互式模型

9.5.1 CubeQA模型

9.5.2 BERTSel模型

9.5.3 MCAN模型

9.6 混合式

9.6.1 CompQA模型

9.6.2 所有模型的实验对比

9.7 大模型时代的信息检索和问答系统

9.7.1 使用大模型进行直接问答

9.7.2 使用大模型进行本地文件信息检索和问答

9.8 小结

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部