在数据驱动的智能时代,向量数据库作为关键技术,正以前所未有的速度改变着数据处理与应用的格局。《向量数据库:大模型驱动的智能检索与应用》一书,犹如一盏明灯,为数据科学、人工智能领域的从业者以及研究人员照亮了探索向量数据库奥秘的道路。 《向量数据库:大模型驱动的智能检索与应用》系统解读了向量数据库的核心技术,从理论基础到算法原理,再到技术实现,层层递,深浅出。读者仿佛置身于知识的长河中,逐步领略向量数据库在高维数据存储与检索中的独特优势,理解其技术条的每一个环节。
售 价:¥
纸质售价:¥94.00购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
作者简介
内容简介
前言
第1部分 理论基础
第1章 为何需要向量数据库
1.1 大语言模型的缺陷
1.1.1 高维向量表示中的信息丢失问题
1.1.2 嵌入空间对语义相似度的误差影响
1.2 高维数据存储与检索的技术瓶颈
1.2.1 高维数据的特性与存储难点分析
1.2.2 高维空间中的“维度诅咒”问题简介
1.2.3 高效检索:索引结构与搜索算法简介
1.3 传统数据库与向量数据库的对比分析
1.3.1 传统数据库的设计原理与局限性
1.3.2 高维向量检索在传统数据库中的实现难点
1.3.3 传统数据库与向量数据库的性能对比分析
1.4 向量数据库的优势
1.5 本章小结
1.6 思考题
第2章 向量数据库基础
2.1 向量数据库的核心概念与基本数据结构
2.1.1 向量数据库的定义与发展背景
2.1.2 向量数据库常见的数据结构:倒排索引、图索引与分区技术
2.1.3 向量数据库与传统数据库逻辑对比
2.2 特征提取与向量表示:从数据到高维坐标系
2.2.1 特征提取的基本方法
2.2.2 嵌入向量生成
2.2.3 数据预处理对向量质量的影响
2.3 高维空间特性与“维度诅咒”问题解析
2.3.1 高维空间中的稀疏性与数据分布特性
2.3.2 距离度量的退化:欧氏距离与余弦相似度
2.3.3 维度诅咒:降维与索引优化
2.4 本章小结
2.5 思考题
第2部分 核心技术与算法原理
第3章 向量嵌入
3.1 静态向量嵌入
3.1.1 传统词向量模型:Word2Vec与GloVe
3.1.2 静态嵌入的局限性:语义多义性与上下文缺失
3.1.3 静态向量嵌入在特定领域的应用
3.2 动态向量嵌入
3.2.1 动态词向量的生成:BERT与GPT的嵌入机制
3.2.2 动态嵌入的优势:上下文敏感性与语义一致性
3.2.3 动态向量嵌入的实时生成与优化
3.3 均匀分布与空间覆盖率
3.3.1 高维向量分布分析
3.3.2 嵌入向量的均匀性测量方法
3.3.3 空间覆盖率对检索性能的影响
3.4 嵌入向量优化
3.4.1 主成分分析与奇异值分解的降维应用
3.4.2 t-SNE与UMAP降维技术
3.4.3 降维对嵌入语义保留与性能的权衡分析
3.5 本章小结
3.6 思考题
第4章 向量相似性搜索初步
4.1 基于暴力搜索的向量相似性检索
4.1.1 暴力搜索的原理与实现
4.1.2 暴力搜索优化
4.2 欧氏距离与余弦相似度
4.2.1 距离与相似度的数学定义
4.2.2 不同相似度指标的适用场景分析
4.3 向量搜索的精度与召回率
4.3.1 精度、召回率与F1评分的计算方法
4.3.2 向量搜索性能提升方案
4.4 本章小结
4.5 思考题
第5章 分层定位与局部敏感哈希
5.1 HNSW的核心原理:图结构与分层搜索路径优化
5.1.1 基于图结构的近邻搜索模型
5.1.2 分层搜索路径的构建与更新
5.1.3 HNSW索引时间复杂度分析
5.2 局部敏感哈希的设计与性能调优
5.2.1 哈希函数的设计与向量分区原理
5.2.2 LSH桶化与参数调优
5.2.3 LSH的内存占用与计算性能分析
5.3 HNSW与LSH的具体应用
5.3.1 HNSW在推荐系统中的应用
5.3.2 LSH在文本和图像检索中的应用
5.3.3 HNSW与LSH的组合应用:多模态检索实例
5.4 本章小结
5.5 思考题
第6章 LSH搜索优化
6.1 BallTree算法的工作原理
6.1.1 BallTree的节点分割与索引构建
6.1.2 BallTree查询过程与复杂度分析
6.2 Annoy搜索算法
6.2.1 Annoy的索引结构设计与分区原理
6.2.2 Annoy在大规模向量检索中的性能优化
6.3 随机投影在LSH中的应用
6.3.1 随机投影的数学基础
6.3.2 随机投影在高维数据降维与检索中的实际应用
6.3.3 随机投影在用户画像降维与检索中的应用
6.4 本章小结
6.5 思考题
第3部分 工具与系统构建
第7章 相似性测量初步
7.1 从曼哈顿距离到切比雪夫距离
7.1.1 曼哈顿距离的几何意义与公式推导
7.1.2 切比雪夫距离在棋盘模型中的应用
7.1.3 不同距离度量的适用场景分析
7.2 相似性测量的时间复杂度与优化
7.2.1 向量间距离计算的时间复杂度分析
7.2.2 减少距离计算的分区优化技术
7.2.3 并行化与硬件加速在相似性测量中的应用
7.2.4 广告分发系统案例:基于相似性测量的高效推荐
7.3 本章小结
7.4 思考题
第8章 测量进阶:点积相似度与杰卡德相似度
8.1 点积相似度测量
8.1.1 点积相似度测量实现
8.1.2 点积相似度在推荐系统中的应用案例
8.1.3 点积相似度在医疗领域的应用案例:患者治疗方案匹配
8.2 杰卡德相似度在稀疏向量中的应用
8.2.1 稀疏向量的构造与稀疏性分析
8.2.2 杰卡德相似度案例分析
8.2.3 基于杰卡德相似度的犯罪嫌疑人关系网络分析
8.3 跨模态医疗数据相似性分析与智能诊断系统
8.4 本章小结
8.5 思考题
第9章 元数据过滤与犯罪行为分析系统
9.1 元数据与向量检索
9.1.1 元数据在混合检索中的作用
9.1.2 元数据标签的定义与标准化
9.1.3 智能多条件推荐系统
9.2 多条件检索实现
9.2.1 多维度条件组合检索
9.2.2 基于元数据优先级的排序算法
9.2.3 基于元数据的酒店智能化推荐案例分析
9.3 元数据索引的构建与优化
9.3.1 元数据索引构建
9.3.2 动态元数据的更新与重建
9.4 实时检索与元数据缓存
9.4.1 基于缓存的高性能检索架构
9.4.2 元数据缓存失效与一致性管理
9.5 基于元数据的犯罪行为分析与实时预警系统
9.5.1 模块开发划分
9.5.2 逐模块开发
9.5.3 犯罪分析与预警系统综合测试
9.6 本章小结
9.7 思考题
第10章 FAISS向量数据库开发基础
10.1 FAISS库的安装与快速上手
10.1.1 FAISS初步开发以及CPU、GPU的版本差异
10.1.2 加载数据与基本查询示例
10.2 基于FAISS的索引构建与参数调整
10.2.1 不同索引类型:Flat、IVF与HNSW
10.2.2 参数调整对搜索精度与速度的影响
10.3 大规模向量搜索的分片与分布式实现
10.3.1 数据分片与动态分片
10.3.2 基于分布式框架的FAISS部署
10.4 FAISS中的内存优化与GPU加速
10.4.1 压缩索引与量化技术
10.4.2 多GPU的并行处理
10.5 本章小结
10.6 思考题
第11章 Milvus向量数据库开发基础
11.1 Milvus的架构设计与功能模块解析
11.1.1 Milvus的初步使用及集群架构与组件通信
11.1.2 数据分区与高可用设计
11.2 使用Milvus进行向量插入、检索与过滤
11.2.1 向量数据预处理与批量插入
11.2.2 复杂查询条件实现
11.3 Milvus的索引类型与性能调优
11.3.1 索引类型的选择与适用场景分析
11.3.2 并行优化与索引更新
11.4 Milvus在企业级应用中的部署与扩展方案
11.4.1 基于容器化的高可用部署
11.4.2 动态扩展与监控集成方案
11.5 本章小结
11.6 思考题
第4部分 实战与案例分析
第12章 基于FAISS的自动驾驶泊车数据检索系统
12.1 项目背景介绍
12.1.1 系统架构
12.1.2 应用流程
12.1.3 案例特色
12.2 模块划分
12.3 模块化开发
12.3.1 数据预处理模块
12.3.2 向量生成模块
12.3.3 索引构建与存储模块
12.3.4 实时检索模块
12.3.5 动态更新模块
12.3.6 系统监控与优化模块
12.4 系统综合测试
12.5 API接口开发与云端部署
12.5.1 API接口开发
12.5.2 云端部署完整系统
12.6 本章小结
12.7 思考题
第13章 基于语义搜索的向量数据库开发实战
13.1 语义嵌入生成与优化
13.1.1 使用预训练模型生成语义向量嵌入
13.1.2 动态分词与文本预处理
13.1.3 领域微调技术
13.2 构建向量索引与语义检索框架
13.2.1 选择合适的向量索引类型
13.2.2 构建Milvus向量索引
13.2.3 语义向量检索与关键词过滤
13.2.4 结合元数据与筛选条件实现多维度语义搜索
13.3 语义搜索系统的性能调优
13.3.1 GPU加速优化检索
13.3.2 批量查询与异步IO技术
13.3.3 实现基于分布式架构的语义搜索系统
13.4 企业级语义搜索应用集成与部署
13.4.1 构建语义搜索RESTful接口
13.4.2 使用Docker与Kubernetes实现语义搜索系统的容器化
13.4.3 日志监控与错误诊断模块
13.4.4 基于语义搜索的文档检索系统集成与部署
13.4.5 大型图书馆图书检索的测试案例
13.5 本章小结
13.6 思考题
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜