1. 本书作者刘汪根、陈果,在大数据圈子和咨询领域的口碑、流量不错,有较高的影响力。 2. 本书在内容组织上有如下3大特色: (1)系统性:完整的数据管理知识体系。 (2)理论与实践相结合:既包括核心技术的介绍,又包括大型企业的成功案例。 (3)前沿性:不仅包含成熟的数据管理技术,还包括AI+数据管理的前沿技术与应用。
售 价:¥
纸质售价:¥63.00购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容提要
作者介绍
推 荐 序
前 言
第1章 数字化与信息化
1.1 数据与信息
1.2 数据处理的起源
1.3 数字化的数据处理
1.3.1 从机械化到数字化
1.3.2 从数据处理到信息系统
1.3.3 面向记录事务的数据管理
1.4 数据管理与分析
1.5 商业智能与数据科学
1.6 数据可视化
1.7 现代企业数据组织
1.7.1 数据工程师
1.7.2 数据分析师
1.7.3 数据科学家
1.7.4 数据管理人员
第2章 数据价值的创造路径
2.1 数据分析创造价值
2.1.1 企业数据价值创造的阶段化路径
2.1.2 国内数字化的行业观察
2.2 数据价值:数字化决策
2.2.1 运营管理的数字化
2.2.2 风险管理的数字化
2.2.3 营销获客的数字化
2.3 数据价值:业务创新
2.3.1 线下业务转线上
2.3.2 监管的数字化
2.4 数据价值:推动AI变革
2.4.1 ImageNet
2.4.2 数字疗法
2.5 数据价值创造的组织保障
2.5.1 数据管理团队能力建设
2.5.2 数据产品团队能力建设
2.5.3 数据底座团队能力建设
第3章 数据管理的方法与技术
3.1 数据资产管理
3.1.1 数据模型管理
3.1.2 数据标准管理
3.1.3 数据质量管理
3.1.4 主数据管理
3.1.5 元数据管理
3.1.6 数据安全管理
3.1.7 数据资产管理平台
3.2 数据资产运营
3.2.1 数据可视化
3.2.2 商业智能
3.2.3 数据洞察
3.2.4 数据标签
3.2.5 数据指标
3.2.6 数据资产盘点与编目
3.2.7 数据资产运营平台
3.3 数据平台架构
3.3.1 数据仓库
3.3.2 数据湖
3.3.3 数据集市
3.3.4 数据中台
3.4 中国联通的数据运营体系
3.4.1 数据运营体系的建设由来
3.4.2 数据运营的规范统一
3.4.3 统一工具支撑“一体化运营”
3.4.4 “一套数据管理体系”保障数据供给
第4章 数据要素价值化的路径探索
4.1 数据要素:数据价值的产业化
4.1.1 数据要素×医疗健康
4.1.2 数据要素×金融服务
4.1.3 数据要素×智慧农业
4.1.4 数据要素×气象服务
4.2 数据要素的基础体系
4.2.1 数据基础设施
4.2.2 数据基础制度
4.3 可信数据流通技术
4.3.1 数据空间
4.3.2 其他技术路径
4.4 数据资产入表
4.4.1 数据资产的确认
4.4.2 数据资产的会计计量
4.4.3 数据资源入表管理平台
第5章 数据底座的技术与实践
5.1 数据底座的架构要求
5.1.1 数据底座的能力要求
5.1.2 数据底座的核心功能
5.2 分布式存储技术
5.2.1 分布式文件存储HDFS
5.2.2 对象存储Ceph
5.2.3 宽表存储HBase
5.2.4 文档搜索引擎Elasticsearch
5.3 分布式计算技术
5.3.1 MapReduce
5.3.2 Spark
5.3.3 Presto
5.4 分布式资源管理技术
5.5 分析型数据库
5.5.1 MPP数据库
5.5.2 分布式分析型数据库
5.5.3 分析型数据库的评价
5.6 数据联邦
5.7 湖仓一体架构
5.7.1 Hudi
5.7.2 Iceberg
5.7.3 Delta Lake
5.8 流批一体架构
5.8.1 Lambda架构
5.8.2 Kappa架构
5.8.3 Flink
5.9 存算分离架构
5.9.1 基于云存储的存算分离
5.9.2 基于本地存储的存算分离
5.10 中国联通集团的数据底座建设
5.10.1 大数据技术架构
5.10.2 数据平台架构
第6章 数据与AI的融合
6.1 推荐系统
6.1.1 协同过滤
6.1.2 内容过滤
6.1.3 基于向量的近邻召回的推荐系统
6.1.4 基于点击率预估模型的推荐系统
6.2 基于LLM的数据治理与分析
6.2.1 智能化数据治理
6.2.2 基于LLM的数据分析
6.3 数据标注
6.4 向量数据库
6.4.1 特征与向量
6.4.2 相似度的度量
6.4.3 向量检索的召回率与准确率
6.4.4 向量检索与索引技术
6.5 知识图谱
6.5.1 知识的表示方法
6.5.2 知识抽取与推理技术
6.5.3 知识存储与图模型
6.5.4 图数据库与图计算技术
6.6 AI数据安全的挑战与防护技术
6.6.1 对抗样本攻击与防御
6.6.2 数据投毒攻击与防御
6.6.3 后门攻击与防御
6.6.4 预训练大模型的数据风险
第7章 企业AI应用的方法论与知识融合
7.1 通用模型、推理模型与智能体
7.1.1 通用模型
7.1.2 推理模型
7.1.3 智能体
7.1.4 典型案例:DeepSeek大模型
7.2 企业AI应用落地方法论
7.2.1 企业AI应用落地条件
7.2.2 企业AI落地场景
7.2.3 企业AI场景实践案例
7.3 大模型与企业知识融合
7.3.1 大模型数据调优难题:Demo与上线的差距
7.3.2 LLM的知识机制
7.3.3 企业AI应用的基础设施只需要DeepSeek吗
7.4 知识工程中的大模型应用
7.4.1 大模型参数差异与NER任务的影响
7.4.2 知识增强对实体识别的优化
7.4.3 易混淆知识的识别策略
7.4.4 知识长度与识别准确率的关系
7.4.5 推理能力对大模型识别效果的影响
7.4.6 大模型驱动的知识工程流水线
第8章 数据领域技术趋势与思考
8.1 数据技术的自主可控
8.2 开源技术的发展与挑战
8.3 数据中台的发展历程与思考
8.4 数据编织技术的原理与展望
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜