如今,许多组织分析和共享有关个人的大型敏感数据集。无论这些数据集涵盖医疗保健详细信息、财务记录还是考试成绩,组织都越来越难以通过去识别化、匿名化和其他传统的统计披露限制技术来保护个人信息。这本书介绍了差分隐私(DP)如何提供帮助。 书中解释了这些技术如何使数据科学家、研究人员和程序员能够运行统计分析,隐藏任何单个人的贡献。你将深了解基本的DP概念,并了解如何使用源工具创建差异私有统计信息,探索如何评估效用/隐私权衡,并学习如何将差分隐私集成到工作流中。
售 价:¥
纸质售价:¥83.30购买纸书
6.3
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐

书名页
版权
O'Reilly Media,Inc.介绍
本书赞誉
译者序
前言
第一部分 差分隐私的概念
第1章 欢迎来到差分隐私的世界
1.1历史
1.2差分隐私之前的数据私有化
1.3案例研究:课堂场景中应用差分隐私技术
1.3.1隐私保护与均值计算
1.3.2隐私泄露的防范机制
1.4相邻数据集:个体退出场景分析
1.5敏感度:统计量的变化范围
1.6噪声注入机制
1.7可用工具概览
1.8总结
1.9练习
第2章 差分隐私的基本原理
2.1隐私保护的直观理解
2.1.1隐私单元
2.1.2隐私损失
2.2差分隐私的正式化定义
2.2.1随机响应
2.2.2隐私侵犯
2.3差分隐私模型分类
2.4敏感度深度解析
2.5差分隐私机制总览
2.5.1拉普拉斯机制
2.5.2拉普拉斯机制的ε-DP证明
2.5.3机制准确性分析
2.5.4学生家庭类型统计案例
2.5.5指数机制
2.6差分隐私查询的组合性
2.7差分隐私后处理不变性
2.8使用SmartNoise实现差分隐私查询
2.8.1示例1:差分隐私计数
2.8.2示例2:差分隐私求和
2.8.3示例3:单数据库多查询处理
2.9总结
2.10练习
第3章 稳定变换
3.1距离度量
3.1.1数据集相邻性
3.1.2有界差分隐私与无界差分隐私
3.2 c-稳定变换的定义
3.2.1变换案例:双重变换
3.2.2变换案例:逐行变换
3.3稳定性是敏感度的充要条件
3.3.1变换案例:计数
3.3.2变换案例:未知大小求和
3.4域描述符
3.5链式变换
3.6度量空间
3.7稳定性的定义
3.7.1变换案例:已知大小求和
3.7.2变换案例:已知大小的均值
3.7.3变换案例:未知大小的均值
3.7.4变换案例:调整大小
3.7.5标量聚合器回顾
3.8向量值聚合器
3.8.1向量范数、距离和敏感度
3.8.2有界范数数据聚合
3.8.3分组数据
3.9实践
3.10总结
3.11练习
第4章 隐私机制
4.1隐私度量
4.1.1隐私度量:最大散度
4.1.2度量、散度与隐私度量
4.2关于隐私机制
4.2.1随机响应机制
4.2.2向量拉普拉斯机制
4.2.3指数机制
4.2.4分位数评分变换
4.2.5噪声最大值报告机制
4.3交互式查询处理
4.4高于阈值
4.4.1数据流处理
4.4.2在线隐私选择
4.4.3流数据稳定性变换
4.5总结
4.6练习
第5章 隐私的定义
5.1隐私损失随机变量
5.2近似差分隐私
5.2.1截断噪声机制
5.2.2建议-测试-发布
5.2.3高级组合定理
5.3高斯机制
5.4Rényi差分隐私
5.4.1零集中差分隐私
5.4.2基于矩的隐私度量强度分析
5.5有界范围机制
5.6隐私损失分布
5.6.1数值组合
5.6.2特征函数
5.7假设检验解释
5.8总结
5.9练习
第6章 组合范式精要
6.1链式处理
6.1.1示例:边界估计
6.1.2示例:B树结构
6.2隐私度量转换
6.3组合
6.3.1自适应组合
6.3.2里程表和过滤器
6.4分区数据处理
6.4.1示例:对寻求庇护者的数据进行分组
6.4.2并行组合
6.4.3示例:多分位数计算
6.5隐私增强
6.5.1通过简单随机抽样实现隐私增强
6.5.2通过泊松抽样实现隐私增强
6.5.3通过混洗实现隐私增强
6.6抽样与聚合
6.7隐私候选集选择
6.8总结
6.9练习
第二部分 差分隐私在实践中的应用
第7章 隐私单元深度解析
7.1隐私层级体系
7.2浏览器日志示例:朴素事件级保证
7.3具有无界贡献的数据集
7.4数据集截断
7.4.1蓄水池抽样
7.4.2分区数据截断
7.4.3医院就诊示例:偏差-方差权衡
7.5截断阈值的隐私估计
7.6未知域名问题
7.7截断操作的适用场景
7.7.1稳定性分组变换
7.7.2稳定性并集变换
7.7.3稳定性连接变换
7.8总结
7.9练习
第8章 差分隐私统计建模
8.1隐私推理
8.2差分隐私的线性回归
8.2.1充分统计量扰动
8.2.2隐私Theil-Sen估计器
8.2.3目标函数扰动
8.3算法选择策略
8.4差分隐私朴素贝叶斯
8.4.1分类朴素贝叶斯
8.4.2连续朴素贝叶斯
8.4.3机制设计方案
8.4.4示例:朴素贝叶斯实现
8.5隐私决策树
8.6总结
8.7练习
第9章 差分隐私机器学习
9.1机器学习模型隐私保护必要性
9.2机器学习术语回顾
9.3差分隐私梯度下降
9.4随机批处理
9.4.1并行组合应用
9.4.2通过子抽样实现隐私增强
9.4.3超参数调优
9.5隐私聚合教师模型
9.6使用PyTorch训练差分隐私模型
9.7总结
9.8练习
第10章 差分隐私合成数据
10.1合成数据的定义
10.2合成数据应用场景
10.3基于边缘分布的合成器
10.4图模型方法
10.5GAN合成器
10.6总结
10.7练习
第三部分 差分隐私的部署
第11章 隐私攻击防护
11.1隐私侵犯的定义
11.2针对表格数据集的攻击
11.2.1记录链接攻击
11.2.2单独识别攻击
11.2.3差分攻击
11.2.4方程系统重构攻击
11.2.5追踪攻击
11.2.6 k匿名漏洞
11.3机器学习模型攻击
11.4总结
11.5练习
第12章 数据发布的隐私损失参数
12.1抽样策略
12.2元数据参数
12.3隐私损失预算分配
12.4决策辅助实践
12.4.1代码手册与数据标注
12.4.2上下文规范参数化
12.5在探索性数据分析的背景下进行决策
12.6自适应隐私参数选择
12.7透明参数选择的潜在风险
12.8总结
12.9练习
第13章 规划你的第一个差分隐私项目
13.1进行差分隐私部署须考虑的事项
13.1.1部署差分隐私的频率
13.1.2组合与预算管理
13.2差分隐私部署清单
13.3示例项目:课堂场景回归
13.4真实数据发布规范
13.4.1领英经济图谱案例
13.4.2微软宽带数据案例
13.5差分隐私发布表:发布详情标准
13.6结束语
扩展阅读
附录
关于作者
关于封面
推荐阅读
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜