万本电子书0元读

万本电子书0元读

顶部广告

差分隐私:OpenDP理论与实践电子书

如今,许多组织分析和共享有关个人的大型敏感数据集。无论这些数据集涵盖医疗保健详细信息、财务记录还是考试成绩,组织都越来越难以通过去识别化、匿名化和其他传统的统计披露限制技术来保护个人信息。这本书介绍了差分隐私(DP)如何提供帮助。 书中解释了这些技术如何使数据科学家、研究人员和程序员能够运行统计分析,隐藏任何单个人的贡献。你将深了解基本的DP概念,并了解如何使用源工具创建差异私有统计信息,探索如何评估效用/隐私权衡,并学习如何将差分隐私集成到工作流中。

售       价:¥

纸质售价:¥83.30购买纸书

5人正在读 | 0人评论 6.3

作       者:(美)伊桑·科恩,(美)迈克尔·舒马特,(美)玛雅娜·佩雷拉

出  版  社:机械工业出版社

出版时间:2025-09-15

字       数:17.5万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(条)
  • 读书简介
  • 目录
  • 累计评论(条)
差分隐私可以在不泄露数据集中具体个人信息的前提下,准确发布数据集的统计信息。本书详细阐述了差分隐私的理论基础、实际应用以及面临的挑战,覆盖具体算法和数学模型。全书分为三部分:第一部分介绍差分隐私的理论,详细解释了准备数据和执行差分隐私数据发布所需的各个概念;第二部分探讨差分隐私的应用,包括如何查询不同的数据格式(如搜索日志)以及在机器学习算法中添加差分隐私;第三部分则关注从业者需要了解的重要主题,例如理解隐私攻、设置隐私参数以及部署首次差分隐私数据发布。本书适合数据管理人员、数据技术相关人员、安全领域技术人员等阅读。<br/>【推荐语】<br/>如今,许多组织分析和共享有关个人的大型敏感数据集。无论这些数据集涵盖医疗保健详细信息、财务记录还是考试成绩,组织都越来越难以通过去识别化、匿名化和其他传统的统计披露限制技术来保护个人信息。这本书介绍了差分隐私(DP)如何提供帮助。 书中解释了这些技术如何使数据科学家、研究人员和程序员能够运行统计分析,隐藏任何单个人的贡献。你将深了解基本的DP概念,并了解如何使用源工具创建差异私有统计信息,探索如何评估效用/隐私权衡,并学习如何将差分隐私集成到工作流中。<br/>【作者】<br/>伊桑·科恩(Ethan Cowan) 软件工程师,目前是哈佛大学继续教育学院的硕士生,研究兴趣在于伦理学和计算机科学的交叉领域。他还经营着一家数据科学咨询公司,帮助初创公司做出关键的技术决策。玛雅娜·佩雷拉(Mayana Pereira)微软 AI for Good Research Lab 的数据科学家, OpenDP 合作者,研究领域涉及数字安全、网络安全、软件安全和人工智能,以及隐私保护技术在机器学习部署场景中的影响。迈克尔·舒马特(Michael Shoemate) 高级数据隐私软件发工程师,目前在研究机构TwoRavens工作,发用于可视化数据和行统计分析的工具,构建了一组可重用的模块化 UI 组件,以便在 Mithril 中行快速和同质的前端发。<br/>
目录展开

书名页

版权

O'Reilly Media,Inc.介绍

本书赞誉

译者序

前言

第一部分 差分隐私的概念

第1章 欢迎来到差分隐私的世界

1.1历史

1.2差分隐私之前的数据私有化

1.3案例研究:课堂场景中应用差分隐私技术

1.3.1隐私保护与均值计算

1.3.2隐私泄露的防范机制

1.4相邻数据集:个体退出场景分析

1.5敏感度:统计量的变化范围

1.6噪声注入机制

1.7可用工具概览

1.8总结

1.9练习

第2章 差分隐私的基本原理

2.1隐私保护的直观理解

2.1.1隐私单元

2.1.2隐私损失

2.2差分隐私的正式化定义

2.2.1随机响应

2.2.2隐私侵犯

2.3差分隐私模型分类

2.4敏感度深度解析

2.5差分隐私机制总览

2.5.1拉普拉斯机制

2.5.2拉普拉斯机制的ε-DP证明

2.5.3机制准确性分析

2.5.4学生家庭类型统计案例

2.5.5指数机制

2.6差分隐私查询的组合性

2.7差分隐私后处理不变性

2.8使用SmartNoise实现差分隐私查询

2.8.1示例1:差分隐私计数

2.8.2示例2:差分隐私求和

2.8.3示例3:单数据库多查询处理

2.9总结

2.10练习

第3章 稳定变换

3.1距离度量

3.1.1数据集相邻性

3.1.2有界差分隐私与无界差分隐私

3.2 c-稳定变换的定义

3.2.1变换案例:双重变换

3.2.2变换案例:逐行变换

3.3稳定性是敏感度的充要条件

3.3.1变换案例:计数

3.3.2变换案例:未知大小求和

3.4域描述符

3.5链式变换

3.6度量空间

3.7稳定性的定义

3.7.1变换案例:已知大小求和

3.7.2变换案例:已知大小的均值

3.7.3变换案例:未知大小的均值

3.7.4变换案例:调整大小

3.7.5标量聚合器回顾

3.8向量值聚合器

3.8.1向量范数、距离和敏感度

3.8.2有界范数数据聚合

3.8.3分组数据

3.9实践

3.10总结

3.11练习

第4章 隐私机制

4.1隐私度量

4.1.1隐私度量:最大散度

4.1.2度量、散度与隐私度量

4.2关于隐私机制

4.2.1随机响应机制

4.2.2向量拉普拉斯机制

4.2.3指数机制

4.2.4分位数评分变换

4.2.5噪声最大值报告机制

4.3交互式查询处理

4.4高于阈值

4.4.1数据流处理

4.4.2在线隐私选择

4.4.3流数据稳定性变换

4.5总结

4.6练习

第5章 隐私的定义

5.1隐私损失随机变量

5.2近似差分隐私

5.2.1截断噪声机制

5.2.2建议-测试-发布

5.2.3高级组合定理

5.3高斯机制

5.4Rényi差分隐私

5.4.1零集中差分隐私

5.4.2基于矩的隐私度量强度分析

5.5有界范围机制

5.6隐私损失分布

5.6.1数值组合

5.6.2特征函数

5.7假设检验解释

5.8总结

5.9练习

第6章 组合范式精要

6.1链式处理

6.1.1示例:边界估计

6.1.2示例:B树结构

6.2隐私度量转换

6.3组合

6.3.1自适应组合

6.3.2里程表和过滤器

6.4分区数据处理

6.4.1示例:对寻求庇护者的数据进行分组

6.4.2并行组合

6.4.3示例:多分位数计算

6.5隐私增强

6.5.1通过简单随机抽样实现隐私增强

6.5.2通过泊松抽样实现隐私增强

6.5.3通过混洗实现隐私增强

6.6抽样与聚合

6.7隐私候选集选择

6.8总结

6.9练习

第二部分 差分隐私在实践中的应用

第7章 隐私单元深度解析

7.1隐私层级体系

7.2浏览器日志示例:朴素事件级保证

7.3具有无界贡献的数据集

7.4数据集截断

7.4.1蓄水池抽样

7.4.2分区数据截断

7.4.3医院就诊示例:偏差-方差权衡

7.5截断阈值的隐私估计

7.6未知域名问题

7.7截断操作的适用场景

7.7.1稳定性分组变换

7.7.2稳定性并集变换

7.7.3稳定性连接变换

7.8总结

7.9练习

第8章 差分隐私统计建模

8.1隐私推理

8.2差分隐私的线性回归

8.2.1充分统计量扰动

8.2.2隐私Theil-Sen估计器

8.2.3目标函数扰动

8.3算法选择策略

8.4差分隐私朴素贝叶斯

8.4.1分类朴素贝叶斯

8.4.2连续朴素贝叶斯

8.4.3机制设计方案

8.4.4示例:朴素贝叶斯实现

8.5隐私决策树

8.6总结

8.7练习

第9章 差分隐私机器学习

9.1机器学习模型隐私保护必要性

9.2机器学习术语回顾

9.3差分隐私梯度下降

9.4随机批处理

9.4.1并行组合应用

9.4.2通过子抽样实现隐私增强

9.4.3超参数调优

9.5隐私聚合教师模型

9.6使用PyTorch训练差分隐私模型

9.7总结

9.8练习

第10章 差分隐私合成数据

10.1合成数据的定义

10.2合成数据应用场景

10.3基于边缘分布的合成器

10.4图模型方法

10.5GAN合成器

10.6总结

10.7练习

第三部分 差分隐私的部署

第11章 隐私攻击防护

11.1隐私侵犯的定义

11.2针对表格数据集的攻击

11.2.1记录链接攻击

11.2.2单独识别攻击

11.2.3差分攻击

11.2.4方程系统重构攻击

11.2.5追踪攻击

11.2.6 k匿名漏洞

11.3机器学习模型攻击

11.4总结

11.5练习

第12章 数据发布的隐私损失参数

12.1抽样策略

12.2元数据参数

12.3隐私损失预算分配

12.4决策辅助实践

12.4.1代码手册与数据标注

12.4.2上下文规范参数化

12.5在探索性数据分析的背景下进行决策

12.6自适应隐私参数选择

12.7透明参数选择的潜在风险

12.8总结

12.9练习

第13章 规划你的第一个差分隐私项目

13.1进行差分隐私部署须考虑的事项

13.1.1部署差分隐私的频率

13.1.2组合与预算管理

13.2差分隐私部署清单

13.3示例项目:课堂场景回归

13.4真实数据发布规范

13.4.1领英经济图谱案例

13.4.2微软宽带数据案例

13.5差分隐私发布表:发布详情标准

13.6结束语

扩展阅读

附录

关于作者

关于封面

推荐阅读

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部