Interpretable Machine Learning 可解释的机器学习 黑盒模型可解释性理解指南 Christoph Molnar著 朱明超译 @ChristophMolnar 序言 机器学习对于改进产品、过程和研究有着很大的潜力.但是计算机通常无法解释他们的预测,这是 采用机器学习的障碍.这本书是关于使机器学习模型及其决策可解释的. 在探索了可解释性的概念之后,你将学习简单的、可解释的模型,例如决策树、决策规则和线性回 归.后面几章重点介绍了解释黑盒模型的模型无关的一般方法,如特征重要性和累积局部效应,以 及用Shapley值和LIME解释单个实例预测. 的解释方法进行了深入说明和批判性讨论.它们如何在黑盒下工作的?它们的优缺点是什么? 如何解释它们的输出?本书将使你能够选择并正确应用最适合你的机器学习项目的解释方法. 这本书的重点是表格式数据(也称为关系数据或结构化数据)的机器学习模型,较少涉及到计算机 视觉和自然语言处理任务.建议机器学习从业者、数据科学家、统计学家和任何对使机器学习模型 可解释的人阅读本书
PDF书签目录:
序言 -6
前言 1
故事时间 2
闪电永不两次 2
信任倒下 4
费米的回形针 5
什么是机器学习? 7
术语 8
可解释性 11
可解释性的重要性 11
可解释性方法的分类 15
可解释性范围 17
算法透明度 17
全局、整体的模型可解释性 17
模块层面上的全局模型可解释性 17
单个预测的局部可解释性 18
一组预测的局部可解释性 18
可解释性评估 18
解释的性质 19
人性化的解释 21
什么是解释 21
什么是好的解释? 22
数据集 25
自行车租赁 (回归) 25
\YouTube 垃圾评论 (文本分类) 26
宫颈癌的危险因素 (分类) 27
可解释的模型 28
线性回归 29
解释 30
示例 32
可视化解释 33
解释单个实例预测 35
分类特征的编码 36
线性模型是否有很好的解释? 38
稀疏线性模型 38
优点 41
缺点 42
逻辑回归 42
线性回归用于分类有什么问题? 42
理论 43
解释 45
示例 46
优缺点 47
软件 48
\text{GLM}, \text{GAM} 和其他模型 48
非高斯结果输出 - \text{GLM} 50
交互 55
非线性效应 - \text{GAM} 58
优点 62
缺点 63
软件 63
进一步扩展 63
决策树 65
解释 67
示例 67
优点 69
缺点 70
软件 70
决策规则 70
从单个特征学习规则 (OneR) 72
顺序覆盖 76
贝叶斯规则列表 79
优点 84
缺点 84
软件和替代方法 85
RuleFit 85
解释和示例 86
理论 88
优点 90
缺点 91
软件和替代方法 91
其他可解释模型 92
朴素贝叶斯分类器 92
k-最近邻 92
模型无关方法 93
部分依赖图 95
示例 96
优点 100
缺点 101
软件和替代方法 101
个体条件期望 101
示例 102
优点 105
缺点 106
软件和替代方法 106
累积局部效应图 106
动机和直觉 106
理论 109
估计 111
示例 113
优点 123
缺点 124
实现和替代方法 124
特征交互 125
特征交互 125
理论:弗里德曼的 H 统计量 126
示例 127
优点 130
缺点 130
实现 131
替代方法 131
置换特征重要性 132
理论 132
我应该计算训练数据还是测试数据的重要性? 132
示例和解释 135
优点 136
缺点 137
软件和替代方法 138
全局代理模型 138
理论 138
示例 140
优点 141
缺点 142
软件 142
局部代理 (LIME) 142
表格数据的LIME 143
文本的LIME 146
图像的LIME 148
优点 148
缺点 149
Shapley 值 150
总体思路 150
示例与解释 153
详细的 Shapley 值 154
优点 157
缺点 158
软件和替代方法 159
SHAP 159
定义 159
KernelSHAP 161
TreeSHAP 164
示例 165
SHAP特征重要性 166
SHAP概要图 167
SHAP依赖图 167
SHAP交互值 168
聚类SHAP值 169
优点 170
缺点 170
软件 171
基于样本的解释 172
反事实解释 173
生成反事实解释 175
示例 176
优点 177
缺点 178
软件和替代方法 178
对抗样本 179
方法与示例 180
网络安全视角 186
原型与批评 188
理论 189
示例 192
优点 193
缺点 194
代码和替代方法 194
有影响力的实例 194
删除诊断 198
影响函数 201
识别有影响力的实例的优点 206
识别有影响力的实例的缺点 207
软件和替代方法 207
水晶球 209
机器学习的未来 210
可解释性的未来 212
参考文献 212