Draft Version MACHINE LEARNING YEARNING Technical Strategy for Al Engineers In the Era of Deep Learning ANDREW NG 目录 1机器学习为什么需要策略? 2如何使用此书来帮助你的团队 3先修知识与符号说明 4规模驱动机器学习发展 5开发集和测试集的定义 6开发集和测试集应该服从同一分布 7开发集和测试集应该有多大?? 8使用单值评估指标进行优化 9优化指标和满意度指标 10通过开发集和度量指标加速迭代 11何时修改开发集、测试集和指标 12小结:建立开发集和测试集 13快速构建并迭代你的第一个系统 14误差分析:根据开发集样本评估想法 15在误差分析时并行评估多个想法 16清洗误标注的开发集和测试集样本 17将大型开发集拆分为两个子集,专注其一 18 Eyeball和Blackbox开发集该设置多大? 19小结:基础误差分析 20偏差和方差:误差的两大来源 21偏差和方差举例 22与最优错误率比较 23处理偏差和方差 24偏差和方差间的权衡 25减少可避免偏差的技术 Page 3 Machine Learning Yearning-Draft Andrew Ng 26训练集误差分析 27减少方差的技术 28诊断偏差与方差:学习曲线 29绘制训练误差曲线 30解读学习曲线:高偏差 31解读学习曲线:其它情况 32绘制学习曲线 33为何与人类表现水平进行对比 34如何定义人类表现水平 35超越人类表现水平 36何时在不同的分布上训练与测试 37如何决定是否使用你的数据 38如何决定是否添加不一致的数据 39给数据添加权重 40从训练集泛化到开发集 41辨别偏差、方差和数据不匹配误差 42解决数据不匹配问题 43人工合成数据 44优化验证测试 45优化验证测试的一般形式 46强化学习举例 47端到端学习的兴起 48端到端学习的更多例子 49端到端学习的优缺点 50流水线组件的选择:数据可用性 51流水线组件的选择:任务简单性 Page 4 Machine Learning Yearning-Draft Andrew Ng ...