快乐机器学习 1.第1章机器学习是什么—机器学习定义 2.第2章机器学习可行吗——让算学习理论 3.第3章机器学习怎么学—模型评估选择 4.第4章线性回归 5.第5章对率回归 6.第6章正则化回归 7.第7章支持向量机 8.第8章朴素贝叶斯 9.第9章决策树 10.第10章人工神经网络 11.第11章正向/反向传播 12.第12章集成学习 13.第13章随机森林和提升树 14.第14章极度梯度提升 15.第15章本书总结 16.结语 第1章 机器学习是什么——机器学习定义 Machine learning is the science of getting puters to act without being explicitly programmed.-Stanford 引言 2018年6月1日,中央电视台正在转播美国职业篮球联赛(NBA)总决 赛,此时是勇士队对骑士队第一场比赛的加时赛,我一看勇士队领先了 10分而且是主场作战,就预测骑士队会输掉比赛,勇士队会夺得冠军. 这时,我突然发现自己的Python作业还没写完,就关上了电视机,聚精 会神地完成了用Python编写程序打印“Hello Machine Learning!”的作 业. 先看上面这段文字的前半部分,这里涉及基于经验做出的预判. 例如,为什么在勇士队主场作战并领先1分的情况下,我就认 为勇士队会赢呢?因为在本赛季中,勇士队在主场作战的情况 下只输过两场,而且在加时赛领先10分时获胜的概率是100%. 为什么勇士队赢一场比赛我就认为其会夺得NBA冠军呢?因为 据统计,在决赛中赢得第一场比赛的球队有79%的概率会夺得 NBA冠军.这些对经验的利用是靠我们自身完成的,但这是机 器学习吗?不是,我是人,不是机器,是我在预测,而不是机 器在预测. 再看上面这段文字的后半部分,计算机根据用Python编写的程 序,打印了一句话.但这是机器学习吗?不是,打印一句话也 好意思称为学习?它只不过是在机械地执行命令罢了. 所以,到底什么是机器学习?从字面上来讲就是(人用)计算机来学 习.谈起机器学习就一定要提起汤姆米切尔(Tom M.Mitchell) 就像 在谈起音乐时大多会提起贝多芬,在谈起篮球时大多会提起迈克尔乔 丹一样.米切尔对机器学习的定义是[1]: A puter program is said to learn from experienceEwith respect to some class of tasksTand performance measurePif its performance at tasks inT as measured byP improves with experienceE. 这段英文有一点抽象、难懂.首先,要注意两个词:puter program 和learn 翻译成中文就是“机器(计算机程序)”和“学习”.把上面的英 文翻译成中文就是: 假设用性能度量P来评估模型在某类任务T中的性能,若该模型通过 利用经验E在任务T中改善其性能度量P 那么可以说机器对经验E 进行了学习. 在该定义中,除核心词“机器”和“学习”外,还有关键词经验E、性能度 量P和任务T.在计算机系统中,通常经验E是以数据D的形式存在的, 而机器学习就是在给定不同的任务中,从数据中产生模型,模型的好 坏就用性能度量P来评估.现在面临两个问题: (1)模型的性能如何定量评估?这就需要根据不同的学习任务T在数 据D上定义对应的性能度量P. (2)模型的性能如何...