神经网络与深度学习邱锡鹏 nndl-book.pdf

文档页数：440

文档大小：6.41MB

文档格式：pdf

文档分类：计算机与AI

上传会员：匿名用户

上传日期：2025-02-20

最后更新：2025-02-20

《神经网络与深度学习》 NeuralNetworks andDeepLearning nndl-github.10/ 邱锡鹏 xpqiu@fudan.edu.cn 2020年3月7日
序近年来由于阿尔法围棋战胜人类顶级高手新闻的轰动效应，让人工智能一下子进入了寻常百姓家，成为家喻户晓的热词.阿尔法围棋之所以能取得如此成功的关键技术之一，正是所谓的深度学习技术.而其实在阿尔法围棋出来之前，以深度学习为代表的人工智能技术已经在模式识别、计算机视觉、语音识别与生成、自然语言处理、机器翻译等方面取得了重要的进步.也因此，2018年有计算机领域诺贝尔奖之称的图灵奖就颁给了对深度学习作出重要贡献的三位科学家： Yoshua Bengio Geoffrey Hinton 和l Yann LeCun. 邱锡鹏教授的《神经网络与深度学习》一书较全面地介绍了神经网络、机器学习和深度学习的基本概念、模型和方法，同时也涉及了深度学习中许多最新进展.书后还提供了相关数学分支的简要介绍，以供读者需要时参考《神经网络与深度学习》一书已在网上发布，得到广泛好评，相信此书的出版的深度学习相当于函数逼近间题，即函数或曲面的拟合，所不同的是，这里用作基函数的是非线性的神经网络函数，而原来数学中用的则是多项式、三角多项式、 B-spline、一般spline以及小波函数等的线性组合由于神经网络的非线性和复杂性（要用许多结构参数和连接权值来描述），它有更强的表达能力，即从给定的神经网络函数族中可能找到对特定数据集拟合得史好的神经网络.这相信正是深度学习方法能得到一系列很好结果的重要原因.直观上很清楚，当你有更多的选择时，你有可能选出更好的选择，当然，要从非常非常多的选择中找到那个更好的选择并不容易这里既涉及设计合适的神经网络类型，也涉及从该类型的神经网络中找出好的（即拟合误差小的）那个特定神经网络的方法.后者正是数学中最优化分支所研究的间题.从数学角度看，目前深度学习中所用的优化算法还是属于比较简单的梯度下降法.许多数学中已有的史复杂的算法，由于高维数问题都还没有得到应用
II 本书中对这两方面都有很好的介绍.相信随着研究的不断发展，今后一定会提出更多新的神经网络和新的优化算法所谓成也萧何败也萧何，神经网络的非线性和复杂性（即要用大量参数来描述：在深度网络场合其个数动辑上万、百万甚至更多），使得虽然通过大量的标注数据经过深度学习可以得到一个结果误差很小的神经网络，但要用它来进行解释却是十分困难.其实这也是长期困抗神经网络方法的一个问题，使用深度神经网络的深度学习方法也概莫能外难于解释相当于知其然不知其所以然，这对有些应用而言是可以的：但对有些可能造成严重后果的应用而言则有很大间题一般而言，人们除了希望知其然，也会希望能知其所以然近案也有学者发现，一个精度很高的神经网络，去改变它的儿个（甚至一个）参数，就会使该网络的性能下降许多.换言之，深度学习方法的鲁棒性也有待研究总之，本书介绍的基于神经网络的深度学习方法是近年来经过大量实践并取得很好成果的一种很通用的方法，也是近年来人工智能领域中最活跃的分支之一.相信，无论在方法本身的发展上，抑或在新领域应用的研发上，都会呈现出一派欣欣的气象吴立德于上海-复且大学 2019年8月17日
前言近年来，以机器学习、知识图谱为代表的人工智能技术逐渐变得普及.从车牌识别、人脸识别、铂音识别、智能问客、推荐系统到自动驾驶，人们在日常生活中都可能有意无意地使用到了人工智能技术，这些技术的背后都离不开人工智能领域研究者们的长期努力.特别是最近这儿年，得益于数据的增多、计算能力的增强、学习算法的成熟以及应用场景的丰富，越来越多的人开始关注这一个“薪新” 的研究领域：深度学习.深度学习以神经网络为主要模型，一开始用来解决机器学习中的表示学习问题.但是由于其强大的能力，深度学习越来越多地用来解决一些通用人工智能问题，比如推理、决策等.目前，深度学习技术在学术界和工业界取得了广泛的成功，受到高度重视，并撤起新一轮的人工智能热潮然而，我们也应充分意识到目前以深度学习为核心的各种人工智能技术和 “人类智能”还不能相提并论.深度学习需要大量的标注数据，和人类的学习方式差异性很大.虽然深度学习取得了很大的成功，但是深度学习还不是一种可以解决一系列复杂间题的通用智能技术，而是可以解决单个问题的一系列技术.比如可以打败人类的AlphaGo只能下围棋，而不会一个简单的算术运算想要达到通用人工智能依然困难重重本书的写作目的是使得读者能够掌握神经网络与深度学习技术的基本原理，知其然还要知其所以然.全书共15章.第1章是绪论，介绍人工智能、机器学习、深度学习的概要，使读者全面了解相关知识.第2、3章介绍机器学习的基础知识第46章分别讲述三种主要的神经网络模型：前馈神经网络、卷积神经网络和循环神经网络.第7章介绍神经网络的优化与正则化方法.第8草介绍神经网络中的注意力机制和外部记忆第9章简要介绍一些无监督学习方法.第10章介绍一些模型独立的机器学习方法：集成学习、自训练、协同训练多任务学习、迁移学习、终身学习、元学习等，这些都是目前深度学习的难点和热点问题.第11章介绍概率图模型的基本概念，为后面的章节进行铺垫.第12章介绍两种早期的深度学习模型：玻尔兹曼机和深度信念网络，第13章介绍最近两年发展十分迅速的深度生成模型：变分自编码器和生成对抗网络.第14章介绍深度强化学习的知识，第15章介绍应用十分广泛的序列生成模型
IV 2015年复旦大学计算机学院开设了《神经网络与深度学习》课程.讲好深度学习课程并不是一件容易的事，当时还没有关于深度学习的系统介绍，而且還程涉及知识点非常多并且比较杂乱，和实践结合也十分紧密.作为任還教师，我尝试梳理了深度学习的知识体系，并写了一本讲义放在网络上.虽然现在看起来当时对深度学习的理解仍然十分粗浅，且讲义存在很多错误，但依然受到了很多热心网发的和效励.2016年初机械工业出版社华章公可的姚蓄编辑多次拜访并希望我能将这个讲义整理成书.我一方面被姚蓄编辑的诚意打动，另一方面也确实感到应该有一本面向在校学生和相关从业人员的关于深度学习的专门书籍，因此最终有了正式出版的意愿但我依然低估了写书的难度，一方面是深度学习的发展十分迅速，而自己关于深度学习的认知也在不断变化，导致已写好的内容经常需要修改，另一方面是平时的科研工作十分紧忙，很难抽出大段的时间采静心写作，因此断断续续的写作一直拖延至今. 我自己理想中著书立说的境界是自己在某一个领域有自己的理论体系，将各式各样的方法都统一到自己的体系下，并可以容纳大多数技术，从新的角度来重新解释这些技术，本书显然还达不到这样的水平，但希望能结合自身的经验，对神经网络和深度学习的相关知识进行梳理、总结，通过写书这一途径，也促使自己更加能够深人理解深度学习这一领域，提高自己的理论水半本书能够完成，首先感谢我的导师吴立德教授，他对深度学习的独到见解和深人浅出的讲授，使得我对深度学习有了更深层次的认识，也感谢复且大学计算机学院的黄萱菁教授和薛向阳教授的支持和帮助.本书在写作时将书稿放在网络上，也得到很多网发的帮助、特别感谢王利锋、林同茂、张钧瑞、李浩、胡可鑫、书鹏辉、徐国海、侯宇蓬、任强、王少敬、肖耀、李鹏等人指出了本书初稿的错误或提出了富有建设性的意见.此外，本书在写作过程中参考了互联网上大量的优秀资料.如维基百料、知乎、Quora等网站另外，我也特别感谢我的家人本书的写作占用了大量的业余时间，没有家人的理解和支持，这本书不可能完成最后，因为个人能力有限，书中难免有不当和错误之处，还望读者海翘和指正，不胜感激邱锡鹏于上海-复且大学 2020年3月7日

资源链接请先登录（扫码可直接登录、免注册）

①本文档内容版权归属内容提供方。如果您对本资料有版权申诉，请及时联系我方进行处理（联系方式详见页脚）。
②由于网络或浏览器兼容性等问题导致下载失败，请加客服微信处理（详见下载弹窗提示），感谢理解。
③本资料由其他用户上传，本站不保证质量、数量等令人满意，若存在资料虚假不完整，请及时联系客服投诉处理。

投稿会员：匿名用户

神经网络与深度学习 邱锡鹏 nndl-book.pdf

推荐内容/By 规范库

手机扫码、免注册、直接登录

神经网络与深度学习邱锡鹏 nndl-book.pdf