LUON 动手学深度学习 MXNetCommunity 2018年11月28日
目录 引言 1.1 前言 1.2 深度学习简介 g 1.3 如何使用本书 13 2 预备知识 17 2.1 获取和运行本书代码 17 2.2 数据操作 21 2.3 自动求梯度 29 2.4 查阅MXNet文档 32 3深度学习基础 37 3.1 线性回归 37 3.2 线性回归的从零开始实现 43 3.3 线性回归的Gluon实现. 49 3.4 Softmax回归. 53 3.5 图像分类数据集(Fashion-MNIST) 58 3.6 Softmax回归的从零开始实现 62 3.7 Softmax回归的Gluon实现 67 3.8 多层感知机 69
3.9 多层感知机的从零开始实现 77 3.10多层感知机的Gluon实现 79 3.11模型选择、欠拟合和过拟合 80 3.12权重衰减 89 3.13丢弃法, 96 3.14正向传播、反向传播和计算图 .101 3.15数值稳定性和模型初始化.
.105 3.16实战Kaggle比赛:房价预测 107 4深度学习计算 117 4.1 模型构造 .117 4.2 模型参数的访问、初始化和共享 122 4.3 模型参数的延后初始化 .128 4.4 自定义层 .130 4.5 读取和存储 133 4.6 GPU计算 .136 5 卷积神经网络 141 5.1 二维卷积层 141 5.2 填充和步幅 .147 5.3 多输入通道和多输出通道 .151 5.4 池化层. .155 5.5 卷积神经网络(LeNet) .160 5.6 深度卷积神经网络(AlexNet) .164 5.7 使用重复元素的网络(VGG) 170 5.8 网络中的网络(NiN) .173 5.9 含并行连结的网络(GoogLeNet) 177 5.10 批量归一化 182 5.11残差网络(ResNet) .188 5.12稠密连接网络(DenseNet) 193 6 循环神经网络 199 6.1 语言模型 .200 6.2 循环神经网络 202 6.3 语言模型数据集(周杰伦专辑歌词) 206 i
6.4 循环神经网络的从零开始实现 211 6.5 循环神经网络的Gluon实现 218 6.6 通过时间反向传播 .223 6.7 门控循环单元(GRU) .226 6.8 长短期记忆(LSTM) .233 6.9 深度循环神经网络 .241 6.10双向循环神经网络 243 优化算法 245 7.1 优化与深度学习, .245 7.2 梯度下降和随机梯度下降 .250 7.3 小批量随机梯度下降 258 7.4 动量法. .264 7.5 Adagrad .272 7.6 RMSProp 277 7.7 Adadelta .281 7.8 Adam .285 8 计算性能 289 8.1 命令式和符号式混合编程 .289 8.2 异步计算 .297 8.3 自动并行计算 8.4 多GPU计算 .306 8.5 多GPU计算的Gluon实现 313 9 计算机视觉 319 9.1 图像增广 .319 9.2 微调 .329 9.3 目标检测和边界框 9.4 锚框. 9.5 多尺度目标检测 9.6 目标检测数据集(皮卡丘) 352 9.7 单发多框检测(SSD) .356 9.8 区域卷积神经网络(R-CNN)系列 368 9.9 语义分割和数据集 375
9.10全卷积网络(FCN) 381 9.11样式迁移 391 9.12实战Kaggle比赛:图像分类(CIFAR-10) 401 9.13实战Kaggle比赛:狗的品种识别(ImageNet Dogs). 410 10自然语言处理 419 10.1词嵌入(word2vec) .419 10.2近似训练 .425 10.3Word2vec的实现. .428 10.4子词嵌入(fastText) 439 10.5全局向量的词嵌入(GloVe) .440 10.6求近义词和类比词 444 10.7文本情感分类:使用循环神经网络 .448 10.8文本情感分类:使用卷积律经网络(textCNN) .454 10.9编码器一解码器(seq2seq) 461 10.10束搜索. .464 10.11注意力机制 468 10.12机器翻译 472 11附录 483 11.1主要符号一览 483 11.2数学基础 .485 11.3使用Jupyter笔记本 .492 11.4使用AWS运行代码 .498 11.5GPU购买指南 509 11.6如何为本书贡献.
.512 11.7gluonbook包索引. .518 iv