本书带领读者用原生Python语言和Numpy线性代数库实现一个基于计算图的深度学习框架MatrixSlow(类似简易版的PyTorch、TensorFlow或Caffe)。全书分为三个部分。第一部分是原理篇,实现了MatrixSlow框架的核心基础设施,并基于此讲解了机器学习与深度学习的概念和原理,比如模型、计算图、训练、梯度下降法及其各种变体。第二部分是模型篇,介绍了多种具有代表性的模型,包括逻辑回归、多层全连接神经网络、因子分解机、Wide & Deep、DeepFM、循环神经网络以及卷积神经网络,这部分除了着重介绍这些模型的原理、结构以及它们之间的联系外,还用MatrixSlow框架搭建并训练它们以解决实际问题。第三部分是工程篇,讨论了一些与深度学习框架相关的工程问题,内容涉及训练与评估,模型的保存、导入和服务部署,分布式训练,等等。
目录:第一部分 原理篇
第1章 机器学习与模型 2
第2章 计算图 13
第3章 优化器 49
第二部分 模型篇
第4章 逻辑回归 70
第5章 神经网络 90
第6章 非全连接神经网络 117
第7章 循环神经网络 151
第8章 卷积神经网络 168
第三部分 工程篇
第9章 训练与评估 196
第10章 模型保存、预测和服务 212
第11章 分布式训练 224
第12章 工业级深度学习框架 261
点击下载