周志华老师的《机器学习》(俗称“西瓜书”)是机器学习领域的经典入门教材之一。本书共16章,与“西瓜书”章节、公式对应,每个公式的推导和解释都以本科数学基础的视角进行讲解,希望能够帮助读者快速掌握各个机器学习算法背后的数学原理。
本书思路清晰,视角独特,结构合理,可作为高等院校计算机及相关专业的本科生或研究生教材,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。
作者简介:
谢文睿 北京工业大学硕士,Datawhale 开源项目负责人,百度算法工程师,研究方向为机器学习与自然语言处理。 秦州 康奈尔大学计算机硕士,Datawhale 成员,阿里巴巴算法专家,研究方向为图计算与自然语言处理,在 NeurIPS、AAAI、CIKM 等会议上录用多篇学术论文并获得 CIKM 2019 最佳应用论文奖。 贾彬彬 工学博士,兰州理工大学讲师,研究方向为机器学习与数据挖掘,在 TKDE、TNNLS、PRJ、ICML、AAAI 等期刊和会议上共发表学术论文十余篇,并担任 ICML、NeurIPS、ICLR、AAAI、IJCAI 等会议的程序委员会委员(PC Member)。
目录:
第1 章 绪论 1
1.1 引言 1
1.2 基本术语 1
1.3 假设空间 5
1.4 归纳偏好 5
第2 章 模型评估与选择 8
2.1 经验误差与过拟合 8
2.2 评估方法 9
2.3 性能度量 11
2.4 比较检验 22
2.5 偏差与方差 26
参考文献 29
第3 章 线性模型 30
3.1 基本形式 30
3.2 线性回归 30
3.3 对率回归 39
3.4 线性判别分析 46
3.5 多分类学习 52
3.6 类别不平衡问题 52
参考文献 52
第4 章 决策树 53
4.1 基本流程 53
4.2 划分选择 54
4.3 剪枝处理 62
4.4 连续值与缺失值 63
4.5 多变量决策树 64
参考文献 66
第5 章 神经网络 67
5.1 神经元模型 67
5.2 感知机与多层网络 67
5.3 误差逆传播算法 70
5.4 全局最小与局部极小 73
5.5 其他常见神经网络 73
5.6 深度学习 74
参考文献 75
第6 章 支持向量机 77
6.1 间隔与支持向量 77
6.2 对偶问题 80
6.3 核函数 87
6.4 软间隔与正则化 87
6.5 支持向量回归 89
6.6 核方法 92
参考文献 99
第7 章 贝叶斯分类器 100
7.1 贝叶斯决策论 100
7.2 极大似然估计 101
7.3 朴素贝叶斯分类器 104
7.4 半朴素贝叶斯分类器 110
7.5 贝叶斯网 112
7.6 EM 算法 113
参考文献 121
第8 章 集成学习 122
8.1 个体与集成 123
8.2 Boosting 124
8.3 Bagging 与随机森林 140
8.4 结合策略 141
8.5 多样性 143
8.6 Gradient Boosting、GBDT、XGBoost的联系与区别 147
参考文献 152
第9 章 聚类 153
9.1 聚类任务 153
9.2 性能度量 153
9.3 距离计算 156
9.4 原型聚类 157
9.5 密度聚类 166
9.6 层次聚类 168
第10 章 降维与度量学习 170
10.1 预备知识 170
10.2 矩阵的F 范数与迹 171
10.3 k 近邻学习 173
10.4 低维嵌入 175
10.5 主成分分析 180
10.6 核化线性降维 188
10.7 流形学习 191
10.8 度量学习 196
参考文献 199
第11 章 特征选择与稀疏学习 200
11.1 子集搜索与评价 200
11.2 过滤式选择 201
11.3 包裹式选择 201
11.4 嵌入式选择与L1 正则化 202
11.5 稀疏表示与字典学习 208
11.6 压缩感知 213
参考文献 214
第12 章 计算学习理论 215
12.1 基础知识 215
12.2 PAC 学习 217
12.3 有限假设空间 218
12.4 VC 维 223
12.5 Rademacher 复杂度 229
12.6 定理12.6 的解释 233
12.7 稳定性 235
参考文献 238
第13 章 半监督学习 240
13.1 未标记样本 240
13.2 生成式方法 240
13.3 半监督SVM 248
13.4 图半监督学习 250
13.5 基于分歧的方法 259
13.6 半监督聚类 260
参考文献 260
第14 章 概率图模型 261
14.1 隐马尔可夫模型 261
14.2 马尔可夫随机场 263
14.3 条件随机场 265
14.4 学习与推断 266
14.5 近似推断 269
14.6 话题模型 278
参考文献 279
第15 章 规则学习 280
15.1 剪枝优化 280
15.2 归纳逻辑程序设计 281
第16 章 强化学习 283
16.1 任务与奖赏 283
16.2 K-摇臂赌博机 283
16.3 有模型学习 284
16.4 免模型学习 286
16.5 值函数近似 287
参考文献 287
点击下载