《深入理解计算机视觉:在边缘端构建高效的目标检测应用》按实战项目研发的先后顺序,介绍了目标检测神经网络从研发到运营的全生命周期。首先介绍了目标检测场景下的图片标注方法和数据格式,以及与之密切相关的特征融合网络和预测网络;介绍了数据“后处理”所涉及的 NMS 算法及其变种,在此基础上,读者只需结合各式各样的骨干网络就可以搭建完整的一阶段目标检测神经网络模型。接下来介绍了神经网络的动态模式和静态模式两种训练方法,以及训练过程中的数据监控和异常处理。最后以亚马逊云和谷歌 Coral 开发板为例,介绍了神经网络的云端部署和边缘端部署。其中,对于边缘端部署,本书还详细介绍了神经网络量化模型的基础原理和模型编译逻辑,这对将神经网络转化为可独立交付的产品至关重要。
《深入理解计算机视觉:在边缘端构建高效的目标检测应用》还结合智慧交通、智慧后勤、自动驾驶等项目,介绍了计算机视觉数据增强技术和神经网络性能评估原理,以及边缘计算网关、边缘计算系统、自动驾驶数据的计算原理和 PointNet++等多个三维目标检测神经网络,帮助读者快速将计算机视觉技术运用到实际生产中。
《深入理解计算机视觉:在边缘端构建高效的目标检测应用》实用性非常强,既适合对计算机视觉具有一定了解的高等院校本科生、研究生及具有转型意愿的软件工程师入门学习,又适合计算机视觉工程项目研发和运营人员参考阅读。对深度学习关键算法和骨干网络设计等基础知识感兴趣的读者还可以阅读本书作者编写的《深入理解计算机视觉:关键算法解析和深度神经网络设计》一书。
作者简介:
张晨然 作者本科毕业于天津大学通信工程专业,硕士研究生阶段就读于厦门大学,主攻嵌入式系统和数字信号底层算法,具备扎实的理论基础。 作者先后就职于中国电信集团公司和福建省电子信息(集团)有限责任公司,目前担任福建省人工智能学会的理事和企业工作委员会的主任,同时也担任谷歌开发者社区、亚马逊开发者生态的福州区域负责人,长期从事机器视觉和自然语言基础技术的研究,积累了丰富的人工智能项目经验,致力于推动深度学习在交通、工业、民生、建筑等领域的应用落地。作者于2017年获得高级工程师职称,拥有多项发明专利。
目录:
第1篇 一阶段目标检测神经网络的结构设计 1
第1章 目标检测的竞赛和数据集 2
1.1 计算机视觉坐标系的约定和概念 2
1.2 PASCAL VOC竞赛和数据集 6
1.3 MS COCO挑战赛和数据集 14
1.4 目标检测标注的解析和统计 18
第2章 目标检测神经网络综述 24
2.1 几个著名的目标检测神经网络 24
2.2 目标检测神经网络分类和高阶API资源 32
2.3 矩形框的交并比评价指标和实现 34
第3章 一阶段目标检测神经网络的特征融合和中段网络 40
3.1 一阶段目标检测神经网络的整体结构 40
3.2 一阶段目标检测神经网络的若干中段网络介绍 41
3.3 不同融合方案中段网络的关系和应用 46
3.4 YOLO的多尺度特征融合中段网络案例 47
3.5 神经网络输出的解码 62
第4章 一阶段目标检测神经网络典型案例——YOLO解析 73
4.1 YOLO家族目标检测神经网络简介 73
4.2 先验锚框和YOLO神经网络的检测思路 74
4.3 建立YOLO神经网络 82
4.4 YOLO神经网络的迁移学习和权重加载 89
4.5 原版YOLO模型的预测 107
4.6 NMS算法的原理和预测结果可视化 111
4.7 YOLO模型的多个衍生变种简介 124
4.8 YOLO模型的发展与展望 127
第2篇 YOLO神经网络的损失函数和训练 129
第5章 将数据资源制作成标准TFRecord数据集文件 130
5.1 数据资源的加载 130
5.2 数据资源的解析和提取 135
5.3 TFRecord数据集文件的制作 139
5.4 单样本的example对象制作 139
5.5 遍历全部样本制作完整数据集 144
5.6 从数据集提取样本进行核对 145
第6章 数据集的后续处理 150
6.1 数据集的加载和打包 150
6.2 将原始数据集打包为可计算数据集 163
第7章 一阶段目标检测的损失函数的设计和实现 181
7.1 损失函数框架和输入数据的合理性判别 182
7.2 真实数据和预测数据的对应和分解 184
7.3 预测矩形框的前背景归类和权重分配 188
7.4 预测矩形框的误差度量 192
7.5 前景和背景的预测误差 208
7.6 分类预测误差 212
7.7 总误差的合并和数值合理性确认 213
第8章 YOLO神经网络的训练 217
8.1 数据集和模型准备 217
8.2 动态模式训练 225
8.3 训练中非法数值的监控和调试 237
8.4 静态模式训练和TensorBoard监控 244
第3篇 目标检测神经网络的云端和边缘端部署 249
第9章 一阶段目标检测神经网络的云端训练和部署 250
9.1 一阶段目标检测神经网络的推理模型设计 250
9.2 目标检测推理模型的云端部署 256
9.3 在亚马逊SageMakerStudio上训练云计算模型 259
第10章 神经网络的INT8全整数量化原理 262
10.1 神经网络量化模型的基本概念 262
10.2 神经网络量化模型的制作和分析 273
10.3 量化性能分析和量化模型的逐层调试 289
10.4 不支持算子的替换技巧 300
第11章 以YOLO和Edge TPU为例的边缘计算实战 305
11.1 TensorFlow模型的量化 307
11.2 神经网络模型的编译 315
11.3 YOLO目标检测模型的量化和编译 321
11.4 YOLO量化模型的编译和边缘端部署 337
第4篇 个性化数据增强和目标检测神经网络性能测试 345
第12章 个性化目标检测数据集处理 346
12.1 农村公路占道数据的目标检测应用 346
12.2 数据的增强 350
12.3 使用Albumentations进行数据增强 361
第13章 模型性能的定量测试和决策阈值选择 368
13.1 神经网络性能量化的基本概念 368
13.2 餐盘识别神经网络性能测试案例 373
第14章 使用边缘计算网关进行多路摄像头目标检测 385
14.1 边缘计算网关的整体结构 385
14.2 开发环境准备 392
14.3 浮点32位模型部署的全流程 399
14.4 边缘端全整数量化模型部署 410
14.5 模型的编译和部署 419
第15章 边缘计算开发系统和RK3588 427
15.1 RK3588边缘推理开发系统结构 427
15.2 开发工具链和神经网络模型部署 431
第5篇 三维计算机视觉与自动驾驶 447
第16章 三维目标检测和自动驾驶 448
16.1 自动驾驶数据集简介 448
16.2 KITTI数据集计算原理 450
16.3 自动驾驶的点云特征提取 461
附录A 官方代码引用说明 469
附录B 本书运行环境搭建说明 471
附录C TensorFlow矩阵基本操作 473
参考文献 474
点击下载