




本书旨在展示如何充分利用 Python 实现快速的数据处理。本书结合示例系统展示了 Python 在获取数据、转换数据和分析数据方面的功能。
◎编辑推荐:
通过本书,你不仅会深入理解 Python 数据结构及其强大的第三方库,还会掌握如何聚合、合并、可视化和分析数据等。在企业管理、市场营销和金融等领域中,基于Python可以实现快速的数据处理。
本书主要内容:
◆列表、元组、字典、集合;
◆NumPy库、pandas库、scikit-learn库、Matplotlib库;
◆关系数据库和NoSQL数据库;
◆数据的聚合、合并、分析与可视化;
◆机器学习在数据分析中的应用。
◎内容简介:
本书主要从实战角度讲述了如何处理、分析和可视化数据,如何用数据建立各种统计学或机器学习模型。本书首先介绍如何使用Python代码获取、转换和分析数据;接着讲述如何使用Python中的数据结构和第三方库;然后展示如何以各种格式加载数据,如何对数据进行分组与汇总,如何创建图表和可视化数据;最后讨论如何解决实际的问题。
本书适合希望使用Python处理和分析数据的开发人员阅读,也可供计算机相关专业的师生参考。
作者简介:
尤里•瓦西列夫(Yuli Vasiliev)是一名程序员、作家,精通开源开发、数据结构和数据库后端开发。他是 Natural Language Processing with Python and spaCy一书的作者。
目录:
第1章 数据的基础知识 1
1.1 数据类别 1
1.2 数据来源 5
1.3 数据处理流程 8
1.4 Python特有的方式 11
1.5 总结 12
第2章 Python数据结构 13
2.1 列表 13
2.2 元组 24
2.3 字典 26
2.4 集合 29
2.5 总结 32
第3章 Python第三方库 33
3.1 NumPy库 33
3.2 pandas库 36
3.3 scikit-learn库 47
3.4 总结 51
第4章 从文件和API访问数据 52
4.1 使用Python函数open导入数据 52
4.2 将数据导出到文件 57
4.3 访问远程文件和API 58
4.4 将数据移入或移出数据框 62
4.5 总结 66
第5章 使用数据库 67
5.1 关系数据库 67
5.2 NoSQL数据库 81
5.3 总结 85
第6章 聚合数据 86
6.1 要聚合的数据 86
6.2 合并数据框 88
6.3 分组和聚合数据 90
6.4 选择组中的所有行 96
6.5 总结 97
第7章 合并数据 98
7.1 合并Python数据结构 98
7.2 合并NumPy数组 104
7.3 合并pandas数据结构 106
7.4 总结 114
第8章 数据可视化 115
8.1 常见可视化形式 115
8.2 使用Matplotlib库绘制图 118
8.3 总结 124
第9章 分析空间数据 125
9.1 获取空间数据 125
9.2 基于geopy库和Shapely库的空间数据分析 129
9.3 结合空间数据和非空间数据 134
9.4 总结 137
第10章 分析时间序列数据 139
10.1 规则时间序列与不规则时间序列 139
10.2 常见的时间序列分析技术 141
10.3 多元时间序列 144
10.4 总结 150
第11章 从数据中挖掘信息 151
11.1 关联法则 151
11.2 Apriori算法 153
11.3 可视化关联规则 157
11.4 从关联规则获得可操作信息 160
11.5 总结 163
第12章 数据分析的机器学习 164
12.1 为什么选择机器学习 164
12.2 机器学习的类型 165
12.3 机器学习的工作原理 166
12.4 情感分析示例:产品评论分类 168
12.5 预测股票走势 175
12.6 总结 180
点击下载