Python数据处理pdf百度网盘下载地址?
本书采用基于项目的方法,介绍用Python完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括:Python基础知识,如何从CSV、Excel、XML、JSON和PDF文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和API中提取数据。
作者简介:
作者简介: Jacqueline Kazil 数据科学家,资深软件开发者。活跃于Python软件基金会、PyLadies等社区。曾参与美国总统创新伙伴项目,是美国政府技术组织18F的联合创始人。曾担任《华盛顿邮报》数据记者。 Katharine Jarmul 资深Python开发者,PyLadies联合创始人。喜欢数据分析和获取、网页抓取、教人学习Python以及Unix,期望通过教育和培训来促进Python和其他开源语言的多元化。 译者简介: 张亮(hysic) 毕业于北京大学物理学院,爱好机器学习和数据分析的核安全工程师。 吕家明 2016年毕业于哈尔滨工业大学,现就职于腾讯,从事搜索、Query分析等相关工作,熟悉大规模数据下的数据挖掘和机器学习实践。
目录:
第1章 Python 简介 1
第2章 Python 基础 14
第3章 供机器读取的数据 34
第4章 处理Excel 文件 58
第5章 处理PDF 文件,以及用Python 解决问题 73
第6章 数据获取与存储 103
第7章 数据清洗:研究、匹配与格式化 121
第8章 数据清洗:标准化和脚本化 153
第9章 数据探索和分析 173
第10章 展示数据 199
第11章 网页抓取:获取并存储网络数据 221
第12章 高级网页抓取:屏幕抓取器与爬虫 251
第13章 应用编程接口 286
第14章 自动化和规模化 298
第15章 结论 330
点击下载