




本书以Python 3.9为编程环境,从Python编程基础到扩展库,再到数据分析,逐步展开Python数据分析与可视化教学。本书首先简要介绍数据分析与可视化的相关概念,并介绍Python基础知识;然后按照数据分析的主要步骤,重点介绍与数据获取、数据处理、数据分析、数据可视化以及机器学习建模过程相关的扩展库,包括NumPy、Pandas、BeautifulSoup、sklearn、Matplotlib、seaborn、pyecharts等;最后通过股票数据量化分析和销售业客户价值数据分析两个案例实战演示Python和相关扩展库的应用,将Python数据分析和可视化知识与实用案例有机结合。
本书适合作为高等院校本科生“数据分析”等课程的教材,也适合作为数据分析初学者的自学用书,还适合从事数据分析相关工作的工程师和爱好者阅读。
作者简介:
夏敏捷 中原工学院教师,主要研究项目及领域:计算机、可视化、游戏开发等。 个人荣誉:2019年度被评为校级师德标兵,2020年度被评为校级教学名师。 出版图书: 《Python项目案例开发从入门到实战》清华大学出版社,2019年, 年销量8000册。 《Python程序设计——从基础开发到数据分析(微课版)》清华大学出版社,2020年,年销量8000册。 《Python基础入门-微课视频版》清华大学出版社,2021年,年销量5000。
目录:
第1章 数据分析与可视化概述 1
1.1 数据与大数据 1
1.2 数据分析 2
1.3 数据可视化 3
1.4 数据分析流程 5
1.5 Python数据分析与可视化 6
1.6 Jupyter Notebook的安装和使用 8
1.7 PyCharm的安装和使用 11
实验一 熟悉Python开发环境 13
第2章 python编程基础 15
2.1 Python语言简介 15
2.2 Python语言基本语法 16
2.3 Python面向对象程序设计 36
2.4 Python图形用户界面设计 43
2.5 操作常用文件 65
2.6 Python的第三方库 72
实验二 基于Tkinter的GUI程序开发 74
第3章 科学计算NumPy 库 81
3.1 NumPy数组的使用 81
3.2 NumPy中的矩阵对象 91
3.3 NumPy中的数据统计分析 92
实验三 NumPy数据分析应用 97
第4章 Pandas统计分析基础 102
4.1 Pandas 102
4.2 Pandas统计 112
4.3 Pandas排序和排名 114
4.4 Pandas筛选和过滤 118
4.5 Pandas数据透视表和交叉表 122
4.6 Pandas数据导入导出 126
4.7 Pandas日期处理 129
4.8 Pandas数据运算 133
4.9 Pandas数据分析应用案例——学生成绩统计分析 136
实验四 Pandas数据分析应用 141
第5章 Python爬取网页数据 145
5.1 HTTP与网络爬虫相关知识 145
5.2 urllib库 146
5.3 BeautifulSoup库 155
5.4 requests库 161
5.5 动态网页爬虫 168
5.6 Selenium实现AJAX动态加载 172
5.7 爬虫应用案例——Python爬取新浪国内新闻 181
5.8 爬虫应用案例——Python爬取豆瓣电影TO 184
实验五 Python爬取网页信息 187
第6章 数据处理数据分析 192
6.1 数据处理 192
6.2 Pandas数据清理 196
6.3 Pandas数据集成 204
6.4 Pandas数据变换与数据离散化 211
6.5 Pandas数据分析 214
实验六 数据处理与数据分析 218
第7章 sklearn构造数据分析模型 225
7.1 机器学习基础 225
7.2 机器学习库sklearn的应用 228
实验七 sklearn机器学习应用 240
第8章 数据可视化 244
8.1 Matplotlib绘图可视化 244
8.2 seaborn绘图可视化 254
8.3 pyecharts绘图可视化 267
8.4 Pandas数据分析应用案例——天气数据分析和展示 277
8.5 数据可视化应用案例——学生成绩分布条形图展示 281
实验八 数据可视化 284
第9章 案例实战——股票数据量化分析 291
9.1 股票数据量化分析的背景与功能 291
9.2 程序设计的思路 291
9.3 程序设计的步骤 292
第10章 案例实战——销售业务客户价值数据分析 305
10.1 销售业客户价值数据分析的意义 305
10.2 程序设计的思路 305
10.3 程序设计的步骤 306
参考文献 320
点击下载