当前位置: 首页 > python

PySpark实战指南:利用Python和Spark构建数据密集型应用并规模化部署 PDF电子书 [23MB]

  • python
  • 更新时间:2021-05-15 19:16:46
简介PySpark实战指南:利用Python和Spark构建数据密集型应用并规模化部署pdf百度网盘下载地址? 本文从Spark的基本特点出发,借助大量例子详细介绍了如何使用Python调用Spark新特...
《PySpark实战指南:利用Python和Spark构建数据密集型应用并规模化部署》pdf电子书下载
《PySpark实战指南:利用Python和Spark构建数据密集型应用并规模化部署》pdf百度云
《PySpark实战指南:利用Python和Spark构建数据密集型应用并规模化部署》pdf百度云

 

PySpark实战指南:利用Python和Spark构建数据密集型应用并规模化部署pdf百度网盘下载地址?

本文从Spark的基本特点出发,借助大量例子详细介绍了如何使用Python调用Spark新特性、处理结构化及非结构化数据、使用PySpark中基本可用数据类型、生成机器学习模型、进行图像操作以及阅读串流数据等新兴技术内容。


作者简介:
作者:(美)托马兹·卓巴斯 作者:丹尼·李 译者:栾云杰 译者:陈瑶 译者:刘旭斌 托马兹·卓巴斯(Tomasz Drabas),微软数据科学家,他拥有超过13年的数据分析经验。托马兹每天都和大数据打交道,解决机器学习问题(如异常检测、流失预测),并使用Spark进行模式识别。丹尼·李(Denny Lee),微软Azure DocumentDB团队的首席项目经理。他是一个经验丰富的分布式系统和数据科学工程师,拥有超过18年的经验,擅长开发互联网级别基础架构、数据平台和预测分析系统(包括内部部署和云环境)。

目录:
第1章 了解Spark 1
第2章 弹性分布式数据集 12
第3章 DataFrame 24
第4章 准备数据建模 43
第5章 MLlib介绍 61
第6章 ML包介绍 75
第7章 GraphFrames 100
第8章 TensorFrames 120
第9章 使用Blaze实现混合持久化

点击下载