当前位置: 首页 > 大数据

Spark海量数据处理 技术详解与平台实战 PDF电子书 [202MB]

  • 大数据
  • 更新时间:2023-09-11 09:41:41
简介Spark海量数据处理 技术详解与平台实战pdf百度网盘下载地址? 本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,层次分明,循序渐进。全书分为3部分,涵盖了技术理论与实战,...
《Spark海量数据处理 技术详解与平台实战》pdf电子书下载
《Spark海量数据处理 技术详解与平台实战》pdf百度云
《Spark海量数据处理 技术详解与平台实战》pdf百度云
《Spark海量数据处理 技术详解与平台实战》pdf百度云
《Spark海量数据处理 技术详解与平台实战》pdf百度云

 

Spark海量数据处理 技术详解与平台实战pdf百度网盘下载地址?

本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,层次分明,循序渐进。全书分为3部分,涵盖了技术理论与实战,读者可以从实战中巩固学习到的知识。第一部分主要围绕BDAS(伯克利数据分析栈),不仅介绍了如何开发Spark应用的基础内容,还介绍了Structured Streaming、Spark机器学习、Spark图挖掘、Spark深度学习等高级主题,此外还介绍了Alluxio系统。第二部分实现了一个企业背景调查系统,比较新颖的是,该系统借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足需求,既是对本书第一部分很好的巩固,又完整呈现了一个实时大数据应用的开发过程。第三部分是对全书的总结和展望。

本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。


作者简介:
范东来,北京航空航天大学硕士,泛山科技联合创始人,Spark Contributor、SupersetContributor,架构师,技术图书作者和译者,著有《Hadoop海量数据处理》,译有《解读NoSQL》《NoSQL**指南》《神经网络算法和实现》《Hadoop深度学习》《精通数据科学算法》等,另译有畅销小说《巧克力时代:因为这是我的血脉》。

目录:
第 1章 序篇 2
第 2章 Spark编程 13
第3章 Spark统一编程接口:DataFrame、Dataset和Spark SQL 71
第4章 Spark流处理:Spark Streaming
第5章 Spark图计算:GraphX 164
第6章 Spark机器学习:MLlib 197
第7章 Spark深度学习:Deeplearning4j 250
第8章 分布式存储:Alluxio 271
第9章 企业数据湖与Lambda架构 290
第 10章 大数据企业动态背景调查平台 305
第 11章 平台设计 322
第 12章 数据管道层 328
第 13章 速度层 337
第 14章 批处理层 356
第 15章 服务层与查询层 371
第 16章 总结和展望 378

点击下载