当前位置: 首页 > 大数据

Hadoop专家:管理、调优与SparkYARNHDFS安全PDF电子书 [243MB]

  • 大数据
  • 更新时间:2021-05-02 21:16:17
简介Hadoop专家:管理、调优与SparkYARNHDFS安全中文版怎么样? 《Hadoop专家:管理、调优与SparkYARNHDFS安全》翻译自 Sam R. Alapati 的 Expert Ha...
《Hadoop专家:管理、调优与SparkYARNHDFS安全》pdf电子书下载
《Hadoop专家:管理、调优与SparkYARNHDFS安全》pdf百度云
《Hadoop专家:管理、调优与SparkYARNHDFS安全》pdf百度云

 

Hadoop专家:管理、调优与SparkYARNHDFS安全中文版怎么样?

《Hadoop专家:管理、调优与SparkYARNHDFS安全》翻译自 Sam R. Alapati 的 Expert Hadoop Administration。Sam R. Alapati 是 Sabre 公司的首席 Hadoop 管理员,具有多年的 Hadoop 运维管理经验。他希望通过本书,为 Hadoop 集群开发与管理人员提供一些有益指导。

从事 Hadoop 的管理工作, 首先要了解 Hadoop 的架构,只进行单纯的操作并不能被称为合格的管理员。基于此,本书在介绍 Hadoop 及其生态组件时,都会首先介绍其架构,以期读者能够从更高的层次认识管理工作。

《Hadoop专家:管理、调优与SparkYARNHDFS安全》首先介绍了 Hadoop 的整体架构及其部署与使用;然后着重介绍了两个重要的计算引擎MapReduce 与 Spark;接着介绍了 Hadoop 的数据存储与安全、数据均衡等特性;最后则介绍了如何进行参数调优与故障排除。整个流程下来,读者能够建立起完整的关于 Hadoop 管理的体系架构。

《Hadoop专家:管理、调优与SparkYARNHDFS安全》为 Hadoop 管理员而编写,同时也适合Hadoop 开发人员使用。


作者简介:
Sam R. Alapati 是Sabre 的首席Hadoop 管理员,公司总部位于得克萨斯州的南湖,他每天都要管理多个Hadoop 集群。作为Sabre 企业数据分析(EDA)部门所有Hadoop管理相关工作的负责人,Sam 管理并优化了与Hadoop 相关的多个关键数据科学和数据分析工作的流程。Sam 还是一名Oracle 数据库管理专家,具有丰富的关系型数据库和SQL 的相关知识,因而他能成功地完成Hadoop 相关的项目。Sam 在数据库和中间件领域取得了多项成就,包括在过去14 年出版了18 本受欢迎的书籍,主要是关于Oracle数据库管理和Oracle Weblogic Server 方面的。Sam 也是《现代Linux 管理》(O’Reilly,2017)一书的作者。Sam 多年来在配置、体系结构和管理Hadoop 性能方面的从业经历使... Sam R. Alapati 是Sabre 的首席Hadoop 管理员,公司总部位于得克萨斯州的南湖,他每天都要管理多个Hadoop 集群。作为Sabre 企业数据分析(EDA)部门所有Hadoop管理相关工作的负责人,Sam 管理并优化了与Hadoop 相关的多个关键数据科学和数据分析工作的流程。Sam 还是一名Oracle 数据库管理专家,具有丰富的关系型数据库和SQL 的相关知识,因而他能成功地完成Hadoop 相关的项目。Sam 在数据库和中间件领域取得了多项成就,包括在过去14 年出版了18 本受欢迎的书籍,主要是关于Oracle数据库管理和Oracle Weblogic Server 方面的。Sam 也是《现代Linux 管理》(O’Reilly,2017)一书的作者。Sam 多年来在配置、体系结构和管理Hadoop 性能方面的从业经历使他认识到,许多Hadoop 管理员和开发人员都希望有一个方便的指南,比如本书,以便在创建、管理、保护和优化Hadoop 基础架构时参考。

目录:
第1章 Hadoop与Hadoop环境介绍 3
第2章 Hadoop架构介绍 31
第3章 创建和配置一个简单的Hadoop集群 55
第4章 规划和创建一个完全分布式集群 87
第5章 在集群上运行一个应用—MapReduce框架和Hive、Pig 125
第6章 集群上的应用—Spark框架介绍 143
第7章 运行Spark应用程序 163
第8章 NameNode的作用和HDFS的工作原理 199
第9章 HDFS命令、HDFS权限和HDFS存储 235
第10章 数据保护、文件格式和访问HDFS 269
第11章 NameNode操作、高可用性和联合 307
第12章 将数据导入和导出Hadoop 343
第13章 Hadoop集群中的资源分配 395
第14章 使用Oozie管理作业工作流 425
第15章 Hadoop安全 463
第16章 管理作业、使用Hue和执行常规任务 513
第17章 监控、指标和Hadoop日志 553
第18章 调优集群资源,优化MapReduce作业和基准测试 595
第19章 在YARN上配置和调优Apache Spark 641
第20章 优化Spark应用程序 673
第21章 Hadoop故障排除—样例 705

点击下载