Hadoop生态系统中文版怎么样?最新电子版百度云下载
《Hadoop生态系统》本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:核心技术,Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。数据库和数据管理,Cassandra、HBase、MongoDB和Hive。序列化,Avro、JSON和Parquet。管理和监视,Puppet、Chef、Zookeeper和Oozie。分析辅助,Pig、Mahout和MLLib。数据传输,Scoop、Flume、distcp和Storm。安全、访问控制和审计,Sentry、Kerberos和Knox。云计算和虚拟化,Serengeti、Docker和Whirr。
作者简介:
Kevin Sitto是Pivotal Software公司的领域解决方案工程师,主要为客户提供咨询服务,帮助客户理解和描述大数据需求。 Marshall Presser是Pivotal Data Engineering集团的成员。他帮助客户使用Hadoop、关系数据库和内存数据网格来解决复杂的分析问题。
目录:
第1章关键技术
第2章数据库及数据管理
第3章序列化
第4章管理与监控
第5章分析辅助
第6章数据传输
第7章安全、访问控制和审计
第8章云计算和虚拟化
点击下载