大数据项目管理:从规划到实现pdf百度网盘下载地址?
许多公司会在大数据项目的实施细节上下很多功夫,例如研究分布式处理引擎和数据分析算法。这并没有错,但不要因为一棵树而错过整片森林。本书将为你打开更广阔的视野,展示如何从大数据项目的规划阶段开始,一步步走向成功。无论是首席信息官、首席技术官、项目经理,还是架构师和开发人员,都能通过本书得到启迪。
- 开始规划:思考大数据项目的主要类型
- 评估和选择数据管理解决方案
- 降低与技术、团队、需求相关的风险
- 探索良好的接口设计模式
- 为项目选择合适的分布式存储系统
- 规划和实施元数据收集
- 使用数据管道确保数据完整性
- 根据并行处理引擎的特征评估处理框架
作者简介:
作者简介: 特德·马拉斯卡(Ted Malaska) Capital One的企业架构主管,曾在暴雪娱乐公司担任全球视野工程总监,负责为《魔兽世界》《守望先锋》《炉石传说》等游戏提供支持。他为众多开源项目贡献过代码,并与塞德曼等人合著有《Hadoop应用架构》。 乔纳森·塞德曼(Jonathan Seidman) Cloudera云计算团队的软件工程师。在加入Cloudera之前,他是Orbitz Worldwide大数据团队的技术负责人,负责为一个流量巨大的网站管理Hadoop集群。塞德曼与马拉斯卡等人合著有《Hadoop应用架构》。 译者简介: 薛命灯 InfoQ高级社区编辑,毕业于厦门大学软件学院,拥有十余年软件开发和架构经验,曾在多家大型软件公司任职,另译有《Kafka权威指南》等技术图书。
目录:
第1章 数据项目的主要类型及考虑因素 1
第2章 评估和选择数据管理解决方案 25
第3章 数据项目的风险管理 41
第4章 接口设计 57
第5章 分布式存储系统 75
第6章 企业元数据 101
第7章 确保数据完整性 117
第8章 数据处理 127
点击下载