当前位置: 首页 > 大数据

《大数据Hive离线计算开发实战》杨力 pdf电子书[68MB]

  • 大数据
  • 更新时间:2024-11-27 09:14:08
简介《大数据Hive离线计算开发实战》是由杨力编著,本书从数据处理平台数据库和数据仓库入手,帮助读者逐步搭建大数据Hive数据仓库平台,并介绍了这种传统数据分析方法在大数据平台成功应用的典型案例。本书通过对Hive数据定义语言、Hive数据操纵语言、H...
《大数据Hive离线计算开发实战》pdf电子书下载
《大数据Hive离线计算开发实战》pdf百度网盘
《大数据Hive离线计算开发实战》pdf百度网盘
《大数据Hive离线计算开发实战》pdf百度网盘
《大数据Hive离线计算开发实战》pdf百度网盘

 

本书从数据处理平台数据库和数据仓库入手,帮助读者逐步搭建大数据Hive数据仓库平台,并介绍了这种传统数据分析方法在大数据平台成功应用的典型案例。本书通过对Hive数据定义语言、Hive数据操纵语言、Hive数据基本查询、Hive数据复杂查询的详细介绍,全面阐述了Hive大数据平台工具的应用与开发。另外,还介绍了Hive数据库对象、用户自定义函数以及Azkaban工作流作业调度器,帮助读者掌握Hive平台的强大功能和特性。最后,通过电商推荐系统、汽车销售数据分析系统以及微博数据分析系统3个实战开发项目案例,让读者对Hive大数据平台数据仓库工具的实战应用有更深的理解。


作者简介:
杨力,原北大青鸟学术部经理兼教学总监,中信国安创客霸王课特聘高级讲师,现任北京兄弟连IT教育大数据专家级讲师,一直从事大数据方向,是大数据领域专家,资深顾问,致力于大数据技术的推广与普及,拥有Apache Hadoop、Oracle OCM等多项产品的技术认证证书。曾创立国内**大数据校企合作大数据实验室平台,现已推广至全国高校,助力高校大数据学科的建设和研究,对国内大中型企业的信息系统设计与实施有丰富的实践经验。曾在一线任职新奥集团大数据平台首席架构师,京东万象大数据平台缔造人之一,二六三网络通信反垃圾邮件系统数据平台项目经理、中信银行网银数据平台技术经理等要职。

目录:
第1章 数据仓库基础 1
1.1 数据处理平台 1
1.2 数据库 2
1.3 关系型数据库 2
1.4 数据仓库 7
1.5 数据仓库设计理念 9
1.6 数据库与数据仓库的不同 10
1.7 本章总结 11
1.8 本章习题 11
第2章 Hive安装部署 12
2.1 Hive基本概念 12
2.2 Hive安装部署 14
2.3 安装配置MySQL 16
2.4 配置启动Hive 22
2.5 Hive常用内部命令 26
2.6 Hive数据类型 27
2.7 本章总结 36
2.8 本章习题 36
第3章 Hive数据定义与操作 37
3.1 HiveQL数据定义语言 37
3.2 HiveQL数据操作 53
3.3 本章总结 56
3.4 本章习题 57
第4章 HiveQL数据查询基础 58
4.1 HiveQL数据查询语句 58
4.2 HiveQL连接查询语句 64
4.3 本章总结 70
4.4 本章习题 70
第5章 HiveQL数据查询进阶 71
5.1 Hive内置函数 71
5.2 Hive构建搜索引擎日志数据分析系统 79
5.3 Sqoop应用与开发 88
5.4 本章总结 96
5.5 本章习题 96
第6章 Hive数据库对象与用户自定义函数 97
6.1 Hive视图 97
6.2 Hive分桶表 100
6.3 Hive用户自定义函数 102
6.4 Hive用户自定义聚合函数 105
6.5 本章总结 108
6.6 本章习题 108
第7章 Azkaban任务调度器 109
7.1 Azkaban简介 109
7.2 Azkaban安装部署 112
7.3 Hadoop作业的设置与书写 119
7.4 Hive作业的设置与书写 128
7.5 本章总结 130
7.6 本章习题 131
第8章 电商推荐系统开发实战 132
8.1 构建数据仓库 132
8.2 数据清洗 139
8.3 推荐算法实现 144
8.4 数据ETL 152
8.5 本章总结 155
8.6 本章习题 156
第9章 汽车销售数据分析系统实战开发 157
9.1 数据概况 157
9.2 项目实战 158
9.3 本章总结 169
9.4 本章习题 169
第10章 新浪微博数据分析系统实战开发 170
10.1 数据概况 170
10.2 项目实战 172
10.3 本章总结 184
10.4 本章习题 184

点击下载