当前位置：首页 > 大数据

大数据互联网大规模数据挖掘与分布式处理第2版PDF电子书 [34MB]

大数据
更新时间：2021-03-21 22:19:12

简介大数据互联网大规模数据挖掘与分布式处理第2版中文版怎么样? 本书由斯坦福大学“Web 挖掘”课程的内容总结而成，主要关注极大规模数据的挖掘。主要内容包括分布式文件系统、相似性搜索、...

大数据互联网大规模数据挖掘与分布式处理第2版中文版怎么样?最新电子版百度云下载

本书由斯坦福大学“Web 挖掘”课程的内容总结而成，主要关注极大规模数据的挖掘。主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统、社会网络图挖掘和大规模机器学习等。其中每一章节有对应的习题，以巩固所讲解的内容。读者更可以从网上获取相关拓展材料。

作者简介:
Jure Leskovec 斯坦福大学计算机科学系助理教授，研究方向是大型社交和信息网络的数据挖掘。他的研究成果获得了很多奖项，如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship，还获得了很多最佳论文奖，同时也被《纽约时报》《华尔街日报》《华盛顿邮报》《麻省理工科技评论》《连线》、NBC、BBC等流行的社会媒体刊载。他还创建了斯坦福网络分析平台（SNAP，http://snap.stanford.edu）。Twitter账号是@jure。 Anand Rajaraman 数据库和Web技术领域权威，创业投资基金Cambrian联合创始人，斯坦福大学计算机科学系助理教授。Rajaraman的职业生涯非常成功：1996年... Jure Leskovec 斯坦福大学计算机科学系助理教授，研究方向是大型社交和信息网络的数据挖掘。他的研究成果获得了很多奖项，如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship，还获得了很多最佳论文奖，同时也被《纽约时报》《华尔街日报》《华盛顿邮报》《麻省理工科技评论》《连线》、NBC、BBC等流行的社会媒体刊载。他还创建了斯坦福网络分析平台（SNAP，http://snap.stanford.edu）。Twitter账号是@jure。 Anand Rajaraman 数据库和Web技术领域权威，创业投资基金Cambrian联合创始人，斯坦福大学计算机科学系助理教授。Rajaraman的职业生涯非常成功：1996年创办Junglee公司，两年后被亚马逊以2.5亿美元收购，Rajaraman被聘为亚马逊技术总监，推动亚马逊从一个零售商转型为零售平台；2000年与人合创Cambrian，孵化出几个后来被谷歌收购的公司；2005年创办Kosmix公司并任CEO，该公司于2011年被沃尔玛集团收购，Rajaraman被聘为沃尔玛负责全球电子商务业务的高级副总裁。Rajaraman生于印度，在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。Twitter账号是@anand_raj。 Jeffrey David Ullman 美国国家工程院院士，计算机科学家。早年在贝尔实验室工作，之后任教于普林斯顿大学，十年后加入斯坦福大学直至退休，一生的科研、著书和育人成果卓著。他是ACM会员，曾获SIGMOD创新奖、高德纳奖、冯诺依曼奖等多项科研大奖；他是“龙书”《编译原理》、数据库名著《数据库系统实现》等多部经典著作的合著者；麾下多名学生成为了数据库领域的专家，其中最有名的当属谷歌创始人Sergey Brin；本书第二作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。

目录:
第1章数据挖掘基本概念　　1
第2章 MapReduce及新软件栈　　16
第3章相似项发现　　55
第4章数据流挖掘　　100
第5章链接分析　　126
第6章频繁项集　　157
第7章聚类　　187
第8章 Web广告　　218
第9章推荐系统　　238
第10章社会网络图挖掘　　265
第11章降维处理　　312
第12章大规模机器学习　　338

点击下载

分布式

上一篇：大数据Spark企业级实战版PDF电子书 [115MB]

下一篇： ELK Stack权威指南PDF电子书 [46MB]

大数据互联网大规模数据挖掘与分布式处理第2版PDF电子书 [34MB]

大数据互联网大规模数据挖掘与分布式处理第2版中文版怎么样?最新电子版百度云下载

云计算那些事儿：从IaaS到PaaS进阶 pdf电子书[155MB]

《云计算（典藏版）》刘鹏 pdf电子书[320MB]

《华为云计算实战指南》何坤源 pdf电子书[74MB]

《Scala并发编程（第2版）》王文涛 pdf电子书[6MB]

《Flink大数据分析实战》张伟洋 pdf电子书[43MB]

《大数据Hive离线计算开发实战》杨力 pdf电子书[68MB]

数据可视化分析：Tableau原理与实践 pdf电子书[210MB]

《实战大数据(Hadoop+Spark+Flink) 从平台构建到交互式数据分析》杨俊 pdf电子书[117MB]

深入理解Kafka：核心设计与实践原理PDF电子书 [83MB]

华为数据之道 PDF电子书 [48MB]

Hadoop权威指南大数据的存储与分析-第4版PDF电子书 [185MB]

凤凰架构：构建可靠的大型分布式系统 PDF电子书 [6MB]

大数据处理框架Apache Spark设计与实现（全彩） PDF电子书 [43MB]

OpenStack设计与实现（第3版） PDF电子书 [221MB]

大数据平台架构与原型实现：数据中台建设实战 PDF电子书 [53MB]

Flink入门与实战 PDF电子书 [95MB]