文本数据挖掘 基于R语言pdf百度网盘下载地址?
文本是一种特殊的非结构化数据,在当今的大数据时代,其价值日趋凸显。本书利用开源而强大的R软件,对文本数据挖掘的概念、技术及技巧进行了系统的介绍。本书共11章,内容包括:走进文本数据挖掘,R语言快速入门,字符串的基本处理,用好正则表达式,导入各类文本数据,对各类文本数据进行预处理,文本特征提取的4种方法,基于机器学习的文本分类方法,文本情感分析,文本可视化,文本数据挖掘项目实践。本书还提供了丰富的应用案例和程序源代码引导读者高效学习。
本书适合对文本数据挖掘感兴趣的学生、科研人员和数据科学从业者阅读。同时,本书还可以作为工具书,为需要经常进行文本数据挖掘的读者提供快速检索。
作者简介:
黄天元,复旦大学理学博士。热爱数据科学与开源工具,致力于利用数据科学迅速积累行业经验优势和科学知识发现,研究领域包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等。在CRAN上维护了3个下载量破万的R包(akc、tidyfst、tidyft),著有《R语言高效数据处理指南》一书,并设有知乎专栏“R语言数据挖掘”,关注人数9000+。
目录:
第1章 走进文本数据挖掘1
第2章 文本数据挖掘利器—R语言7
第3章 从基础做起1—字符串的基本处理51
第4章 从基础做起2—用好正则表达式59
第5章 步入正题—导入各类文本数据70
第6章 更进一步—对各类文本数据进行预处理79
第7章 上手文本数据挖掘—文本特征提取的4种方法92
第8章 文本分类—基于机器学习的方法105
第9章 深入理解文本内涵—文本情感分析142
第10章 文本数据的直观表达—文本可视化153
第11章 举一反三—文本数据挖掘项目实践170
点击下载