出版社: 中国传媒大学出版社
ISBN:9787565721601
版次:1
商品编码:12291025
包装:平装
丛书名: “十三五”规划全媒体人才培养丛书·数据科学系列
外文名称:Introduction to Big Data Technology
开本:16开
出版时间:2017-09-01
用纸:胶版纸
页数:282
字
数据分析与数据挖掘实用教程 [Introduction to Big Data Technology] epub pdf mobi txt 电子书 下载 2024
内容简介
《数据分析与数据挖掘实用教程》立足于信息爆炸时代对大数据隐藏信息探索的需求,以多年实践教学经验及不断的应用创新为基础,构建了一系列数据分析与数据挖掘的实用理论及应用体系。
《数据分析与数据挖掘实用教程》中不仅以数据挖掘技术为基础进行分章详述,章后还配以相应的实验增进对知识的吸收理解,实验部分选取了典型数据集并配以精练的实验代码,使读者在掌握基础知识的同时了解业界认可的数据挖掘软件,为读者提供了广阔的进步与深造空间。
作者简介
殷复莲,1982年5月生,2010年毕业于哈尔滨工程大学,工学博士,现任教于中国传媒大学理工学部信息工程学院数字媒体技术系,副教授。主讲大数据与数据挖掘技术等课程,荣获中国传媒大学第八届“青年教师教学基本功大赛”二等奖、中国传媒大学首届“微课大赛”三等奖。主持或主要参与国家、省部级、横向等科研项目20余项,发表学术论文50余篇,其中SCI或EI检索20余篇,获得国家发明专利8项,软件著作权3项,荣获2015年度广播影视科技创新奖突出贡献奖、2015年中国电影电视技术协会科学进步奖一等奖、中国新闻技术工作者联合会2016年学术年会新闻科技论文一等奖等。
内页插图
目录
第1章 绪论
1.1 数据和大数据
1.2 数据分析和数据挖掘
1.3 数据挖掘的基本概念
1.4 R语言
第2章 初识数据
2.1 数据类型
2.2 数据的统计特性
2.3 相似性和相异性度量
2.4 实验
第3章 初始数据获取
3.1 数据获取
3.2 信息搜索
3.3 爬虫程序基本原
3.4 网络爬虫
3.5 实验
第4章 数据预处理
4.1 为什么进行数据预处理
4.2 数据清理
4.3 数据集成
4.4 数据变换
4.5 数据归约
4.6 实验
第5章 关联分析
5.1 关联分析的基本概念
5.2 关联分析的预备知识
5.3 频繁项集的产生
5.4 规则产生
5.5 关联模式的评估
5.6 实验
第6章 回归
6.1 回归、分类和聚类的关系
6.2 回归的基本概念
6.3 线性回归
6.4 非线性回归
6.5 回归模型的评估
6.6 实验
第7章 分类
7.1 分类的基本概念
7.2 决策树分类
7.3 k-最近邻分类
7.4 贝叶斯分类
7.5 人工神经网络分类
7.6 支持向量机分类
7.7 组合方法分类
7.8 分类模型的评估
7.9 实验
第8章 聚类
8.1 聚类的基本概念
8.2 划分方法
8.3 层次方法
8.4 基于密度的方法
8.5 聚类方法的评估
8.6 实验
参考文献
前言/序言
人类的智慧使文明不断地从陈旧桎梏中破壳而出,21世纪是大数据的时代,以数字形态存储的数据中蕴藏着巨大的信息和智慧,正如人们早已对“啤酒和尿不湿”的故事耳熟能详,在如今大数据的浪潮之下,数据分析和数据挖掘技术作为大数据的核心技术基础,其理论和应用价值不言而喻。本书从实际应用的角度,深入浅出地介绍了数据分析和数据挖掘的基本概念和典型技术,以案例的形式进行讲授,并配以基于R语言的实验仿真,帮助读者了解数据挖掘的基本理论体系、掌握数据分析和数据挖掘的基本方法。本书共8章:
第1章为绪论,首先介绍了数据和大数据的基本概念,以明晰数据和大数据各自的特点,继而讲述数据分析和数据挖掘的区别,同时指明笔者非常赞同的证析的观点:“无论是数据分析还是数据挖掘,无论采用的分析手段是简单还是复杂,只要能够达到指导决策的效果就是非常优秀的方法。”第1章还重点介绍了数据挖掘的作用、标准流程和工具,最后对R语言的基本操作进行了描述。
第2章为初识数据,作为数据分析和数据挖掘的主体,本章首先对数据类型进行了定义,包括数据的定义和数据集的类型。接下来介绍了包括中心趋势度量和数据离散程度度量的数据统计特性以及数据的相似性和相异性度量。最后为读入数据与列联分析和图形显示的案例分析。
第3章为初始数据获取,本部分首先介绍数据获取的方式以及信息搜索方式,并对爬虫程序的基本原理和网络爬虫的分类进行了介绍。第3章重点介绍了简单HTML网页页面爬取、HTML网页中复杂表格爬取和非规整多页网页数据爬取的实际操作。
第4章为数据预处理,本部分在明确为什么进行数据预处理的基础上,介绍了数据清理(包括处理缺失值和处理噪声数据)、数据集成、数据变换(包括光滑、聚集、数据泛化、规范化、特征构造和数据离散化)、数据归约(包括数据立方体聚集、属性子集选择、维度归约、数值归约、离散化和概念分层)。第4章给出了数据预处理中非常重要的缺失值处理和主成分分析的案例讲解。
数据分析与数据挖掘实用教程 [Introduction to Big Data Technology] epub pdf mobi txt 电子书 下载 2024
数据分析与数据挖掘实用教程 [Introduction to Big Data Technology] 下载 epub mobi pdf txt 电子书 2024
数据分析与数据挖掘实用教程 [Introduction to Big Data Technology] mobi pdf epub txt 电子书 下载 2024
数据分析与数据挖掘实用教程 [Introduction to Big Data Technology] epub pdf mobi txt 电子书 下载 2024