万本电子书0元读

万本电子书0元读

顶部广告

R数据挖掘实战电子书

通过本书的学习,读者能够: ·掌握数据挖掘的相关软件包,如dplyr、ggplot2等。 ·学会如何通过数据挖掘标准流程(CRISP-DM)来有效地组织数据挖掘项目。 ·对数据执行数据清理和数据验证操作—为数据挖掘活动准备数据。 ·以数值方式和图形方式分别执行探索性数据分析。 ·发简单线性回归模型、多元线性回归模型以及逻辑回归模型。 ·应用基本的集成学习技术整合不同数据挖掘模型的结果。

售       价:¥

纸质售价:¥78.80购买纸书

2人正在读 | 0人评论 6.8

作       者:安德烈亚·奇里洛(Andrea Cirillo) 著

出  版  社:人民邮电出版社有限公司

出版时间:2024-05-01

字       数:24.6万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书通过循序渐的介绍,让读者借助基础以及先的数据挖掘技术,帮助一个虚拟的商业公司解决对其造成负面影响的真实欺诈案例。通过全程参与这一极不寻常的数据挖掘案例,读者将会掌握数据挖掘方面的强大技能。 本书非常适合想通过R语言快速了解数据挖掘、预测分析、商业分析等领域的数据科学家和数据分析员阅读,也适合高等院校数据挖掘相关专业师生和对数据挖掘感兴趣的技术人员参考。<br/>【推荐语】<br/>通过本书的学习,读者能够: ·掌握数据挖掘的相关软件包,如dplyr、ggplot2等。 ·学会如何通过数据挖掘标准流程(CRISP-DM)来有效地组织数据挖掘项目。 ·对数据执行数据清理和数据验证操作—为数据挖掘活动准备数据。 ·以数值方式和图形方式分别执行探索性数据分析。 ·发简单线性回归模型、多元线性回归模型以及逻辑回归模型。 ·应用基本的集成学习技术整合不同数据挖掘模型的结果。 ·对非结构化的PDF文件和文本数据执行文本挖掘及分析。 ·编制有效传达数据分析目标、方法和洞察的报告。<br/>【作者】<br/>[意]安德烈亚·奇里洛(Andrea Cirillo):目前就职于意大利联合圣保罗银行(Intesa Sanpaolo Banking Group),担任审计量化分析师一职。在此之前,他曾在德勤会计师事务所(Deloitte Touche Tohmatsu)从事财务和外部审计相关工作,以及在 FNM(一家意大利上市公司)从事内部审计相关工作。他目前的主要工作职责涉及信用风险管理模型的评估及改—主要围绕巴塞尔协议Ⅲ这一领域。他与弗朗西丝卡(Francesca)结婚,并共同养育四个子女,他们的名字名别是:托马索(Tommaso)、吉安娜(Gianna)、扎卡里亚(Zaccaria)和菲利波(Filippo)。安德里亚(Andrea)曾编写并供稿一些有用的 R语言软件包,包括 updateR、ramazon 和 paletteR,此外,他会定期地分享一些关于 R 语言编程的深刻见解和教程。他的研究工作主要聚焦于通过建模定制算法以及发交互式应用程序,实现 R 语言在风险管理和欺诈检测领域中的应用。<br/>
目录展开

版权声明

内容提要

作者简介

审稿人简介

前 言

第1章 为何选择R语言

1.1 什么是R语言

1.2 R语言的发展历史

1.3 R语言的优势

1.4 安装R语言和编写R语言代码

1.5 R语言的基本概念

1.6 R语言的劣势以及如何克服这些劣势

1.7 更多参考

1.8 小结

第2章 数据挖掘入门——银行账户数据分析

2.1 获取并组织银行数据

2.2 使用数据透视表汇总数据

2.3 使用ggplot2程序包对数据进行可视化

2.4 更多参考

2.5 小结

第3章 数据挖掘进阶——CRISP-DM方法论

3.1 CRISP-DM方法论之数据挖掘周期

3.2 业务理解

3.3 数据理解

3.4 数据准备

3.5 建模

3.6 评估

3.7 部署

3.8 小结

第4章 保持室内整洁——数据挖掘架构

4.1 概述

4.2 数据源

4.3 数据仓库和数据库

4.4 数据挖掘引擎

4.5 用户界面

4.6 如何使用R语言创建数据挖掘架构

4.7 更多参考

4.8 小结

第5章 如何解决数据挖掘问题——数据清洗和验证

5.1 安静祥和的一天

5.2 数据清洗

5.3 更多参考

5.4 小结

第6章 观察数据——探索性数据分析

6.1 汇总EDA介绍

6.2 图形化EDA

6.3 更多参考

6.4 小结

第7章 最初的猜想——线性回归

7.1 定义数据建模策略

7.2 应用线性回归

7.3 更多参考

7.4 小结

第8章 浅谈模型性能评估

8.1 定义模型性能

8.2 衡量回归模型的性能

8.3 衡量分类问题模型的性能

8.4 区分训练数据集与测试数据集

8.5 更多参考

8.6 小结

第9章 不要放弃—继续学习 包括多元变量的回归

9.1 从简单线性回归到多元线性回归

9.2 降维

9.3 使用R语言拟合多元线性模型

9.4 更多参考

9.5 小结

第10章 关于分类模型问题的不同展望

10.1 为什么需要分类模型

10.2 逻辑回归

10.3 支持向量机

10.4 更多参考

10.5 小结

第11章 最后冲刺——随机森林和集成学习

11.1 随机森林

11.2 集成学习

11.3 在新数据上应用估计模型

11.4 结构化更加良好的预测分析方法

11.5 对预测数据应用集成学习中的多数投票技术

11.6 更多参考

11.7 小结

第12章 寻找罪魁祸首——使用R语言执行文本数据挖掘

12.1 提取PDF文件中的数据

12.2 文本情感分析

12.3 开发词云

12.4 N元模型分析

12.5 网络分析

12.6 更多参考

12.7 小结

第13章 借助R Markdown分享公司现状

13.1 富有说服力的数据挖掘报告的原则

13.2 编制R Markdown报告

13.3 在RStudio中编制R Markdown报告文档

13.4 渲染和分享R Markdown报告

13.5 更多参考

13.6 小结

第14章 结语

附录 日期、相对路径和函数处理

使用R语言处理日期

R语言中的工作目录和相对路径

条件声明

彩 图

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部