万本电子书0元读

万本电子书0元读

顶部广告

IBM SPSS Modeler 18.0数据挖掘权威指南电子书

联袂推荐 暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞,广东省环保厅环境咨询专家委员会专家、广东柯内特环境科技有限公司总经理朱斌 本书特色 内容全面:涉及数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署、性能优化、数据挖掘方法论等诸多内容;

售       价:¥

纸质售价:¥73.90购买纸书

168人正在读 | 2人评论 6.2

作       者:张浩彬 周伟珠

出  版  社:人民邮电出版社有限公司

出版时间:2019-04-01

字       数:21.5万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(3条)
  • 读书简介
  • 目录
  • 累计评论(3条)
本书是一本以数据挖掘应用为主导,以SPSS Modeler为实践框架的应用指南,内容涵盖数据挖掘方法论、数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署以及性能优化等,力求帮助读者全面掌握数据挖掘项目的主要内容以及实践细节。 除了操作层面,本书也尽可能地把专业晦涩的数据挖掘知识及商业应用内容以通俗易懂的方式传递给读者,同时所有场景会结合IBM SPSS工具行实现并提供样例学习,方便读者在学习的同时加深巩固和理解。 如果你是在校学生、刚刚从事数据分析的大学毕业生、数据分析爱好者、市场营销人员、产品运营人员或者数据分析师,如果你希望提升自己的数据挖掘技术,那么就适合阅读本书。<br/>【推荐语】<br/>联袂推荐 暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞,广东省环保厅环境咨询专家委员会专家、广东柯内特环境科技有限公司总经理朱斌 本书特色 内容全面:涉及数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署、性能优化、数据挖掘方法论等诸多内容; 讲解透彻:既有理论的讲解,又涵盖应用的实践,而且在工具的介绍上,尽可能包括每一个选项的内容和应用形式,力求让读者“吃透”每一章节的内容; 突出实战:集行业经验、项目实践、算法剖析、应用技巧于一身,配套提供数据文件以及数据模型文件,方便读者动手实践。<br/>【作者】<br/>张浩彬, 人称“浩彬老撕”,历任IBM华南区SPSS分析工程师,IBM大中华区认知解决方案专家,现任广东柯内特环境科技有限公司数据科学家。多年来一直从事数据分析、数据挖掘的商业应用项目,专注于人工智能的商业化技术应用,曾与人合著《数据实践之美》,独自创作《小白学数据挖掘与机器学习:SPSS Modeler案例篇》。个人微信公众号:探数寻理(wetalkdata),致力于机器学习及应用技术分享。 周伟珠, 曾在IBM华南区大数据分析部门担任售前咨询顾问,专门负责SPSS产品的推广、培训及方案咨询,熟悉SPSS Modeler、SPSS Statistics和SPSS Cooperations and deployment services产品的使用及应用场景,现任汇丰银行数据分析师。热爱写作,曾为IBM大数据技术团队微信公众号原创30多篇文章,与广大客户朋友分享SPSS数据挖掘技术及应用,并获得一致好评。近十几年一直从事数据分析工作,积累了金融、电信、零售、制造、互联网、电商、政府等多个行业的数据分析项目经验。<br/>
目录展开

内容提要

前言

本书特色

致谢

联系方式和电子资源

资源与支持

配套资源

提交勘误

与我们联系

关于异步社区和异步图书

第1章 IBM SPSS Modeler基本介绍

1.1 SPSS简介

1.2 SPSS Modeler的特点

1.3 CRISP-DM方法论

1.4 SPSS Modeler 下载与安装

1.5 SPSS Modeler的主界面及基本操作

1.5.1 主界面介绍

1.5.2 鼠标基本操作

1.6 SPSS Modeler连接服务器端

1.7 从SPSS Modeler中获取帮助

1.8 实战技巧

第2章 数据读取——源节点

2.1 数据的身份(存储类型、测量级别和角色)

2.1.1 变量的存储类型

2.1.2 变量的测量级别

2.1.3 变量的角色

2.2 数据读取

2.2.1 读取Excel文件数据

2.2.2 读取变量文件数据

2.2.3 读取SPSS(.sav)文件数据

2.2.4 读取数据库数据

2.3 实战技巧

第3章 数据整理——关于数据的基本设定与集成

3.1 字段的“类型”功能

3.2 字段的“过滤器”功能

3.3 数据集成

3.3.1 数据的记录集成:追加节点

3.3.2 数据的字段集成:合并节点

3.4 实战技巧

第4章 数据整理——关于行的处理

4.1 数据“选择”功能

4.1.1 功能介绍

4.1.2 实战技巧

4.2 使用参数及全局变量实现数据选择功能

4.2.1 参数功能

4.2.2 使用参数实例介绍

4.2.3 使用全局变量功能介绍

4.2.4 使用全局变量实例介绍

4.3 数据排序

4.4 数据区分

4.5 数据汇总

4.5.1 功能介绍

4.5.2 实战技巧

第5章 数据整理——关于列的处理

5.1 导出

5.1.1 功能介绍

5.1.2 实例介绍

5.2 填充

5.3 重新分类

5.4 匿名化

5.5 分级化

5.6 设为标志

5.6.1 功能介绍

5.6.2 实例介绍

5.7 重建

5.7.1 功能介绍

5.7.2 实例介绍

5.8 转置

5.8.1 功能介绍

5.8.2 实例介绍

5.9 历史记录

5.9.1 功能介绍

5.9.2 实例介绍

5.10 字段重排

5.11 时间间隔

5.11.1 功能介绍

5.11.2 实例介绍

5.12 自动数据准备

第6章 图形可视化——图形节点

6.1 “散点图”节点

6.1.1 散点图

6.1.2 线图

6.1.3 多重散点图

6.1.4 时间散点图

6.2 “条形图”节点

6.2.1 简单条形图

6.2.2 堆积条形图

6.3 “直方图”节点

6.3.1 直方图

6.3.2 堆积直方图

6.4 “网络”节点

6.5 “图形板”节点

6.5.1 气泡图

6.5.2 散点图矩阵

6.5.3 箱图

6.5.4 聚类箱图

6.5.5 热图

6.6 实战技巧:图形的编辑模式

第7章 描述性统计分析

7.1 描述性统计分析概述

7.2 数据审核,一键输出描述性统计分析结果

7.3 缺失值的定义、检查和处理

7.3.1 缺失值的定义和检查

7.3.2 缺失值的自动化处理

7.4 实战技巧

第8章 常用的统计检验分析

8.1 两个连续型变量的关系分析——相关分析

8.1.1 相关分析

8.1.2 相关分析实践——“Statistics”节点

8.2 两个分类型变量的关系分析——卡方检验

8.2.1 列联表与卡方检验

8.2.2 卡方检验实践——“矩阵”节点

8.3 连续型变量与分类型变量间的关系分析——t检验及卡方分析

8.3.1 两组独立样本均值比较

8.3.2 两组配对样本均值比较

8.3.3 方差分析

8.3.4 均值比较实践——“平均值”节点

8.4 实战技巧:相关分析的注意事项

第9章 回归分析

9.1 一元线性回归分析

9.2 一元线性回归实践

9.3 多元线性回归分析

9.4 多元线性回归实践

9.5 逐步回归分析

9.6 逐步回归实践

9.7 实战技巧

第10章 Logistic回归分析

10.1 Logistic回归理论概要

10.2 Logistic回归中的检验

10.2.1 方程的显著性检验

10.2.2 系数显著性检验

10.2.3 拟合优度检验

10.3 Logistic回归实践案例

10.4 实战技巧

第11章 建模前的优化及准备工作

11.1 样本管理与分区

11.1.1 数据抽样

11.1.2 数据分区

11.1.3 数据平衡

11.2 特征选择

11.3 数据变换

11.4 实战技巧:分区与平衡的顺序

第12章 RFM分析

第13章 决策树

13.1 决策树概述

13.1.1 决策树的直观理解

13.1.2 决策树的生长

13.1.3 决策树的剪枝

13.2 C5.0算法

13.2.1 C5.0算法的决策树生长

13.2.2 C5.0算法的决策树剪枝

13.2.3 代价敏感学习

13.2.4 C5.0算法实践案例

13.3 CART算法

13.3.1 CART算法的决策树生长

13.3.2 CART算法的决策树剪枝

13.3.3 先验概率

13.3.4 CART算法实践案例

13.4 实战技巧

13.4.1 生成规则集

13.4.2 跟踪规则

第14章 神经网络

14.1 感知机

14.2 多层感知机与误差反向传播算法

14.2.1 隐藏层

14.2.2 反向传播算法

14.3 神经网络实践

14.4 实战技巧:生成“报告”

第15章 集成学习算法

15.1 Bagging

15.2 Boosting

15.3 随机森林

15.4 集成学习算法实践

15.4.1 Bagging和Boosting实践

15.4.2 随机森林实践

15.4.3 各个集成学习算法的结果比较

15.5 异质集成——“整体”节点

第16章 聚类分析

16.1 聚类方法概述

16.2 聚类方法的关键:距离

16.3 K-means算法

16.3.1 K-means算法原理

16.3.2 K-means的其他注意事项

16.4 K-means聚类实践

16.5 实践技巧:使用平行图进行比较分析

第17章 KNN分类器

17.1 KNN学习方法原理

17.2 KNN分类实践

17.2.1 分类预测

17.2.2 最近邻识别

第18章 关联分析

18.1 关联分析的基本概念

18.2 关联规则的有效性指标

18.2.1 关联规则的基础评价性指标

18.2.2 关联规则的实用性指标

18.2.3 其他的关联规则评估指标

18.3 Apriori算法

18.3.1 生成频繁项集

18.3.2 生成关联规则

18.4 Apriori关联分析实践

18.5 实战技巧:导出生成的关联规则

第19章 自动建模

19.1 自动分类

19.1.1 功能介绍

19.1.2 实例介绍

19.2 自动聚类

19.2.1 功能介绍

19.2.2 实例介绍

19.3 自动数值

19.3.1 功能介绍

19.3.2 实例介绍

第20章 蒙特卡罗模拟法

20.1 模拟生成

20.1.1 功能介绍

20.1.2 实例介绍

20.2 模拟拟合

20.2.1 功能介绍

20.2.2 实例介绍

20.3 模拟求值

20.3.1 功能介绍

20.3.2 实例介绍

第21章 SPSS Modeler的集成与扩展

21.1 SPSS Modeler与R、Python集成

21.1.1 概述

21.1.2 SPSS Modeler与R的集成环境准备

21.1.3 与R的集成功能介绍

21.1.4 实例介绍

21.2 定制对话框实现与R、Python的集成

21.2.1 定制对话框简介

21.2.2 安装配置自定义节点

21.3 SPSS Modeler扩展功能

21.3.1 功能介绍

21.3.2 获取天气数据的应用分析案例

第22章 SPSS Modeler模型部署

22.1 产品架构

22.2 通过批处理任务定时运行模型

22.2.1 功能介绍

22.2.2 实例介绍

22.3 SPSS Modeler服务器安装及管理(For Linux)

22.3.1 正常维护SPSS Modeler服务器

22.3.2 SPSS Modeler 服务器如何在Linux上安装及配置

22.3.3 配置ODBC连接数据库

22.4 SPSS Modeler官方支持的数据库和Hadoop平台

第23章 性能优化

23.1 功能介绍

23.2 客户端SQL性能优化

23.3 数据库内建模

23.3.1 功能介绍

23.3.2 实例介绍

23.4 使用外部程序批量加载

累计评论(3条) 2个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部