万本电子书0元读

万本电子书0元读

顶部广告

大数据、数据挖掘与智慧运营电子书

随着移动互联网和物联网时代的来临,人和万事万物被广泛地联系在一起。人们在联系的过程产生了大量的数据,例如用户基础信息、网页浏览记录、历史消费记录、视频监控影像,等等。据此,以Google 为首的互联网公司提出了“大数据”(Big Data)的概念,并声称人类已经脱离了信息时代(Information Time,IT),了大数据时代(Data Time,DT)。显然,海量数据包含了非常丰富的浅层次信息和深层次知识。对于同一竞争领域的企业,谁能获取*量的数据,展*精准的数据挖掘与建模分析,并加以精细化的落地实施,谁便能在行业竞争中取得优势。

售       价:¥

纸质售价:¥74.80购买纸书

234人正在读 | 3人评论 6.2

作       者:梁栋,张兆静,彭木根

出  版  社:清华大学出版社

出版时间:2017-11-01

字       数:25.9万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(3条)
  • 读书简介
  • 目录
  • 累计评论(3条)
本书系统地介绍了大数据挖掘的基本概念、经典挖掘算法、挖掘工具和企业智慧运营应用案例。 全书分为9章,内容包括:大数据挖掘与智慧运营的概念,数据预处理,数据挖掘中的四种主流算法:聚类分析、分类分析、回归分析、关联分析,增强型数据挖掘算法,数据挖掘在运营商智慧运营中的应用案例,未来大数据挖掘的发展趋势等。 全书以运用大数据挖掘方法提升企业运营业绩与效率为主线,从运营商实际工作中选取了大量运营和销售案例,详细讲述了数据采集、挖掘建模、模型落地与精准营销的全部过程。书中大部分案例的代码、软件操作流程和微课视频可以通过扫描本书封底的二维码下载。 本书主要面向运营商及其他高科技企业员工、高等院校相关专业本科生和研究生,以及其他对数据挖掘与精准营销感兴趣的读者。<br/>【推荐语】<br/>随着移动互联网和物联网时代的来临,人和万事万物被广泛地联系在一起。人们在联系的过程产生了大量的数据,例如用户基础信息、网页浏览记录、历史消费记录、视频监控影像,等等。据此,以Google 为首的互联网公司提出了“大数据”(Big Data)的概念,并声称人类已经脱离了信息时代(Information Time,IT),了大数据时代(Data Time,DT)。显然,海量数据包含了非常丰富的浅层次信息和深层次知识。对于同一竞争领域的企业,谁能获取*量的数据,展*精准的数据挖掘与建模分析,并加以精细化的落地实施,谁便能在行业竞争中取得优势。 对于运营商企业而言,其具备的一个显著优势便是手握海量数据资源。如果能运用先的数据挖掘技术找出客户的行为规律,从传统的经验式、粗放式、“一刀切”式的运营决策向数据化、精细化、个性化的运营决策转型,运营商将迎来新的腾飞。上述运营模式转型的目标,便是所谓的“智慧运营”。<br/>【作者】<br/>梁栋,博士毕业于北京邮电大学信号与系统专业,现任教于北京邮电大学,硕士研究生导师,曾主持和参加多项国家自然科学基金项目、国家863课题项目、国家973科技项目和多项省部级科研项目,主要研究方向为大数据、数据挖掘与智慧运营,所带领的研究团队在包括IEEE Internet of things Journal、IEEE International Conference on Data Mining等著名学术期刊和会议上发表高水平学术论文20多篇,并且长期与中国移动等运营商企业行科技产业化合作,在大数据、数据挖掘技术运用于企业智慧化运营方面有着丰富的落地经验。<br/>
目录展开

内容简介

前言

第1章 大数据、数据挖掘与智慧运营综述

1.1 数据挖掘的发展史

1.1.1 数据挖掘的定义与起源

1.1.2 数据挖掘的早期发展

1.1.3 数据挖掘的算法前传

1.1.4 数据挖掘的第一个里程碑

1.1.5 最近十年的发展与应用

1.2 数据挖掘的主要流程与金字塔模型

1.2.1 数据挖掘的任务

1.2.2 数据挖掘的基本步骤

1.2.3 数据挖掘的架构——云计算

1.2.4 “金字塔”模型

1.3 数据挖掘对智慧运营的意义

1.3.1 “互联网+”时代的来临及其对运营商的冲击和挑战

1.3.2 大数据时代的来临及其对运营商的挑战和机遇

1.3.3 电信运营商运营发展面临的主要瓶颈

1.3.4 电信运营商发展的“三条曲线”

1.3.5 智慧运营与大数据变现

1.3.6 数据挖掘对于提升智慧运营效率的意义

1.4 大数据时代已经来临

1.4.1 大数据的定义

1.4.2 大数据的“4V”特征

1.4.3 结构化数据与非结构化数据

1.5 非结构化数据挖掘的研究进展

1.5.1 文本挖掘

1.5.2 模式识别

1.5.3 语音识别

1.5.4 视频识别

1.5.5 其他非结构化数据挖掘

1.6 数据挖掘与机器学习、深度学习、人工智能及云计算

1.6.1 机器学习

1.6.2 深度学习

1.6.3 人工智能

1.6.4 云计算

1.7 现有数据挖掘的主要分析软件与系统

1.7.1 Hadoop

1.7.2 Storm

1.7.3 Spark

1.7.4 SPASS(SPSS)

1.7.5 SAS

参考文献

第2章 数据统计与数据预处理

2.1 数据属性类型

2.1.1 数据属性定义

2.1.2 离散属性

2.1.3 连续属性

2.2 数据的统计特性

2.2.1 中心趋势度量

2.2.2 数据散布度量

2.2.3 数据相关性

2.3 数据预处理

2.3.1 数据预处理概述

2.3.2 数据预处理的主要任务

2.3.3 数据清理

2.3.4 数据集成

2.3.5 数据规约

2.3.6 数据变换和离散化

2.4 数据字段的衍生

2.4.1 数据字段的拆分

2.4.2 统计特征的构造

2.4.3 数据域的变换

2.5 SPSS软件中的数据预处理案例

2.5.1 缺失值的实操处理

2.5.2 噪声数据的实操处理

2.5.3 主成分分析的实操处理

参考文献

第3章 聚类分析

3.1 概述

3.2 聚类算法的评估

3.3 基于划分的聚类:K-means

3.3.1 基于划分的聚类算法概述

3.3.2 K-means聚类算法原理

3.3.3 K-means算法的优势与劣势

3.3.4 K-means算法优化

3.3.5 SPSS软件中的K-means算法应用案例

3.4 基于层次化的聚类:BIRCH

3.4.1 基于层次化的聚类算法概述

3.4.2 BIRCH算法的基本原理

3.4.3 BIRCH算法的优势与劣势

3.5 基于密度的聚类:DBSCAN

3.5.1 基于密度的聚类算法概述

3.5.2 DBSCAN算法的基本原理

3.5.3 DBSCAN算法的优势与劣势

3.6 基于网格的聚类:CLIQUE

3.6.1 基于网格的聚类算法概述

3.6.2 CLIQUE算法的基本原理

3.6.3 CLIQUE算法的优势与劣势

参考文献

第4章 分类分析

4.1 分类分析概述

4.2 分类分析的评估

4.3 决策树分析

4.3.1 决策树算法的基本原理

4.3.2 CHAID决策树

4.3.3 ID3决策树

4.3.4 C4.5决策树

4.3.5 CART决策树

4.3.6 决策树中的剪枝问题

4.3.7 决策树在SPSS中的应用

4.4 最近邻分析(KNN)

4.4.1 KNN算法的基本原理

4.4.2 KNN算法流程

4.4.3 KNN算法的若干问题

4.4.4 KNN分类器的特征

4.4.5 KNN算法在SPSS中的应用

4.5 贝叶斯分析

4.5.1 贝叶斯定理

4.5.2 朴素贝叶斯分类

4.5.3 贝叶斯网络

4.6 神经网络

4.6.1 感知器

4.6.2 多重人工神经网络

4.6.3 人工神经网络的特点

4.7 支持向量机

4.7.1 支持向量机简介

4.7.2 最大边缘超平面

4.7.3 数据线性可分的情况

4.7.4 数据非线性可分的情况

4.7.5 支持向量机的特征

参考文献

第5章 回归分析

5.1 回归分析概述

5.2 一元线性回归

5.2.1 一元线性回归的基本原理

5.2.2 一元线性回归性能评估

5.2.3 SPSS软件中一元线性回归应用案例

5.3 多元线性回归

5.3.1 多元线性回归基本原理

5.3.2 自变量选择方法

5.3.3 SPSS软件中的多元线性回归应用案例

5.4 非线性回归

5.4.1 非线性回归基本原理

5.4.2 幂函数回归分析

5.4.3 指数回归分析

5.4.4 对数回归分析

5.4.5 多项式回归分析

5.4.6 非线性模型线性化和曲线回归

5.5 逻辑回归

5.5.1 逻辑回归基本原理

5.5.2 二元逻辑回归

5.5.3 多元逻辑回归

5.5.4 SPSS软件中的逻辑回归应用案例

参考文献

第6章 关联分析

6.1 关联分析概述

6.2 关联分析的评估指标

6.2.1 支持度

6.2.2 置信度

6.2.3 算法复杂度

6.3 Apriori算法

6.3.1 频繁项集的定义与产生

6.3.2 先验原理

6.3.3 基于支持度的计数与剪枝

6.3.4 候选项集生成

6.3.5 基于置信度的剪枝

6.3.6 Apriori算法规则生成

6.4 FP-tree算法

6.4.1 频繁模式树

6.4.2 FP-tree算法频繁项集的产生

6.4.3 FP-tree算法规则生成

6.4.4 算法性能对比与评估

6.5 SPSS Modeler关联分析实例

参考文献

第7章 增强型数据挖掘算法

7.1 增强型数据挖掘算法概述

7.1.1 组合方法的优势

7.1.2 构建组合分类器的方法

7.2 随机森林

7.2.1 随机森林的原理

7.2.2 随机森林的优缺点

7.2.3 随机森林的泛化误差

7.2.4 输入特征的选择方法

7.3 Bagging算法

7.4 AdaBoost算法

7.4.1 AdaBoost算法简介

7.4.2 AdaBoost算法原理

7.4.3 AdaBoost算法的优缺点

7.5 提高不平衡数据的分类准确率

7.5.1 不平衡数据

7.5.2 不平衡数据的处理方法——数据层面

7.5.3 不平衡数据的处理方法——算法层面

7.6 迁移学习

7.6.1 迁移学习的基本原理

7.6.2 迁移学习的分类

7.6.3 迁移学习与数据挖掘

7.6.4 迁移学习的发展

参考文献

第8章 数据挖掘在运营商智慧运营中的应用

8.1 概述

8.2 单个业务的精准营销——合约机外呼营销

8.2.1 总结历史营销规律

8.2.2 预测潜在客户群体

8.2.3 客户群体细分

8.2.4 制定层次化、个性化精准营销方案

8.3 多种互联网业务的精准推送

8.3.1 根据历史营销规律总结单个业务的历史营销规律

8.3.2 预测潜在客户群体、预测单个业务的潜在客户群体及多个业务的联合建模

8.3.3 制定多业务层次化个性化联合精准营销方案

8.3.4 落地效果评估

8.4 套餐精准适配

8.4.1 痛点

8.4.2 挖掘潜在客户群体

8.4.3 探寻强相关字段

8.4.4 多元线性回归建模

8.4.5 制定层次化、个性化精准营销方案

8.4.6 落地效果评估与模型调优

8.5 客户保有

8.5.1 总结客户流失的历史规律

8.5.2 细分潜在流失客户群体

8.5.3 客户保有效益建模与最优决策

8.5.4 落地效果评估

8.6 投诉预警

8.6.1 客户投诉现象分析

8.6.2 挖掘潜在客户群体

8.6.3 制定个性化关怀方案

8.7 网络质量栅格化呈现

8.7.1 栅格化呈现的基本原理

8.7.2 覆盖栅格化

8.7.3 基于流量聚簇的网络优化策略

8.8 无线室内定位

8.8.1 传统室内定位方法

8.8.2 基于Wi-Fi信号的指纹定位算法

8.8.3 基于数据挖掘算法的改进定位方法

参考文献

第9章 面向未来大数据的数据挖掘与机器学习发展趋势

9.1 大数据时代数据挖掘与机器学习面临的新挑战

9.2 IEEE ICDM会议数据挖掘与机器学习的最新研究进展

9.3 “计算机奥运会”——Sort Benchmark

参考文献

累计评论(3条) 3个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部