随着移动互联网和物联网时代的来临,人和万事万物被广泛地联系在一起。人们在联系的过程产生了大量的数据,例如用户基础信息、网页浏览记录、历史消费记录、视频监控影像,等等。据此,以Google 为首的互联网公司提出了“大数据”(Big Data)的概念,并声称人类已经脱离了信息时代(Information Time,IT),了大数据时代(Data Time,DT)。显然,海量数据包含了非常丰富的浅层次信息和深层次知识。对于同一竞争领域的企业,谁能获取*量的数据,展*精准的数据挖掘与建模分析,并加以精细化的落地实施,谁便能在行业竞争中取得优势。
售 价:¥
纸质售价:¥74.80购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容简介
前言
第1章 大数据、数据挖掘与智慧运营综述
1.1 数据挖掘的发展史
1.1.1 数据挖掘的定义与起源
1.1.2 数据挖掘的早期发展
1.1.3 数据挖掘的算法前传
1.1.4 数据挖掘的第一个里程碑
1.1.5 最近十年的发展与应用
1.2 数据挖掘的主要流程与金字塔模型
1.2.1 数据挖掘的任务
1.2.2 数据挖掘的基本步骤
1.2.3 数据挖掘的架构——云计算
1.2.4 “金字塔”模型
1.3 数据挖掘对智慧运营的意义
1.3.1 “互联网+”时代的来临及其对运营商的冲击和挑战
1.3.2 大数据时代的来临及其对运营商的挑战和机遇
1.3.3 电信运营商运营发展面临的主要瓶颈
1.3.4 电信运营商发展的“三条曲线”
1.3.5 智慧运营与大数据变现
1.3.6 数据挖掘对于提升智慧运营效率的意义
1.4 大数据时代已经来临
1.4.1 大数据的定义
1.4.2 大数据的“4V”特征
1.4.3 结构化数据与非结构化数据
1.5 非结构化数据挖掘的研究进展
1.5.1 文本挖掘
1.5.2 模式识别
1.5.3 语音识别
1.5.4 视频识别
1.5.5 其他非结构化数据挖掘
1.6 数据挖掘与机器学习、深度学习、人工智能及云计算
1.6.1 机器学习
1.6.2 深度学习
1.6.3 人工智能
1.6.4 云计算
1.7 现有数据挖掘的主要分析软件与系统
1.7.1 Hadoop
1.7.2 Storm
1.7.3 Spark
1.7.4 SPASS(SPSS)
1.7.5 SAS
参考文献
第2章 数据统计与数据预处理
2.1 数据属性类型
2.1.1 数据属性定义
2.1.2 离散属性
2.1.3 连续属性
2.2 数据的统计特性
2.2.1 中心趋势度量
2.2.2 数据散布度量
2.2.3 数据相关性
2.3 数据预处理
2.3.1 数据预处理概述
2.3.2 数据预处理的主要任务
2.3.3 数据清理
2.3.4 数据集成
2.3.5 数据规约
2.3.6 数据变换和离散化
2.4 数据字段的衍生
2.4.1 数据字段的拆分
2.4.2 统计特征的构造
2.4.3 数据域的变换
2.5 SPSS软件中的数据预处理案例
2.5.1 缺失值的实操处理
2.5.2 噪声数据的实操处理
2.5.3 主成分分析的实操处理
参考文献
第3章 聚类分析
3.1 概述
3.2 聚类算法的评估
3.3 基于划分的聚类:K-means
3.3.1 基于划分的聚类算法概述
3.3.2 K-means聚类算法原理
3.3.3 K-means算法的优势与劣势
3.3.4 K-means算法优化
3.3.5 SPSS软件中的K-means算法应用案例
3.4 基于层次化的聚类:BIRCH
3.4.1 基于层次化的聚类算法概述
3.4.2 BIRCH算法的基本原理
3.4.3 BIRCH算法的优势与劣势
3.5 基于密度的聚类:DBSCAN
3.5.1 基于密度的聚类算法概述
3.5.2 DBSCAN算法的基本原理
3.5.3 DBSCAN算法的优势与劣势
3.6 基于网格的聚类:CLIQUE
3.6.1 基于网格的聚类算法概述
3.6.2 CLIQUE算法的基本原理
3.6.3 CLIQUE算法的优势与劣势
参考文献
第4章 分类分析
4.1 分类分析概述
4.2 分类分析的评估
4.3 决策树分析
4.3.1 决策树算法的基本原理
4.3.2 CHAID决策树
4.3.3 ID3决策树
4.3.4 C4.5决策树
4.3.5 CART决策树
4.3.6 决策树中的剪枝问题
4.3.7 决策树在SPSS中的应用
4.4 最近邻分析(KNN)
4.4.1 KNN算法的基本原理
4.4.2 KNN算法流程
4.4.3 KNN算法的若干问题
4.4.4 KNN分类器的特征
4.4.5 KNN算法在SPSS中的应用
4.5 贝叶斯分析
4.5.1 贝叶斯定理
4.5.2 朴素贝叶斯分类
4.5.3 贝叶斯网络
4.6 神经网络
4.6.1 感知器
4.6.2 多重人工神经网络
4.6.3 人工神经网络的特点
4.7 支持向量机
4.7.1 支持向量机简介
4.7.2 最大边缘超平面
4.7.3 数据线性可分的情况
4.7.4 数据非线性可分的情况
4.7.5 支持向量机的特征
参考文献
第5章 回归分析
5.1 回归分析概述
5.2 一元线性回归
5.2.1 一元线性回归的基本原理
5.2.2 一元线性回归性能评估
5.2.3 SPSS软件中一元线性回归应用案例
5.3 多元线性回归
5.3.1 多元线性回归基本原理
5.3.2 自变量选择方法
5.3.3 SPSS软件中的多元线性回归应用案例
5.4 非线性回归
5.4.1 非线性回归基本原理
5.4.2 幂函数回归分析
5.4.3 指数回归分析
5.4.4 对数回归分析
5.4.5 多项式回归分析
5.4.6 非线性模型线性化和曲线回归
5.5 逻辑回归
5.5.1 逻辑回归基本原理
5.5.2 二元逻辑回归
5.5.3 多元逻辑回归
5.5.4 SPSS软件中的逻辑回归应用案例
参考文献
第6章 关联分析
6.1 关联分析概述
6.2 关联分析的评估指标
6.2.1 支持度
6.2.2 置信度
6.2.3 算法复杂度
6.3 Apriori算法
6.3.1 频繁项集的定义与产生
6.3.2 先验原理
6.3.3 基于支持度的计数与剪枝
6.3.4 候选项集生成
6.3.5 基于置信度的剪枝
6.3.6 Apriori算法规则生成
6.4 FP-tree算法
6.4.1 频繁模式树
6.4.2 FP-tree算法频繁项集的产生
6.4.3 FP-tree算法规则生成
6.4.4 算法性能对比与评估
6.5 SPSS Modeler关联分析实例
参考文献
第7章 增强型数据挖掘算法
7.1 增强型数据挖掘算法概述
7.1.1 组合方法的优势
7.1.2 构建组合分类器的方法
7.2 随机森林
7.2.1 随机森林的原理
7.2.2 随机森林的优缺点
7.2.3 随机森林的泛化误差
7.2.4 输入特征的选择方法
7.3 Bagging算法
7.4 AdaBoost算法
7.4.1 AdaBoost算法简介
7.4.2 AdaBoost算法原理
7.4.3 AdaBoost算法的优缺点
7.5 提高不平衡数据的分类准确率
7.5.1 不平衡数据
7.5.2 不平衡数据的处理方法——数据层面
7.5.3 不平衡数据的处理方法——算法层面
7.6 迁移学习
7.6.1 迁移学习的基本原理
7.6.2 迁移学习的分类
7.6.3 迁移学习与数据挖掘
7.6.4 迁移学习的发展
参考文献
第8章 数据挖掘在运营商智慧运营中的应用
8.1 概述
8.2 单个业务的精准营销——合约机外呼营销
8.2.1 总结历史营销规律
8.2.2 预测潜在客户群体
8.2.3 客户群体细分
8.2.4 制定层次化、个性化精准营销方案
8.3 多种互联网业务的精准推送
8.3.1 根据历史营销规律总结单个业务的历史营销规律
8.3.2 预测潜在客户群体、预测单个业务的潜在客户群体及多个业务的联合建模
8.3.3 制定多业务层次化个性化联合精准营销方案
8.3.4 落地效果评估
8.4 套餐精准适配
8.4.1 痛点
8.4.2 挖掘潜在客户群体
8.4.3 探寻强相关字段
8.4.4 多元线性回归建模
8.4.5 制定层次化、个性化精准营销方案
8.4.6 落地效果评估与模型调优
8.5 客户保有
8.5.1 总结客户流失的历史规律
8.5.2 细分潜在流失客户群体
8.5.3 客户保有效益建模与最优决策
8.5.4 落地效果评估
8.6 投诉预警
8.6.1 客户投诉现象分析
8.6.2 挖掘潜在客户群体
8.6.3 制定个性化关怀方案
8.7 网络质量栅格化呈现
8.7.1 栅格化呈现的基本原理
8.7.2 覆盖栅格化
8.7.3 基于流量聚簇的网络优化策略
8.8 无线室内定位
8.8.1 传统室内定位方法
8.8.2 基于Wi-Fi信号的指纹定位算法
8.8.3 基于数据挖掘算法的改进定位方法
参考文献
第9章 面向未来大数据的数据挖掘与机器学习发展趋势
9.1 大数据时代数据挖掘与机器学习面临的新挑战
9.2 IEEE ICDM会议数据挖掘与机器学习的最新研究进展
9.3 “计算机奥运会”——Sort Benchmark
参考文献
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜