万本电子书0元读

万本电子书0元读

顶部广告

Python大战机器学习:数据科学家的第一个小目标电子书

时下极热门的职业是数据科学家,而不是传统的信息科学家,也不是大数据工程师。 数据科学家的技能中,机器学习和Python 应该是位列前五的两项,学习本书,实现自己的第1个小目标。 更多计算机好书请关注:电子工业出版社当当自营店

售       价:¥

纸质售价:¥51.70购买纸书

287人正在读 | 2人评论 6.2

作       者:华校专,王正林

出  版  社:电子工业出版社

出版时间:2017-02-01

字       数:265.4万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(3条)
  • 读书简介
  • 目录
  • 累计评论(3条)
数据科学家是当下炙手可热的职业,机器学习则是他们的技能,机器学习在大数据分析中居于核心的地位,在互联网、金融保险、制造业、零售业、医疗等产业领域发挥了越来越大的作用且日益受到关注。Python是又好又热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的zui佳语言。 《Python大战机器学习:数据科学家的第—个小目标》以快速上手、四分理论六分实践为出发,讲述机器学习的算法和Python编程实践,采用“原理笔记精华 算法Python实现 问题实例 实际代码 运行调参”的形式展,理论与实践结合,算法原理与编程实战并重。全书共13 章分为4篇展:第—篇:机器学习基础篇(第1~6 章),讲述机器学习的基础算法,包括线性模型、决策树、贝叶斯分类、k近邻法、数据降维、聚类和EM算法;第二篇:机器学习高级篇(第7~10章),讲述经典而常用的高级机器学习算法,包括支持向量机、人工神经网络、半监督学习和集成学习;第三篇:机器学习工程篇(第11~12章),讲述机器学习工程中的实际技术,包括数据预处理,模型评估、选择与验证等。第四篇:kaggle实战篇(第13章),讲述一个kaggle竞赛题目的实战。《Python大战机器学习:数据科学家的第—个小目标》内容丰富、深浅出,算法与代码齐头并,无论你是新手还是有经验的读者,都能快速学到你想要的。《Python大战机器学习:数据科学家的第—个小目标》可供为高等院校计算机、金融、数学、自动化及相关理工科专业的本科生或研究生使用,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。<br/>【推荐语】<br/>时下极热门的职业是数据科学家,而不是传统的信息科学家,也不是大数据工程师。 数据科学家的技能中,机器学习和Python 应该是位列前五的两项,学习本书,实现自己的第1个小目标。 更多计算机好书请关注:电子工业出版社当当自营店<br/>【作者】<br/>华校专,计算机专业硕士。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP发,并且仿照 C STL 的风格实现了各种算法(算法导论的C 实现已经放在个人的github上),目前已从部队退役,并顺利拿到了阿里的算法工程师offer。<br/>
目录展开

版权页

自序

前言

第一篇 机器学习基础篇

第1章 线性模型

1.1 概述

1.2 算法笔记精华

1.2.1 普通线性回归

1.2.2 广义线性模型

1.2.3 逻辑回归

1.2.4 线性判别分析

1.3 Python实战

1.3.1 线性回归模型

1.3.2 线性回归模型的正则化

1.3.3 逻辑回归

1.3.4 线性判别分析

第2章 决策树

2.1 概述

2.2 算法笔记精华

2.2.1 决策树原理

2.2.2 构建决策树的3个步骤

2.2.3 CART算法

2.2.4 连续值和缺失值的处理

2.3 Python实战

2.3.1 回归决策树(DecisionTreeRegressor)

2.3.2 分类决策树(DecisionTreeClassifier)

2.3.3 决策图

第3章 贝叶斯分类器

3.1 概述

3.2 算法笔记精华

3.2.1 贝叶斯定理

3.2.2 朴素贝叶斯法

3.3 Python实战

3.3.1 高斯贝叶斯分类器(GaussianNB)

3.3.2 多项式贝叶斯分类器(MultinomialNB)

3.3.3 伯努利贝叶斯分类器(BernoulliNB)

3.3.4 递增式学习partial_fit方法

第4章 k近邻法

4.1 概述

4.2 算法笔记精华

4.2.1 kNN三要素

4.2.2 k近邻算法

4.2.3 kd树

4.3 Python实践

第5章 数据降维

5.1 概述

5.2 算法笔记精华

5.2.1 维度灾难与降维

5.2.2 主成分分析(PCA)

5.2.3 SVD降维

5.2.4 核化线性(KPCA)降维

5.2.5 流形学习降维

5.2.6 多维缩放(MDS)降维

5.2.7 等度量映射(Isomap)降维

5.2.8 局部线性嵌入(LLE)

5.3 Python实战

5.4 小结

第6章 聚类和EM算法

6.1 概述

6.2 算法笔记精华

6.2.1 聚类的有效性指标

6.2.2 距离度量

6.2.3 原型聚类

6.2.4 密度聚类

6.2.5 层次聚类

6.2.6 EM算法

6.2.7 实际中的聚类要求

6.3 Python实战

6.3.1 K均值聚类(KMeans)

6.3.2 密度聚类(DBSCAN)

6.3.3 层次聚类(AgglomerativeClustering)

6.3.4 混合高斯(GaussianMixture)模型

6.4 小结

第二篇 机器学习高级篇

第7章 支持向量机

7.1 概述

7.2 算法笔记精华

7.2.1 线性可分支持向量机

7.2.2 线性支持向量机

7.2.3 非线性支持向量机

7.2.4 支持向量回归

7.2.5 SVM的优缺点

7.3 Python实战

7.3.1 线性分类SVM

7.3.2 非线性分类SVM

7.3.3 线性回归SVR

7.3.4 非线性回归SVR

第8章 人工神经网络

8.1 概述

8.2 算法笔记精华

8.2.1 感知机模型

8.2.2 感知机学习算法

8.2.3 神经网络

8.3 Python实战

8.3.1 感知机学习算法的原始形式

8.3.2 感知机学习算法的对偶形式

8.3.3 学习率与收敛速度

8.3.4 感知机与线性不可分数据集

8.3.5 多层神经网络

8.3.6 多层神经网络与线性不可分数据集

8.3.7 多层神经网络的应用

第9章 半监督学习

9.1 概述

9.2 算法笔记精华

9.2.1 生成式半监督学习方法

9.2.2 图半监督学习

9.3 Python实战

9.4 小结

第10章 集成学习

10.1 概述

10.2 算法笔记精华

10.2.1 集成学习的原理及误差

10.2.2 Boosting算法

10.2.3 AdaBoost算法

10.2.4 AdaBoost与加法模型

10.2.5 提升树

10.2.6 Bagging算法

10.2.7 误差-分歧分解

10.2.8 多样性增强

10.3 Python实战

10.3.1 AdaBoost

10.3.2 Gradient Tree Boosting

10.3.3 Random Forest

10.4 小结

第三篇 机器学习工程篇

第11章 数据预处理

11.1 概述

11.2 算法笔记精华

11.2.1 去除唯一属性

11.2.2 处理缺失值的三种方法

11.2.3 常见的缺失值补全方法

11.2.4 特征编码

11.2.5 数据标准化、正则化

11.2.6 特征选择

11.2.7 稀疏表示和字典学习

11.3 Python实践

11.3.1 二元化

11.3.2 独热码

11.3.3 标准化

11.3.4 正则化

11.3.5 过滤式特征选取

11.3.6 包裹式特征选取

11.3.7 嵌入式特征选取

11.3.8 学习器流水线(Pipeline)

11.3.9 字典学习

第12章 模型评估、选择与验证

12.1 概述

12.2 算法笔记精华

12.2.1 损失函数和风险函数

12.2.2 模型评估方法

12.2.3 模型评估

12.2.4 性能度量

12.2.5 偏差方差分解

12.3 Python实践

12.3.1 损失函数

12.3.2 数据集切分

12.3.3 性能度量

12.3.4 参数优化

第四篇 Kaggle实战篇

第13章 Kaggle牛刀小试

13.1 Kaggle简介

13.2 清洗数据

13.2.1 加载数据

13.2.2 合并数据

13.2.3 拆分数据

13.2.4 去除唯一值

13.2.5 数据类型转换

13.2.6 Data_Cleaner类

13.3 数据预处理

13.3.1 独热码编码

13.3.2 归一化处理

13.3.3 Data_Preprocesser类

13.4 学习曲线和验证曲线

13.4.1 程序说明

13.4.2 运行结果

13.5 参数优化

13.6 小结

全书符号

累计评论(3条) 3个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部