万本电子书0元读

万本电子书0元读

顶部广告

scikit-learn机器学习(第2版)电子书

机器学习是一个非常热门的技术,本书内容涵盖多种机器学习模型,包括流行的机器学习算法,例如K近邻算法、逻辑回归、朴素贝叶斯、K 均值算法、决策树以及人工神经网络。与此同时,还讨论了数据预处理、超参数优化和集成方法等主题。 阅读完本书之后,读者将学会构建用于文档分类、图像识别、广告检测等任务的系统,还将学到如何使用scikit-learn类库的API从类别变量、文本和图像中提取特征,如何评估模型的性能,并对如何提升模型的性能建立直觉。除此之外,还将掌握在实践中运用scikit-learn构建高效模型所需的技能,并能够通过实用的策略完成高级任务。

售       价:¥

纸质售价:¥53.20购买纸书

86人正在读 | 0人评论 6.8

作       者:(美)加文·海克(Gavin Hackeling)

出  版  社:人民邮电出版社

出版时间:2019-02-01

字       数:14.9万

所属分类:

温馨提示:此类商品不支持退换货,不支持下载打印

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
近年来,Python语言成为了广受欢迎的编程语言,而它在机器学习领域也有很好的表现。scikit-learn是一个用Python语言编写的机器学习算法库,它可以实现一系列常用的机器学习算法,是一个好工具。 本书通过14章内容,详细地介绍了一系列机器学习模型和scikit-learn的使用技巧。本书从机器学习的基础理论讲起,涵盖了简单线性回归、K-近邻算法、特征提取、多元线性回归、逻辑回归、朴素贝叶斯、非线性分类、决策树回归、随机森林、感知机、支持向量机、人工神经网络、K-均值算法、主成分分析等重要话题。 本书适合机器学习领域的工程师学习,也适合想要了解scikit-learn的数据科学家阅读。通过阅读本书,读者将有效提升自己在机器学习模型的构建和评估方面的能力,并能够高效地解决机器学习难题。 近年来,Python语言成为了广受欢迎的编程语言,而它在机器学习领域也有很好的表现。scikit-learn是一个用Python语言编写的机器学习算法库,它可以实现一系列常用的机器学习算法,是一个好工具。 本书通过14章内容,详细地介绍了一系列机器学习模型和scikit-learn的使用技巧。本书从机器学习的基础理论讲起,涵盖了简单线性回归、K-近邻算法、特征提取、多元线性回归、逻辑回归、朴素贝叶斯、非线性分类、决策树回归、随机森林、感知机、支持向量机、人工神经网络、K-均值算法、主成分分析等重要话题。 本书适合机器学习领域的工程师学习,也适合想要了解scikit-learn的数据科学家阅读。通过阅读本书,读者将有效提升自己在机器学习模型的构建和评估方面的能力,并能够高效地解决机器学习难题。
【推荐语】
机器学习是一个非常热门的技术,本书内容涵盖多种机器学习模型,包括流行的机器学习算法,例如K近邻算法、逻辑回归、朴素贝叶斯、K 均值算法、决策树以及人工神经网络。与此同时,还讨论了数据预处理、超参数优化和集成方法等主题。 阅读完本书之后,读者将学会构建用于文档分类、图像识别、广告检测等任务的系统,还将学到如何使用scikit-learn类库的API从类别变量、文本和图像中提取特征,如何评估模型的性能,并对如何提升模型的性能建立直觉。除此之外,还将掌握在实践中运用scikit-learn构建高效模型所需的技能,并能够通过实用的策略完成高级任务。
【作者】
Gavin Hackeling 是一名数据科学家和作家。他研究过各种各样的机器学习问题,包括自动语音识别、文档分类、目标识别、以及语义切分。Gavin Hackeling 毕业于北卡罗来纳大学和纽约大学,目前和他的妻子和猫生活在布鲁克林。
目录展开

版权

版权声明

内容提要

作者简介

审稿人简介

前言

资源与支持

第1章 机器学习基础

1.1 定义机器学习

1.2 从经验中学习

1.3 机器学习任务

1.4 训练数据、测试数据和验证数据

1.5 偏差和方差

1.6 scikit-learn简介

1.7 安装scikit-learn

1.7.1 使用pip安装

1.7.2 在Windows系统下安装

1.7.3 在Ubuntu 16.04系统下安装

1.7.4 在Mac OS系统下安装

1.7.5 安装Anaconda

1.7.6 验证安装

1.8 安装pandas、Pillow、NLTK和matplotlib

1.9 小结

第2章 简单线性回归

2.1 简单线性回归

2.1.1 用代价函数评价模型的拟合性

2.1.2 求解简单线性回归的OLS

2.2 评价模型

2.3 小结

第3章 用K-近邻算法分类和回归

3.1 K-近邻模型

3.2 惰性学习和非参数模型

3.3 KNN模型分类

3.4 KNN模型回归

特征缩放

3.5 小结

第4章 特征提取

4.1 从类别变量中提取特征

4.2 特征标准化

4.3 从文本中提取特征

4.3.1 词袋模型

4.3.2 停用词过滤

4.3.3 词干提取和词形还原

4.3.4 tf-idf权重扩展词包

4.3.5 空间有效特征向量化与哈希技巧

4.3.6 词向量

4.4 从图像中提取特征

4.4.1 从像素强度中提取特征

4.4.2 使用卷积神经网络激活项作为特征

4.5 小结

第5章 从简单线性回归到多元线性回归

5.1 多元线性回归

5.2 多项式回归

5.3 正则化

5.4 应用线性回归

5.4.1 探索数据

5.4.2 拟合和评估模型

5.5 梯度下降法

5.6 小结

第6章 从线性回归到逻辑回归

6.1 使用逻辑回归进行二元分类

6.2 垃圾邮件过滤

6.2.1 二元分类性能指标

6.2.2 准确率

6.2.3 精准率和召回率

6.2.4 计算F1值

6.2.5 ROC AUC

6.3 使用网格搜索微调模型

6.4 多类别分类

多类别分类性能衡量指标

6.5 多标签分类和问题转换

多标签分类性能衡量指标

6.6 小结

第7章 朴素贝叶斯

7.1 贝叶斯定理

7.2 生成模型和判别模型

7.3 朴素贝叶斯

朴素贝叶斯的假设

7.4 在scikit-learn中使用朴素贝叶斯

7.5 小结

第8章 非线性分类和决策树回归

8.1 决策树

8.2 训练决策树

8.2.1 选择问题

8.2.2 基尼不纯度

8.3 使用scikit-learn类库创建决策树

决策树的优点和缺点

8.4 小结

第9章 集成方法:从决策树到随机森林

9.1 套袋法

9.2 推进法

9.3 堆叠法

9.4 小结

第10章 感知机

10.1 感知机

10.1.1 激活函数

10.1.2 感知机学习算法

10.1.3 使用感知机进行二元分类

10.1.4 使用感知机进行文档分类

10.2 感知机的局限性

10.3 小结

第11章 从感知机到支持向量机

11.1 核与核技巧

11.2 最大间隔分类和支持向量

11.3 用scikit-learn分类字符

11.3.1 手写数字分类

11.3.2 自然图片字符分类

11.4 小结

第12章 从感知机到人工神经网络

12.1 非线性决策边界

12.2 前馈人工神经网络和反馈人工神经网络

12.3 多层感知机

12.4 训练多层感知机

12.4.1 反向传播

12.4.2 训练一个多层感知机逼近XOR函数

12.4.3 训练一个多层感知机分类手写数字

12.5 小结

第13章 K-均值算法

13.1 聚类

13.2 K-均值算法

13.2.1 局部最优值

13.2.2 用肘部法选择K值

13.3 评估聚类

13.4 图像量化

13.5 通过聚类学习特征

13.6 小结

第14章 使用主成分分析降维

14.1 主成分分析

14.1.1 方差、协方差和协方差矩阵

14.1.2 特征向量和特征值

14.1.3 进行主成分分析

14.2 使用PCA对高维数据可视化

14.3 使用PCA进行面部识别

14.4 小结

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部