万本电子书0元读

万本电子书0元读

顶部广告

特征工程入门与实践电子书

特征工程是数据科学和机器学习流水线上的重要一环,包括识别、清洗、构建和发掘数据的特征,为一步解释数据并行预测性分析做准备。 本书囊括了特征工程的全流程,从数据检查到可视化,再到转换和一步处理等,并给出了大量数学工具,帮助读者掌握如何将数据处理、转换成适当的形式,以便送计算机和机器学习流水线中行处理。后半部分的特征工程实践用Python作为示例语言,循序渐,通俗易懂。

售       价:¥

纸质售价:¥52.50购买纸书

183人正在读 | 0人评论 6.2

作       者:(土)锡南·厄兹代米尔(Sinan Ozdemir),迪夫娅·苏萨拉(Divya Susarla)

出  版  社:人民邮电出版社有限公司

出版时间:2019-06-01

字       数:18.0万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:此类商品不支持退换货,不支持下载打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书将带你了解特征工程的完整过程,使机器学习更加系统、高效。你会从理解数据始学习,机器学习模型的成功正是取决于如何利用不同类型的特征,例如连续特征、分类特征等。你将了解何时纳一项特征、何时忽略一项特征,以及其中的原因。你还会学习如何将问题陈述转换为有用的新特征,如何提供由商业需求和数学见解驱动的特征,以及如何在自己的机器上行机器学习,从而自动学习数据中的特征。 本书将带你了解特征工程的完整过程,使机器学习更加系统、高效。你会从理解数据始学习,机器学习模型的成功正是取决于如何利用不同类型的特征,例如连续特征、分类特征等。你将了解何时纳一项特征、何时忽略一项特征,以及其中的原因。你还会学习如何将问题陈述转换为有用的新特征,如何提供由商业需求和数学见解驱动的特征,以及如何在自己的机器上行机器学习,从而自动学习数据中的特征。
【推荐语】
特征工程是数据科学和机器学习流水线上的重要一环,包括识别、清洗、构建和发掘数据的特征,为一步解释数据并行预测性分析做准备。 本书囊括了特征工程的全流程,从数据检查到可视化,再到转换和一步处理等,并给出了大量数学工具,帮助读者掌握如何将数据处理、转换成适当的形式,以便送计算机和机器学习流水线中行处理。后半部分的特征工程实践用Python作为示例语言,循序渐,通俗易懂。 - 识别和利用不同类型的特征 - 清洗数据中的特征,提升预测能力 - 为何、如何行特征选择和模型误差分析 - 利用领域知识构建新特征 - 基于数学知识交付特征 - 使用机器学习算法构建特征 - 掌握特征工程与特征优化 - 在现实应用中利用特征工程
【作者】
锡南·厄兹代米尔(Sinan Ozdemir) 数据科学家、数学家、约翰·霍普金斯大学讲师,Kylie.ai公司联合创始人、CTO,在应用数据挖掘、功能分析和算法发做出基于数据和知识的决策方面拥有丰富的经验。 迪夫娅·苏萨拉(Divya Susarla) 在利用数据方面经验丰富,在包括投资管理、社会企业咨询和红9营销的各个产业和领域里实现并应用过相应的策略。Kylie.ai公司产品经理,目前专注于自然语言处理和生成技术。
目录展开

版权声明

前言

第 1 章 特征工程简介

1.1 激动人心的例子:AI驱动的聊天

1.2 特征工程的重要性

1.3 特征工程是什么

1.4 机器学习算法和特征工程的评估

1.5 特征理解:我的数据集里有什么

1.6 特征增强:清洗数据

1.7 特征选择:对坏属性说不

1.8 特征构建:能生成新特征吗

1.9 特征转换:数学显神通

1.10 特征学习:以AI促AI

1.11 小结

第 2 章 特征理解:我的数据集里有什么

2.1 数据结构的有无

2.2 定量数据和定性数据

2.3 数据的4个等级

2.4 数据等级总结

2.5 小结

第 3 章 特征增强:清洗数据

3.1 识别数据中的缺失值

3.2 处理数据集中的缺失值

3.3 标准化和归一化

3.4 小结

第 4 章 特征构建:我能生成新特征吗

4.1 检查数据集

4.2 填充分类特征

4.3 编码分类变量

4.4 扩展数值特征

4.5 针对文本的特征构建

4.6 小结

第 5 章 特征选择:对坏属性说不

5.1 在特征工程中实现更好的性能

5.2 创建基准机器学习流水线

5.3 特征选择的类型

5.4 选用正确的特征选择方法

5.5 小结

第 6 章 特征转换:数学显神通

6.1 维度缩减:特征转换、特征选择与特征构建

6.2 主成分分析

6.3 线性判别分析

6.4 LDA与PCA:使用鸢尾花数据集

6.5 小结

第 7 章 特征学习:以AI促AI

7.1 数据的参数假设

7.2 受限玻尔兹曼机

7.3 伯努利受限玻尔兹曼机

7.4 在机器学习流水线中应用RBM

7.5 学习文本特征:词向量

7.6 小结

第 8 章 案例分析

8.1 案例1:面部识别

8.2 案例2:预测酒店评论数据的主题

8.3 小结

看完了

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部