数据科学近年来迅速成为了热门研究领域,但很少有数据科学从业人士冒险涉足Java世界。考虑到在工程与科学的交叉地带所需的可伸缩性、稳健性以及便利性,Java其实是一门理想的语言。本书将循序渐地引导读者数据科学的工作流程,在解释数学原理的同时给出代码示例。书中解释了数据科学流程每一步背后的基本数学原理,以及如何采用Java来应用这些原理。 本书内容涉及数据输与输出、线性代数、统计学、数据操作、学习与预测,以及Hadoop MapReduce在这个过程中所扮演的关键角色。 ● 讨论获取数据、清理数据,以及以纯粹方式排列数据的众多方法 ● 理解数据应采用的矩阵结构 ● 学习测试数据来源及数据有效性的基本概念 ● 把数据转换为稳定且可用的数值 ● 理解监督型学习算法与无监督型学习算法,以及评估这些算法是否成功的方法 ● 采用适合数据科学算法的定制组件,设置和运行MapReduce任务
售 价:¥
纸质售价:¥44.20购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
版权声明
O'Reilly Media, Inc. 介绍
前言
第 1 章 数据的输入与输出
第 2 章 线性代数
第 3 章 统计学
第 4 章 数据操作
第 5 章 学习与预测
第 6 章 Hadoop MapReduce
附录 A 数据集
作者简介
关于封面
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜