万本电子书0元读

万本电子书0元读

顶部广告

数据科学实战手册 R+Python电子书

本书涵盖R和Python两种主流语言,其优在于其结构,每一章的每一节内容都是按照“准备工作—处理流程—工作原理”的方式组织,这种组织形式非常适合一边实践一边学习(learn-by-doing)。

售       价:¥

纸质售价:¥40.70购买纸书

321人正在读 | 0人评论 6.2

作       者:[美]Tony Ojeda(托尼·奥杰德),Sean Patrick Murphy(肖恩·派特里克·墨菲)

出  版  社:人民邮电出版社

出版时间:2016-08-01

字       数:26.3万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
这本书是基于R和Python的数据科学项目案例集锦,内容涵盖了基于数据科学的所有要素,包括数据采集、处理、清洗、分析、建模、可视化以及数据产品的搭建。案例包含了汽车数据分析、股票市场建模、社交网络分析、推荐系统、地理信息分析,以及Python代码的计算优化。通过手把手的案例解析,令读者知其然并知其所以然。业界的数据分析师、数据挖掘工程师、数据科学家都可以读一读。想要了解实际工作中如何用数据产生价值的在校学生,或者对数据科学感兴趣的人也值得一读。<br/>【推荐语】<br/>本书涵盖R和Python两种主流语言,其优在于其结构,每一章的每一节内容都是按照“准备工作—处理流程—工作原理”的方式组织,这种组织形式非常适合一边实践一边学习(learn-by-doing)。<br/>【作者】<br/>作者简介Tony Ojeda(托尼·奥杰德),华盛顿DC数据社区的联合创始人,一位经验丰富的数据科学家和企业家,他在佛罗里达国际大学获得金融硕士学位,并且在德保罗大学获得了MBA学位。Sean Patrick Murphy(肖恩·派特里克·莫非),华盛顿DC数据社区的联合创始人,曾在约翰霍普金斯大学的应用物理实验室做了15年的高级科学家,他专注于机器学习、信号处理、高性能计算以及建模和模拟。现在他是旧金山、纽约和华盛顿DC多家公司的数据顾问。Benjamin Bengfort(本杰明·班福特),一位非常有经验的数据科学家和Python发者。他曾在军方、业界和学术界工作过8年。他目前在马里兰大学派克学院攻读计算机博士学位,研究元识别和自然语言处理。他拥有北达科塔州立大学的计算机硕士学位,并是乔治城大学的客座教授。Abhijit Dasgupta(阿布吉特·达斯古普塔),华盛顿DC数据社区的成员,华盛顿DC统计编程社群的创始人和联合组织者,他拥有华盛顿大学生物统计的博士学位,在生物制药行业咨询、商业分析、生物信息以及生物工程咨询方面拥有多年的经验。译者简介郝智恒,甘肃兰州人,南大学概率统计专业毕业,统计之都活跃会员。目前在*商业智能部任职,擅长数据分析和数据挖掘,喜欢用数据探索商业世界的边界。王佳玮,黄山脚下长大,香港城大-中科大联合培养博士毕业,现于阿里云大数据孵化器团队搬砖,喜欢数据分析和挖掘在社会各领域的应用,目前正致力于用数据和算法解决交通拥堵问题。谢时光,2011年博士毕业于美国弗吉尼亚理工大学工业工程系运筹学专业,毕业后从事数据分析、优化和决策支持相关工作至今。曾先后在安飞士(Avis)、亚马逊(Amazon.com)、费埃哲(FICO)等行业领先的公司从事从供应到风险控制等多个应用领域的数据分析和优化决策研究工作。刘梦馨,灵雀云高级软件工程师,专注于容器虚拟化领域,机器学习爱好者。<br/>
目录展开

内容提要

关于作者

关于译者和中文版审稿人

关于英文版审稿人

前言

第1章 准备你的数据科学环境

简介

理解数据科学管道

处理流程

工作原理

在Windows、Mac OS X、Linux上安装R

准备工作

处理流程

工作原理

参考资料

在R和RStudio中安装扩展包

准备工作

处理流程

工作原理

更多内容

参考资料

在Linux和Mac OS X上安装Python

准备工作

处理流程

工作原理

更多内容

参考资料

在Windows上安装Python

处理流程

工作原理

参考资料

在Mac OS X和Linux上安装Python数据分析库

准备工作

处理流程

工作原理

更多内容

参考资料

安装更多Python包

准备工作

处理流程

工作原理

更多内容

参考资料

安装和使用virtualenv

准备工作

处理流程

工作原理

更多内容

参考资料

第2章 汽车数据的可视化分析(R)

简介

获取汽车燃料效率数据

准备工作

处理流程

工作原理

为了你的第一个项目准备好R

准备工作

处理流程

工作原理

参考资料

将汽车燃料效率数据导入R

准备工作

处理流程

工作原理

更多内容

参考资料

探索和描述燃料效率数据

准备工作

处理流程

工作原理

更多内容

进一步分析汽车燃料效率数据

准备工作

处理流程

工作原理

参考资料

研究汽车的产量以及车型

准备工作

处理流程

工作原理

更多内容

参考资料

第3章 模拟美式橄榄球比赛数据(R)

简介

准备工作

获取和清洗美式橄榄球比赛数据

准备工作

处理流程

工作原理

参考资料

分析和理解美式橄榄球比赛数据

准备工作

处理流程

工作原理

更多内容

参考资料

构建度量攻防能力的指标

准备工作

处理流程

工作原理

参考资料

模拟单场由程序决定胜负的比赛

准备工作

处理流程

工作原理

模拟多场由计算决定胜负的比赛

准备工作

处理流程

工作原理

更多内容

第4章 建模分析股票市场数据(R)

简介

准备工作

获取股票市场数据

处理流程

描述数据

准备工作

工作原理

更多内容

清洗和研究数据

准备工作

处理流程

工作原理

参考资料

形成相对估值法

准备工作

处理流程

工作原理

分析历史价格筛选股票

准备工作

处理流程

工作原理

第5章 就业数据的可视化探索(R)

简介

分析前的准备

准备工作

处理流程

工作原理

参考资料

将就业数据导入R

准备工作

处理流程

工作原理

更多内容

参考资料

就业数据探究

准备条件

处理流程

工作原理

参考资料

获取和合并添加附加信息

准备工作

处理流程

工作原理

添加地理信息

准备工作

处理流程

工作原理

参考资料

获取州和县级水平的薪资和就业信息

准备工作

处理流程

工作原理

参考资料

可视化薪资的地理分布特性

准备工作

处理流程

工作原理

参考资料

探究各行业工作的地理分布情况

处理流程

工作原理

更多内容

参考资料

绘制地理空间的时间序列地图

准备工作

处理流程

工作原理

更多内容

函数性能测试和比较

准备工作

处理流程

工作原理

更多内容

参考资料

第6章 运用税务数据进行应用导向的数据分析(Python)

简介

应用导向方法简介

准备高收入数据集的分析

准备工作

处理流程

工作原理

导入并熟悉世界各国高收入数据集

准备工作

处理流程

工作原理

更多内容

参考资料

分析并可视化美国的高收入数据集

准备工作

处理流程

工作原理

进一步分析美国的高收入阶层

准备工作

处理流程

工作原理

用Jinja2汇报结果

准备工作

处理流程

工作原理

更多内容

参考资料

第7章 运用汽车数据进行可视化分析(Python)

简介

IPython入门

准备工作

处理流程

工作原理

参考资料

熟悉IPython Notebook

准备工作

处理流程

工作原理

更多内容

参考资料

准备分析汽车油耗

准备工作

处理流程

工作原理

更多内容

参考资料

用Python熟悉并描述汽车油耗数据

准备工作

处理流程

工作原理

更多内容

参考资料

用Python分析汽车油耗随时间变化趋势

准备工作

处理流程

工作原理

更多内容

参考资料

用Python调查汽车的制造商和型号

准备工作

处理流程

工作原理

参考资料

第8章 社交网络分析(Python)

简介

理解图和网络

准备用Python进行社交网络的分析工作

准备工作

处理流程

工作原理

更多内容

导入网络

准备工作

处理流程

工作原理

探索英雄网络的子图

准备工作

处理流程

工作原理

更多内容

找出强关联

准备工作

处理流程

工作原理

更多内容

找出关键人物

准备工作

处理流程

工作原理

更多内容

调查全网的特征

准备工作

处理流程

工作原理

社交网络中的聚类和发现社群

准备工作

处理流程

工作原理

更多内容

可视化图

准备工作

处理流程

工作原理

第9章 大规模电影推荐(Python)

简介

对偏好建模

处理流程

工作原理

理解数据

准备工作

处理流程

工作原理

更多内容

加载电影评分数据

准备工作

处理流程

工作原理

寻找高评分电影

准备工作

处理流程

工作原理

更多内容

参考资料

提升电影评分系统

准备工作

处理流程

工作原理

更多内容

参考资料

计算用户在偏好空间中的距离

准备工作

处理流程

工作原理

更多内容

参考资料

计算用户相关性

准备工作

处理流程

工作原理

更多内容

为特定用户寻找最好的影评人

准备工作

处理流程

工作原理

预测用户评分

准备工作

处理流程

工作原理

基于物品的协同过滤

准备工作

处理流程

工作原理

建立非负矩阵分解模型

处理流程

工作原理

参考资料

将数据集载入内存

准备工作

处理流程

工作原理

更多内容

导出SVD模型至硬盘

处理流程

工作原理

训练SVD模型

处理流程

工作原理

更多内容

测试SVD模型

处理流程

工作原理

更多内容

第10章 获取和定位Twitter数据(Python)

简介

创建Twitter应用

准备工作

处理流程

工作原理

参考资料

了解Twitter API v1.1

准备工作

处理流程

工作原理

更多内容

参考资料

获取粉丝和朋友信息

准备工作

处理流程

工作原理

更多内容

参考资料

提取Twitter用户档案

准备工作

处理流程

工作原理

更多内容

参考资料

避免Twitter速度限制

准备工作

处理流程

工作原理

存储JSON数据至硬盘

准备工作

处理流程

工作原理

安装MongoDB

准备工作

处理流程

工作原理

更多内容

参考资料

利用PyMongo将用户信息存入MongoDB

准备工作

处理流程

工作原理

探索用户地理信息

准备工作

处理流程

工作原理

更多内容

参考资料

利用Python绘制地理分布图

准备工作

处理流程

工作原理

更多内容

参考资料

第11章 利用NumPy和SciPy优化数值计算(Python)

简介

了解优化的步骤

处理流程

工作原理

更多内容

识别代码中常见性能瓶颈

处理流程

工作原理

通读代码

准备工作

处理流程

工作原理

参考资料

利用Unix time函数剖析Python代码

准备工作

处理流程

工作原理

参考资料

利用Python内建函数剖析Python代码

准备工作

处理流程

工作原理

参考资料

利用IPython%timeit函数剖析Python代码

处理流程

工作原理

利用line_profiler剖析Python代码

准备工作

处理流程

工作原理

更多内容

参考资料

摘取低处的(经过优化的)果实

准备工作

处理流程

工作原理

测试NumPy带来的性能提升

准备工作

处理流程

工作原理

更多内容

参考资料

用NumPy重写函数

准备工作

处理流程

工作原理

用NumPy优化最内层循环

准备工作

处理流程

工作原理

更多内容

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部