万本电子书0元读

万本电子书0元读

顶部广告

数据科学之编程技术:使用R进行数据清理、分析与可视化电子书

售       价:¥

纸质售价:¥74.20购买纸书

1人正在读 | 0人评论 6.8

作       者:(美) 迈克尔·弗里曼, 乔尔·罗斯

出  版  社:机械工业出版社

出版时间:2019-11-18

字       数:17.7万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书围绕使用R行数据科学编程所需的实际步骤展,介绍了有关该主题的工具和技术的整个系统。书中共分为六大部分。第壹部分介绍了如何下载和安装书中涉及的各种软件;第二部分介绍了项目管理的基础技术,包括跟踪代码的版本并生成文档;第三部分介绍了R编程语言,它是整本书使用的主要发语言;第四部分介绍了如何在R中加载、格式化、遍历和重塑数据;第五部分介绍了数据科学中数据可视化的原则以及如何利用R构建数据可视化;第六部分介绍了如何用两种不同的方法创建交互平台来分享自己的观,以及如何拓展自己的知识。<br/>
目录展开

译者序

前言

第一部分 开始

第1章设置计算机

1.1 设置命令行工具

1.1.1 Mac上的命令行

1.1.2 Windows上的命令行

1.1.3 Linux上的命令行

1.2 安装git

1.3 创建GitHub账户

1.4 选择一个文本编辑器

1.4.1 Atom

1.4.2 Visual Studio Code

1.4.3 Sublime Text

1.5 下载R语言

1.6 下载RStudio

第2章使用命令行

2.1 访问命令行

2.2 浏览文件系统

2.2.1 改变目录

2.2.2 列出文件

2.2.3 路径

2.3 管理文件

2.3.1 学习新命令

2.3.2 通配符

2.4 错误处理

2.5 重定向输出

2.6 网络命令

第二部分 项目管理

第3章使用git和GitHub进行版本控制

3.1 什么是git

3.1.1 git的核心概念

3.1.2 什么是GitHub

3.2 配置和项目设置

3.2.1 生成一个仓库

3.2.2 检查状态

3.3 跟踪项目变更

3.3.1 添加文件

3.3.2 提交

3.3.3 审核本地git流程

3.4 在GitHub中存储项目

3.4.1 分支和克隆

3.4.2 推送和拉取

3.5 访问项目历史

3.5.1 提交历史

3.5.2 恢复早期版本

3.6 忽略项目中的文件

第4章使用Markdown制作文档

4.1 编写Markdown

4.1.1 文本格式

4.1.2 文本块

4.1.3 超链接

4.1.4 图像

4.1.5 表格

4.2 渲染Markdown

第三部分 R的基本技能

第5章R语言

5.1 用R编程

5.2 运行R代码

5.2.1 使用RStudio

5.2.2 从命令行运行R

5.3 注释

5.4 变量定义

5.4.1 基本数据类型

5.5 获取帮助

5.5.1 如何学习R

第6章函数

6.1 什么是函数

6.1.1 R函数语法

6.2 内置R函数

6.2.1 命名参数

6.3 加载函数

6.4 编写函数

6.4.1 调试函数

6.5 使用条件语句

第7章向量

7.1 什么是向量

7.1.1 创建向量

7.2 向量化操作

7.2.1 循环

7.2.2 多数为向量

7.2.3 向量化函数

7.3 向量索引

7.3.1 多索引

7.4 向量过滤

7.5 向量修改

第8章列表

8.1 什么是列表

8.2 创建列表

8.3 访问列表元素

8.4 修改列表

8.4.1 单双括号

8.5 lapply()函数

第四部分 数据清理

第9章理解数据

9.1 数据生成过程

9.2 查找数据

9.3 数据类型

9.3.1 测量尺度

9.3.2 数据结构

9.4 解释数据

9.4.1 获取领域知识

9.4.2 了解数据模式

9.5 用数据回答问题

第10章数据框

10.1 什么是数据框

10.2 使用数据框

10.2.1 创建数据框

10.2.2 数据帧的结构

10.2.3 访问数据框

10.3 使用CSV数据

10.3.1 工作目录

10.3.2 因子变量

第11章使用dplyr操作数据

11.1 操作数据语法

11.2 核心dplyr函数

11.2.1 选择

11.2.2 过滤

11.2.3 修改

11.2.4 排序

11.2.5 汇总

11.3 执行顺序操作

11.3.1 管道操作

11.4 按组分析数据框

11.5 连接数据框

11.6 dplyr实战:分析飞行数据

第12章使用tidyr重塑数据

12.1 什么是“整洁”数据

12.2 从列到行:gather()

12.3 从行到列:spread()

12.4 tidyr实战:探索教育统计

第13章访问数据库

13.1 关系数据库概述

13.1.1 什么是关系数据库

13.1.2 建立关系数据库

13.2 体验SQL

13.3 从R访问数据库

第14章访问Web API

14.1 什么是Web API

14.2 RESTful请求

14.2.1 URI(统一资源标识符)

14.2.2 HTTP动词

14.3 从R访问Web API

14.4 处理JSON数据

14.4.1 解析JSON

14.4.2 展平数据

14.5 API实战:在西雅图寻找古巴食品

第五部分 数据可视化

第15章设计数据可视化

15.1 可视化的目的

15.2 选择可视化布局

15.2.1 可视化单个变量

15.2.2 可视化多个变量

15.2.3 可视化分层数据

15.3 选择有效的图形编码

15.3.1 有效颜色

15.3.2 利用前注意属性

15.4 数据显示的表达力

15.5 强化美学

第16章使用ggplot2创建可视化

16.1 图形语法

16.2 使用ggplot2进行基本绘图

16.2.1 指定几何图形

16.2.2 美学映射

16.3 复杂的布局及定制

16.3.1 位置调整

16.3.2 标度样式

16.3.3 坐标系

16.3.4 分面

16.3.5 标签和注释

16.4 构建地图

16.4.1 分级统计(Choropleth)地图

16.4.2 点分布地图

16.5 ggplot2实战:绘制旧金山驱逐地图

第17章R中的交互式可视化

17.1 plotly包

17.2 rbokeh包

17.3 leaflet包

17.4 交互式可视化实战:展示西雅图的变化

第六部分 构建和共享应用程序

第18章使用R Markdown创建动态报告

18.1 设置报告

18.1.1 新建.Rmd文件

18.1.2 编织(Knit)文档

18.2 集成Markdown与R代码

18.2.1 R代码块

18.2.2 内联代码

18.3 在报告中渲染数据与可视化

18.3.1 渲染字符串

18.3.2 渲染Markdown列表

18.3.3 渲染表格

18.3.4 渲染绘图

18.4 以网站形式共享报告

18.5 R Markdown实战:寿命预测报告

第19章使用Shiny构建交互式Web应用程序

19.1 Shiny框架

19.1.1 Shiny核心概念

19.1.2 程序结构

19.2 设计用户界面

19.2.1 静态内容

19.2.2 动态输入

19.2.3 动态输出

19.2.4 布局

19.3 开发应用程序服务器

19.4 发布Shiny应用程序

19.5 Shiny实战:可视化警察致命射击

第20章协同工作

20.1 使用分支跟踪代码的不同版本

20.1.1 不同分支

20.1.2 合并分支

20.1.3 合并冲突

20.1.4 GitHub的合并

20.2 使用特性分支开发项目

20.3 使用集中工作流协作

20.3.1 新建一个集中仓库

20.3.2 在集中工作流中使用特性分支

20.4 使用分叉工作流协作

第21章继续学习

21.1 统计学习

21.1.1 评估关系

21.1.2 预测

21.2 其他编程语言

21.3 道德准则

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部