万本电子书0元读

万本电子书0元读

顶部广告

统计思维:程序员数学之概率统计(第2版)电子书

现实工作中,人们常常需要用数据说话。可是,数据自己不会说话,需要人对它行分析和挖掘才能找到有价值的信息。概率统计是数据分析的通用语言,是大数据时代预测未来的根基。如果你有编程背景,就能以概率和统计学为工具,将数据转化为有用的信息和知识,让数据说话。本书介绍了如何借助计算而非数学方法,使用Python语言对数据行统计分析。 通过书中有趣的案例,你可以学到探索性数据分析的整个过程,从数据收集和生成统计量,到发现模式和检验假设。你还将探索概率分布、概率法则、可视化技术,以及其他许多工具和概念。

售       价:¥

纸质售价:¥47.00购买纸书

767人正在读 | 0人评论 6.2

作       者:唐尼(Allen B. Downey)

出  版  社:人民邮电出版社

出版时间:2015-09-01

字       数:13.9万

所属分类: 科技 > 计算机/网络 > 计算机教材

温馨提示:此类商品不支持退换货,不支持下载打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
《统计思维:程序员数学之概率统计(第2版)》是一本以全新视角讲解概率统计的门图书。抛经典的数学分析,Downey手把手教你用编程理解统计学。 具体说来,《统计思维:程序员数学之概率统计(第2版)》通过一个案例研究,介绍探索性数据分析的全过程:从收集数据、生成统计信息,到发现模式、验证假设。同时研究分布、概率规则、可视化和其他多种工具及概念。此外,第2版新增了回归、时间序列分析、生存分析和分析方法等章节。 《统计思维:程序员数学之概率统计(第2版)》是一本以全新视角讲解概率统计的门图书。抛经典的数学分析,Downey手把手教你用编程理解统计学。 具体说来,《统计思维:程序员数学之概率统计(第2版)》通过一个案例研究,介绍探索性数据分析的全过程:从收集数据、生成统计信息,到发现模式、验证假设。同时研究分布、概率规则、可视化和其他多种工具及概念。此外,第2版新增了回归、时间序列分析、生存分析和分析方法等章节。
【推荐语】
现实工作中,人们常常需要用数据说话。可是,数据自己不会说话,需要人对它行分析和挖掘才能找到有价值的信息。概率统计是数据分析的通用语言,是大数据时代预测未来的根基。如果你有编程背景,就能以概率和统计学为工具,将数据转化为有用的信息和知识,让数据说话。本书介绍了如何借助计算而非数学方法,使用Python语言对数据行统计分析。 通过书中有趣的案例,你可以学到探索性数据分析的整个过程,从数据收集和生成统计量,到发现模式和检验假设。你还将探索概率分布、概率法则、可视化技术,以及其他许多工具和概念。 这一版内容较第1版有很多改动,并且新增了回归、时间序列分析、生存分析和分析方法章节,以丰富你的知识。 通过学习本书,你将能够: 编写测试代码深理解概率论和统计学; 运行实验检验统计行为特征,如生成服从各种分布的样本; 通过模拟理解数学上艰涩的概念; 学习贝叶斯估计等实用内容; 用Python从大部分数据源导数据,不依赖由统计工具清洗的格式化数据; 用统计推理解读现实世界中的数据。
【作者】
Allen B. Downey是富兰克林欧林工程学院计算机科学教授,曾执教于韦尔斯利学院、科尔比学院和加州大学伯克利分校。在加州大学伯克利分校获得计算机科学博士学位。Downey已出版十余本技术书,包括Think Python、Think Bayes、Think Complexity等。
目录展开

O'Reilly Media, Inc. 介绍

业界评论

前言

写作思路

本书代码

致谢

Safari® Books Online

联系我们

第1章 探索性数据分析

1.1 统计学方法

1.2 全国家庭增长调查

1.3 数据导入

1.4 DataFrame

1.5 变量

1.6 数据变换

1.7 数据验证

1.8 解释数据

1.9 练习

1.10 术语

第2章 分布

2.1 表示直方图

2.2 绘制直方图

2.3 全国家庭增长调查中的变量

2.4 离群值

2.5 第一胎

2.6 分布概述

2.7 方差

2.8 效应量

2.9 报告结果

2.10 练习

2.11 术语

第3章 概率质量函数

3.1 概率质量函数

3.2 绘制PMF

3.3 绘制PMF的其他方法

3.4 课堂规模悖论

3.5 使用DataFrame进行索引

3.6 练习

3.7 术语

第4章 累积分布函数

4.1 PMF的局限

4.2 百分位数

4.3 CDF

4.4 表示CDF

4.5 比较CDF

4.6 基于百分位数的统计量

4.7 随机数

4.8 比较百分位秩

4.9 练习

4.10 术语

第5章 分布建模

5.1 指数分布

5.2 正态分布

5.3 正态概率图

5.4 对数正态分布

5.5 Pareto分布

5.6 随机数生成

5.7 为什么使用模型

5.8 练习

5.9 术语

第6章 概率密度函数

6.1 PDF

6.2 核密度估计

6.3 分布框架

6.4 Hist实现

6.5 Pmf实现

6.6 Cdf实现

6.7 矩

6.8 偏度

6.9 练习

6.10 术语

第7章 变量之间的关系

7.1 散点图

7.2 描述关系特征

7.3 相关性

7.4 协方差

7.5 Pearson相关性

7.6 非线性关系

7.7 Spearman秩相关

7.8 相关性和因果关系

7.9 练习

7.10 术语

第8章 估计

8.1 估计游戏

8.2 猜测方差

8.3 抽样分布

8.4 抽样偏倚

8.5 指数分布

8.6 练习

8.7 术语

第9章 假设检验

9.1 经典假设检验

9.2 假设检验

9.3 检验均值差

9.4 其他检验统计量

9.5 检验相关性

9.6 检验比例

9.7 卡方检验

9.8 再谈第一胎

9.9 误差

9.10 功效

9.11 复现

9.12 练习

9.13 术语

第10章 线性最小二乘法

10.1 最小二乘法拟合

10.2 实现

10.3 残差

10.4 估计

10.5 拟合优度

10.6 检验线性模型

10.7 加权重抽样

10.8 练习

10.9 术语

第11章 回归

11.1 StatsModels

11.2 多重回归

11.3 非线性关系

11.4 数据挖掘

11.5 预测

11.6 Logistic回归

11.7 估计参数

11.8 实现

11.9 准确度

11.10 练习

11.11 术语

第12章 时间序列分析

12.1 导入和清洗数据

12.2 绘制图形

12.3 线性回归

12.4 移动平均值

12.5 缺失值

12.6 序列相关

12.7 自相关

12.8 预测

12.9 参考书目

12.10 练习

12.11 术语

第13章 生存分析

13.1 生存曲线

13.2 危险函数

13.3 估计生存曲线

13.4 Kaplan-Meier估计

13.5 婚姻曲线

13.6 估计生存函数

13.7 置信区间

13.8 群组效应

13.9 外推

13.10 预期剩余生存期

13.11 练习

13.12 术语

第14章 分析方法

14.1 正态分布

14.2 抽样分布

14.3 表示正态分布

14.4 中心极限定理

14.5 检验CLT

14.6 应用CLT

14.7 相关检验

14.8 卡方检验

14.9 讨论

14.10 练习

作者介绍

封面介绍

看完了

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部