万本电子书0元读

万本电子书0元读

顶部广告

统计至简(概率统计全彩图解 + 微课 + Python编程)电子书

这是一套前所未见的数学书,更是一套具备极高颜值的书。姜伟生博士自谦“小镇做题家”,实际上他是国际著名金融企业的金融科技专家。很难想象一位以“术数”为业的金融家具备如此彻底的分享动机,同时,姜博士有着卓越的艺术品位和设计能力,不仅承担了这套书的精深内容,更承担了全系图书的整体设计。希望读者从枯燥的常规数学书中解脱出来,赏心悦目地慢慢走缤纷的数学宇宙。

售       价:¥

纸质售价:¥129.00购买纸书

2人正在读 | 0人评论 6.5

作       者:姜伟生

出  版  社:清华大学出版社有限公司

出版时间:2023-10-01

字       数:21.8万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
数据科学和机器学习已经深度融合到我们生活的方方面面,而数学正是启未来大门的钥匙。不是所有人生来都握有一副好牌,但是掌握“数学 编程 机器学习”的知识绝对是王牌。这一次,学习数学不再是为了考试、分数、升学,而是投资时间、自我实现、面向未来。为了让大家学数学、用数学,甚至爱上数学,在创作时,作者尽量克服传统数学教材的各种弊端,让大家学习时有兴趣、看得懂、有思考、更自信、用得着。 《统计至简:概率统计全彩图解 微课 Python编程》是“鸢尾花数学大系—从加减乘除到机器学习”丛书中数学版块—“数学三剑客”的第三册,也是最后一本。“数学”板块的第一本《数学要素》是各种数学工具的“大杂烩”,可谓数学基础;《矩阵力量》专门讲解机器学习中常用的线性代数工具;本册《统计至简》则介绍机器学习和数据分析中常用的概率统计工具。《统计至简:概率统计全彩图解 微课 Python编程》的核心是“多元统计”,离不第二册《矩阵力量》中介绍的线性代数工具。《统计至简:概率统计全彩图解 微课 Python编程》内容又可以归纳为 7 大板块——统计、概率、高斯、随机、频率派、贝叶斯派、椭圆。《统计至简:概率统计全彩图解 微课 Python编程》在讲解概率统计工具时,会穿插介绍其在数据科学和机器学习领域的应用场景,让大家学以致用。 《统计至简:概率统计全彩图解 微课 Python编程》读者群包括所有在工作中应用概率统计的朋友,尤其适用于初级程序员阶、大学本科数学窍、高级数据分析师、机器学习发者。<br/>【推荐语】<br/>这是一套前所未见的数学书,更是一套具备极高颜值的书。姜伟生博士自谦“小镇做题家”,实际上他是国际著名金融企业的金融科技专家。很难想象一位以“术数”为业的金融家具备如此彻底的分享动机,同时,姜博士有着卓越的艺术品位和设计能力,不仅承担了这套书的精深内容,更承担了全系图书的整体设计。希望读者从枯燥的常规数学书中解脱出来,赏心悦目地慢慢走缤纷的数学宇宙。<br/>【作者】<br/>姜伟生  博士 FRM。 勤奋的小镇做题家,热爱知识可视化和源分享。自2022年8月始,在GitHub上源“鸢尾花书”学习资源,截至2023年9月,已经分享4000多页PDF、4000多幅矢量图、约2000个代码文件,全球读者数以万计。<br/>
目录展开

内容简介

前言

致谢

使用本书

绪论 Introduction 图解+编程+实践+数学板块融合

01 Section 01 统计

01 Landscape of Statistics and Probability 概率统计全景 公式连篇,可能是“鸢尾花书”最枯燥无味的一章

1.1 必备数学工具:一个线性代数小测验

1.2 统计描述

1.3 概率

1.4 高斯

1.5 随机

1.6 频率派

1.7 贝叶斯派

1.8 椭圆三部曲

02 Descriptive Statistics 统计描述 用图形和汇总统计量描述样本数据

2.1 统计两大工具:描述、推断

2.2 直方图:单特征数据分布

2.3 散点图:两特征数据分布

2.4 有标签数据的统计可视化

2.5 集中度:均值、质心

2.6 分散度:极差、方差、标准差

2.7 分位:四分位、百分位等

2.8 箱型图:小提琴图、分布散点图

2.9 中心距:均值、方差、偏度、峰度

2.10 多元随机变量关系:协方差矩阵、相关性系数矩阵

02 Section 02 概率

03 Classical Probability 古典概率模型 归根结底,概率就是量化的生活常识

3.1 无处不在的概率

3.2 古典概率:离散均匀概率律

3.3 回顾:杨辉三角和概率

3.4 事件之间的关系:集合运算

3.5 条件概率:给定部分信息做推断

3.6 贝叶斯定理:条件概率、边缘概率、联合概率关系

3.7 全概率定理:穷举法

3.8 独立、互斥、条件独立

04 Discrete Random Variables 离散随机变量 取值为有限个或可数无穷个,对应概率质量函数PMF

4.1 随机:天地不仁,以万物为刍狗

4.2 期望值:随机变量的可能取值加权平均

4.3 方差:随机变量离期望距离平方的平均值

4.4 累积分布函数(CDF):累加

4.5 二元离散随机变量

4.6 协方差、相关性系数

4.7 边缘概率:偏求和,相当于降维

4.8 条件概率:引入贝叶斯定理

4.9 独立性:条件概率等于边缘概率

4.10 以鸢尾花数据为例:不考虑分类标签

4.11 以鸢尾花数据为例:考虑分类标签

4.12 再谈概率1:展开、折叠

05 Discrete Distributions 离散分布 理想化的离散随机变量概率模型

5.1 概率分布:高度理想化的数学模型

5.2 离散均匀分布:不分厚薄

5.3 伯努利分布:非黑即白

5.4 二项分布:杨辉三角

5.5 多项分布:二项分布推广

5.6 泊松分布:建模随机事件的发生次数

5.7 几何分布:滴水穿石

5.8 超几何分布:不放回

06 Continuous Random Variables 连续随机变量 PDF积分得到边缘概率密度或概率值

6.1 一元连续随机变量

6.2 期望、方差和标准差

6.3 二元连续随机变量

6.4 边缘概率:二元PDF偏积分

6.5 条件概率:引入贝叶斯定理

6.6 独立性:比较条件概率和边缘概率

6.7 以鸢尾花数据为例:不考虑分类标签

6.8 以鸢尾花数据为例:考虑分类标签

07 Continuous Distributions 连续分布 分布相当于理想化假设

7.1 连续均匀分布:离散均匀分布的连续版

7.2 高斯分布:最重要的概率分布,没有之一

7.3 逻辑分布:类似高斯分布

7.4 学生t-分布:厚尾分布

7.5 对数正态分布:源自正态分布

7.6 指数分布:泊松分布的连续随机变量版

7.7 卡方分布:若干IID标准正态分布平方和

7.8 F-分布:和两个服从卡方分布的独立随机变量有关

7.9 Beta分布:概率的概率

7.10 Dirichlet分布:多元Beta分布

08 Conditional Expectation and Variance 条件概率 离散、连续随机变量的条件期望、条件方差

8.1 离散随机变量:条件期望

8.2 离散随机变量:条件方差

8.3 离散随机变量的条件期望和条件方差:以鸢尾花为例

8.4 连续随机变量:条件期望

8.5 连续随机变量:条件方差

8.6 连续随机变量:以鸢尾花为例

8.7 再谈如何分割“1”

03 Section 03 高斯

09 Univariate Gaussian Distribution 一元高斯分布 可能是应用最广泛的概率分布

9.1 一元高斯分布:期望值决定位置,标准差决定形状

9.2 累积概率密度:对应概率值

9.3 标准高斯分布:期望为0,标准差为1

9.4 68-95-99.7法则

9.5 用一元高斯分布估计概率密度

9.6 经验累积分布函数

9.7 QQ图:分位-分位图

9.8 从距离到一元高斯分布

10 Bivariate Gaussian Distribution 二元高斯分布 椭圆的影子几乎无处不在

10.1 二元高斯分布:看见椭圆

10.2 边缘分布:一元高斯分布

10.3 累积分布函数:概率值

10.4 用椭圆解剖二元高斯分布

10.5 聊聊线性相关性系数

10.6 以鸢尾花数据为例:不考虑分类标签

10.7 以鸢尾花数据为例:考虑分类标签

11 Multivariate Gaussian Distribution 多元高斯分布 几何、代数、概率统计的完美结合

11.1 矩阵角度:一元、二元、三元到多元

11.2 高斯分布:椭圆、椭球、超椭球

11.3 解剖多元高斯分布PDF

11.4 平移→旋转

11.5 平移→旋转→缩放

12 Conditional Gaussian Distributions 条件高斯分布 假设随机变量服从高斯分布,讨论条件期望、条件方差

12.1 联合概率和条件概率关系

12.2 给定X条件下,Y的条件概率:以二元高斯分布为例

12.3 给定Y条件下,X的条件概率:以二元高斯分布为例

12.4 多元正态条件分布:引入矩阵运算

13 Covariance Matrix 协方差矩阵 很多数学科学、机器学习算法的起点

13.1 计算协方差矩阵:描述数据分布

13.2 相关性系数矩阵:描述Z分数分布

13.3 特征值分解:找到旋转、缩放

13.4 SVD分解:分解数据矩阵

13.5 Cholesky分解:列向量坐标

13.6 距离:欧氏距离vs马氏距离

13.7 几何视角:超椭球、椭球、椭圆

13.8 合并协方差矩阵

04 Section 04 随机

14 Functions of Random Variables 随机变量的函数 从几何视角探讨随机变量的线性变换

14.1 随机变量的函数:以鸢尾花为例

14.2 线性变换:投影视角

14.3 单方向投影:以鸢尾花两特征为例

14.4 正交系投影:以鸢尾花两特征为例

14.5 以椭圆投影为视角看线性变换

14.6 主成分分析:换个视角看数据

15 Monte Carlo Simulation 蒙特卡洛模拟 以概率统计为基础,基于伪随机数,进行数值模拟

15.1 蒙特卡洛模拟:基于伪随机数发生器

15.2 估算平方根

15.3 估算积分

15.4 估算体积

15.5 估算圆周率

15.6 布丰投针估算圆周率

15.7 接受-拒绝抽样法

15.8 二项分布随机漫步

15.9 两个服从高斯分布的随机变量相加

15.10 产生满足特定相关性的随机数

05 Section 05 频率派

16 Frequentist Inference 频率派统计推断 参数固定,但不可知,将概率解释为反复抽样的极限频率

16.1 统计推断:两大学派

16.2 频率学派的工具

16.3 中心极限定理:渐近于正态分布

16.4 最大似然:鸡兔比例

16.5 最大似然:以估算均值、方差为例

16.6 区间估计:总体方差已知,均值估计

16.7 区间估计:总体方差未知,均值估计

16.8 区间估计:总体均值未知,方差估计

17 Probability Density Estimation 概率密度估计 核密度估计就是若干概率密度函数加权叠合

17.1 概率密度估计:从直方图说起

17.2 核密度估计:若干核函数加权叠合

17.3 带宽:决定核函数的高矮胖瘦

17.4 核函数:八种常见核函数

17.5 二元KDE:概率密度曲面

06 Section 06 贝叶斯派

18 Bayesian Classification 贝叶斯分类 最大化后验概率,利用花萼长度分类鸢尾花

18.1 贝叶斯定理:分类鸢尾花

18.2 似然概率:给定分类条件下的概率密度

18.3 先验概率:鸢尾花分类占比

18.4 联合概率:可以作为分类标准

18.5 证据因子:和分类无关

18.6 后验概率:也是分类的依据

18.7 单一特征分类:基于KDE

18.8 单一特征分类:基于高斯

19 Dive into Bayesian Classification 贝叶斯分类进阶 计算后验概率,利用花萼长度和宽度分类鸢尾花

19.1 似然概率:给定分类条件下的概率密度

19.2 联合概率:可以作为分类标准

19.3 证据因子:和分类无关

19.4 后验概率:也是分类的依据

19.5 独立:不代表条件独立

19.6 条件独立:不代表独立

20 Bayesian Inference 101 贝叶斯推断入门 参数不确定,参数对应概率分布

20.1 贝叶斯推断:更贴合人脑思维

20.2 从一元贝叶斯公式说起

20.3 走地鸡兔:比例完全不确定

20.4 走地鸡兔:很可能一半一半

20.5 走地鸡兔:更一般的情况

21 Dive into Bayesian Inference 贝叶斯推断进阶 属于同类的后验分布与先验分布叫共轭分布

21.1 除了鸡兔,农场发现了猪

21.2 走地鸡兔猪:比例完全不确定

21.3 走地鸡兔猪:很可能各1/3

21.4 走地鸡兔猪:更一般的情况

22 Fundamentals of Markov Chain Monte Carlo 马尔可夫链蒙特卡洛 使用PyMC3产生满足特定后验分布的随机数

22.1 归一化因子没有闭式解?

22.2 鸡兔比例:使用PyMC3

22.3 鸡兔猪比例:使用PyMC3

07 Section 07 椭圆

23 Mahalanobis Distance 马氏距离 一种和椭圆有关、考虑数据分布的距离度量

23.1 马氏距离:考虑数据分布的距离度量

23.2 欧氏距离:最基本的距离

23.3 标准化欧氏距离:两个视角

23.4 马氏距离:两个视角

23.5 马氏距离和卡方分布

24 Linear Regression 线性回归 以概率统计、几何、矩阵分解、优化为视角

24.1 再聊线性回归

24.2 最小二乘法

24.3 优化问题

24.4 投影视角

24.5 线性方程组:代数视角

24.6 条件概率

24.7 最大似然估计(MLE)

25 Principal Component Analysis 主成分分析 以概率统计、几何、矩阵分解、优化为视角

25.1 再聊主成分分析

25.2 原始数据

25.3 特征值分解协方差矩阵

25.4 投影

25.5 几何视角看PCA

25.6 奇异值分解

25.7 优化问题

25.8 数据还原和误差

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部