这是一套前所未见的数学书,更是一套具备极高颜值的书。姜伟生博士自谦“小镇做题家”,实际上他是国际著名金融企业的金融科技专家。很难想象一位以“术数”为业的金融家具备如此彻底的分享动机,同时,姜博士有着卓越的艺术品位和设计能力,不仅承担了这套书的精深内容,更承担了全系图书的整体设计。希望读者从枯燥的常规数学书中解脱出来,赏心悦目地慢慢走缤纷的数学宇宙。
售 价:¥
纸质售价:¥129.00购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容简介
前言
致谢
使用本书
绪论 Introduction 图解+编程+实践+数学板块融合
01 Section 01 统计
01 Landscape of Statistics and Probability 概率统计全景 公式连篇,可能是“鸢尾花书”最枯燥无味的一章
1.1 必备数学工具:一个线性代数小测验
1.2 统计描述
1.3 概率
1.4 高斯
1.5 随机
1.6 频率派
1.7 贝叶斯派
1.8 椭圆三部曲
02 Descriptive Statistics 统计描述 用图形和汇总统计量描述样本数据
2.1 统计两大工具:描述、推断
2.2 直方图:单特征数据分布
2.3 散点图:两特征数据分布
2.4 有标签数据的统计可视化
2.5 集中度:均值、质心
2.6 分散度:极差、方差、标准差
2.7 分位:四分位、百分位等
2.8 箱型图:小提琴图、分布散点图
2.9 中心距:均值、方差、偏度、峰度
2.10 多元随机变量关系:协方差矩阵、相关性系数矩阵
02 Section 02 概率
03 Classical Probability 古典概率模型 归根结底,概率就是量化的生活常识
3.1 无处不在的概率
3.2 古典概率:离散均匀概率律
3.3 回顾:杨辉三角和概率
3.4 事件之间的关系:集合运算
3.5 条件概率:给定部分信息做推断
3.6 贝叶斯定理:条件概率、边缘概率、联合概率关系
3.7 全概率定理:穷举法
3.8 独立、互斥、条件独立
04 Discrete Random Variables 离散随机变量 取值为有限个或可数无穷个,对应概率质量函数PMF
4.1 随机:天地不仁,以万物为刍狗
4.2 期望值:随机变量的可能取值加权平均
4.3 方差:随机变量离期望距离平方的平均值
4.4 累积分布函数(CDF):累加
4.5 二元离散随机变量
4.6 协方差、相关性系数
4.7 边缘概率:偏求和,相当于降维
4.8 条件概率:引入贝叶斯定理
4.9 独立性:条件概率等于边缘概率
4.10 以鸢尾花数据为例:不考虑分类标签
4.11 以鸢尾花数据为例:考虑分类标签
4.12 再谈概率1:展开、折叠
05 Discrete Distributions 离散分布 理想化的离散随机变量概率模型
5.1 概率分布:高度理想化的数学模型
5.2 离散均匀分布:不分厚薄
5.3 伯努利分布:非黑即白
5.4 二项分布:杨辉三角
5.5 多项分布:二项分布推广
5.6 泊松分布:建模随机事件的发生次数
5.7 几何分布:滴水穿石
5.8 超几何分布:不放回
06 Continuous Random Variables 连续随机变量 PDF积分得到边缘概率密度或概率值
6.1 一元连续随机变量
6.2 期望、方差和标准差
6.3 二元连续随机变量
6.4 边缘概率:二元PDF偏积分
6.5 条件概率:引入贝叶斯定理
6.6 独立性:比较条件概率和边缘概率
6.7 以鸢尾花数据为例:不考虑分类标签
6.8 以鸢尾花数据为例:考虑分类标签
07 Continuous Distributions 连续分布 分布相当于理想化假设
7.1 连续均匀分布:离散均匀分布的连续版
7.2 高斯分布:最重要的概率分布,没有之一
7.3 逻辑分布:类似高斯分布
7.4 学生t-分布:厚尾分布
7.5 对数正态分布:源自正态分布
7.6 指数分布:泊松分布的连续随机变量版
7.7 卡方分布:若干IID标准正态分布平方和
7.8 F-分布:和两个服从卡方分布的独立随机变量有关
7.9 Beta分布:概率的概率
7.10 Dirichlet分布:多元Beta分布
08 Conditional Expectation and Variance 条件概率 离散、连续随机变量的条件期望、条件方差
8.1 离散随机变量:条件期望
8.2 离散随机变量:条件方差
8.3 离散随机变量的条件期望和条件方差:以鸢尾花为例
8.4 连续随机变量:条件期望
8.5 连续随机变量:条件方差
8.6 连续随机变量:以鸢尾花为例
8.7 再谈如何分割“1”
03 Section 03 高斯
09 Univariate Gaussian Distribution 一元高斯分布 可能是应用最广泛的概率分布
9.1 一元高斯分布:期望值决定位置,标准差决定形状
9.2 累积概率密度:对应概率值
9.3 标准高斯分布:期望为0,标准差为1
9.4 68-95-99.7法则
9.5 用一元高斯分布估计概率密度
9.6 经验累积分布函数
9.7 QQ图:分位-分位图
9.8 从距离到一元高斯分布
10 Bivariate Gaussian Distribution 二元高斯分布 椭圆的影子几乎无处不在
10.1 二元高斯分布:看见椭圆
10.2 边缘分布:一元高斯分布
10.3 累积分布函数:概率值
10.4 用椭圆解剖二元高斯分布
10.5 聊聊线性相关性系数
10.6 以鸢尾花数据为例:不考虑分类标签
10.7 以鸢尾花数据为例:考虑分类标签
11 Multivariate Gaussian Distribution 多元高斯分布 几何、代数、概率统计的完美结合
11.1 矩阵角度:一元、二元、三元到多元
11.2 高斯分布:椭圆、椭球、超椭球
11.3 解剖多元高斯分布PDF
11.4 平移→旋转
11.5 平移→旋转→缩放
12 Conditional Gaussian Distributions 条件高斯分布 假设随机变量服从高斯分布,讨论条件期望、条件方差
12.1 联合概率和条件概率关系
12.2 给定X条件下,Y的条件概率:以二元高斯分布为例
12.3 给定Y条件下,X的条件概率:以二元高斯分布为例
12.4 多元正态条件分布:引入矩阵运算
13 Covariance Matrix 协方差矩阵 很多数学科学、机器学习算法的起点
13.1 计算协方差矩阵:描述数据分布
13.2 相关性系数矩阵:描述Z分数分布
13.3 特征值分解:找到旋转、缩放
13.4 SVD分解:分解数据矩阵
13.5 Cholesky分解:列向量坐标
13.6 距离:欧氏距离vs马氏距离
13.7 几何视角:超椭球、椭球、椭圆
13.8 合并协方差矩阵
04 Section 04 随机
14 Functions of Random Variables 随机变量的函数 从几何视角探讨随机变量的线性变换
14.1 随机变量的函数:以鸢尾花为例
14.2 线性变换:投影视角
14.3 单方向投影:以鸢尾花两特征为例
14.4 正交系投影:以鸢尾花两特征为例
14.5 以椭圆投影为视角看线性变换
14.6 主成分分析:换个视角看数据
15 Monte Carlo Simulation 蒙特卡洛模拟 以概率统计为基础,基于伪随机数,进行数值模拟
15.1 蒙特卡洛模拟:基于伪随机数发生器
15.2 估算平方根
15.3 估算积分
15.4 估算体积
15.5 估算圆周率
15.6 布丰投针估算圆周率
15.7 接受-拒绝抽样法
15.8 二项分布随机漫步
15.9 两个服从高斯分布的随机变量相加
15.10 产生满足特定相关性的随机数
05 Section 05 频率派
16 Frequentist Inference 频率派统计推断 参数固定,但不可知,将概率解释为反复抽样的极限频率
16.1 统计推断:两大学派
16.2 频率学派的工具
16.3 中心极限定理:渐近于正态分布
16.4 最大似然:鸡兔比例
16.5 最大似然:以估算均值、方差为例
16.6 区间估计:总体方差已知,均值估计
16.7 区间估计:总体方差未知,均值估计
16.8 区间估计:总体均值未知,方差估计
17 Probability Density Estimation 概率密度估计 核密度估计就是若干概率密度函数加权叠合
17.1 概率密度估计:从直方图说起
17.2 核密度估计:若干核函数加权叠合
17.3 带宽:决定核函数的高矮胖瘦
17.4 核函数:八种常见核函数
17.5 二元KDE:概率密度曲面
06 Section 06 贝叶斯派
18 Bayesian Classification 贝叶斯分类 最大化后验概率,利用花萼长度分类鸢尾花
18.1 贝叶斯定理:分类鸢尾花
18.2 似然概率:给定分类条件下的概率密度
18.3 先验概率:鸢尾花分类占比
18.4 联合概率:可以作为分类标准
18.5 证据因子:和分类无关
18.6 后验概率:也是分类的依据
18.7 单一特征分类:基于KDE
18.8 单一特征分类:基于高斯
19 Dive into Bayesian Classification 贝叶斯分类进阶 计算后验概率,利用花萼长度和宽度分类鸢尾花
19.1 似然概率:给定分类条件下的概率密度
19.2 联合概率:可以作为分类标准
19.3 证据因子:和分类无关
19.4 后验概率:也是分类的依据
19.5 独立:不代表条件独立
19.6 条件独立:不代表独立
20 Bayesian Inference 101 贝叶斯推断入门 参数不确定,参数对应概率分布
20.1 贝叶斯推断:更贴合人脑思维
20.2 从一元贝叶斯公式说起
20.3 走地鸡兔:比例完全不确定
20.4 走地鸡兔:很可能一半一半
20.5 走地鸡兔:更一般的情况
21 Dive into Bayesian Inference 贝叶斯推断进阶 属于同类的后验分布与先验分布叫共轭分布
21.1 除了鸡兔,农场发现了猪
21.2 走地鸡兔猪:比例完全不确定
21.3 走地鸡兔猪:很可能各1/3
21.4 走地鸡兔猪:更一般的情况
22 Fundamentals of Markov Chain Monte Carlo 马尔可夫链蒙特卡洛 使用PyMC3产生满足特定后验分布的随机数
22.1 归一化因子没有闭式解?
22.2 鸡兔比例:使用PyMC3
22.3 鸡兔猪比例:使用PyMC3
07 Section 07 椭圆
23 Mahalanobis Distance 马氏距离 一种和椭圆有关、考虑数据分布的距离度量
23.1 马氏距离:考虑数据分布的距离度量
23.2 欧氏距离:最基本的距离
23.3 标准化欧氏距离:两个视角
23.4 马氏距离:两个视角
23.5 马氏距离和卡方分布
24 Linear Regression 线性回归 以概率统计、几何、矩阵分解、优化为视角
24.1 再聊线性回归
24.2 最小二乘法
24.3 优化问题
24.4 投影视角
24.5 线性方程组:代数视角
24.6 条件概率
24.7 最大似然估计(MLE)
25 Principal Component Analysis 主成分分析 以概率统计、几何、矩阵分解、优化为视角
25.1 再聊主成分分析
25.2 原始数据
25.3 特征值分解协方差矩阵
25.4 投影
25.5 几何视角看PCA
25.6 奇异值分解
25.7 优化问题
25.8 数据还原和误差
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜