万本电子书0元读

万本电子书0元读

顶部广告

金融中的机器学习电子书

1. 本书是聚焦于金融业的现代机器学习使用指南 2. 配套代码 图片讲解帮助读者快速上手 3. 详细的理论推到和算法分析,引导读者了解机器学习的内核 4. 知识与代码示例环环相扣,理论与编程实践完美结合

售       价:¥

纸质售价:¥59.90购买纸书

94人正在读 | 0人评论 6.2

作       者:简尼斯·克拉斯(Jannes Klaas) 著

出  版  社:人民邮电出版社有限公司

出版时间:2021-07-01

字       数:27.9万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
机器学习是设计与应用算法的科学,可从数据中行学习和预测,其应用已经非常普遍。金融领域集中了大量的交易数据,为人工智能技术的运用奠定了良好的数据基础。本书面向金融领域的读者,介绍了机器学习技术的原理与实践。 本书包括10章,介绍了神经网络算法、结构化数据的处理、计算机视觉处理技术、时间序列分析、自然语言处理、生成模型的应用、强化学习技术、数据建模与调试、贝叶斯推理和概率编程等内容。 本书由资深金融从业者编写,融合了其在金融项目中关于机器学习的实践经验,适合金融领域的数据科学家、数据分析师、金融科技公司的技术研发人员以及对金融领域的机器学习技术感兴趣的读者阅读。<br/>【推荐语】<br/>1. 本书是聚焦于金融业的现代机器学习使用指南 2. 配套代码 图片讲解帮助读者快速上手 3. 详细的理论推到和算法分析,引导读者了解机器学习的内核 4. 知识与代码示例环环相扣,理论与编程实践完美结合<br/>【作者】<br/>简尼斯·克拉斯(Jannes Klaas)是一名拥有金融学和经济学背景的量化分析师。他曾主导过两个机器学习训练营项目,也同研发数据驱动类应用的公司和交易策略类公司有过合作。目前,他的研究领域包括系统风险和大规模自动化的知识挖掘。<br/>
目录展开

版 权

版权声明

内容提要

作者简介

审稿人简介

前言

第1章 神经网络和基于梯度的优化

1.1 本书的内容概要

1.2 什么是机器学习

1.3 监督学习

1.4 非监督学习

1.5 强化学习

1.5.1 极其有效的数据

1.5.2 模型即是错

1.6 创建工作区

1.7 使用Kaggle内核

本地运行Notebook文件

1.8 使用AWS深度学习AMI

1.9 近似函数

1.10 前向传递

1.11 逻辑回归器

逻辑回归器的Python实现

1.12 优化模型参数

1.13 评估模型损失

1.13.1 梯度下降

1.13.2 反向传播

1.13.3 参数更新

1.13.4 阶段小结

1.14 深度网络

1.15 Keras简介

1.15.1 导入Keras库

1.15.2 Keras中的双层模型

1.15.3 Keras和TensorFlow

1.16 张量和计算图

1.17 练习

1.18 本章小结

第2章 机器学习在结构化数据中的应用

2.1 数据

2.2 启发式模型、基于特征的模型和E2E模型

2.3 机器学习软件栈

2.4 启发式方法

2.4.1 使用启发式模型来预测

2.4.2 分数

2.4.3 基于混淆矩阵的评价

2.5 特征工程方法

2.5.1 特征源于直觉——诈骗者永不眠

2.5.2 专家视角——转账后提款

2.5.3 统计奇事——余额中的错误

2.6 Keras库的数据准备

2.6.1 one-hot编码

2.6.2 实体嵌入(entity embeddings)

2.7 使用Keras创建预测模型

2.7.1 提取目标

2.7.2 创建测试集

2.7.3 创建验证集

2.7.4 训练数据的过采样

2.7.5 构建模型

2.8 基于决策树方法的简要入门

2.8.1 一个简单的决策树

2.8.2 随机森林

2.8.3 XGBoost

2.9 E2E模型

2.10 练习

2.11 本章小结

第3章 计算机视觉的应用

3.1 卷积神经网络

3.1.1 过滤MNIST数据集

3.1.2 第二个过滤器

3.2 彩色图片的过滤技术

3.3 Keras ConvNet组成模块

3.3.1 Conv2D

3.3.2 最大池化

3.3.3 Flatten层

3.3.4 Dense层

3.3.5 训练MNIST

3.4 神经网络的延展

3.4.1 动量

3.4.2 Adam优化器

3.4.3 正则化(regularization)

3.4.4 失效(dropout)

3.4.5 批归一化(BatchNorm)

3.5 采用大图片数据集

3.6 采用预训练模型

3.6.1 修改VGG16

3.6.2 随机图像增强

3.7 模块度权衡

3.8 计算机视觉不止分类

3.8.1 人脸识别

3.8.2 边框预测

3.9 练习

3.10 本章小结

第4章 理解时间序列

4.1 数据的可视化与Pandas准备

4.1.1 汇总全局特征统计

4.1.2 检查采样时间序列

4.1.3 不同平稳特性

4.1.4 为什么平稳性重要

4.1.5 让时间序列具有平稳性

4.1.6 何时忽略平稳性问题

4.2 快速傅里叶变换

4.3 自相关

4.4 构建训练和测试方案

4.5 回测

4.6 中位数预测

4.7 ARIMA模型

4.8 卡曼滤波

4.9 神经网络预测

数据准备

4.10 Conv1D

4.11 因果卷积和扩张卷积

4.12 简单的RNN

4.13 LSTM

carry

4.14 循环dropout

4.15 贝叶斯深度学习

4.16 练习

4.17 本章小结

第5章 用自然语言处理解析文本数据

5.1 spaCy的入门指南

5.2 命名实体识别

微调NER

5.3 词性标记

5.4 基于规则的匹配

5.4.1 在匹配器中添加自定义函数

5.4.2 匹配器添加到pipeline中

5.4.3 基于规则和学习相结合的系统

5.5 正则表达式

5.5.1 Python 正则表达式

5.5.2 Pandas正则表达式

5.5.3 何时使用正则表达式

5.6 文本分类任务

5.7 准备数据

5.7.1 清理字符

5.7.2 词形还原

5.7.3 制定目标

5.7.4 准备训练集和测试集

5.8 词袋模型

TF-IDF

5.9 主题模型

5.10 单词嵌入

5.10.1 针对单词向量训练的预处理

5.10.2 加载预先训练的单词向量

5.10.3 单词向量的时间序列模型

5.11 具有单词嵌入的文档相似度

5.12 快速浏览Keras函数API

5.13 注意力机制

5.14 注意力模块

5.15 seq2seq模型

5.15.1 seq2seq架构概述

5.15.2 数据

5.15.3 字符编码

5.15.4 构建推断模型

5.15.5 翻译

5.16 练习

5.17 本章小结

第6章 生成模型的应用

6.1 理解自编码器

6.1.1 MNIST的自编码器

6.1.2 信用卡自编码器

6.2 使用t-SNE可视化隐空间

6.3 变分自编码器

6.3.1 MNIST实例

6.3.2 使用Lambda层

6.3.3 Kullback-Leibler散度

6.3.4 创建自定义损失

6.3.5 使用VAE生成数据

6.3.6 针对端到端诈骗检测系统的VAE

6.4 时间序列的VAE

6.5 GAN

6.5.1 MNIST GAN

6.5.2 理解GAN隐向量

6.5.3 GAN训练技巧

6.6 使用更少的数据——主动学习

6.6.1 高效使用标签预算

6.6.2 采用机器来为人类打标签

6.6.3 未打标签数据的伪标签

6.6.4 使用生成模型

6.7 用于诈骗检测的SGAN

6.8 练习

6.9 本章小结

第7章 金融市场中的强化学习

7.1 “接水果”游戏——强化学习的快速指南

7.1.1 Q-learning将强化学习变成监督学习

7.1.2 定义Q-learning模型

7.1.3 训练玩“接水果”游戏

7.2 马尔可夫过程和贝尔曼方程——强化学习的形式化介绍

经济学中的贝尔曼方程

7.3 优势动作评论(A2C)模型

7.3.1 学习平衡

7.3.2 学习交易

7.4 进化策略和基因算法

7.5 强化学习工程的实用建议

7.5.1 设计良好的收益函数

7.5.2 强鲁棒性的强化学习

7.6 强化学习技术前沿

7.6.1 多代理强化学习

7.6.2 学习如何去学习

7.6.3 通过强化学习理解大脑

7.7 练习

7.8 本章小结

第8章 调试和发布产品

8.1 调试数据

8.1.1 如何查看数据是否胜任任务

8.1.2 没有足够数据该怎么办

8.1.3 单元测试数据

8.1.4 保证数据隐私并遵守法规

8.1.5 为训练准备数据

8.1.6 了解何种输入导致何种预测

8.2 调试模型

8.2.1 Hyperas搜索超参

8.2.2 高效的学习率搜索

8.2.3 学习率调度

8.2.4 TensorBoard监控训练

8.2.5 梯度爆炸和消失

8.3 部署

8.3.1 快速上线

8.3.2 理解和监控指标

8.3.3 了解数据的来源

8.4 性能建议

8.4.1 使用合适的硬件

8.4.2 使用分布式训练和TF估计器

8.4.3 使用CuDNNLSTM优化层

8.4.4 优化管道

8.4.5 使用Cython加速代码

8.4.6 缓存频繁的请求

8.5 练习

8.6 本章小结

第9章 挑战偏见

9.1 机器学习中不公平的来源

9.2 法律视角

9.3 量化公平

9.4 训练公平

9.5 因果学习

9.5.1 获得因果模型

9.5.2 工具变量

9.5.3 非线性因果模型

9.6 解释模型来确保公平

9.7 不公平则是复杂系统的失败

9.7.1 复杂系统本质上是危险系统

9.7.2 诸多故障引发灾难

9.7.3 复杂系统以降级模式运行

9.7.4 人工操作既能引发事故也能防止事故

9.7.5 无事故操作要求有故障经验

9.8 开发公平模型的检查清单

9.8.1 模型开发人员的目标是什么

9.8.2 数据存在偏见吗

9.8.3 错误是否有偏见

9.8.4 如何整合反馈

9.8.5 模型可解释吗

9.8.6 模型部署后会发生什么

9.9 练习

9.10 本章小结

第10章 贝叶斯推理和概率编程

10.1 贝叶斯推理入门指南

10.1.1 扁平先验

10.1.2 < 50%先验

10.1.3 先验与后验

10.1.4 马尔可夫链蒙特卡罗算法

10.1.5 Metropolis-Hastings MCMC

10.1.6 从概率编程到深度概率编程

10.2 本章小结

结束语

推荐读物

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部