当当云阅读 > 教育 > 大中专教材 > 研究生/本科/专科教材 > Python数据分析

Python数据分析电子书

本书系统介绍了使用Python行数据分析需要掌握的各项知识，涵盖了Python基础知识、网络爬虫、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy行科学计算、使用Pandas处理数据、数据可视化、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。

售价：¥

纸质售价：¥46.70购买纸书

12人正在读 | 0人评论

6.5

作者：王俊

出版社：机械工业出版社

出版时间：2024-12-27

字数：14.9万

所属分类：教育 > 大中专教材 > 研究生/本科/专科教材

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(5条)

读书简介
目录
累计评论(5条)

本书系统介绍了使用Python行数据分析需要掌握的各项知识，涵盖了Python基础知识、网络爬虫技术、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy与Pandas处理数据、数据可视化技术、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。本书通过结合数据分析技术的理论知识与Python的实战应用，帮助读者更好地运用Python解决数据分析中的实际问题。本书适合作为高等院校工商管理类研究生、本科生的数据分析课程教材，还适合作为金融行业人员的参考资料。 【推荐语】 本书系统介绍了使用Python行数据分析需要掌握的各项知识，涵盖了Python基础知识、网络爬虫、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy行科学计算、使用Pandas处理数据、数据可视化、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。 【作者】 王俊，现为西南财经大学管理科学与工程学院副教授，硕士生导师，西南财经大学金融科技国际联合实验室主任助理，金融智能与金融工程四川省重实验室主任助理，加拿大纽芬兰纪念大学访问学者。致力于从大数据分析视角，通过大机器学习、数据分析、人工智能等方法解决金融市场的重要问题。主要研究包括多源数据对证券市场的影响性分析，大数据视角的数字化互动媒体对股票市场的影响性研究、基于大数据的证券市场量化分析研究、基于海量数据的媒体信息识别与情感量化分析研究等。迄今为止，已发表英文学术论文10余篇，参与国家自然科学基金项目3项，国家重科研项目1项，部级、省级重科研项目5项。同时，王俊多次受邀参加国际学术会议（全球信息系统年会-ICIS、亚洲信息系统年会-PACIS、全球管理学顶尖年会-HICSS），前往美国夏威夷、日本东京、韩国首尔、马来西亚兰卡威等地区行论文发表讲演，还作为国内外学术期刊IEEE Network Magazine、Association for Computational Linguistics、Journal of Global Information Management（JGIM）、系统工程理论与实践的审稿人参与稿件评审。

目录展开

书名页

前言

第1章数据分析导论

1.1 面向财经领域的数据分析

1.2 数据分析工作流程与案例赏析

1.2.1 数据分析的工作流程

1.2.2 数据分析的案例赏析

1.3 扩展阅读

1.3.1 大数据驱动的决策范式转变

1.3.2 使用大语言模型做数据分析

第2章 Python基础知识

2.1 数据类型

2.1.1 数值

2.1.2 字符串

2.1.3 列表

2.1.4 元组

2.1.5 集合

2.1.6 字典

2.2 运算法则

2.2.1 算术运算

2.2.2 逻辑运算

2.2.3 比较运算

2.3 条件语句

2.4 循环语句

2.4.1 while循环

2.4.2 for循环

2.5 终止语句

2.6 函数构造和参数

2.6.1 自定义函数

2.6.2 自定义函数的参数

2.6.3 局部和全局变量

2.6.4 Lambda函数

2.7 扩展阅读

2.7.1 应用ChatGLM开发聊天机器人

2.7.2 使用ChatGPT辅助学习Python

第3章网络爬虫

3.1 网络爬虫概述

3.2 网页结构

3.2.1 服务器与本地交换机制

3.2.2 HTML

3.3 获取网页内容

3.3.1 通过Requests发送请求

3.3.2 在URL中传递参数

3.3.3 添加Headers

3.4 利用爬虫获取股吧评论数据

3.5 扩展阅读

3.5.1 常见的反爬机制与解决方案

3.5.2 使用ChatGPT辅助开发网络爬虫

第4章正则表达式

4.1 初识正则表达式

4.1.1 什么是正则表达式

4.1.2 构建简单的正则表达式

4.2 正则表达式进阶

4.3 使用正则表达式解析HTML网页

4.4 扩展阅读

第5章 BeautifulSoup和JSON

5.1 BeautifulSoup基本语法

5.1.1 创建BeautifulSoup对象

5.1.2 提取标签信息

5.2 使用BeautifulSoup解析HTML网页

5.3 JSON

5.3.1 JSON的特点

5.3.2 JSON的结构

5.3.3 JSON序列化与反序列化

5.3.4 解析在线API返回的JSON数据

5.4 扩展阅读

第6章词语切分

6.1 分词简介

6.1.1 最大匹配法分词

6.1.2 基于统计的分词

6.2 Jieba分词

6.2.1 Jieba分词简介

6.2.2 使用Jieba分词

6.3 读取文件并切词

6.4 下载网页数据并切词

6.5 扩展阅读

6.5.1 Jieba分词算法细节

6.5.2 使用大语言模型切词

第7章自然语言处理简介

7.1 TF-IDF

7.1.1 TF-IDF原理

7.1.2 TF-IDF案例

7.2 词袋法

7.3 情感分析

7.3.1 定义函数创建词袋

7.3.2 使用Python实现词袋法

7.4 扩展阅读

7.4.1 词嵌入

7.4.2 使用ChatGPT做文本分析

第8章使用NumPy进行科学计算

8.1 创建数组

8.1.1 安装NumPy

8.1.2 列表和数组

8.1.3 创建并探索NumPy数组

8.1.4 创建特殊NumPy数组

8.1.5 导入并查看titanic数据集

8.2 数组切片

8.2.1 索引和切片

8.2.2 数组切片和列表切片

8.2.3 数组拼接

8.3 数组计算

8.3.1 广播

8.3.2 数组的绝对值与均值

8.3.3 点积

8.4 词语相似度计算

8.5 手写数字案例

8.5.1 初步探索数据集

8.5.2 数据标准化

8.5.3 图像翻转

8.6 金融案例分析

8.6.1 读取文件

8.6.2 计算成交量加权平均价格

8.6.3 计算最大值和最小值

8.6.4 计算极差

8.6.5 计算中位数

8.6.6 计算方差

8.7 扩展阅读

第9章使用Pandas处理数据

9.1 序列和数据框

9.1.1 创建序列

9.1.2 创建数据框

9.1.3 使用Pandas读取和存储数据

9.2 用Pandas处理数据

9.2.1 关于INVEST部门的投资任务

9.2.2 查看数据

9.2.3 数据切片

9.2.4 数据类型转换

9.2.5 数据的增删改

9.3 用Pandas处理文本数据

9.3.1 在序列中处理文本数据

9.3.2 进一步清洗文本数据

9.3.3 更新评论日期

9.4 光线传媒股价数据分析

9.5 扩展阅读

9.5.1 混频数据

9.5.2 ChatGPT视角下的Pandas

第10章数据可视化

10.1 数据可视化的基本步骤

10.2 Matplotlib可视化

10.3 Pandas可视化

10.3.1 参数列表

10.3.2 绘图

10.4 使用数据可视化探索人们的生活规律

10.5 股票价格的数据可视化

10.6 扩展阅读

10.6.1 科研工作中常用的数据可视化工具

10.6.2 使用生成模型辅助数据可视化

10.6.3 ChatGPT视角下的Matplotlib

第11章认识MySQL

11.1 数据库基础

11.1.1 表

11.1.2 列

11.1.3 数据类型

11.1.4 行

11.1.5 主键

11.1.6 SQL

11.1.7 什么是MySQL

11.1.8 MySQL的优势

11.2 数据库基本操作

11.2.1 检索数据：SELECT语句

11.2.2 过滤数据

11.2.3 插入数据

11.2.4 更新数据

11.2.5 删除数据

11.3 利用MySQL存取csv文件

11.4 使用Python和MySQL存取数据

11.5 扩展阅读

11.5.1 什么是云数据库

11.5.2 ChatGPT视角下的MySQL

第12章机器学习介绍

12.1 机器学习概述

12.1.1 语音助手例子

12.1.2 什么是机器学习

12.1.3 机器学习的分类

12.1.4 深入理解机器学习

12.2 模型评估与选择

12.2.1 模型选择的目的

12.2.2 评估指标

12.2.3 模型评估与选择的方法

12.2.4 最终模型

12.3 梯度下降

12.3.1 一维梯度下降

12.3.2 学习率

12.3.3 多维梯度下降

12.3.4 随机梯度下降

12.3.5 小批量梯度下降

12.4 建立并训练一个模型

12.4.1 研发投入与创新绩效的关系

12.4.2 使用批量梯度下降求解

12.4.3 使用随机梯度下降求解

12.4.4 模型评估

12.5 扩展阅读

第13章朴素贝叶斯模型的应用

13.1 朴素贝叶斯模型

13.1.1 贝叶斯公式

13.1.2 全概率和贝叶斯定理

13.1.3 模型介绍

13.2 结合Pandas和Jieba做训练数据准备

13.2.1 下载数据

13.2.2 将函数应用到序列中

13.3 使用朴素贝叶斯做情感分析

13.3.1 文本的词袋表示

13.3.2 使用多项式朴素贝叶斯模型做文本分类

13.3.3 使用Pipeline对象组合机器学习模型的各个步骤

13.3.4 应用交叉验证法评估并选择模型

13.3.5 保存并下载模型以进行预测

13.4 扩展阅读

第14章支持向量机的应用

14.1 SVM原理简介

14.1.1 SVM支持向量

14.1.2 对偶问题

14.1.3 松弛变量

14.1.4 非线性SVM分类任务（核函数）

14.1.5 支持向量回归任务

14.1.6 SVM算法小结

14.2 支持向量机的Python代码实现

14.2.1 SVM的Python实现基本步骤

14.2.2 Scikit-Learn支持向量机算法库小结

14.2.3 SVM算法库其他调参要点

14.3 基于SVM的个人信贷违约预测

14.3.1 数据预览及预处理

14.3.2 特征工程

14.3.3 模型建立与参数调整

14.4 使用基于合页损失函数的SVM进行情感分类

14.4.1 合页损失函数基本概念介绍

14.4.2 导入数据

14.4.3 使用合页损失函数

14.4.4 使用测试数据做预测

14.5 扩展阅读

第15章随机森林的应用

15.1 决策树与随机森林

15.1.1 决策树

15.1.2 随机森林

15.2 情感指标的获取与生成

15.2.1 获取每日情感分数

15.2.2 获取每日股评数量及意见分歧指数

15.2.3 填充缺失值

15.2.4 生成累积滞后分数

15.3 数据拼接

15.3.1 百度指数

15.3.2 获取股票市场数据

15.3.3 合并数据集

15.4 用随机森林做金融市场价格波动预测

15.4.1 数据准备

15.4.2 可视化混淆矩阵

15.4.3 训练决策树模型

15.4.4 训练随机森林模型

15.4.5 对比不同训练集的模型度量指标AUC

15.5 基于量化投资的模型评估指标

15.6 信用评分

15.6.1 背景

15.6.2 目标

15.6.3 数据准备

15.6.4 训练决策树模型

15.6.5 训练随机森林模型

15.7 拓展阅读

15.7.1 机器学习模型的公平性

15.7.2 ChatGPT视角下的随机森林

第16章深度学习

16.1 感知器与神经网络

16.1.1 感知器

16.1.2 神经网络

16.1.3 BP神经网络

16.2 深度学习中的基本模型

16.2.1 卷积神经网络

16.2.2 循环神经网络

16.2.3 长短期记忆神经网络

16.3 深度学习的发展方向

16.4 扩展阅读

16.4.1 人机融合预测系统

16.4.2 ChatGPT视角下的深度学习

第17章量化投资

17.1 量化投资概述

17.1.1 什么是量化投资以及量化策略开发流程

17.1.2 量化投资必备的基础金融理论

17.2 股息率选股策略

17.2.1 “一鸟在手胜过双鸟在林”

17.2.2 股息率策略研究与实践

17.2.3 获取月度交易日

17.2.4 获取股息率

17.2.5 筛选前30%的股票作为组合

17.2.6 绩效可视化

17.3 PEG策略

17.3.1 PEG策略实现

17.3.2 策略可视化

17.4 股息率策略的回测平台代码实践

17.5 扩展阅读A

17.5.1 回测环境

17.5.2 编译运行

17.5.3 策略回测

17.5.4 模拟交易

17.5.5 数据

17.5.6 运行频率

17.5.7 运行时间

17.5.8 佣金与印花税

17.5.9 滑点

17.5.10 拆分、合并与分红

17.6 扩展阅读B

参考文献

累计评论(5条) 19个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

发表评论

买过这本书的人还买过

读了这本书的人还在读

支持设备

激光原理及应用￥10.00

陈鹤鸣,赵新彦,等

￥10.00

中医临床技能实训教程(全国中医药行业高等教育“十三五”创新教材) ￥70.00

王健

￥70.00

子午流注针法(全国中医药行业高等教育“十四五”创新教材) ￥47.50

赵志国;赵仓焕

￥47.50

从就业看专业￥45.00

张雪峰·峰阅教研团队编著

￥45.00

操作系统(第3版) ￥10.00

罗宇

￥10.00

经济学原理￥1.09

（英）马歇尔

￥1.09

更多同类图书 >