Python语言拥有大量可用于存储、操作和洞察数据的程序库,已然成为深受数据科学研究人员推崇的工具。本书以IPython、NumPy、Pandas、Matplotlib和Scikit-Learn这5个能完成数据科学大部分工作的基础工具为主,从实战角度出发,讲授如何清洗和可视化数据、如何用数据建立各种统计学或机器学习模型等常见数据科学任务,旨在让各领域与数据处理相关的工作人员具备发现问题、解决问题的能力。
售 价:¥
纸质售价:¥104.60购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
译者序
前言
第1章 IPython:超越Python
1.1 shell还是Notebook
1.2 IPython的帮助和文档
1.3 IPython shell中的快捷键
1.4 IPython魔法命令
1.5 输入和输出历史
1.6 IPython和shell命令
1.7 与shell相关的魔法命令
1.8 错误和调试
1.9 代码的分析和计时
1.10 IPython参考资料
第2章 NumPy入门
2.1 理解Python中的数据类型
2.2 NumPy数组基础
2.3 NumPy数组的计算:通用函数
2.4 聚合:最小值、最大值和其他值
2.5 数组的计算:广播
2.6 比较、掩码和布尔逻辑
2.7 花哨的索引
2.8 数组的排序
2.9 结构化数据:NumPy的结构化数组
第3章 Pandas数据处理
3.1 安装并使用Pandas
3.2 Pandas对象简介
3.3 数据取值与选择
3.4 Pandas数值运算方法
3.5 处理缺失值
3.6 层级索引
3.7 合并数据集:Concat与Append操作
3.8 合并数据集:合并与连接
3.9 累计与分组
3.10 数据透视表
3.11 向量化字符串操作
3.12 处理时间序列
3.13 高性能Pandas:eval()与query()
3.14 参考资料
第4章 Matplotlib数据可视化
4.1 Matplotlib常用技巧
4.2 两种画图接口
4.3 简易线形图
4.4 简易散点图
4.5 可视化异常处理
4.6 密度图与等高线图
4.7 频次直方图、数据区间划分和分布密度
4.8 配置图例
4.9 配置颜色条
4.10 多子图
4.11 文字与注释
4.12 自定义坐标轴刻度
4.13 Matplotlib自定义:配置文件与样式表
4.14 用Matplotlib画三维图
4.15 用Basemap可视化地理数据
4.16 用Seaborn做数据可视化
4.17 参考资料
第5章 机器学习
5.1 什么是机器学习
5.2 Scikit-Learn简介
5.3 超参数与模型验证
5.4 特征工程
5.5 专题:朴素贝叶斯分类
5.6 专题:线性回归
5.7 专题:支持向量机
5.8 专题:决策树与随机森林
5.9 专题:主成分分析
5.10 专题:流形学习
5.11 专题:k-means聚类
5.12 专题:高斯混合模型
5.13 专题:核密度估计
5.14 应用:人脸识别管道
5.15 机器学习参考资料
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜