万本电子书0元读

万本电子书0元读

顶部广告

Python数据科学入门电子书

不同类型文本数据的获取、清洗、组织和可视化 如何用NumPy和Pandas模块处理数值数据 探索用MySQL和MongoDB配置、填充、查询数据 网络创建、度量和分析 概率与统计以及机器学习的相关基本概念

售       价:¥

纸质售价:¥36.70购买纸书

137人正在读 | 0人评论 6.2

作       者:德米特里·齐诺维耶夫(Dmitry Zinoviev)

出  版  社:人民邮电出版社

出版时间:2017-11-01

字       数:13.3万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
《Python数据科学门》以Python 语言讲解数据科学基础知识,涵盖了数据采集、清洗、存储、检索、转换、可视化、高级数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python 核心特性,文本数据、数据库、表格形式的数值数据、series 和frame、网络数据的使用,数据的绘制,概率与统计,机器学习。 《Python数据科学门》面向研究生和本科生、数据科学教员、刚门的数据科学专业人员,以及那些想拥有一本参考手册来帮助记住所有Python 函数及参数的发人员。<br/>【推荐语】<br/>不同类型文本数据的获取、清洗、组织和可视化 如何用NumPy和Pandas模块处理数值数据 探索用MySQL和MongoDB配置、填充、查询数据 网络创建、度量和分析 概率与统计以及机器学习的相关基本概念<br/>【作者】<br/>Dmitry Zinoviev 计算机科学教授,自2001年起一直在萨福克大学任教。研究兴趣包括计算机模拟与建模、网络科学、社交网络分析以及数字人文。拥有莫斯科国立大学物理学硕士学位和纽约州立大学石溪分校计算机科学博士学位。<br/>
目录展开

前言

致谢

第1章 什么是数据科学

第1单元 数据分析步骤

第2单元 数据获取途径

第3单元 报告的结构

轮到你了

第2章 数据科学的Python核心

第4单元 理解基本的字符串函数

第5单元 选择合适的数据结构

第6单元 通过列表推导式理解列表

第7单元 使用计数器

第8单元 使用文件

第9单元 上网

第10单元 使用正则表达式实现模式匹配

理解正则表达式语言

使用模块re进行搜索、拆分和替换

第11单元 globbing7文件名与其他字符串

第12单元 Pickling和Unpickling数据

轮到你了

第3章 使用文本数据

第13单元 处理HTML文件

第14单元 处理CSV文件

第15单元 读取JSON文件

第16单元 处理自然语言中的文本

NLTK语料库

规范化

其他文本处理程序

轮到你了

第4章 使用数据库

第17单元 设置MySQL数据库

第18单元 使用MySQL数据库:命令行

插入

删除

变更

选择

连接

第19单元 使用MySQL数据库:pymysql

第20单元 改善文档存储:MongoDB

轮到你了

第5章 使用表格形式的数值数据

第21单元 创建数组

第22单元 转置和重排

第23单元 索引和切片

第24单元 广播

第25单元 揭秘通用函数

第26单元 理解条件函数

第27单元 数组的聚合与排序

第28单元 将数组用作集合

第29单元 数组的保存和读取

第30单元 生成合成正弦波

轮到你了

第6章 使用series和frame

第31单元 pandas数据结构

series

frame

第32单元 数据重塑

索引

重建索引

分层索引

堆叠和旋转

第33单元 处理缺失数据

删除缺失数据

插补缺失数据

替换数据

第34单元 组合数据

合并

连接

删除重复行

第35单元 数据的排序和描述

排序和分级

描述性统计量

唯一性、计数、会员资格

第36单元 数据转换

算术运算

数据聚合

离散化

映射

交叉表

第37单元 掌握pandas的文件读写功能

读取CSV和表格文件

分块

读取其他文件

轮到你了

第7章 使用网络数据

第38单元 概念剖析

图的元素、类型和密度

图的结构

中心性

第39单元 网络分析序列

第40单元 使用networkx

构建和修改网络

探索和分析网络

管理属性

团和社区结构

输入和输出

轮到你了

第8章 绘图

第41单元 使用PyPlot进行基本绘图

第42单元 了解其他绘图类型

第43单元 精通绘图装饰

第44单元 用pandas绘图

轮到你了

第9章 概率与统计

第45单元 回顾概率分布

均匀分布

正态分布

二项分布

第46单元 回顾统计度量

第47单元 以Python的方式完成统计

生成随机数

计算统计度量

轮到你了

第10章 机器学习

第48单元 设计预测实验

第49单元 线性回归拟合

普通最小二乘回归

脊回归

逻辑回归

第50单元 用k均值聚类实现数据分组

第51单元 在随机决策森林中生存

轮到你了

附录1 扩展阅读

附录2 单星项目的解决方案

参考文献

看完了

累计评论(0条) 3个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部