万本电子书0元读

万本电子书0元读

顶部广告

Python编程:从数据分析到数据科学电子书

售       价:¥

纸质售价:¥51.00购买纸书

366人正在读 | 1人评论 6.2

作       者:朝乐门

出  版  社:电子工业出版社有限公司

出版时间:2019-01-01

字       数:16.3万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
朝乐门老师的《Python编程:从数据分析到数据科学(原稿)》作为全国高校大数据教育联盟主办的“Python编程及数据分析骨干教师高级研修班”的指定教材,得到与会代表的一致好评。该教材较好地反映了本学科的基本理论、基本知识、基本技能,并注重知识体系的系统性、科学性和先性,对于大数据类专业中设Python编程课程具有重要的示范意义和指导作用。—— 全国高校大数据教育联盟<br/>【作者】<br/>朝乐门,男,1979年生,中国人民大学信息资源管理学院、数据工程与知识工程*重实验室副教授,博士生导师。中国计算机学会信息系统专委员会委员、ACM高级会员、国际知识管理协会正式委员、全国高校大数据教育联盟大数据教材专家指导委员会委员、清华大学博士后校友会IT分会副秘书长;主持完成国家自然科学基金、国家社会科学基金等重要科学研究项目10余项;参与完成核高基、973、863、国家自然科学基金重项目、国家社会科学基金重大项目等国家重大科研项目10余项;发表SCI/SSCI/EI/CSCI论文30余篇,软件著作权5个、发明专利3项、出版学术专著3部;获得北京市中青年骨干教师称号、国际知识管理与智力资本杰出成就奖、IBM全球卓越教师奖、Emerald/EFMD国际杰出博士论文奖、国家自然科学基金项目优秀项目、中国大数据学术创新奖、中国大数据创新百人榜单、全国大数据教育行业杰出贡献奖等多种奖励30余项。<br/>
目录展开

前言

第一篇 准备工作

1 为什么要学习Python?学习Python的什么

2 学习Python之前需要准备的工作有哪些

3 如何看懂和运行本书代码

3.1 输入部分

3.2 输出部分

3.3 错误与异常信息

3.4 外部数据文件

3.5 注意事项

第二篇 Python基础

4 数据类型

4.1 查看数据类型的方法

4.2 判断数据类型的方法

4.3 转换数据类型的方法

4.4 特殊数据类型

4.5 序列类型

5 变量

5.1 变量的定义方法

5.2 Python是动态类型语言

5.3 Python是强类型语言

5.4 Python中的变量名是引用

5.5 Python中区分大小写

5.6 变量命名规范

5.7 iPython的特殊变量

5.8 查看Python关键字的方法

5.9 查看已定义的所有变量

5.10 删除变量

6 语句书写规范

6.1 一行一句

6.2 一行多句

6.3 一句多行

6.4 复合语句

6.5 空语句

7 赋值语句

7.1 赋值语句在Python中的重要地位

7.2 链式赋值语句

7.3 复合赋值语句

7.4 序列的拆包式赋值

7.5 两个变量值的调换

8 注释语句

8.1 注释方法

8.2 注意事项

9 运算符

9.1 特殊运算符

9.2 内置函数

9.3 math模块

9.4 优先级与结合方向

10 if语句

10.1 基本语法

10.2 elif语句

10.3 if与三元运算

10.4 注意事项

11 for语句

11.1 基本语法

11.2 range()函数

11.3 注意事项

12 while语句

12.1 基本语法

12.2 注意事项

13 pass语句

13.1 含义

13.2 作用

14 列表

14.1 定义方法

14.2 切片操作

14.3 反向遍历

14.4 类型转换

14.5 extend与append的区别

14.6 列表推导式

14.7 插入与删除

14.8 常用操作函数

15 元组

15.1 定义方法

15.2 主要特征

15.3 基本用法

15.4 应用场景

16 字符串

16.1 定义方法

16.2 主要特征

16.3 字符串的操作

17 序列

17.1 支持索引

17.2 支持切片

17.3 支持迭代

17.4 支持拆包

17.5 支持*运算

17.6 通用函数

18 集合

18.1 定义方法

18.2 主要特征

18.3 基本运算

18.4 应用场景

19 字典

19.1 定义方法

19.2 字典的主要特征

19.3 字典的应用场景

20 迭代器与生成器

20.1 可迭代对象与迭代器

20.2 生成器与迭代器

21 函数

21.1 内置函数

21.2 模块函数

21.3 用户自定义函数

22 内置函数

22.1 内置函数的主要特点

22.2 数学函数

22.3 类型函数

22.4 其他功能函数

23 模块函数

23.1 import模块名

23.2 import模块名as别名

23.3 from模块名import函数名

24 自定义函数

24.1 定义方法

24.2 函数中的docString

24.3 调用方法

24.4 返回值

24.5 自定义函数的形参与实参

24.6 变量的可见性

24.7 值传递与地址传递

24.8 自定义函数时的注意事项

25 lambda函数

25.1 lambda函数的定义方法

25.2 lambda函数的调用方法

26 模块

26.1 导入与调用用法

26.2 查看内置模块清单的方法

27 包

27.1 相关术语

27.2 安装包

27.3 查看已安装包

27.4 更新(或删除)已安装包

27.5 导入包

27.6 查看包的帮助

27.7 常用包

28 帮助文档

28.1 help函数

28.2 docString

28.3 查看源代码

28.4 doc属性

28.5 dir()函数

28.6 其他方法

第三篇 Python进阶

29 异常与错误

29.1 try/except/finally

29.2 异常信息的显示模式

29.3 断言

30 程序调试方法

30.1 调试程序的基本方法

30.2 设置错误信息的显示方式

30.3 设置断言的方法

31 面向对象编程

31.1 类的定义方法

31.2 类中的特殊方法

31.3 类之间的继承关系

31.4 私有属性及@property装饰器

31.5 self和cls

31.6 new与init的区别和联系

32 魔术命令

32.1 运行.py文件:%run

32.2 统计运行时间:%timeit与%%timeit

32.3 查看历史In和Out变量:%history

32.4 更改异常信息的显示模式:%xmode

32.5 调试程序:%debug

32.6 程序运行的逐行统计:%prun与%lprun

32.7 内存使用情况的统计:%memit

33 搜索路径

33.1 变量搜索路径

33.2 模块搜索路径

34 当前工作目录

34.1 显示当前工作目录的方法

34.2 更改当前工作目录的方法

34.3 读、写当前工作目录的方法

第四篇 数据加工

35 随机数

35.1 一次生成一个数

35.2 一次生成一个随机数组

36 数组

36.1 创建方法

36.2 主要特征

36.3 切片/读取

36.4 浅拷贝和深拷贝

36.5 形状与重构

36.6 属性计算

36.7 ndarray的计算

36.8 ndarray的元素类型

36.9 插入与删除

36.10 缺失值处理

36.11 ndarray的广播规则

36.12 ndarray的排序

37 Series

37.1 Series的主要特点

37.2 Series的定义方法

37.3 Series的操作方法

38 DataFrame

38.1 DataFrame的创建方法

38.2 查看行或列

38.3 引用行或列

38.4 index操作

38.5 删除或过滤行/列

38.6 算术运算

38.7 大小比较运算

38.8 统计信息

38.9 排序

38.10 导入/导出

38.11 缺失数据处理

38.12 分组统计

39 日期与时间

39.1 常用包与模块

39.2 时间和日期类型的定义

39.3 转换方法

39.4 显示系统当前时间

39.5 计算时差

39.6 时间索引

39.7 period_range()函数

40 可视化

40.1 Matplotlib可视化

40.2 改变图的属性

40.3 改变图的类型

40.4 改变图的坐标轴的取值范围

40.5 去掉边界的空白

40.6 在同一个坐标上画两个图

40.7 多图显示

40.8 图的保存

40.9 散点图的画法

40.10 Pandas可视化

40.11 Seaborn可视化

40.12 数据可视化实战

41 自然语言处理

41.1 自然语言处理的常用包

41.2 自然语言处理的包导入及设置

41.3 数据读入

41.4 分词处理

41.5 自定义词汇

41.6 停用词处理

41.7 词性分布分析

41.8 高频词分析

41.9 词频统计

41.10 关键词分析

41.11 生成词云

42 Web爬取

42.1 Scrapy的下载与安装

42.2 Scrapy Shell的基本原理

42.3 Scrapy Shell的应用

42.4 自定义Spider类

42.5 综合运用

第五篇 数据分析

43 统计分析

43.1 业务理解

43.2 数据读入

43.3 数据理解

43.4 数据准备

43.5 模型类型的选择与超级参数的设置

43.6 训练具体模型及查看其统计量

43.7 拟合优度评价

43.8 建模前提假定的讨论

43.9 模型的优化与重新选择

43.10 模型的应用

44 机器学习

44.1 机器学习的业务理解

44.2 数据读入

44.3 数据理解

44.4 数据准备

44.5 算法选择及其超级参数的设置

44.6 具体模型的训练

44.7 用模型进行预测

44.8 模型评价

44.9 模型的应用与优化

第六篇 大数据处理

45 Spark编程

45.1 导入pyspark包

45.2 SparkSession及其创建

45.3 Spark数据抽象类型

45.4 Spark DataFrame操作

45.5 SQL编程

45.6 DataFrame的可视化

45.7 Spark机器学习

46 Spark Python开发环境的搭建

46.1 安装Anaconda

46.2 安装和配置Java

46.3 安装和配置Spark

46.4 安装和配置Hadoop

46.5 测试Spark

47 NoSQL数据库

47.1 下载Memcached

47.2 安装Memcached

47.3 安装和导入包pymemcache

47.4 准备试验数据

47.5 定义Client并进行数据读写

47.6 Memcached的更多操作

第七篇 继续学习

48 Python初学者常见错误及纠正方法

48.1 NameError:name ′xxxx′ is not defined

48.2 IndentationError:unexpected indent

48.3 SyntaxError:invalid character in identifier

48.4 TypeError:′XXXX′ object does not support item assignment

48.5 TypeError:unsupported operand type(s) for XXXX

48.6 IndexError:list index out of range

48.7 TypeError:type() takes XXXX arguments

48.8 SyntaxError:unexpected EOF while parsing

48.9 ModuleNotFoundError:No module named XXXX

48.10 TypeError:′list′ object is not callable

48.11 SyntaxError:invalid syntax

48.12 AttributeError:XXXX object has no attribute XXXX

48.13 TypeError:XXXX object is not an iterator

48.14 FileNotFoundError:File XXXX does not exist

48.15 IndexError:too many indices for array

48.16 TypeError:Required argument XXXX not found

48.17 TypeError:an XXXX is required (got type YYYY)

48.18 ValueError:Wrong number of items passed XXXX,placement

49 Python数据分析和数据科学面试题

50 继续学习本书内容的推荐资源

50.1 重要网站

50.2 重点图书

50.3 常用模块与工具包

50.4 常用统计模型

50.5 核心机器学习算法

50.6 继续学习数据科学的建议路线图

参考文献

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部