万本电子书0元读

万本电子书0元读

顶部广告

Python编程精进(第1辑)(套装共3册)电子书

售       价:¥

303人正在读 | 2人评论 6.2

作       者:(波兰)Micha Jaworski 贾沃斯基 (法)莱德,(澳)理查德 劳森 等

出  版  社:人民邮电出版社

出版时间:2017-01-01

字       数:79.6万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(2条)
  • 读书简介
  • 目录
  • 累计评论(2条)
本书包含《Python高级编程 第2版》、《精通Python爬虫框架Scrapy》、《精通Python自然语言处理》共三册。 Python作为一种高级程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言之一。 《Python高级编程 第2版》基于Python 3.5版本进行讲解,通过13章的内容,深度揭示了Python编程的高级技巧。本书从Python语言及其社区的现状开始介绍,对Python语法、命名规则、Python包的编写、部署代码、扩展程序开发、管理代码、文档编写、测试开发、代码优化、并发编程、设计模式等重要话题进行了全面系统化的讲解。本书适合想要进一步提高自身Python编程技能的读者阅读,也适合对Python编程感兴趣的读者参考学习。全书结合典型且实用的开发案例,可以帮助读者创建高性能的、可靠且可维护的Python应用。 《精通Python爬虫框架Scrapy》:Scrapy是使用Python开发的一个快速、高层次的屏幕抓取和Web抓取框架,用于抓Web站点并从页面中提取结构化的数据。《精通Python爬虫框架Scrapy》以Scrapy 1.0版本为基础,讲解了Scrapy的基础知识,以及如何使用Python和三方API提取、整理数据,以满足自己的需求。《精通Python爬虫框架Scrapy》共11章,其内容涵盖了Scrapy基础知识,理解HTML和XPath,安装Scrapy并爬取一个网站,使用爬虫填充数据库并输出到移动应用中,爬虫的强大功能,将爬虫部署到Scrapinghub云服务器,Scrapy的配置与管理,Scrapy编程,管道秘诀,理解Scrapy性能,使用Scrapyd与实时分析进行分布式爬取。本书附录还提供了各种软件的安装与故障排除等内容。《精通Python爬虫框架Scrapy》适合软件开发人员、数据科学家,以及对自然语言处理和机器学习感兴趣的人阅读。 《精通Python自然语言处理》:自然语言处理是计算语言学和人工智能之中与人机交互相关的领域之一。 本书是学习自然语言处理的一本综合学习指南,介绍了如何用Python实现各种NLP任务,以帮助读者创建基于真实生活应用的项目。全书共10章,分别涉及字符串操作、统计语言建模、形态学、词性标注、语法解析、语义分析、情感分析、信息检索、语篇分析和NLP系统评估等主题。本书适合熟悉Python语言并对自然语言处理开发有一定了解和兴趣的读者阅读参考。
目录展开

Python高级编程(第2版)

内容提要

作者简介

译者简介

审稿人简介

前言

第1章 Python现状

1.1 Python的现状与未来

1.2 Python升级及其原因

1.3 追踪Python最新变化——PEP文档

1.4 当前Python 3的普及程度

1.5 Python 3和Python 2的主要差异

1.5.1 为什么要关注这些差异

1.5.2 主要的语法差异和常见陷阱

1.5.3 用于保持跨版本兼容性的常用工具和技术

1.6 不只是CPython

1.6.1 为什么要关注Python实现

1.6.2 Stackless Python

1.6.3 Jython

1.6.4 IronPython

1.6.5 PyPy

1.7 Python开发的现代方法

1.8 应用层Python环境隔离

1.8.1 为什么要隔离

1.8.2 常用解决方案

1.8.3 选择哪种工具

1.9 系统级环境隔离

1.9.1 使用Vagrant的虚拟开发环境

1.9.2 容器化与虚拟化的对比

1.10 常用的生产力工具

1.10.1 自定义Python shell——IPython、bpython、ptpython等

1.10.2 交互式调试器

1.11 有用的资源

1.12 小结

第2章 语法最佳实践——类级别以下

2.1 Python的内置类型

2.1.1 字符串与字节

2.1.2 集合类型

2.2 高级语法

2.2.1 迭代器

2.2.2 yield语句

2.2.3 装饰器

2.2.4 上下文管理器——with语句

2.3 你可能还不知道的其他语法元素

2.3.1 for...else...语句

2.3.2 函数注解

2.4 小结

第3章 语法最佳实践——类级别以上

3.1 子类化内置类型

3.2 访问超类中的方法

3.2.1 Python 2中的旧式类与super

3.2.2 理解Python的方法解析顺序

3.2.3 使用super易犯的错误

3.2.4 最佳实践

3.3 高级属性访问模式

3.3.1 描述符

3.3.2 property

3.3.3 槽

3.4 元编程

3.4.1 装饰器——一种元编程方法

3.4.2 类装饰器

3.4.3 使用__new__()方法覆写实例创建过程

3.4.4 元类

3.4.5 一些关于代码生成的提示

3.5 小结

第4章 选择好的名称

4.1 PEP 8与命名最佳实践

4.1.1 为何要遵守PEP 8以及何时遵守PEP 8

4.1.2 超越PEP 8——团队的风格指南

4.2 命名风格

4.3 命名指南

4.3.1 用“has”或“is”前缀命名布尔元素

4.3.2 用复数形式命名集合变量

4.3.3 用显式名称命名字典

4.3.4 避免通用名称

4.3.5 避免现有名称

4.4 参数的最佳实践

4.4.1 通过迭代设计构建参数

4.4.2 信任参数和测试

4.4.3 小心使用*args和**kwargs魔法参数

4.5 类的名称

4.6 模块和包的名称

4.7 有用的工具

4.7.1 Pylint

4.7.2 pep8和flake8

4.8 小结

第5章 编写一个包

5.1 创建一个包

5.1.1 Python打包工具的混乱状态

5.1.2 项目配置

5.1.3 自定义setup命令

5.1.4 在开发期间使用包

5.2 命名空间包

5.2.1 为什么有用

5.2.2 PEP 420——隐式命名空间包

5.2.3 以前Python版本中的命名空间包

5.3 上传一个包

5.3.1 PyPI——Python包索引

5.3.2 源代码包与构建包

5.4 独立可执行文件

5.4.1 独立可执行文件何时有用

5.4.2 常用工具

5.4.3 可执行包中Python代码的安全性

5.5 小结

第6章 部署代码

6.1 十二要素应用

6.2 用Fabric进行自动化部署

6.3 你自己的包索引或索引镜像

6.3.1 PyPI镜像

6.3.2 使用包进行部署

6.4 常见约定与实践

6.4.1 文件系统层次结构

6.4.2 隔离

6.4.3 使用进程管理工具

6.4.4 应该在用户空间运行应用代码

6.4.5 使用HTTP反向代理

6.4.6 优雅地重新加载进程

6.5 代码检测与监控

6.5.1 记录错误——sentry/raven

6.5.2 监控系统与应用指标

6.5.3 处理应用日志

6.6 小结

第7章 使用其他语言开发Python扩展

7.1 使用C或者C++编写扩展

7.2 为什么你想用扩展

7.2.1 提高关键代码段的性能

7.2.2 集成现有的使用不同语言编写的代码

7.2.3 集成第三方动态库

7.2.4 创建自定义数据类型

7.3 编写扩展

7.3.1 纯C扩展

7.3.2 Cython

7.4 挑战

7.4.1 额外的复杂性

7.4.2 调试

7.5 无扩展的动态库接口

7.5.1 ctypes

7.5.2 CFFI

7.6 小结

第8章 管理代码

8.1 版本控制系统

8.1.1 集中式系统

8.1.2 分布式系统

8.1.3 集中式还是分布式

8.1.4 尽可能使用Git

8.1.5 Git工作流程与GitHub工作流程

8.2 持续的开发过程

8.2.1 持续集成

8.2.2 持续交付

8.2.3 持续部署

8.2.4 常用的持续集成工具

8.2.5 选择正确的工具和常见的陷阱

8.3 小结

第9章 文档化你的项目

9.1 7项技术写作规则

9.1.1 两步写作

9.1.2 定位读者

9.1.3 使用简单的风格

9.1.4 限制信息范围

9.1.5 使用现实中的代码示例

9.1.6 使用轻量且充分的方法

9.1.7 使用模板

9.2 reStructuredText入门

9.2.1 章节结构

9.2.2 列表

9.2.3 行内标记

9.2.4 文字块

9.2.5 链接

9.3 构建文档

9.4 构建自己的文档集

9.4.1 构建格局

9.4.2 文档构建与持续集成

9.5 小结

第10章 测试驱动开发

10.1 我不测试

10.1.1 测试开发的原则

10.1.2 什么样的测试

10.1.3 达式Python标准测试工具

10.2 我做测试

10.2.1 unittest陷阱

10.2.2 unittest的替代品

10.2.3 测试覆盖率

10.2.4 仿真与模拟

10.2.5 测试环境与依赖兼容性

10.2.6 文档驱动开发

10.3 小结

第11章 优化——一般原则与分析技术

11.1 3个优化规则

11.1.1 首先要能工作

11.1.2 从用户的角度考虑

11.1.3 保持代码的可读性和可维护性

11.2 优化策略

11.2.1 找到另外的罪魁祸首

11.2.2 扩展硬件

11.2.3 编写速度测试

11.3 查找瓶颈

11.3.1 分析CPU使用情况

11.3.2 分析内存使用

11.3.3 分析网络使用情况

11.4 小结

第12章 优化——一些强大的技术

12.1 降低复杂度

12.1.1 循环复杂度

12.1.2 大O记法

12.2 简化

12.3 使用集合模块

12.3.1 deque

12.3.2 defaultdict

12.3.3 namedtuple

12.4 架构体系的权衡

12.4.1 使用启发式和近似算法

12.4.2 使用任务队列和延迟处理

12.4.3 使用概率型数据结构

12.5 缓存

12.5.1 确定性缓存

12.5.2 非确定性缓存

12.5.3 缓存服务

12.6 小结

第13章 并发

13.1 为什么需要并发

13.2 多线程

13.2.1 什么是多线程

13.2.2 Python如何处理多线程

13.2.3 何时应该使用多线程

13.3 多进程

13.4 异步编程

13.4.1 协同多任务与异步I/O

13.4.2 Python中的async和await关键字

13.4.3 老Python版本中的asyncio

13.4.4 异步编程实例

13.4.5 使用futures将异步代码同步化

13.5 小结

第14章 有用的设计模式

14.1 创建型模式

14.2 结构型模式

14.2.1 适配器

14.2.2 代理

14.2.3 外观

14.3 行为模式

14.3.1 观察者

14.3.2 访问者

14.3.3 模板

14.4 小结

Python网络爬虫实战

内容简介

前言

第1章 Python环境配置

1.1 Python简介

1.2 Python开发环境配置

1.3 本章小结

第2章 Python基础

2.1 Python变量类型

2.2 Python语句

2.3 函数和类

2.4 Python代码格式

2.5 Python调试

2.6 本章小结

第3章 简单的Python脚本

3.1 九九乘法表

3.2 斐波那契数列

3.3 概率计算

3.4 读写文件

3.5 本章小结

第4章 Python爬虫常用模块

4.1 Python标准库之urllib2模块

4.2 Python标准库 ——logging模块

4.3 其他有用模块

4.4 本章小结

第5章 Scrapy爬虫框架

5.1 安装Scrapy

5.2 Scrapy选择器XPath和CSS

5.3 Scrapy爬虫实战一:今日影视

5.4 Scrapy爬虫实战二:天气预报

5.5 Scrapy爬虫实战三:获取代理

5.6 Scrapy爬虫实战四:糗事百科

5.7 scrapy爬虫实战五:爬虫攻防

5.8 本章小结

第6章 Beautiful Soup爬虫

6.1 安装Beautiful Soup环境

6.2 BeautifulSoup解析器

6.3 bs4爬虫实战一:获取百度贴吧内容

6.4 bs4爬虫实战二:获取双色球中奖信息

6.5 bs4爬虫实战三:获取起点小说信息

6.6 bs4爬虫实战四:获取电影信息

6.7 bs4爬虫实战五:获取音悦台榜单

6.8 本章小结

第7章 Mechanize模拟浏览器

7.1 安装Mechanize模块

7.2 Mechanize测试

7.3 Mechanize实站一:获取Modem信息

7.4 Mechanize实战二:获取音悦台公告

7.5 本章总结

第8章 Selenium模拟浏览器

8.1 安装Selenium模块

8.2 浏览器选择

8.3 Selenium&PhantomJS抓取数据

8.4 Selenium&PhantomJS实战一:获取代理

8.5 Selenium&PhantomJS实战二:漫画爬虫

8.6 本章总结

精通Python自然语言处理

内容提要

作者简介

审阅者简介

译者简介

前言

第1章 字符串操作

1.1 切分

1.2 标准化

1.3 替换和校正标识符

1.4 在文本上应用Zipf定律

1.5 相似性度量

1.6 小结

第2章 统计语言建模

2.1 理解单词频率

2.2 在MLE模型上应用平滑

2.3 为MLE开发一个回退机制

2.4 应用数据的插值以便获取混合搭配

2.5 通过复杂度来评估语言模型

2.6 在语言建模中应用Metropolis-Hastings算法

2.7 在语言处理中应用Gibbs采样法

2.8 小结

第3章 形态学:在实践中学习

3.1 形态学简介

3.2 理解词干提取器

3.3 理解词形还原

3.4 为非英文语言开发词干提取器

3.5 形态分析器

3.6 形态生成器

3.7 搜索引擎

3.8 小结

第4章 词性标注:单词识别

4.1 词性标注简介

4.2 创建词性标注语料库

4.3 选择一种机器学习算法

4.4 涉及n-gram的统计建模

4.5 使用词性标注语料库开发分块器

4.6 小结

第5章 语法解析:分析训练资料

5.1 语法解析简介

5.2 Treebank建设

5.3 从Treebank提取上下文无关文法规则

5.4 从CFG创建概率上下文无关文法

5.5 CYK线图解析算法

5.6 Earley线图解析算法

5.7 小结

第6章 语义分析:意义很重要

6.1 语义分析简介

6.2 使用Wordnet生成同义词集id

6.3 使用Wordnet进行词义消歧

6.4 小结

第7章 情感分析:我很快乐

7.1 情感分析简介

7.2 小结

第8章 信息检索:访问信息

8.1 信息检索简介

8.2 向量空间评分及查询操作符关联

8.3 使用隐性语义索引开发IR系统

8.4 文本摘要

8.5 问答系统

8.6 小结

第9章 语篇分析:理解才是可信的

9.1 语篇分析简介

9.2 小结

第10章 NLP系统评估:性能分析

10.1 NLP系统评估要点

10.2 IR系统的评估

10.3 错误识别指标

10.4 基于词汇搭配的指标

10.5 基于句法匹配的指标

10.6 使用浅层语义匹配的指标

10.7 小结

累计评论(2条) 3个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部