万本电子书0元读

万本电子书0元读

顶部广告

Python网络爬虫:从入门到精通(附微课)电子书

1.由北京航空航天大学拥有近20年软件发、计算机教学经验的教师编写,权威性高,内容质量上乘 2.全新内容结构布局,丰富要提示及课程目标,落实翻转课堂教学理念 3.基础详解 大量案例实战,立足于零基础人群实现网络爬虫从门到精通 4.全新的丰富配套数字化资源,提供语法速查表与算法框架表,提供完整案例运行源代码

售       价:¥

纸质售价:¥35.20购买纸书

395人正在读 | 0人评论 6.5

作       者:吕云翔 主编

出  版  社:人民邮电出版社有限公司

出版时间:2023-07-01

字       数:23.7万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书主要介绍如何使用Python语言行网络爬虫程序的发,从Python语言的基本特性手,详细介绍Python网络爬虫发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。 本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。<br/>【推荐语】<br/>1.由北京航空航天大学拥有近20年软件发、计算机教学经验的教师编写,权威性高,内容质量上乘 2.全新内容结构布局,丰富要提示及课程目标,落实翻转课堂教学理念 3.基础详解 大量案例实战,立足于零基础人群实现网络爬虫从门到精通 4.全新的丰富配套数字化资源,提供语法速查表与算法框架表,提供完整案例运行源代码<br/>【作者】<br/>吕云翔 比利时布鲁塞尔自由大学应用科学学院应用信息技术专业硕士、经济学院工商管理专业硕士,北京航空航天大学软件学院副教授,硕士生导师。主要研究方向:软件工程、人工智能、大数据。具有多年的软件发、项目管理、计算机教学经验,对IT行业具有较全面的认识,编著教材多部。曾获得北航教学成果一等奖、二等奖(教材)、三等奖(教材)。<br/>
目录展开

内容提要

前言

基础篇

第1章 Python基础及网络爬虫

1.1 了解Python语言

1.2 配置安装Python开发环境

1.3 Python基础知识

1.4 互联网、HTTP与HTML

1.5 Hello Spider

1.6 分析网站

章节实训:Python环境的配置与爬虫的运行

思考与练习

第2章 静态网页抓取

2.1 从抓取开始

2.2 正则表达式

2.3 BeautifulSoup爬虫

2.4 XPath与lxml

2.5 遍历页面

2.6 使用API

章节实训:哔哩哔哩直播间信息抓取练习

思考与练习

第3章 数据存储

3.1 Python中的文件

3.2 Python中的字符串

3.3 Python中的图片

3.4 CSV文件

3.5 数据库的使用

3.6 其他类型的文档

章节实训:使用Python 3读写SQLite 3数据库

思考与练习

进阶篇

第4章 JavaScript与动态内容

4.1 JavaScript与AJAX技术

4.2 抓取AJAX数据

4.3 抓取动态内容

章节实训:抓取人民邮电出版社热销图书信息

思考与练习

第5章 模拟登录与验证码

5.1 表单

5.2 Cookie

5.3 模拟登录网站

5.4 验证码

章节实训:通过Selenium模拟登录Gitee并保存Cookie

思考与练习

第6章 爬虫数据的分析与处理

6.1 Python与文本分析

6.2 数据处理与科学计算

章节实训:美国新冠疫情每日新增人数的可视化

思考与练习

提高篇

第7章 爬虫的灵活性和多样性

7.1 爬虫的灵活性——以微信数据抓取为例

7.2 爬虫的多样性

7.3 爬虫的部署和管理

章节实训:基于PyQuery抓取菜鸟教程

思考与练习

第8章 Selenium模拟浏览器与网站测试

8.1 测试

8.2 Python的单元测试

8.3 使用Python网络爬虫测试网站

8.4 使用Selenium测试

章节实训:使用Selenium抓取百度搜索引擎中关于“爬虫”的结果

思考与练习

第9章 爬虫框架Scrapy与反爬虫

9.1 爬虫框架

9.2 网站反爬虫

章节实训:使用“反反爬虫”策略抓取某日报网头版的标题内容

思考与练习

实战篇

第10章 实战:保存感兴趣的图片

10.1 豆瓣网分析与爬虫设计

10.2 编写爬虫程序

第11章 实战:抓取二手房数据并绘制热力图

11.1 数据抓取

11.2 绘制热力图

第12章 实战:北京大兴国际机场航班出发时间数据抓取

12.1 程序设计

12.2 爬虫编写

参考文献

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部