1.由北京航空航天大学拥有近20年软件发、计算机教学经验的教师编写,权威性高,内容质量上乘 2.全新内容结构布局,丰富要提示及课程目标,落实翻转课堂教学理念 3.基础详解 大量案例实战,立足于零基础人群实现网络爬虫从门到精通 4.全新的丰富配套数字化资源,提供语法速查表与算法框架表,提供完整案例运行源代码
售 价:¥
纸质售价:¥42.30购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容提要
前言
基础篇
第1章 Python基础及网络爬虫
1.1 了解Python语言
1.2 配置安装Python开发环境
1.3 Python基础知识
1.4 互联网、HTTP与HTML
1.5 Hello Spider
1.6 分析网站
章节实训:Python环境的配置与爬虫的运行
思考与练习
第2章 静态网页抓取
2.1 从抓取开始
2.2 正则表达式
2.3 BeautifulSoup爬虫
2.4 XPath与lxml
2.5 遍历页面
2.6 使用API
章节实训:哔哩哔哩直播间信息抓取练习
思考与练习
第3章 数据存储
3.1 Python中的文件
3.2 Python中的字符串
3.3 Python中的图片
3.4 CSV文件
3.5 数据库的使用
3.6 其他类型的文档
章节实训:使用Python 3读写SQLite 3数据库
思考与练习
进阶篇
第4章 JavaScript与动态内容
4.1 JavaScript与AJAX技术
4.2 抓取AJAX数据
4.3 抓取动态内容
章节实训:抓取人民邮电出版社热销图书信息
思考与练习
第5章 模拟登录与验证码
5.1 表单
5.2 Cookie
5.3 模拟登录网站
5.4 验证码
章节实训:通过Selenium模拟登录Gitee并保存Cookie
思考与练习
第6章 爬虫数据的分析与处理
6.1 Python与文本分析
6.2 数据处理与科学计算
章节实训:美国新冠疫情每日新增人数的可视化
思考与练习
提高篇
第7章 爬虫的灵活性和多样性
7.1 爬虫的灵活性——以微信数据抓取为例
7.2 爬虫的多样性
7.3 爬虫的部署和管理
章节实训:基于PyQuery抓取菜鸟教程
思考与练习
第8章 Selenium模拟浏览器与网站测试
8.1 测试
8.2 Python的单元测试
8.3 使用Python网络爬虫测试网站
8.4 使用Selenium测试
章节实训:使用Selenium抓取百度搜索引擎中关于“爬虫”的结果
思考与练习
第9章 爬虫框架Scrapy与反爬虫
9.1 爬虫框架
9.2 网站反爬虫
章节实训:使用“反反爬虫”策略抓取某日报网头版的标题内容
思考与练习
实战篇
第10章 实战:保存感兴趣的图片
10.1 豆瓣网分析与爬虫设计
10.2 编写爬虫程序
第11章 实战:抓取二手房数据并绘制热力图
11.1 数据抓取
11.2 绘制热力图
第12章 实战:北京大兴国际机场航班出发时间数据抓取
12.1 程序设计
12.2 爬虫编写
参考文献
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜