本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展介绍相关的理论知识,推导生成可行的解决方案,*后落实在任务实现环节。 全书大部分章节紧扣任务需求展,不堆积知识,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化 Python网络爬虫技术。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
售 价:¥
纸质售价:¥29.60购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容提要
大数据专业系列图书编写委员会
前言
第1章 Python爬虫环境与爬虫简介
任务1.1 认识爬虫
任务1.2 认识反爬虫
任务1.3 配置Python爬虫环境
小结
实训 Python爬虫环境配置
课后习题
第2章 网页前端基础
任务2.1 认识Python网络编程
任务2.2 认识HTTP
小结
实训 使用Socket库连接百度首页
课后习题
第3章 简单静态网页爬取
任务3.1 实现HTTP请求
任务3.2 解析网页
任务3.3 数据存储
小结
实训
课后习题
第4章 常规动态网页爬取
任务4.1 逆向分析爬取动态网页
任务4.2 使用Selenium库爬取动态网页
任务4.3 存储数据至MongoDB数据库
小结
实训
课后习题
第5章 模拟登录
任务5.1 使用表单登录方法实现模拟登录
任务5.2 使用Cookie登录方法实现模拟登录
小结
实训
课后习题
第6章 终端协议分析
任务6.1 分析PC客户端抓包
任务6.2 分析App抓包
小结
实训
课后习题
第7章 Scrapy爬虫
任务7.1 认识Scarpy
任务7.2 通过Scrapy爬取文本信息
任务7.3 定制中间件
小结
实训
课后习题
附录A
附录B
参考文献
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜