欢迎光临当当，请登录免费注册

男频| 女频

当当云阅读

当当云阅读文字

万本电子书0元读

万本电子书0元读

搜索

购物车

图书分类

小说: 侦探/悬疑/推理; 情感/都市; 科幻/魔幻; 作品集; 外国小说

文艺: 文学; 青春文学; 传记; 艺术; 动漫/幽默

历史文化: 哲学/宗教; 历史; 政治/军事; 文化; 社会科学; 古籍; 法律

经济/管理: 管理; 经济; 投资理财; 市场/营销; 商务沟通; 中国经济; 国际经济

心理/励志: 心理学; 女性心理学; 儿童心理学; 情绪管理; 职场/人际交往; 人生哲学

生活: 两性关系; 亲子/家教; 旅游/地图; 烹饪/美食; 保健/养生

童书: 儿童文学; 启蒙读物; 少儿英语; 动漫/图画书

科技/教育: 科普读物; 计算机/网络; 自然科学; 中小学教辅; 考试; 外语; 工具书

原版书: 外文原版书; 港台圖書; 小语种

我要充值赠送20%

顶部广告

当当云阅读 > 科技 > 计算机/网络 > 程序设计 > Python网络爬虫技术与应用

Python网络爬虫技术与应用

| | 手机阅读

扫描下载当当云阅读App

Python网络爬虫技术与应用电子书

读者对象《Python网络爬虫技术与应用》可作为高等院校大数据、计算机、电子信息、软件技术相关专业研究生和高年级本科生的教材，也可作为大数据及编程爱好者的参考用书。本书特色 ★★以Python网络爬虫发为主线，兼顾理论与实战。 ★★赠送课程大纲、教学课件PPT、实验手册、各章习题及答案、期末试卷及答案、教学和实验视频，方便教师授课。

售价：¥

纸质售价：¥54.40购买纸书

304人正在读 | 0人评论

6.5

作者：邓维,李贝,汤小洋,康毅滨,林海玉,刘燕秋,林建雄,刘庆胜,钟晓颖

出版社：清华大学出版社

出版时间：2022-08-01

字数：14.3万

所属分类：科技 > 计算机/网络 > 程序设计

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(0条)

读书简介
目录
累计评论(0条)

网络爬虫技术的重之一是网络爬虫框架，因此《Python网络爬虫技术与应用》结合网络爬虫框架的相关案例重介绍网络爬虫的常见框架，包括PySpider网络爬虫框架的安装和使用，Scrapy网络爬虫框架的安装和使用，以及Scrapy网络爬虫管理与部署。另外，《Python网络爬虫技术与应用》对Python网络爬虫发需要的reguests库、Scrapy解析库、存储库、XPath行了介绍，并介绍了requests库、正则表达式、XPath等的使用方法，还重讲解了这些库的实际应用。《Python网络爬虫技术与应用》以Python网络爬虫发为主线，兼顾理论与实战，全面介绍可操作的Python环境与系统发相关知识，以及大数据算法、大数据分析、大数据系统互补的作用。另外，《Python网络爬虫技术与应用》还赠送课程大纲、教学课件PPT、实验手册、各章习题及答案、期末试卷及答案、教学和实验视频，方便教师授课。《Python网络爬虫技术与应用》可作为高等院校大数据、计算机、电子信息、软件技术相关专业研究生和高年级本科生的教材，也可作为大数据及编程爱好者的参考用书。<br/>【推荐语】<br/>读者对象《Python网络爬虫技术与应用》可作为高等院校大数据、计算机、电子信息、软件技术相关专业研究生和高年级本科生的教材，也可作为大数据及编程爱好者的参考用书。本书特色 ★★以Python网络爬虫发为主线，兼顾理论与实战。 ★★赠送课程大纲、教学课件PPT、实验手册、各章习题及答案、期末试卷及答案、教学和实验视频，方便教师授课。 <br/>

目录展开

内容简介

前言

第1章网络爬虫概述

1.1 网络爬虫简介

1.1.1 网络爬虫的概念与类别

1.1.2 网络爬虫的流程

1.1.3 网络爬虫的抓取

1.2 网络爬虫的攻防战

1.3 反网络爬虫技术及解决方案

1.4 本章习题

第2章 Python基本知识介绍

2.1 Python编程

2.1.1 Python的安装与环境配置

2.1.2 PyCharm的安装与使用

2.2 HTML基本原理

2.2.1 HTML简介

2.2.2 HTML的基本原理

2.3 基本库的使用

2.3.1 urllib库

2.3.2 requests库

2.3.3 re库

2.4 实战案例：百度新闻的抓取

2.5 本章习题

第3章原生态网络爬虫开发

3.1 requests库详解

3.1.1 requests语法

3.1.2 requests库的使用

3.2 正则表达式

3.2.1 正则表达式详解与使用

3.2.2 Python与Excel

3.3 实战案例：环球新闻的抓取

3.4 本章习题

第4章解析HTML内容

4.1 XPath的介绍与使用

4.1.1 XPath的介绍

4.1.2 XPath的使用

4.2 lxml库的安装与使用

4.2.1 lxml库的安装

4.2.2 lxml库的常见方法使用

4.3 Chrome浏览器分析网站

4.4 BeautifulSoup的安装与使用

4.5 实战案例：BeautifulSoup的使用

4.6 页面请求与JSON

4.6.1 JSON的介绍与应用

4.6.2 GET请求和POST请求

4.7 模拟浏览器

4.7.1 Selenium的介绍与安装

4.7.2 模拟点击

4.7.3 Ajax结果提取

4.8 实战案例：小说网站的抓取

4.9 模拟登录与验证

4.9.1 复杂的页面请求

4.9.2 代理IP

4.9.3 Cookie的使用与证书

4.9.4 使用Selenium进行模拟登录

4.10 验证码

4.10.1 手动打码

4.10.2 自动打码

4.11 实战案例：模拟登录及验证

4.11.1 基本思路与方法

4.11.2 使用Cookie

4.12 本章习题

第5章 Python与数据库

5.1 MySQL数据库的安装与应用

5.1.1 MySQL数据库的安装

5.1.2 MySQL数据库的应用

5.2 MongoDB的安装与使用

5.2.1 MongoDB的安装

5.2.2 MongoDB的使用

5.2.3 MongoDB的可视化工具RockMongo

5.3 Python库pymongo

5.4 本章习题

第6章 Python网络爬虫框架

6.1 Python网络爬虫的常见框架

6.2 PySpider网络爬虫框架简介

6.3 Scrapy网络爬虫框架简介

6.4 PySpider与Scrapy的区别

6.5 PySpider网络爬虫框架的安装和使用

6.5.1 PySpider的安装与部署

6.5.2 PySpider的界面介绍

6.5.3 PySpider的多线程网络爬虫

6.5.4 使用Phantomjs渲染

6.5.5 PySpider网络爬虫时间控制

6.5.6 RabbitMQ队伍去重

6.5.7 在Linux系统下安装部署PySpider

6.5.8 实战案例：使用PySpider抓取题库

6.6 Scrapy网络爬虫框架的安装和使用

6.6.1 Scrapy的简介与安装

6.6.2 Scrapy的项目文件介绍

6.6.3 Scrapy的使用

6.6.4 Scrapy中使用XPath

6.6.5 Scrapy与MongoDB

6.6.6 Scrapy_Redis的安装与使用

6.6.7 使用Redis缓存网页并自动去重

6.6.8 实战案例：抓取豆瓣Top250

6.7 Scrapy网络爬虫管理与部署

6.7.1 Scrapyd管理网络爬虫

6.7.2 使用SpiderKeeper进行任务监控与定时抓取

6.7.3 Supervisor网络爬虫进程管理

6.7.4 Scrapy项目设计思路

6.7.5 实战案例

6.8 本章习题

第7章综合性实战案例

7.1 实战案例1：瀑布流抓取

7.2 实战案例2：网络爬虫攻防战

7.2.1 网络爬虫攻防技术认识

7.2.2 代理IP地址网站

7.2.3 抓取新浪微博内容

7.2.4 获得微博内容信息并保存到文本中

7.3 实战案例3：分布式抓取

7.3.1 背景/案例知识介绍

7.3.2 某研究中心的数据抓取

7.3.3 查看效果

7.4 实战案例4：微信公众号文章点赞阅读数抓取

7.4.1 所运用的内容讲解

7.4.2 抓取微信公众号文章的评论数据

7.4.3 效果展示

本章习题

参考文献

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

当当云阅读

买过这本书的人还买过

读了这本书的人还在读

支持设备

同类图书排行榜

01

图解Skill:AI提效实战指南

图解Skill:AI提效实战指南￥39.90

宝玉著

￥39.90

02

Python从入门到全栈开发

Python从入门到全栈开发￥70.00

钱超

￥70.00

03

大模型应用开发动手做AI Agent

大模型应用开发动手做AI Agent ￥57.47

黄佳著

￥57.47

04

Python编程:从入门到实践(第3版)

Python编程:从入门到实践(第3版) ￥54.90

[美]埃里克·马瑟斯(Eric Matthes) 著

￥54.90

05

Python网络爬虫与数据分析从入门到实践

Python网络爬虫与数据分析从入门到实践￥55.86

马国俊

￥55.86

06

程序员必会的40种算法

程序员必会的40种算法￥59.40

(加)伊姆兰·艾哈迈德(Imran Ahmad)

￥59.40

07

Python完全自学教程

Python完全自学教程￥57.54

明日科技编著

￥57.54

08

懒人“养虾”攻略:OpenClaw+豆包+扣子+飞书落地实战指南

懒人“养虾”攻略:OpenClaw+豆包+扣子+飞书落地实战指南￥45.00

林园编著

￥45.00

09

量化投资：策略与技术

量化投资：策略与技术￥22.00

丁鹏

￥22.00

10

Python+Office:轻松实现Python办公自动化

Python+Office:轻松实现Python办公自动化￥55.30

王国平

￥55.30

更多同类图书 >

电子书排行榜

新书排行榜

5元封顶

关注我们

最受欢迎的阅读产品

关注我们：
- 新浪微博
- 官方微信
关于我们

欢迎反馈宝贵意见给我们

客服书吧：当当云阅读问答

意见反馈

Copyright (C) 当当网 2004-2022, All Rights Reserved

京ICP备17043473号-1 | 出版物经营许可证新出发京批字第直0673号

当当网收录的免费小说作品、频道内容、书友评论、用户上传文字、图片等其他一切内容及在当当网所做之广告均属用户个人行为，与当当网无关。

当当云阅读

二维码

0元畅读数万本精选电子书