万本电子书0元读

万本电子书0元读

顶部广告

网络爬虫原理与实践:基于C#语言电子书

售       价:¥

纸质售价:¥55.30购买纸书

36人正在读 | 0人评论 6.4

作       者:李健,种惠芳

出  版  社:机械工业出版社

出版时间:2022-11-15

字       数:11.0万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书基于C#语言介绍网络爬虫发的基本原理、技巧和应用实例,适合网络爬虫发的爱好者和研究者阅读。读者*好具备一定的编程基础,或者正在学习C#编程,以便更好地理解本书的内容。 本书具有以下特: 1)内容简明、由浅深。本书不追求内容上的面面俱到,而是围绕网络爬虫的核心环节,介绍其基本原理和实现方法,并行适当的功能扩展。与其他同类书籍相比,本书篇幅适中,适合初学者阅读。 2)实例丰富,代码翔实。书中尽量选择逻辑简明、功能完整的典型实例,从需求、设计、实现的角度分别行介绍。而且,几乎所有实例都给出了主要实现代码,并对关键代码行了详细注释,方便读者行实践。<br/>
目录展开

前言

第1章 网络爬虫概述

1.1 网络基础

1.2 网页知识

1.3 网络爬虫的原理

第2章 C#编程基础

2.1 C#语言概述

2.2 数据和运算

2.3 流程控制

2.4 常用数据结构

第3章 网络资源下载

3.1 同步下载

3.2 异步下载

3.3 通用资源下载器

第4章 网页数据抽取

4.1 正则表达式抽取

4.2 XPath抽取

4.3 HTML解析器

4.4 综合实例:新闻资讯爬虫

第5章 其他数据抽取

5.1 XML数据抽取

5.2 JSON数据抽取

5.3 综合实例1:天气爬虫

5.4 综合实例2:音乐爬虫

第6章 数据存储

6.1 数据的维度

6.2 文件存储

6.3 数据库存储

第7章 爬虫控制

7.1 爬虫搜索方式

7.2 爬虫控制器

7.3 综合实例:站内文章爬虫

第8章 多线程爬虫

8.1 多线程机制

8.2 多线程爬虫

8.3 自定义线程池

8.4 多线程爬虫控制器

第9章 使用代理

9.1 代理机制

9.2 自定义代理池

第10章 模拟浏览器

10.1 浏览器的工作原理

10.2 使用浏览器内核

10.3 综合实例:网页翻译爬虫

第11章 可视化模板配置

11.1 可视化模板配置方法

11.2 综合实例:可视化网页文章爬虫

参考文献

推荐阅读

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部