• 🔔 B站主页:https://space.bilibili/1707990930
  • 📣 欢迎🎉点赞👍收藏🌟评论📝如有错误请指正!
  • 💻 Python&Java领域博主
  • 😁 你们的支持是我最大的动力

你好,我是爱丽

我是一名自由工程师,正在创业中。
目前,我正在参与一个涉及抓取和自然语言处理的分析项目。

这一次,我将介绍“使用Python学习网页爬虫的3本推荐书籍”。

我会按照难度和目的介绍了它们。

文章目录

  • 3本精挑细选的网络爬虫书籍
    • 推荐①:用Python写网络爬虫(web scraping with python)
    • 推荐② : Python网络数据采集(Web Scraping with Python: Collecting Data from the Modern Web)
    • 推荐③ : Python网络爬虫权威指南(第2版)
  • 爬虫学习中除了 Python 之外的三件事
    • 学习内容①:HTML、CSS
    • 学习内容②:JavaScript
    • 学习内容③:网络知识
  • 总结:免费学习Python和爬虫【比书上易懂】

3本精挑细选的网络爬虫书籍

我将介绍一本使用 Python 学习网络抓取的书。

如果你是初学者,最好从“推荐①”开始。,因为随着你从上到下的阅读,难度会增加。

推荐①:用Python写网络爬虫(web scraping with python)

这是最适合爬虫初学者的一本书籍,但是你得先了解完基础知识在看。

我学完了python基础语法,想看书入门爬虫,不知道从哪开始?

在这种情况下,建议从本书开始。
毫无挫折地学习网页抓取的基础知识。

作者对爬虫的编写考虑较为全面,且有相关练习网页可以实操,所以很适合初学者阅读

缺点是不够实际使用。
如果你开始阅读本书,你需要用其他教材来补充你的知识。

推荐② : Python网络数据采集(Web Scraping with Python: Collecting Data from the Modern Web)

作者是此行达人,踩坑踩多了都是直接上经验。

非常提纲携领地讲解了python爬虫可能涉及到的各个方面的知识。

非常全面和广泛,但也牺牲了细节。

不错的代码实例一定程度上弥补了细节不足的缺陷。

算是鸟瞰整个知识领域的书,值得入门阅读。

推荐③ : Python网络爬虫权威指南(第2版)

O’Reilly是一家可靠的、值得信赖的公司。

在这本书中,你可以学到单元测试、并行化和避免陷阱等高级课题。

当你觉得自己已经学习了 "推荐②"时,建议在这本书上下功夫,但这还远远不够。

我给它的优先级低于推荐②的原因是,英译中的翻译有点难读,我个人不喜欢这种编码风格。

在Python中,我们使用下划线来连接两者,如create_transaction。
但在本书中,它被写成了createTransaction和GO语言。

爬虫学习中除了 Python 之外的三件事

如果你想学习网页抓取,除了 Python 之外,你还应该了解以下内容。

HTML、CSS
JavaScript
网络基础知识

学习内容①:HTML、CSS

网页抓取是一种“从网页中提取信息的技术”。

网页是用 HTML 和 CSS 编写的。

这意味着如果你不了解 HTML 或 CSS,你将无法提取所需的信息。

所以HTML5和CSS3也是你必学的

学习内容②:JavaScript

基本上,你可以通过理解 HTML 和 CSS 来抓取。

但是,根据你抓取的站点,可能会出现以下问题。

不登录应用就无法获取你想要的数据
除非按“更多”,否则无法显示要获取的列表
不向下滚动就看不到想要获取的数据

即使在Web应用程序的开发中,如果你想抓取数据,JavaScript的知识也是必不可少的。

让我们在这个时候掌握基本知识。

学习内容③:网络知识

我想解释一下“首先围绕 Web 的知识是什么”。

要使用 Python 进行抓取,请按照以下步骤操作。

STEP①:访问Python程序上的URL
STEP②:从访问结果中获取HTML信息
STEP③:解析获取的HTML,获取想要的数据

首先,你需要在 Python 中访问 URL。

但此时,“GET”和“POST”的概念出现了。

这个“GET”或“POST”是关于网络的知识。

实际上,在访问 URL 时,访问方法是通过使用“GET”或“POST”来改变的。

使用 Google Chrome 浏览器不必担心,但程序不需要。

因此,如果你想学习抓取,请保留你对网络的了解。

总结:免费学习Python和爬虫【比书上易懂】

这一次,我介绍了一本使用Python学习网页抓取的书。

但是,我个人不建议初学者用书来学习。

那么,要做的就是推荐使用视频而不是书籍来学习。

原因如下。

读书变得无聊
如果是视频,你可以通过做同样的动作来执行代码
如果是视频,很容易理解,因为即使有“耳朵”也能输入

总之,书本学习不太适合初学者。

如果有的话,书籍和书籍可以说是你习惯编程时使用的物品。

如果你还不熟悉编程,让我们通过视频学习。

以上的书籍以及视频资料我都准备好了离线版,如果你需要的话可以通过以下方式获取哦

更多推荐

【3本精挑细选的书籍】网络爬虫推荐书籍(Python)【从0到实践】