首页 > 编程开发文章详情

python爬虫时爬虫爬数据时出现“访问本页面，请开启JavaScript并刷新该页”

编程开发更新时间:2023-03-25 21:11:31

最近没事的时候就爱爬小说玩，也不看，就是觉得爬小说好嗨皮(▽)。以前都是在网上下TXT，现在发现，有可能也是这么来的(▽)

但执行的时候一直有个问题，之前也没怎么注意，因为没有打印页面的信息，所以一直没注意，今天打印了下，在打印的页面中发现了"访问本页面，请开启JavaScript并刷新该页"。

我仔细一想这大概是网站做的反爬。百度了下后，大概是知道了为什么会这样。

原因：页面加载是通过JS刷新页面，或者是中间有一个过渡的301或302跳转页面。由于直接请求获取后JS刷新不完全或者是请求的地址是301或302这样的跳转页面，自然就得不到想要的信息和数据了。

解决办法：
1、一种是在headers中添加该网站的Cookie，但需要注意的是Cookie的值过一段时间会发生变化，要重新获取。

但是，好像过段时间cookie就不管用了，就得重新获取新的。不知道是为啥。

2、第二种方法，我看搜的是用的是requests模块，这个模块可以很好的解决JS加载不完全的问题。目前对requests模块还不是特别熟悉，就不卖弄了。

更多推荐

python爬虫时爬虫爬数据时出现“访问本页面,请开启JavaScript并刷新该页”

本文发布于:2023-03-25 21:11:00，感谢您对本站的认可！

本文链接:https://www.52dianzi.com/category/article/3fee409a280e2384898f818362fe9b9d.html

版权声明:本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

爬虫本页面该页数据 python

上一篇：盘点四个最好用的JavaScript语言IDE
下一篇：返回列表

智慧餐饮开发|APP开发|盲盒商城源码

发布评论取消回复

评论列表（有 0 条评论）

热门文章