课程:b站《web scraper使用教程》 永恒君的百宝箱

Web Scraper 使用教程(一) 安装_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili

Google浏览器

官方视频介绍:https://chrome.google/webstore/detail/web-scraper-free-web-scra/jnhgnonknehpejjnehehllkliplmbmhn/related

目录

1. 简介

2. 安装方法

3. 基本用法

4. 进阶用法


1. 简介

浏览器数据获取工具

chrome插件

跨平台

2. 安装方法

谷歌浏览器中直接搜索,或在谷歌应用商店中搜索web scaper即可

3. 基本用法

(1)启动界面

打开要爬取的界面,例如:https://www.797rs/news/news_list/id/10.html

按F12

(2)基本配置

开始创建、配置爬虫

create new sitemap-》Create sitemap-》输入名称和start url-》点击create sitemap

点击sitemaps可以看见所有创建的项目

点击刚才创建的项目rs-0226进入,点击 add new selector

填写Id(自己填写,便于区分即可,不可大写),Type(类型),

Selector 一般选择第一个Select(通过手动的鼠标去点击,点击后会自动生成代码),比如说点击标题,点击第二个标题时,发现全部的标题都成为了红色,红色就表示这些内容全部选中了

点完后,点击Done selecting

 

 

因为要选择多项,所以勾选Multiple

Parent selectors不改变,之后点击save selector

(3)运行爬虫

保存后便可以开始爬取

点击上面的Sitemap rs-0226(这是自己起的名字)-》scrape

Request interbal和 page load delay一般不变,直接点击 start scraping即可

 

 

爬取时会出现一个界面,爬取完后自动消失,爬取结束后点击refresh即可看到爬取内容

 可以把这些数据保存下来

 

4. 进阶用法

见下篇文章 :Web scraper使用教程-进阶用法

更多推荐

Web scraper使用教程-基本用法