目录
一、Selenium简介
二、Selenium组成
三、Selenium特点
四、案例演示
4.1 java爬虫入门
① 下载驱动包
② 创建项目并导入依赖
③ 入门
4.2 相关API
① 元素选择方式
② 获取单个元素:driver.findElement
③ 获取多个元素:driver.findElements
④ 输入内容:input.sendKeys("java");
⑤ 元素点击:element.click();
⑥ 获取元素属性:nextPageEle.getAttribute("class");
⑦ 获取标签文本内容:titleEle.getText();
一、Selenium简介
Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。适用于自动化测试,js动态爬虫(破解反爬虫)等领域。
二、Selenium组成
1)Selenium IDE:嵌入到Firefox浏览器中的一个插件,实现简单的浏览器操作录制与回放功能,主要用于快速创建BUG及重现脚本,可转化为多种语言
2)Selenium RC: 核心组件,支持多种不同语言编写自动化测试脚本,通过其服务器作为代理服务器去访问应用,达到测试的目的
3)Selenium WebDriver(重点):一个浏览器自动化框架,它接受命令并将它们发送到浏览器。它是通过特定于浏览器的驱动程序实现的。它直接与浏览器通信并对其进行控制。Selenium WebDriver支持各种编程语言,如Java、C# 、PHP、Python、Perl、Ruby
4)Selenium grid:测试辅助工具,用于做分布式测试,可以并行执行多个测试任务,提升测试效率。
三、Selenium特点
1)开源、免费
2)多浏览器支持:FireFox、Chrome、IE、Opera、Edge;
3)多平台支持:Linux、Windows、MAC;
4)多语言支持:Java、Python、Ruby、C#、JavaScript、C++;
5)对Web页面有良好的支持;
6)简单(API 简单)、灵活(用开发语言驱动);
7)支持分布式测试用例执行。
四、案例演示
爬虫:数据采集、数据清晰、数据分析!!!
4.1 java爬虫入门
我们先创建一个module项目
① 下载驱动包
http://chromedriver.storage.googleapis/index.html
注意:这里的Google要刷新完,要不然版本对不上
我的就 放在E盘下面
② 创建项目并导入依赖
<dependency>
<groupId>org.seleniumhq.selenium</groupId>
<artifactId>selenium-java</artifactId>
<version>3.141.59</version>
</dependency>
③ 入门
//设置驱动
System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");
//创建驱动
WebDriver driver=new ChromeDriver();
//与将要爬取的网站建立连接
driver.get("https://www.baidu");
//关闭浏览器
driver.close();
//释放资源
driver.quit();
这里的图片就是我们百度的官网
我们运行它就会把我们要测试的软件给打开
我们可以根据百度的检查去对应的拿它上面的数据
4.2 相关API
① 元素选择方式
② 获取单个元素:driver.findElement
③ 获取多个元素:driver.findElements
④ 输入内容:input.sendKeys("java");
⑤ 元素点击:element.click();
⑥ 获取元素属性:nextPageEle.getAttribute("class");
⑦ 获取标签文本内容:titleEle.getText();
1)Class选择:driver.findElement(By.className("s_ipt"));
通过类选择器拿到被控制的页面的按钮元素
// WebElement s_btn = driver.findElement(By.className("s_btn"));
// System.out.println(s_btn.getAttribute("id"));
// System.out.println(s_btn.getAttribute("value"));
2)ID选择: driver.findElement(By.id("kw"));
通过id选择器拿到页面中的元素
// WebElement su = driver.findElement(By.id("su"));
// System.out.println(su.getAttribute("class"));
3)name选择: driver.findElement(By.name("wd"));
WebElement tn = driver.findElement(By.name("tn"));
// System.out.println(tn.getAttribute("value"));
4)tag选择: driver.findElements(By.tagName("input"));
获取到百度首页所有点击链接
// List<WebElement> la = driver.findElements(By.tagName("a"));
// for (WebElement a : la) {
a指的是单个A标签
// String text = a.getText();
判空
// if(text!=null && !"".equals(text.trim())){
// System.out.println(text);
// }
// }
这里的图片效果展示不出来,自己摸索一下吧!!!!
5)link选择: driver.findElement(By.linkText("地图"));
通过链接文本获取链接元素, 模拟点击该链接
// driver.findElement(By.linkText("地图")).click();
就比如说:逛淘宝的时候不是都会分页,你总是要点击下一页,这个就是它的作用,模拟点击
6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
通过3获取到所有包含3的连接地址
// List<WebElement> elements = driver.findElements(By.partialLinkText("3"));
// for (WebElement element : elements) {
// System.out.println(element.getText());
// }
这里的图片效果展示不出来,自己摸索一下吧!!!
7)css选择器:driver.findElement(By.cssSelector("#kw"));
这个就是我们从浏览器复制下来的: #hotsearch-content-wrapper > li:nth-child(1)
// 通过CSS选择器获取页面元素
// WebElement element = driver.findElement(By.cssSelector("#hotsearch-content-wrapper > li:nth-child(1)"));
// System.out.println(element.getText());
这里的图片效果展示不出来,自己摸索一下吧!!!
8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
WebElement element = driver.findElement(By.xpath("//*[@id=\"hotsearch-content-wrapper\"]/li[2]"));
// System.out.println(element.getText());
这里就图片效果展示不出来,先是F12检查然后在下面右键检查找到Copy--->里面有很多操作方式,其中一种就是Copy XPath就是我们使用的一种方式
9)模拟搜索 关键字 "禁止收敛url" 获取所有的查询结果
// 拿到百度首页input输入框
WebElement inputsrk = driver.findElement(By.xpath("//*[@id=\"kw\"]"));
// 模拟 往 输入框输入搜索关键字
inputsrk.sendKeys("禁止收敛url");
// 模拟等待
Thread.sleep(3000);
// 获取百度一下的点击按钮
driver.findElement(By.id("su")).click();
更多推荐
Selenium之入门
发布评论