一、Selenium简介

二、Selenium组成

三、Selenium特点

四、案例演示

4.1 java爬虫入门

① 下载驱动包

② 创建项目并导入依赖

③ 入门

4.2 相关API

① 元素选择方式

② 获取单个元素：driver.findElement

③ 获取多个元素：driver.findElements

④ 输入内容：input.sendKeys("java");

⑤ 元素点击：element.click();

⑥ 获取元素属性：nextPageEle.getAttribute("class");

⑦ 获取标签文本内容：titleEle.getText();

一、Selenium简介

Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Google Chrome，Opera等。适用于自动化测试，js动态爬虫（破解反爬虫）等领域。

二、Selenium组成

1）Selenium IDE：嵌入到Firefox浏览器中的一个插件，实现简单的浏览器操作录制与回放功能，主要用于快速创建BUG及重现脚本，可转化为多种语言
2）Selenium RC：核心组件，支持多种不同语言编写自动化测试脚本，通过其服务器作为代理服务器去访问应用，达到测试的目的
3）Selenium WebDriver（重点）：一个浏览器自动化框架，它接受命令并将它们发送到浏览器。它是通过特定于浏览器的驱动程序实现的。它直接与浏览器通信并对其进行控制。Selenium WebDriver支持各种编程语言，如Java、C# 、PHP、Python、Perl、Ruby
4）Selenium grid：测试辅助工具，用于做分布式测试，可以并行执行多个测试任务，提升测试效率。

三、Selenium特点

1）开源、免费
2）多浏览器支持:FireFox、Chrome、IE、Opera、Edge;
3）多平台支持:Linux、Windows、MAC;
4）多语言支持:Java、Python、Ruby、C#、JavaScript、C++;
5）对Web页面有良好的支持；
6）简单(API 简单)、灵活(用开发语言驱动);
7）支持分布式测试用例执行。

四、案例演示

爬虫：数据采集、数据清晰、数据分析！！！

4.1 java爬虫入门

我们先创建一个module项目

① 下载驱动包

http://chromedriver.storage.googleapis/index.html

注意：这里的Google要刷新完，要不然版本对不上

我的就放在E盘下面

② 创建项目并导入依赖

 <dependency>
        <groupId>org.seleniumhq.selenium</groupId>
        <artifactId>selenium-java</artifactId>
        <version>3.141.59</version>
     </dependency>

③ 入门

 //设置驱动
     System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");
     //创建驱动
     WebDriver driver=new ChromeDriver();
     //与将要爬取的网站建立连接
     driver.get("https://www.baidu");
     //关闭浏览器
     driver.close();
     //释放资源
     driver.quit();

这里的图片就是我们百度的官网

我们运行它就会把我们要测试的软件给打开

我们可以根据百度的检查去对应的拿它上面的数据

4.2 相关API

① 元素选择方式

② 获取单个元素：driver.findElement

③ 获取多个元素：driver.findElements

④ 输入内容：input.sendKeys("java");

⑤ 元素点击：element.click();

⑥ 获取元素属性：nextPageEle.getAttribute("class");

⑦ 获取标签文本内容：titleEle.getText();

1）Class选择：driver.findElement(By.className("s_ipt"));

 通过类选择器拿到被控制的页面的按钮元素
//        WebElement s_btn = driver.findElement(By.className("s_btn"));
//        System.out.println(s_btn.getAttribute("id"));
//        System.out.println(s_btn.getAttribute("value"));

2）ID选择： driver.findElement(By.id("kw"));

 通过id选择器拿到页面中的元素
//        WebElement su = driver.findElement(By.id("su"));
//        System.out.println(su.getAttribute("class"));

3）name选择： driver.findElement(By.name("wd"));

 WebElement tn = driver.findElement(By.name("tn"));
//        System.out.println(tn.getAttribute("value"));

4）tag选择： driver.findElements(By.tagName("input"));

获取到百度首页所有点击链接
//        List<WebElement> la = driver.findElements(By.tagName("a"));
//        for (WebElement a : la) {
            a指的是单个A标签
//            String text = a.getText();
            判空
//            if(text!=null && !"".equals(text.trim())){
//                System.out.println(text);
//            }
//        }

这里的图片效果展示不出来，自己摸索一下吧！！！！

5）link选择： driver.findElement(By.linkText("地图"));

 通过链接文本获取链接元素, 模拟点击该链接
//            driver.findElement(By.linkText("地图")).click();

就比如说：逛淘宝的时候不是都会分页，你总是要点击下一页，这个就是它的作用，模拟点击

6）Partial link选择（a标签文本内容模糊匹配）：driver.findElement(By.partialLinkText("使用百"));

  通过3获取到所有包含3的连接地址
//        List<WebElement> elements = driver.findElements(By.partialLinkText("3"));
//        for (WebElement element : elements) {
//            System.out.println(element.getText());
//        }

这里的图片效果展示不出来，自己摸索一下吧！！！

7）css选择器：driver.findElement(By.cssSelector("#kw"));

这个就是我们从浏览器复制下来的： #hotsearch-content-wrapper > li:nth-child(1)
//       通过CSS选择器获取页面元素
//        WebElement element = driver.findElement(By.cssSelector("#hotsearch-content-wrapper > li:nth-child(1)"));
//        System.out.println(element.getText());

这里的图片效果展示不出来，自己摸索一下吧！！！

8）xpath选择：driver.findElement(By.xpath("//*[@id=\"kw\"]"));

 WebElement element = driver.findElement(By.xpath("//*[@id=\"hotsearch-content-wrapper\"]/li[2]"));
//        System.out.println(element.getText());

这里就图片效果展示不出来，先是F12检查然后在下面右键检查找到Copy--->里面有很多操作方式，其中一种就是Copy XPath就是我们使用的一种方式

 9）模拟搜索 关键字 "禁止收敛url" 获取所有的查询结果

//        拿到百度首页input输入框
        WebElement inputsrk = driver.findElement(By.xpath("//*[@id=\"kw\"]"));

//        模拟 往 输入框输入搜索关键字
        inputsrk.sendKeys("禁止收敛url");

//        模拟等待
        Thread.sleep(3000);

//        获取百度一下的点击按钮
       driver.findElement(By.id("su")).click();

更多推荐

Selenium之入门

Selenium之入门

一、Selenium简介

二、Selenium组成

三、Selenium特点

四、案例演示

4.1 java爬虫入门

① 下载驱动包

② 创建项目并导入依赖

③ 入门

4.2 相关API

① 元素选择方式

② 获取单个元素：driver.findElement

③ 获取多个元素：driver.findElements

④ 输入内容：input.sendKeys("java");

⑤ 元素点击：element.click();

⑥ 获取元素属性：nextPageEle.getAttribute("class");

⑦ 获取标签文本内容：titleEle.getText();

发布评论取消回复

最近发表

热门文章

标签列表

Selenium之入门

一、Selenium简介

二、Selenium组成

三、Selenium特点

四、案例演示

4.1 java爬虫入门

① 下载驱动包

② 创建项目并导入依赖

③ 入门

4.2 相关API

① 元素选择方式

② 获取单个元素：driver.findElement

③ 获取多个元素：driver.findElements

④ 输入内容：input.sendKeys("java");

⑤ 元素点击：element.click();

⑥ 获取元素属性：nextPageEle.getAttribute("class");

⑦ 获取标签文本内容：titleEle.getText();

相关文章

发布评论取消回复

最近发表

热门文章

标签列表