首页 技术 正文
技术 2022年11月22日
0 收藏 305 点赞 3,452 浏览 2661 个字

一、特殊操作处理

1. 下拉选择框操作

1.1 如何操作下拉选择框

实现方式一

思路:先定位到要操作的option元素,然后执行点击操作

driver.find_element_by_css_selector("[value='xxx']").click()
1.2 Select类

说明:Select类是Selenium为操作select标签特殊封装的

实例化对象:

select = Select(element)
element: <select>标签对应的元素,通过元素定位方式获取
例如:driver.find_element_by_id("selectA")

方法:

  1. select_by_index(index)--> 根据option索引来定位,从0开始
2. select_by_value(value) -->根据option属性 value值来定位
3. select_by_visible_text(text) -->根据option显示文本来定位

操作:

  1. 导包:from selenium.webdriver.support.select  import Select
2. 实例化:s = Select(element)
3. 调用方法:s.select_by_index()

注意:

  1. 实例化select时,需要的参数为select标签元素
  2. 调用Select类小面的方法,是通过索引、value属性值、显示文本去控制,不需要click事件

2.弹出框

网页中常用的弹出框:

  1. alert 警告框
  2. confirm 确认框
  3. prompt 提示框
2.1 弹出框处理方法

说明:Selenium中对处理弹出框的操作,有专用的处理方法;并且处理的方法都一样

  1. 获取弹出框对象

    alert = driver.switch_to.alert
  2. 调用

    ​alert..text–> 返回alert/confirm/prompt中的文字信息

    ​alert.accept() –> 接收对话框选项(同意)

    ​alert.dismiss()–> 取消对话框选项(取消)

3.滚动条

滚动条:一种可控制页面显示范围的组件

3.1 实现方式

说明:selenium中并没有直接提供操作滚动条的方法,但是它提供了可执行JavaScrip脚本的方法,所以我们可以通过JavaScrip脚本来达到操作滚动条的目的

1. 设置JavaScrip脚本控制滚动条
js = "window.scrollTo(0,1000)"
(0:左边距;1000:上边距;单位像素)2. selenium调用执行JavaScrip脚本的方法
driver.execute_script(js)

4. frame切换

frame:HTML页面中的一种框架,主要作用是在页面中指定区域显示另一页面元素

4.1 frame切换方法

说明:在selenium中封装了如何切换frame框架的方法

方法:

1. driver.seitch_to.frame(frame_reference)-->切换到指定frame的方法
frame_reference: 可以为frame框架的name、id或者定位到的frame元素
2. driver.switch_to.default_content()--> 恢复默认页面方法

5. 多窗口切换

说明:在HTML页面中,当点击超链接或者按钮时,有的会在新的窗口打开页面

5.1 实现方法

说明:在Selenium中封装了获取当前窗口句柄、获取所有窗口句柄和切换到指定句柄窗口的方法;

​句柄:英文handle, 窗口的唯一识别码

方法:

1. driver.current_window_handle--> 获取当前窗口句柄
2. driver.window_handles --> 获取所有窗口句柄
3.driver.switch_to.window(handle)--> 切换指定句柄窗口

6.窗口截图

说明:把当前操作的页面,截图保存到指定位置

6.1 截图方法

说明:在Selenium中,提供了截图的方法,我们只需要调用即可

方法:

​driver.get_screenshot_as_file(imgpath)

​imgpath:图片保存路径

​当前目录:./test.png

​上一级目录:../test.png

7.验证码

说明:一种随机生成的信息(数字、字母、汉字、图片)等为了防止恶意的请求行为,增加应用的安全性

7.1 验证码的处理方式

说明:Selenium中并没有对验证码处理的方法,这里介绍针对验证码的几种常用处理方式

方式:

  1. 去掉验证码(测试环境下-采用)
  2. 设置万能验证码(生产环境和测试环境下-采用)
  3. 验证码识别技术(通过 python-tesseract来识别图片类型验证码:识别率很难达到100%)
  4. 记录cookie(通过记录cookie进行跳过登录)

提示:

  1. 去掉验证码、设置万能验证码:都是开发来完成
  2. 验证码识别技术:成功率不高,验证码种类繁多,不太合适
7.2 Selenium操作cookie

方法:

1. get_cookie(name)--> 获取指定cookie
name:为cookie的名称
2. get_cookies--> 获取本网站所有本地cookies
3. add_cookie(cookie_dict) --> 添加cookie
cookie_dict:一个字典对象,必选的键包括:"name" and "value"
7.2.1案例

需求:使用cookie实现跳过登录

  1. 手动登录百度,获取cookie
  2. 使用获取到的cookie,达到登录目的,然后就可以执行登录之后的操作

分析:

BDUSS是登录百度后的唯一身份凭证(*.baidu.com),拿到BDUSS就等于拿到账号的控制权,通行贴吧、知道、百科、文库、空间、百度云等百度主要产品

  1. 登录baidu,登录成功后抓取(BDUSS)
  2. 使用add_cookie()方法,添加(BDUSS)键和值
  3. 使用刷新方法 driver.refresh

示例代码

from selenium import webdriver
from time import sleepdriver = webdriver.Chrome()
# 打开URL
url = 'https://www.baidu.com/'
driver.get(url)
# 将浏览器 最大化
driver.maximize_window()
# 设置cookie
driver.add_cookie({"name": "BDUSS", "value": "根据实际情况填写"})
# 暂停2秒
sleep(2)
# 刷新
driver.refresh()
# 退出浏览器驱动
driver.quit()

注意:必须要刷新才能看到效果

相关推荐
python开发_常用的python模块及安装方法
adodb:我们领导推荐的数据库连接组件bsddb3:BerkeleyDB的连接组件Cheetah-1.0:我比较喜欢这个版本的cheeta…
日期:2022-11-24 点赞:878 阅读:8,999
Educational Codeforces Round 11 C. Hard Process 二分
C. Hard Process题目连接:http://www.codeforces.com/contest/660/problem/CDes…
日期:2022-11-24 点赞:807 阅读:5,511
下载Ubuntn 17.04 内核源代码
zengkefu@server1:/usr/src$ uname -aLinux server1 4.10.0-19-generic #21…
日期:2022-11-24 点赞:569 阅读:6,357
可用Active Desktop Calendar V7.86 注册码序列号
可用Active Desktop Calendar V7.86 注册码序列号Name: www.greendown.cn Code: &nb…
日期:2022-11-24 点赞:733 阅读:6,140
Android调用系统相机、自定义相机、处理大图片
Android调用系统相机和自定义相机实例本博文主要是介绍了android上使用相机进行拍照并显示的两种方式,并且由于涉及到要把拍到的照片显…
日期:2022-11-24 点赞:512 阅读:7,770
Struts的使用
一、Struts2的获取  Struts的官方网站为:http://struts.apache.org/  下载完Struts2的jar包,…
日期:2022-11-24 点赞:671 阅读:4,848