【Playwright+Python】系列教程(五)元素定位

playwright,python · 浏览次数 : 13

小编点评

本文介绍了Playwright中定位器的使用方法,包括常用元素定位器、Shadow DOM中的定位、筛选定位以及使用约束条件定位等技巧。这些方法可以帮助开发者更有效地在网页中查找和操作元素。 1. **常见元素定位定位器**:介绍了Playwright中定位器的概念,包括按角色、标签、占位符、文本、替代文本、标题和测试ID等方式进行定位。每种定位器都有其适用场景和注意事项。 2. **在Shadow DOM中定位**:解释了Shadow DOM的概念和技术,以及如何在Playwright中使用Shadow DOM中的元素进行定位。同时,提供了查看Shadow DOM的方法和示例代码。 3. **筛选定位**:讲述了如何使用filter方法对定位器进行筛选,包括按文本、子项/后代、无文本和无子/后代等条件进行筛选。这些方法可以帮助开发者精确地定位到目标元素。 4. **使用约束条件定位**:介绍了使用and、or条件和可见性条件等约束条件来缩小定位范围,提高定位的准确性。这些方法可以帮助开发者更精确地定位到目标元素。 5. **列表元素操作**:详细描述了如何使用Playwright的定位方法对列表元素进行操作,包括使用count断言、断言列表中的文本、定位特定元素、按下标定位等操作。这些方法可以帮助开发者管理和操作列表元素。 总的来说,本文详细介绍了Playwright中定位器的使用方法和技巧,为开发者提供了一个全面的定位工具集,以便更有效地在网页中查找和操作元素。

正文

一、常见元素定位

定位器是 Playwright 自动等待和重试能力的核心部分。简而言之,定位器代表了一种随时在页面上查找元素的方法,以下是常用的内置定位器。

1、按角色定位

按显式和隐式可访问性属性进行定位
语法:page.get_by_role()
Dom结构示例1:
image.png
示例代码1:

page.get_by_role("button", name="Sign in").click()

说明:按名称为“Sign in”button的角色找到元素。
Dom结构示例2:
image.png
示例代码2

expect(page.get_by_role("heading", name="Sign up")).to_be_visible()

page.get_by_role("checkbox", name="Subscribe").check()

page.get_by_role("button", name=re.compile("submit", re.IGNORECASE)).click()

说明:

  • 角色定位器包括按钮、复选框、标题、链接、列表、表格等,并遵循 ARIA 角色、ARIA 属性和可访问名称的 W3C 规范。请注意,许多 html 元素(如
  • 建议优先考虑角色定位器来定位元素,因为这是最接近用户和辅助技术感知页面的方式。

page.get_by_label() 通过关联标签的文本查找表单控件。

2、按标签定位

通过关联标签的文本查找表单控件
语法:page.get_by_label()
Dom结构示例:
image.png
示例代码:

page.get_by_label("Password").fill("secret")

3、按占位符定位

语法:page.get_by_placeholder()
Dom结构示例:
image.png
示例代码:

page.get_by_placeholder("name@example.com").fill("playwright@microsoft.com")

4、通过文本定位

按占位符查找输入
语法:page.get_by_text()
Dom结构示例:
image.png
示例代码:

# 可以通过元素包含的文本找到该元素
page.get_by_text("Welcome, John")
# 设置完全匹配
page.get_by_text("Welcome, John", exact=True)
# 正则表达式匹配
page.get_by_text(re.compile("welcome, john", re.IGNORECASE))

说明:

  • 按文本匹配始终会规范化空格,即使完全匹配也是如此。例如,它将多个空格转换为一个空格,将换行符转换为空格,并忽略前导和尾随空格。
  • 建议使用文本定位器来查找非交互式元素,如 div、span、p 等。对于button、a、input等交互式元素,请使用角色定位器。

5、通过替代文本定位

通过其文本替代来定位元素(通常是图像),所有图片都应具有描述图像的 alt 属性。可以使用page.get_by_alt_text() 根据替代文本查找图片。
语法:page.get_by_alt_text()
Dom结构示例:
image.png
示例代码:

page.get_by_alt_text("playwright logo").click()

说明:当元素支持替代文本(如 img 和 area 元素)时,建议使用此定位器

6、按标题定位

按元素的 title 属性查找元素
语法:page.get_by_title()
Dom结构示例:
image.png
示例代码:

expect(page.get_by_title("Issues count")).to_have_text("25 issues")

说明:当元素具有 title 属性时,建议使用此定位器
7、按测试 ID 查找
根据元素data-testid 属性来定位元素(可以配置其他属性)
语法:page.get_by_title()
Dom结构示例:
image.png
示例代码:

page.get_by_test_id("directions").click()

8、设置自定义测试 ID 属性

默认情况下,page.get_by_test_id() 将根据 data-testid 属性查找元素,但您可以在测试配置中或通过调用 selectors.set_test_id_attribute() 来配置它。
将测试 ID 设置为对测试使用自定义数据属性,示例代码:

playwright.selectors.set_test_id_attribute("data-pw")

Dom结构:
image.png
然后像往常一样找到该元素,示例代码如下:

page.get_by_test_id("directions").click()

9、通过 CSS 或 XPath 定位

如果绝对必须使用 CSS 或 XPath 定位器,则可以使用 page.locator() 创建一个定位器,该定位器采用一个选择器来描述如何在页面中查找元素。Playwright 支持 CSS 和 XPath 选择器,如果省略 css= 或 xpath= 前缀,则会自动检测它们。
示例代码:

page.locator("css=button").click()
page.locator("xpath=//button").click()

page.locator("button").click()
page.locator("//button").click()

说明:

  • XPath 和 CSS 选择器可以绑定到 DOM 结构或实现。当 DOM 结构更改时,这些选择器可能会中断。
  • 不建议使用 CSS 和 XPath,因为 DOM 经常会更改,从而导致无法复原的测试。相反,请尝试提供一个接近用户感知页面的定位器,例如角色定位器,或者使用测试 ID 定义显式测试协定。

二、在 Shadow DOM 中定位

1、什么是Shadow DOM?

Shadow DOM 是 Web Components 技术的一部分,它提供了一种将 HTML 结构、样式和行为封装在一个独立的、封闭的 DOM 中的机制。以下是一个使用 Shadow DOM 的例子,该例子展示了如何创建一个简单的自定义组件,并将内容、样式封装在 Shadow DOM 中。
示例代码:

<!DOCTYPE html>  
<html lang="en">  
<head>  
    <meta charset="UTF-8">  
    <meta name="viewport" content="width=device-width, initial-scale=1.0">  
    <title>Shadow DOM Example</title>  
    <style>  
        /* 外部样式,不会影响 Shadow DOM 内部 */  
        .container {  
            font-size: 20px;  
            color: red;  
        }  
    </style>  
</head>  
<body>  
    <div id="hostElement" class="container">Shadow Host (这里不会显示 Shadow DOM 的内容)</div>  
  
    <script>  
        // 自定义元素定义及 Shadow DOM 创建  
        class MyCustomElement extends HTMLElement {  
            constructor() {  
                super();  
                // 创建 Shadow Root  
                const shadowRoot = this.attachShadow({ mode: 'open' });  
  
                // Shadow DOM 内部样式和内容  
                shadowRoot.innerHTML = `  
                    <style>  
                        .shadow-content {  
                            font-size: 16px;  
                            color: blue;  
                        }  
                    </style>  
                    <div class="shadow-content">This is inside the Shadow DOM.</div>  
                `;  
            }  
        }  
  
        // 注册自定义元素  
        customElements.define('my-custom-element', MyCustomElement);  
  
        // 将自定义元素添加到文档中  
        const customElement = document.createElement('my-custom-element');  
        document.body.appendChild(customElement);  
  
        // 注意:在实际应用中,你可能会将自定义元素直接写在 HTML 中,如:<my-custom-element></my-custom-element>  
        // 而不是通过 JavaScript 动态创建和添加。  
    </script>  
</body>  
</html>

dom结构:
image.png

2、如何查看Shadow DOM

首先打开浏览器控制台的设置选项

然后再找到Preference -> Elements,把show user anent shadow dom勾上

这时候我们再来看一下此时的dom元素发生了什么变化

我们会发现这些标签内部都大有乾坤,在这些标签下面都多了一个shadow root,在它里面才是这些标签的真实布局。

3、在 Shadow DOM 中定位

默认情况下,Playwright 中的所有定位器都使用 Shadow DOM 中的元素。例外情况包括:

  • 通过 XPath 定位不会刺穿阴影根
  • 不支持闭合模式阴影根

要定位,使用page.get_by_text("")page.locator("", has_text="")都可以,要确保

包含文本“This is inside the Shadow DOM.”,示例代码如下:

page.goto("http://localhost:8080/shadowDOM.html")
expect(page.get_by_text("This is inside the Shadow DOM.")).to_contain_text("Shadow DOM")
expect(page.locator("div", has_text="This is inside the Shadow DOM.")).to_contain_text("This is inside")

三、筛选定位

1、dom结构

image.png

2、按文本筛选定位

可以使用 locator.filter() 方法按文本过滤定位器。它将在不区分大小写的情况下搜索元素内部的某个特定字符串,可能在后代元素中。
示例代码:

page.get_by_role("listitem").filter(has_text="Product 2").get_by_role(
    "button", name="Add to cart"
).click()

#传递正则表达式。
page.get_by_role("listitem").filter(has_text=re.compile("Product 2")).get_by_role(
    "button", name="Add to cart"
).click()

2.1、按没有文本进行筛选

expect(page.get_by_role("listitem").filter(has_not_text="Out of stock")).to_have_count(2)

2.2、按子项/后代筛选

定位器支持仅选择具有或没有与另一个定位器匹配的后代的元素的选项。因此,您可以按任何其他定位器进行过滤,例如 locator.get_by_role()、locator.get_by_test_id()、locator.get_by_text() 等。
示例代码:

page.get_by_role("listitem").filter(
    has=page.get_by_role("heading", name="Product 2")
).get_by_role("button", name="Add to cart").click()

断言产品卡,确保只有一个,示例代码如下:

expect(
    page.get_by_role("listitem").filter(
        has=page.get_by_role("heading", name="Product 2")
    )
).to_have_count(1)

过滤定位器必须相对于原始定位器,并且从原始定位器匹配项(而不是文档根节点)开始查询。

2.3、按没有子/后代进行筛选

通过内部没有匹配的元素进行过滤,示例代码:

expect(
    page.get_by_role("listitem").filter(
        has_not=page.get_by_role("heading", name="Product 2")
    )
).to_have_count(1)

注意,内部定位器是从外部定位器开始匹配的,而不是从文档根目节点开始匹配的。

四、使用约束条件定位

1、在定位器内匹配

就先定位元素,再去定位子节点元素,以将搜索范围缩小到页面的特定部分。
示例代码

product = page.get_by_role("listitem").filter(has_text="Product 2")
product.get_by_role("button", name="Add to cart").click()

也可以将两个元素定位组合在一起使用,示例代码如下:

save_button = page.get_by_role("button", name="Save")
# ...
dialog = page.get_by_test_id("settings-dialog")
dialog.locator(save_button).click()

2、使用and条件匹配

方法 locator.and_() 通过匹配其他定位器来缩小现有定位器的范围,可以理解为xpath的and使用方法,都是定位一个元素,示例代码如下:

page.get_by_role("link").and_(page.get_by_text("新闻")).click()

3、使用or条件匹配

如果您想定位两个或多个元素中的一个,但不知道会是哪一个,请使用 locator.or_() 创建与所有备选项匹配的定位器。示例代码如下:

def test_navigationCnblogs(page: Page):
    page.goto("https://www.baidu.com/")
    login=page.get_by_role("link").and_(page.get_by_text("登录"))
    message=page.get_by_text("短信登录")
    expect(message.or_(login).first).to_be_visible()
    if (login.is_visible()):
        login.click()
    message.click()

4、仅匹配可见元素

考虑一个有两个按钮的页面,第一个不可见,第二个可见,这时候就可以进行约束,示例代码如下:

page.locator("button").locator("visible=true").click()

五、列表元素操作

dom结构:
image.png

1、使用 count 断言

使用 count 断言确保列表有 3 个项目,示例代码如下:

expect(page.get_by_role("listitem")).to_have_count(3)

2、断言列表中的所有文本

断言定位器以查找列表中的所有文本,示例代码如下:

expect(page.get_by_role("listitem")).to_have_text(["apple", "banana", "orange"])

3、定位某个列表元素

使用 page.get_by_text() 方法按文本内容在列表中查找元素,示例代码如下:

page.get_by_text("orange").click()

也可以使用 locator.filter() 查找列表中的特定元素,示例代码如下:

page.get_by_role("listitem").filter(has_text="orange").click()

4、按下标定位指定元素

您有一个相同元素的列表,并且区分它们的唯一方法是顺序,则可以使用 locator.firstlocator.lastlocator.nth() 从列表中选择特定元素。

    banana = page.get_by_role("listitem").nth(1)
    expect(banana).to_have_text('banana')

5、链接筛选器定位元素

当您有具有各种相似性的元素时,使用 locator.filter() 方法选择正确的元素。还可以链接多个筛选器以缩小选择范,就是层级定位,个人感觉。
DOM 结构
image.png
示例代码

row_locator = page.get_by_role("listitem")

row_locator.filter(has_text="Mary").filter(
    has=page.get_by_role("button", name="Say goodbye")
).screenshot(path="screenshot.png")

6、遍历每个元素

对列表中的每个元素执行操作,示例代码如下:

for row in page.get_by_role("listitem").all():
    print(row.text_content())

rows = page.get_by_role("listitem")
count = rows.count()
for i in range(count):
    print(rows.nth(i).text_content())

7、Evaluate in the page在页面中评估

我觉得这个就是很ES6呀,示例代码如下:

rows = page.get_by_role("listitem")
# 很前端了吧
texts = rows.evaluate_all("list => list.map(element => element.textContent)")

8、检查定位元素的个数

定位元素如果出现定位多个元素,这个就很好用了,可以作为检验是否定位到唯一元素检测,示例代码如下:

print(page.get_by_role("button").count()) #2

与【Playwright+Python】系列教程(五)元素定位相似的内容:

【Playwright+Python】系列教程(五)元素定位

一、常见元素定位 定位器是 Playwright 自动等待和重试能力的核心部分。简而言之,定位器代表了一种随时在页面上查找元素的方法,以下是常用的内置定位器。 1、按角色定位 按显式和隐式可访问性属性进行定位 语法:page.get_by_role() Dom结构示例1: 示例代码1: page.g

【Playwright+Python】系列教程(四)Pytest 插件在Playwright中的使用

一、命令行使用详解 使用Pytest插件在Playwright 中来编写端到端的测试。 1、命令行执行测试 pytest --browser webkit --headed 2、使用 pytest.ini 文件配置 内容如下: [pytest] # Run firefox with UI addop

【Playwright+Python】系列教程(二)手把手带你写一个脚本

一、如何使用代理方式打开网页 在 playwright.chromium.launch() 中传入 proxy 参数即可,示例代码如下: 1、同步写法: from playwright.sync_api import sync_playwright proxy = {'server': 'http:

【Playwright+Python】系列教程(一)环境搭建及脚本录制

一、前言 看到这个文章,有的同学会说: 六哥,你为啥不早早就写完python系列的文章。 因为有徒弟需要吧,如果你也想学自学,那这篇文章,可以说是我们结缘一起学习的开始吧! 如果对你有用,建议收藏和转发! 二、Playwright是什么? 微软开源自动化测试工具Playwright,支持主流浏览器,

《刚刚问世》系列初窥篇-Java+Playwright自动化测试-1-环境准备与搭建

1.简介 Python+Playwright系列的文章还没有结束,就有好的小伙伴或者童鞋们私信公众号留言,问宏哥什么时候出Java语言的Playwright的自动化测试文章。本来想趁热打铁将Python+Playwright完结后,就开始Java语言的Playwright的自动化测试文章,但是好多人

《最新出炉》系列初窥篇-Python+Playwright自动化测试-1-环境准备与搭建

1.简介 有很多人私信留言宏哥问能不能介绍一下Playwright这款自动化神器的相关知识,现在网上的资料太少了。其实在各大博客和公众号也看到过其相关的介绍和讲解。要不就是不全面、不系统,要不就是系统全面但是人家是收费的。当然了宏哥接下来也可能介绍的不全面或者不系统,能力有限望大家理解。 2.Pla

《最新出炉》系列初窥篇-Python+Playwright自动化测试-2-playwright的API及其他知识

1.简介 上一篇宏哥已经将Python+Playwright的环境搭建好了,而且也简单的演示了一下三款浏览器的启动和关闭,是不是很简单啊。今天主要是把一篇的中的代码进行一次详细的注释,然后说一下playwright的API和其他相关知识点。那么首先将上一篇中的代码进行一下详细的解释。 2.代码解释

《最新出炉》系列初窥篇-Python+Playwright自动化测试-3-离线搭建playwright环境

1.简介 有些小伙伴或者童鞋们私信留言说自己是在公司局域网办公,或者公司为了安全对网络管控比较严格(尤其是一些大的国企、央企),总之就是一句话无法连到外网去在线下载,宏哥刚看到留言时觉得这问题还留言问啊,你找个有网的电脑下载好安装包然后安装就可以用了。(第一种情况及解决办法:带要搭建环境的电脑到有网

《最新出炉》系列初窥篇-Python+Playwright自动化测试-4-playwright等待浅析

1.简介 在介绍selenium的时候,宏哥也介绍过等待,是因为在某些元素出现后,才可以进行操作。有时候我们自己忘记添加等待时间后,查了半天代码确定就是没有问题,奇怪的就是获取不到元素。然后搞了好久,或者经过别人的提示才恍然大悟没有添加等待时间。而playwright为了避免我们犯这么low的错误,

《最新出炉》系列初窥篇-Python+Playwright自动化测试-5-元素定位大法-上篇

1.简介 说到元素定位,小伙伴或者童鞋们肯定会首先想到 selenium 的八大元素定位大法。同理Playwright也有自己的元素定位的方法。今天就给小伙伴或者童鞋们讲解和分享一下Playwright的元素定位方法。 宏哥对UI自动化的理解:定位元素 >操作元素 >断言。 2.定位器 定位器(Lo