【Playwright+Python】系列教程(二)手把手带你写一个脚本

playwright,python · 浏览次数 : 0

小编点评

本文介绍了如何在 Python 中使用 Playwright 库通过代理访问网页。Playwright 是一个用于浏览器自动化和测试的工具,支持多种浏览器,如 Chromium、Firefox 和 WebKit。 一、使用代理方式打开网页 在 Playwright 中,可以通过设置 `proxy` 参数来使用代理访问网页。以下是同步和异步两种写法的示例代码: 1. 同步写法: ```python from playwright.sync_api import sync_playwright proxy = {'server': 'http://127.0.0.1:8080'} def run(): with sync_playwright() as p: browser = p.chromium.launch(headless=False, proxy=proxy) page = browser.new_page() page.goto('https://www.baidu.com') title = page.title() if '百度' in title: print('打开百度成功') else: print('打开百度失败') browser.close() run() ``` 2. 异步写法: ```python from playwright.async_api import async_playwright import asyncio proxy = {'server': 'http://127.0.0.1:8080'} async def run(): async with async_playwright() as p: browser = await p.chromium.launch(headless=False, proxy=proxy) page = await browser.new_page() await page.goto('https://www.baidu.com') title = await page.title() if '百度' in title: print('打开百度成功') else: print('打开百度失败') await browser.close() asyncio.get_event_loop().run_until_complete(run()) ``` 二、同步和异步写法对比 同步和异步写法的主要区别在于对系统资源的利用和执行效率。同步代码结构简单易懂,适用于小规模或简单任务;而异步可以更高效地利用系统资源,避免阻塞等待 IO,特别适用于长时间操作如网络请求。 三、写一个用例 以下是一个简单的测试用例,演示了如何使用 Playwright 进行网页自动化测试。 1. 示例脚本: ```python import re from playwright.sync_api import Page, expect, sync_playwright proxy = {'server': 'http://127.0.0.1:8080'} def test_baidu(): with sync_playwright() as p: browser = p.chromium.launch(headless=False, proxy=proxy) page = browser.new_page() # 跳转到baidu页面 page.goto('https://www.baidu.com/') # 点击输入框 page.locator('#kw').click() # 输入框输入selenium page.locator('#kw').fill('selenium') # 点击百度一下查询按钮 page.get_by_role('button', name='百度一下').click() # 验证输入框是否输入selenium expect(page.locator('#kw')).to_have_value('selenium') # 验证页面是否包含文本“大家还在搜” expect(page.locator('#content_left')).to_contain_text('大家还在搜') # 退出浏览器 browser.close() test_baidu() ``` 2. 基本操作 Playwright 提供了许多常用操作,如点击、填写表单、聚焦元素等。更多详细信息请参考定位器 API 部分。 3. 断言操作 使用 expect 函数进行断言,验证元素的属性、文本等是否符合预期。 4. fixtures 夹具的使用 使用 pytest 的 fixtures 可以实现测试环境的一致性,例如设置代理、打开网页等。 总结:对于小任务,同步代码结构更简单;对于需要长时间 IO 等待的任务,使用异步更高效。在选择编程模型时,要根据具体需求进行权衡。

正文

一、如何使用代理方式打开网页

playwright.chromium.launch() 中传入 proxy 参数即可,示例代码如下:

1、同步写法:

from playwright.sync_api import sync_playwright

proxy = {'server': 'http:/127.0.0.1:8080'}


def run():
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=False, proxy=proxy)
        page = browser.new_page()

        page.goto('https://www.baidu.com')

        title = page.title()
        if "百度" in title:
            print("打开百度成功")
        else:
            print("打开百度失败")

        browser.close()


run()

2、异步写法:

from playwright.async_api import async_playwright
import asyncio

proxy = {'server': 'http:/127.0.0.1:8080'}


async def run():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False, proxy=proxy)
        page = await browser.new_page()

        await page.goto('https://www.baidu.com')

        title = await page.title()
        if "百度" in title:
            print("打开百度成功")
        else:
            print("打开百度失败")

        await browser.close()


asyncio.get_event_loop().run_until_complete(run())

二、同步和异步写法对比

1、同步的优点:

  • 代码结构简单易懂,不需要学习async/await语法
  • 适用于小规模或简单任务
  • 调试和理解同步代码更简单

2、异步的优点:

  • 能更高效地利用系统资源,避免阻塞等待IO
  • 对于长时间操作如网络请求更高效
  • 可以支持并发执行多个任务
  • 对于大规模和复杂系统更有利

3、区别

  • 对于小任务和学习用途,同步代码结构更简单。
  • 对于需要长时间IO等待的任务(如网络请求),使用异步可以更高效。
  • 对于需要支持高并发的系统(如网站),使用异步模型可以支持更多并发连接。
  • 多线程同步会带来锁的问题,而异步避免了锁的使用。
  • 异步的FUTURE模式也更易于扩展性好,支持动态增加回调函数。

4、总结

  • 小任务用同步
  • 长时间IO任务用异步
  • 高并发系统用异步
  • 以后的功能扩展考虑异步更灵活

一般来说对于现代化系统,异步编程模型将是主流趋势。但同步在某些场景也同样易用。选择时要根据具体需求来权衡。

三、写一个用例

1、示例脚本

算是个入门的例子,关于每句话的意思,看我注释即可,示例代码如下:

import re
from playwright.sync_api import Page, expect, sync_playwright

proxy = {'server': 'http://127.0.0.1:8080'}


def test_baidu():
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=False, proxy=proxy)
        page = browser.new_page()
        # 跳转到baidu页面
        page.goto("https://www.baidu.com/")
        # 点击输入框
        page.locator("#kw").click()
        # 输入框输入selenium
        page.locator("#kw").fill("selenium")
        # 点击百度一下查询按钮
        page.get_by_role("button", name="百度一下").click()
        # 验证输入框是否输入selenium
        expect(page.locator("#kw")).to_have_value("selenium")
        # 验证页面是否包含文本“大家还在搜”
        expect(page.locator("#content_left")).to_contain_text("大家还在搜")
        # 退出浏览器
        browser.close()

注意:
测试类和测试方法都要用test_ 前缀命名

2、基本操作

这是 Playwright 常用操作列表,请注意,还有许多其他操作,请务必查看定位器 API 部分以了解更多相关信息。

操作 描述
locator.check() 选中输入复选框
locator.click() 点击元素
locator.uncheck() 取消选中输入复选框
locator.hover() 将鼠标悬停在元素上
locator.fill() 填写表单字段,输入文本
locator.focus() 聚焦元素
locator.press() 按下单个键
locator.set_input_files() 选择要上传的文件
locator.select_option() 从下拉菜单中选择选项

3、断言操作

断言 描述
expect(locator).to_be_checked() 复选框处于选中状态
expect(locator).to_be_enabled() 控件已启用
expect(locator).to_be_visible() 元素可见
expect(locator).to_contain_text() 元素包含文本
expect(locator).to_have_attribute() 元素具有属性
expect(locator).to_have_count() 元素列表已给出长度
expect(locator).to_have_text() 元素匹配文本
expect(locator).to_have_value() 输入元素具有值
expect(page).to_have_title() 页面有标题
expect(page).to_have_url() 页面有 URL

4、fixtures夹具的使用

示例代码:

import pytest
from playwright.sync_api import Page, expect, sync_playwright


@pytest.fixture(scope="function", autouse=True)
def before_each_after_each(page: Page):
    print("before the test runs")

    page.goto("https://www.baidu.com/")
    yield

    print("after the test runs")


def test_main_navigation(page: Page):
    page.locator("#kw").fill("久曲健 博客园")
    page.get_by_role("button", name="百度一下").click()
    expect(page.locator("#content_left")).to_contain_text("久曲健 - 博客园")

代码解释:

  • 定义了一个名为 before_each_after_each 的 fixture(夹具),它的作用域是每个测试函数,并且设置为自动应用于每个测试函数。
  • 在这个 fixture 中: 打印 "before the test runs",表示测试运行前执行的操作。 使用 page.goto("https://www.baidu.com/") 打开百度首页。
  • yield 关键字在这个 fixture 运行期间挂起,等待测试函数执行。测试函数将在 fixture 的环境下执行。

与【Playwright+Python】系列教程(二)手把手带你写一个脚本相似的内容:

【Playwright+Python】系列教程(二)手把手带你写一个脚本

一、如何使用代理方式打开网页 在 playwright.chromium.launch() 中传入 proxy 参数即可,示例代码如下: 1、同步写法: from playwright.sync_api import sync_playwright proxy = {'server': 'http:

【Playwright+Python】系列教程(一)环境搭建及脚本录制

一、前言 看到这个文章,有的同学会说: 六哥,你为啥不早早就写完python系列的文章。 因为有徒弟需要吧,如果你也想学自学,那这篇文章,可以说是我们结缘一起学习的开始吧! 如果对你有用,建议收藏和转发! 二、Playwright是什么? 微软开源自动化测试工具Playwright,支持主流浏览器,

【Playwright+Python】系列教程(五)元素定位

一、常见元素定位 定位器是 Playwright 自动等待和重试能力的核心部分。简而言之,定位器代表了一种随时在页面上查找元素的方法,以下是常用的内置定位器。 1、按角色定位 按显式和隐式可访问性属性进行定位 语法:page.get_by_role() Dom结构示例1: 示例代码1: page.g

【Playwright+Python】系列教程(四)Pytest 插件在Playwright中的使用

一、命令行使用详解 使用Pytest插件在Playwright 中来编写端到端的测试。 1、命令行执行测试 pytest --browser webkit --headed 2、使用 pytest.ini 文件配置 内容如下: [pytest] # Run firefox with UI addop

《刚刚问世》系列初窥篇-Java+Playwright自动化测试-1-环境准备与搭建

1.简介 Python+Playwright系列的文章还没有结束,就有好的小伙伴或者童鞋们私信公众号留言,问宏哥什么时候出Java语言的Playwright的自动化测试文章。本来想趁热打铁将Python+Playwright完结后,就开始Java语言的Playwright的自动化测试文章,但是好多人

《最新出炉》系列初窥篇-Python+Playwright自动化测试-1-环境准备与搭建

1.简介 有很多人私信留言宏哥问能不能介绍一下Playwright这款自动化神器的相关知识,现在网上的资料太少了。其实在各大博客和公众号也看到过其相关的介绍和讲解。要不就是不全面、不系统,要不就是系统全面但是人家是收费的。当然了宏哥接下来也可能介绍的不全面或者不系统,能力有限望大家理解。 2.Pla

《最新出炉》系列初窥篇-Python+Playwright自动化测试-2-playwright的API及其他知识

1.简介 上一篇宏哥已经将Python+Playwright的环境搭建好了,而且也简单的演示了一下三款浏览器的启动和关闭,是不是很简单啊。今天主要是把一篇的中的代码进行一次详细的注释,然后说一下playwright的API和其他相关知识点。那么首先将上一篇中的代码进行一下详细的解释。 2.代码解释

《最新出炉》系列初窥篇-Python+Playwright自动化测试-3-离线搭建playwright环境

1.简介 有些小伙伴或者童鞋们私信留言说自己是在公司局域网办公,或者公司为了安全对网络管控比较严格(尤其是一些大的国企、央企),总之就是一句话无法连到外网去在线下载,宏哥刚看到留言时觉得这问题还留言问啊,你找个有网的电脑下载好安装包然后安装就可以用了。(第一种情况及解决办法:带要搭建环境的电脑到有网

《最新出炉》系列初窥篇-Python+Playwright自动化测试-4-playwright等待浅析

1.简介 在介绍selenium的时候,宏哥也介绍过等待,是因为在某些元素出现后,才可以进行操作。有时候我们自己忘记添加等待时间后,查了半天代码确定就是没有问题,奇怪的就是获取不到元素。然后搞了好久,或者经过别人的提示才恍然大悟没有添加等待时间。而playwright为了避免我们犯这么low的错误,

《最新出炉》系列初窥篇-Python+Playwright自动化测试-5-元素定位大法-上篇

1.简介 说到元素定位,小伙伴或者童鞋们肯定会首先想到 selenium 的八大元素定位大法。同理Playwright也有自己的元素定位的方法。今天就给小伙伴或者童鞋们讲解和分享一下Playwright的元素定位方法。 宏哥对UI自动化的理解:定位元素 >操作元素 >断言。 2.定位器 定位器(Lo