3步教你用AI大模型+Python實(shí)現(xiàn)web自動(dòng)化:一套提示詞完成所有AI自動(dòng)化指令
為什么要用AI大模型+Python做web自動(dòng)化?
Python因其簡潔易用和豐富的生態(tài)系統(tǒng),成為自動(dòng)化領(lǐng)域的首選語言。Playwright作為微軟推出的跨瀏覽器自動(dòng)化框架,支持Chromium、Firefox和WebKit,功能強(qiáng)大且穩(wěn)定。結(jié)合AI大模型的智能對(duì)話能力,我們可以讓瀏覽器“聽懂”指令,自動(dòng)完成復(fù)雜任務(wù),極大提升工作效率。
@
- 為什么要用AI大模型+Python做web自動(dòng)化?
- 一、環(huán)境的安裝
1、前提條件
2、創(chuàng)建虛擬環(huán)境以及對(duì)應(yīng)包
- 二、獲取大模型API
- 三、代碼的編寫
- 結(jié)語
一、環(huán)境的安裝
1、前提條件
- 已安裝 Python(建議 3.7 及以上版本)
- 已配置好 Python 環(huán)境變量(可在命令行輸入?
?python --version?
? 驗(yàn)證) - Windows 操作系統(tǒng)(本文以 PowerShell 為例)
2、創(chuàng)建虛擬環(huán)境以及對(duì)應(yīng)包
- 打開 PowerShell,進(jìn)入你想創(chuàng)建項(xiàng)目的目錄,例如:
cd D:\browser-use
- 創(chuàng)建名為?
?browserUse?
? 的虛擬環(huán)境:
python -m venv browserUse
該命令會(huì)在當(dāng)前目錄下生成一個(gè)名為 ??browserUse?
? 的文件夾,里面包含獨(dú)立的 Python 運(yùn)行環(huán)境。
- 激活虛擬環(huán)境:
.\browserUse\Scripts\activate
激活后,命令行提示符通常會(huì)出現(xiàn) ??(browserUse)?
?,表示當(dāng)前處于該虛擬環(huán)境中。
在這里插入圖片描述
- 升級(jí) pip(Python 包管理器)到最新版本,確保安裝包順利:
pip install --upgrade pip
- 安裝 browser-use 包:
pip install browser-use
- 安裝 Playwright Python 包:
pip install playwright
- 安裝 Playwright 瀏覽器驅(qū)動(dòng)
Playwright 需要下載對(duì)應(yīng)的瀏覽器二進(jìn)制文件,執(zhí)行以下命令:
python -m playwright install
該命令會(huì)自動(dòng)下載 Chromium、Firefox、WebKit 等瀏覽器驅(qū)動(dòng),確保 Playwright 可以正常運(yùn)行。
示例圖如下:
二、獲取大模型API
在瀏覽器中打開能用AI API,根據(jù)下面的圖片教程獲取自己的Base_url 和 Api_key。https://ai.nengyongai.cn/register?aff=PEeJ
根據(jù)此步驟我們可以獲取到兩個(gè)重要的數(shù)據(jù):
Base_url = "https://ai.nengyongai.cn/v1"
Api_key = "你自己的key"
三、代碼的編寫
下面是一個(gè)完整示例,演示如何用用AI大模型+Python實(shí)現(xiàn)自動(dòng)打開瀏覽器,搜索“今天的天氣”,并輸出我們想要的結(jié)果。
# 導(dǎo)入所需的模塊和類
from langchain_openai import ChatOpenAI # 用于調(diào)用自研大模型接口
from browser_use import Agent, Browser, BrowserConfig # 瀏覽器自動(dòng)化相關(guān)類
import asyncio # 異步編程模塊
from dotenv import load_dotenv # 用于加載環(huán)境變量
import os # 操作系統(tǒng)接口模塊
# 加載當(dāng)前目錄下的.env文件中的環(huán)境變量
load_dotenv()
# 設(shè)置Base_url接口地址
Base_url = "https://ai.nengyongai.cn/v1"
# 這里填寫你自己的Api_key,建議放在環(huán)境變量中,避免明文寫在代碼里
Api_key = "你自己的key"
# 將Api_key設(shè)置到環(huán)境變量中,供ChatOpenAI調(diào)用
os.environ["OPENAI_API_KEY"] = Api_key
# 創(chuàng)建一個(gè)瀏覽器實(shí)例,配置如下:
browser = Browser(
cnotallow=BrowserConfig(
headless=False, # 是否無頭瀏覽器,F(xiàn)alse表示有界面,方便調(diào)試
disable_security=True, # 禁用瀏覽器安全策略,方便跨域等操作
)
)
# 定義異步主函數(shù)
asyncdef main():
try:
# 創(chuàng)建一個(gè)Agent實(shí)例,負(fù)責(zé)執(zhí)行任務(wù)
agent = Agent(
task="""
1、訪問https://www.baidu.com/,
2、搜索內(nèi)容為“今天的天氣”,
3、將今天的天氣內(nèi)容輸出出來.
""", # 任務(wù)描述,告訴Agent要做什么
llm=ChatOpenAI(
model='gpt-4o-mini', # 使用的模型名稱
base_url=Base_url, # base_url
api_key=Api_key # api_key
),
)
# 運(yùn)行Agent,執(zhí)行任務(wù),返回結(jié)果
result = await agent.run()
# 打印任務(wù)執(zhí)行結(jié)果
print(result)
except Exception as e:
# 如果運(yùn)行過程中出現(xiàn)異常,捕獲并打印錯(cuò)誤信息
print(f"運(yùn)行出錯(cuò): {e}")
# 程序入口,運(yùn)行異步主函數(shù)
if __name__ == '__main__':
asyncio.run(main())
我們直接右鍵運(yùn)行,這里差不多要等到5-10秒鐘,才能自己執(zhí)行web自動(dòng)化。(注意:windows如果出現(xiàn)了啟動(dòng)報(bào)錯(cuò)等問題,那么請(qǐng)直接關(guān)閉殺毒軟件。因?yàn)闅⒍拒浖?huì)阻止我們啟動(dòng)瀏覽器。)
我們可以看到它根據(jù)提示詞的指示,自動(dòng)獲取啟動(dòng)瀏覽器,去完成我們的目標(biāo)。
結(jié)語
用AI大模型+Python做Web自動(dòng)化,不僅是技術(shù)的結(jié)合,更是緊跟時(shí)代以及提升效率的開始。原先的我們需要用到各種定位,現(xiàn)在只需簡單幾步,你就能讓電腦幫你完成繁瑣的瀏覽器操作,希望這篇文章能幫你快速入門,開啟自動(dòng)化新篇章!
本文轉(zhuǎn)載自????愛學(xué)習(xí)的蝌蚪????,作者:hpstream
