偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

一日一技:效率提高十倍,Puppeteer 如何啟動交互模式?

開發(fā) 前端
當我們使用 Selenium 開發(fā)爬蟲的時候,使用 Jupyter 寫代碼會比用 PyCharm 寫代碼更方便。

[[358209]]

當我們使用 Selenium 開發(fā)爬蟲的時候,使用 Jupyter 寫代碼會比用 PyCharm 寫代碼更方便。如果使用 PyCharm 寫代碼并直接運行,當某一行報錯的時候,整個程序就掛了,改了代碼以后必須完全從頭開始,這樣會非常浪費時間。但如果使用 Jupyter 寫代碼,那么我們只需要重試出問題的這一行代碼就可以了,不需要把整個程序再重啟一次。

但如果我們使用 JavaScript 操作 Puppeteer,應該怎么實現(xiàn)寫一行代碼,運行一行代碼呢?

我們知道,Node.js 的命令行本身確實是可以實現(xiàn)寫一行代碼運行一行的,如下圖所示:

 

但 Puppeteer 的代碼 跟上面的這段代碼有點不一樣,我們先來看看 Puppeteer 官方文檔里面,是怎么寫的代碼:

 

注意,其中有很長一段函數(shù)是使用async聲明的,它是異步函數(shù)。在 Node.js 的交互環(huán)境里面,必須把整段函數(shù)全部寫進去,一次性運行,不能一段一段運行。如果嘗試一段一段運行的話,代碼就會報錯,我們來看看:

 

這是因為,await關鍵詞必須在一個異步函數(shù)里面使用。它不能單獨出現(xiàn)在最外層。這就要求我們把所有的代碼都寫到一個異步函數(shù)里面,然后運行這個異步函數(shù)。

但這樣做,跟直接寫一個.js 文件來運行有什么區(qū)別?我每次想測試一個 XPath 語句能否正常運行,都要把整個代碼重新跑一邊。這不是白白浪費了交互環(huán)境的優(yōu)勢嗎?

但實際上,Node.js 與 Chrome 本身就有一個很好用的交互環(huán)境,但很多人可能并不知道。

要啟動這個交互模式,實際上非常簡單。我們從0開始來創(chuàng)建這個環(huán)境。

首先,我們創(chuàng)建一個文件夾test_puppeteer,然后使用 npm 或者yarn安裝puppeteer-core。使用puppeteer-core而不是puppeteer,是因為前者可以直接使用系統(tǒng)的 Chrome,而后者需要下載一個幾百 MB 的 Chromium,非常浪費時間。

  1. mkdir test_puppeteer 
  2. cd test_puppeteer 
  3. yarn add puppeteer-core 

上面的命令執(zhí)行完成以后,我們就可以啟動這個交互環(huán)境了。

執(zhí)行命令:

  1. node --inspect 

運行效果如下圖所示:

 

現(xiàn)在,隨便開一個 Chrome 的窗口,打開開發(fā)者工具,如下圖所示:

 

大家注意,在開發(fā)者工具菜單欄的左上角,圖中箭頭所指向的位置,出現(xiàn)了 Node.js 的綠色 Logo。我們點擊一下它。

此時,會彈出一個單獨的開發(fā)者工具窗口,如下圖所示:

 

這個窗口會自動關聯(lián)上我們剛才啟動的 Node.js。

現(xiàn)在,我們試一試直接在這個開發(fā)者工具的 Console標簽頁上面寫一些代碼:

 

可以看到,在Console標簽頁打印出來的內(nèi)容,也會在終端窗口出現(xiàn)。看起來,不過是從黑色窗口寫代碼變成了在白色窗口寫代碼,這有什么好炫耀的?

現(xiàn)在,我們先來看看你電腦上的 Node.js 的版本是多少,如果小于14,那么就趕緊升級,讓他大于等于14。然后再次執(zhí)行剛剛我們的命令,如下圖所示。

 

接下來,跟剛才一樣的步驟,我們啟動開發(fā)者工具,然后嘗試直接調(diào)用Puppeteer,不可思議的一幕出現(xiàn)了:

 

現(xiàn)在我們已經(jīng)可以直接使用await了!現(xiàn)在,在這個 Console選項卡上面,我們就可以像在 Jupyter 里面寫 JavaScript 代碼了,寫一行,運行一行,看看效果,再寫一行,再運行一行。

我們嘗試在這里打開我的博客:

 

 

可以看到,我在代碼里面故意寫錯了一部分,應該用await browser.NewPage()但是我寫的是await browser.page,導致程序報錯。但是沒關系。我下面重新改成正確的就可以了。整個過程不需要重啟瀏覽器。你運行一行代碼,它執(zhí)行一行代碼,代碼錯了,只需要改這一行重新執(zhí)行就可以了。這才叫做交互環(huán)境。

 本文轉載自微信公眾號「未聞Code」,可以通過以下二維碼關注。轉載本文請聯(lián)系未聞Code公眾號。

 

責任編輯:武曉燕 來源: 未聞Code
相關推薦

2024-08-27 22:08:13

2021-10-15 21:08:31

PandasExcel對象

2025-05-28 03:15:00

Scrapy數(shù)據(jù)sleep

2022-06-28 09:31:44

LinuxmacOS系統(tǒng)

2023-10-28 12:14:35

爬蟲JavaScriptObject

2022-03-12 20:38:14

網(wǎng)頁Python測試

2024-07-30 08:16:18

Python代碼工具

2024-07-30 08:11:16

2024-11-11 00:38:13

Mypy靜態(tài)類型

2021-05-08 19:33:51

移除字符零寬

2021-04-27 22:15:02

Selenium瀏覽器爬蟲

2020-12-11 06:30:00

工具分組DataFrame

2021-04-12 21:19:01

PythonMakefile項目

2022-03-07 09:14:04

Selenium鼠標元素

2020-05-19 13:55:38

Python加密密碼

2024-02-20 22:13:48

Python項目Java

2021-02-14 22:22:18

格式圖片 HTTP

2021-09-26 05:01:55

Scrapy項目爬蟲

2024-12-27 00:44:44

MarkdownPrompt大模型

2021-09-13 20:38:47

Python鏈式調(diào)用
點贊
收藏

51CTO技術棧公眾號