偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

「套殼」的最高境界:OpenAI揭秘Atlas瀏覽器架構(gòu)OWL

人工智能 新聞
OpenAI 表示,要讓 ChatGPT 成為網(wǎng)頁瀏覽的真正副駕駛,必須徹底重構(gòu)瀏覽器的底層架構(gòu):將 Atlas 與 Chromium 運行時剝離開來。

面對 OpenAI 上周發(fā)布的 AI 瀏覽器 Atlas,這可能是不少人的第一反應(yīng),參閱報道《剛剛,OpenAI 發(fā)布 AI 瀏覽器 ChatGPT Atlas,基于 Chromium》。但今天,OpenAI 官方用一篇技術(shù)博客「回懟」了這個說法:我們「套」了,但和別人完全不一樣。

盡管今天還有 Sora 角色客串功能和 GPT-5 查找和修復(fù)安全漏洞智能體的消息,但本文的重點是深扒 Atlas 背后的「靈魂」—— OWL 架構(gòu)??纯?OpenAI 究竟是如何馴服 Chromium,把它從瀏覽器「換皮」玩成了「架構(gòu)重組」的。

基礎(chǔ)是 Chromium

OpenAI 表示,要讓 ChatGPT 成為網(wǎng)頁瀏覽的真正副駕駛,必須徹底重構(gòu)瀏覽器的底層架構(gòu):將 Atlas 與 Chromium 運行時剝離開來。這意味著要開發(fā)一種全新的 Chromium 集成方式,如此才能滿足以下三個關(guān)鍵目標(biāo):

  • 秒級啟動速度
  • 打開更多標(biāo)簽頁時依舊流暢
  • 為智能體(Agent)場景打下堅實基礎(chǔ)

OpenAI 強調(diào),Chromium 是一個天然的構(gòu)建基石。它能提供先進(jìn)的網(wǎng)頁引擎、完善的安全模型、一流的性能,以及卓越的網(wǎng)頁兼容性;更重要的是,它由全球開發(fā)者社區(qū)持續(xù)改進(jìn)。因此,它成為了現(xiàn)代桌面瀏覽器最常用的底層引擎。

重新定義瀏覽器體驗

雖然基于 Chromium,但 OpenAI 自然也會強調(diào)自己的設(shè)計,包括在「Agent 模式」等功能中引入豐富的動畫和視覺效果。

這要求工程團(tuán)隊使用最現(xiàn)代的原生框架(如 SwiftUI、AppKit 和 Metal),而不是簡單地給開源的 Chromium 界面「換皮」。

結(jié)果,OpenAI 表示:「Atlas 的用戶界面幾乎是從零重建的一整套全新體驗?!?/span>

另外,為了實現(xiàn)快速啟動和支持上百個標(biāo)簽頁同時運行而不掉幀的目標(biāo)。還需要對 Chromium 進(jìn)行一些優(yōu)化,畢竟其默認(rèn)架構(gòu)在啟動流程、線程模型、標(biāo)簽管理等方面都非?!腹虉?zhí)」。

OpenAI 說:「我們考慮過大幅修改 Chromium,但那樣會讓后續(xù)更新復(fù)雜且脆弱。為了保持開發(fā)速度,我們選擇了一條更巧妙的路 —— 重新設(shè)計 Chromium 的集成方式?!?/span>

他們的一個關(guān)鍵的技術(shù)標(biāo)準(zhǔn)是:不僅要加快功能實驗、迭代和上線的節(jié)奏,還要保留 OpenAI 的工程文化 —— 第一天就能上線代碼?!该课恍鹿こ處熑肼毜谝惶煜挛缇鸵峤徊⒑喜⒁粋€小改動。即便 Chromium 的源碼編譯要花幾個小時,我們也得保證這一傳統(tǒng)能延續(xù)?!?/span>

OpenAI 的解決方案:OWL

為了解決這些挑戰(zhàn),OpenAI 構(gòu)建了一個新的架構(gòu)層,稱為 OWL(OpenAI’s Web Layer)。

OWL 是 OpenAI 整合 Chromium 的方式,其核心理念是:讓 Chromium 的瀏覽器進(jìn)程獨立運行在 Atlas 主應(yīng)用進(jìn)程之外。

可以這樣理解:Chromium 通過將每個標(biāo)簽頁放入獨立進(jìn)程來革新瀏覽器架構(gòu);而 OpenAI 更進(jìn)一步 —— 把整個 Chromium 從主應(yīng)用進(jìn)程中分離出來,放入一個獨立的服務(wù)層。

如此方法好處多多:

  • 更簡潔現(xiàn)代的應(yīng)用:Atlas 主要使用 SwiftUI 和 AppKit 構(gòu)建,統(tǒng)一語言、統(tǒng)一技術(shù)棧、代碼干凈。
  • 更快啟動:Chromium 會在后臺異步加載,Atlas 幾乎瞬間顯示畫面。
  • 隔離崩潰與卡頓:即使 Chromium 出問題,Atlas 也不會掛。
  • 更少的合并沖突:OpenAI 修改的 Chromium 代碼極少,易于維護(hù)。
  • 更快的開發(fā)節(jié)奏:大多數(shù)工程師無需本地編譯 Chromium,OWL 內(nèi)部以預(yù)構(gòu)建二進(jìn)制形式分發(fā),Atlas 構(gòu)建只需幾分鐘。

因此,即使是新員工,也能在第一天下午輕松提交改動。

OWL 的工作方式

從高層來看,Atlas 瀏覽器是 OWL 客戶端,而 Chromium 瀏覽器進(jìn)程是 OWL 主機(Host)。兩者通過 Mojo(Chromium 的進(jìn)程間通信系統(tǒng))進(jìn)行通信。OpenAI 編寫了 Swift(甚至 TypeScript)的 Mojo 綁定,使 Swift 應(yīng)用能直接調(diào)用主機端接口。

OWL 客戶端庫提供了一套簡潔的 Swift API,用于抽象主機層的關(guān)鍵功能:

  • Session:全局配置與控制
  • Profile:管理用戶瀏覽數(shù)據(jù)
  • WebView:渲染、輸入、導(dǎo)航、縮放等
  • WebContentRenderer:將輸入事件傳遞給渲染管線
  • LayerHost/Client:在 UI 與 Chromium 之間交換合成信息

此外,還提供書簽、下載、擴展、自動填充等服務(wù)端點。

渲染:跨進(jìn)程傳遞像素

WebView 在客戶端應(yīng)用中共享一個合成容器,不同標(biāo)簽頁的內(nèi)容會動態(tài)交換顯示。在 Chromium 一側(cè),這對應(yīng)于一個 gfx::AcceleratedWidget,由底層的 CALayer 支撐。

OpenAI 的設(shè)計是將該層的上下文 ID 暴露給客戶端,由 NSView 通過私有的 CALayerHost API 嵌入。

諸如 <select> 下拉框或顏色選擇器等獨立彈窗,也采用相同機制。OWL 會保持視圖幾何與 Chromium 同步,確保 GPU 合成器輸出正確分辨率和比例的內(nèi)容。

OpenAI 也借用這種機制,將 Chromium 原生界面的一部分直接投射到 Atlas 中,比如權(quán)限提示框,從而快速實現(xiàn)功能原型而無需完全重寫。

輸入事件:捕獲與轉(zhuǎn)發(fā)

通常,Chromium UI 會將 macOS 的 NSEvent 轉(zhuǎn)換為 Blink 的 WebInputEvent,然后再傳遞給渲染器。

但由于 OWL 中 Chromium 在后臺運行,OpenAI 在 Swift 客戶端中自己完成事件轉(zhuǎn)譯,再將轉(zhuǎn)換后的事件發(fā)給 Chromium。

如果網(wǎng)頁未處理某個事件,系統(tǒng)會把事件返回客戶端,OpenAI 重新生成 NSEvent,讓 Atlas 其他部分接管輸入處理。

Agent 模式:特殊情況

Atlas 的智能體瀏覽對渲染、輸入和數(shù)據(jù)存儲提出了額外挑戰(zhàn)。OpenAI 的計算機使用(computer use)模型需要屏幕的完整圖像作為輸入。

但有些 UI(如 <select> 下拉框)會在標(biāo)簽頁外單獨渲染。在 Agent 模式下,OpenAI 會將這些彈窗重新合成為主頁面的一部分,讓模型在一幀中看到完整的上下文。

輸入事件同樣遵循安全原則:Agent 生成的事件直接傳給渲染器,不經(jīng)過特權(quán)瀏覽器層,以確保沙箱隔離。例如,防止自動化事件觸發(fā)系統(tǒng)快捷鍵等非網(wǎng)頁行為。

此外,Agent 瀏覽可以在臨時「登出」上下文中運行。它不會使用用戶的隱私模式配置,而是借助 Chromium 的 StoragePartition 創(chuàng)建獨立的內(nèi)存存儲。每個 Agent 會話都是全新的,結(jié)束后所有 cookie 和數(shù)據(jù)都會被清除。用戶可以同時運行多個互不干擾的「登出」 Agent 會話。

結(jié)語

OpenAI 最后再次重申了 Chromium 的作用:「如果沒有全球 Chromium 社區(qū)的卓越貢獻(xiàn),這一切都無法實現(xiàn)。OWL 在此基礎(chǔ)上開辟了新的方向:將引擎與應(yīng)用解耦,結(jié)合頂級網(wǎng)頁平臺與現(xiàn)代原生框架,打造更快、更靈活的架構(gòu)?!?/span>

對此,你怎么看?

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-10-22 07:59:49

2025-10-22 11:00:49

2025-10-24 12:50:34

2025-10-22 09:36:47

2012-05-04 09:16:32

2017-02-27 16:07:17

MacChrome瀏覽器

2012-05-17 11:16:09

2012-05-16 18:16:20

2010-04-05 21:57:14

Netscape瀏覽器

2025-04-23 11:52:05

2010-08-20 10:21:25

FirefoxIE瀏覽器

2025-10-27 08:58:00

2022-07-27 16:40:25

C語言

2012-03-20 11:41:18

海豚瀏覽器

2012-03-19 17:25:22

2012-03-20 11:31:58

移動瀏覽器

2012-03-20 11:07:08

2010-12-21 10:11:35

手機瀏覽器

2024-04-03 09:02:45

2013-01-14 10:58:51

傲游云瀏覽器
點贊
收藏

51CTO技術(shù)棧公眾號