偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

告別 RAG?Google 用 URL 上下文 Grounding 持續(xù)發(fā)力

人工智能
本文介紹了 Google 為 Gemini 推出的新功能 URL context grounding,它讓開發(fā)者可以直接查詢和分析特定網(wǎng)頁 URL(包括 PDF)的內(nèi)容,而無需傳統(tǒng) RAG 流程,如文本提取、分塊和向量化。

Google 在 AI 相關(guān)產(chǎn)品上的熱潮勢不可擋。就在幾周前,它為 Gemini 推出了一款新工具——URL context grounding。

URL context grounding 可以單獨(dú)使用,也可以結(jié)合 Google search grounding,用來深入挖掘網(wǎng)絡(luò)內(nèi)容。

什么是 URL Context Grounding?

簡單來說,這是一種讓 Gemini 程序化地讀取、理解并回答關(guān)于單個網(wǎng)頁 URL(包括指向 PDF 的鏈接)內(nèi)容的提問方式,而無需進(jìn)行傳統(tǒng)的 RAG(Retrieval-Augmented Generation)處理。

換句話說,你不需要提取 URL 的文本和內(nèi)容、分塊、向量化、存儲等等繁瑣步驟。你只要告訴 Google 你感興趣的 URL,然后就能直接上手。接下來你會看到,它的代碼實(shí)現(xiàn)非常簡單,而且準(zhǔn)確率很高。

正因如此,我才說,這可能是給 RAG 棺材釘上的又一顆釘子。

但它真的好用嗎?我們來看幾個例子。

我先在 Windows 的 Ubuntu WSL2 上搭建開發(fā)環(huán)境。你可以跟著做,或者用你習(xí)慣的方式。

$ uv init url_context
$ cd url_context
$ uv venv url_context
$ uv pip install jupyter
$ uv pip install "google-genai>=1.16.0"

你還需要一個 Google API key。如果你還沒有,可以去 Google AI Studio 注冊,設(shè)置你的密鑰。鏈接在儀表板頁面的右上角附近。

Google AI Studio
aistudio.google.com

在你的 shell 運(yùn)行以下命令,會在瀏覽器中打開一個新的 Notebook 標(biāo)簽頁:

$ jupyter notebook

需要注意的一些限制

在開始寫代碼示例之前,有幾點(diǎn)關(guān)于 URL context grounding 的限制和約束你需要知道:

  • 每次請求最多支持 20 個 URL。
  • 單個 URL 檢索的內(nèi)容最大為 34MB。
  • 以下內(nèi)容類型不受支持:

a.付費(fèi)墻內(nèi)容

b.YouTube 視頻

c.Google Workspace 文件,如 Google Docs 或電子表格

d.視頻和音頻文件

了解了這些,我們開始看例子吧!

示例 1 — 解析復(fù)雜的在線 PDF

我測試 RAG 或類似處理 PDF 數(shù)據(jù)時,常用的測試文件是特斯拉的 10-Q 季度財(cái)報。這份文件很長,大約 50 頁,包含復(fù)雜的表格和其他布局元素。

作為 SEC 備案文件,它的內(nèi)容是公開的,完全免費(fèi)使用。

如果你想自己看看,這份文件在這里:

https://ir.tesla.com/_flysystem/s3/sec/000162828023034847/tsla-20230930-gen.pdf

對于這個 PDF,我的問題一直是:

“2022 年和 2023 年的總負(fù)債和總資產(chǎn)是多少?”

答案在文件的第 4 頁。以下是那一頁的內(nèi)容。

圖片圖片

圖片來自特斯拉 10-Q SEC 備案文件

對人類來說,答案很好找。你可以看到,2022/2023 年的總資產(chǎn)(單位:百萬美元)分別是 $82,338 和 $93,941,總負(fù)債分別是 $36,440 和 $39,446。

在過去(大概 18 個月前?。?,用傳統(tǒng) RAG 方法從這份文件中提取信息可不容易。

那 Google URL context grounding 表現(xiàn)如何呢?

在你的 Jupyter notebook 中,輸入以下代碼:

from google import genai
from google.genai import types

from IPython.display import HTML, Markdown

client = genai.Client(api_key='YOUR_API_KEY HERE')

# 我們可以使用大多數(shù) Gemini 模型,比如 2.5 Flash 等
MODEL_ID = "gemini-2.5-pro"

prompt = """
  根據(jù)這個 PDF 的內(nèi)容 https://ir.tesla.com/_flysystem/s3/sec/000162828023034847/tsla-20230930-gen.pdf,2022 年和 2023 年的總負(fù)債和總資產(chǎn)是多少?請按以下格式列出:
                   September 30 2023    December 31, 2022
Total Assets         $123               $456
Total Liabilities    $67                $23

不要輸出其他內(nèi)容,僅輸出以上信息
"""

config = {
    "tools": [{"url_context": {}}],
}

response = client.models.generate_content(
    cnotallow=[prompt],
    model=MODEL_ID,
    cnotallow=config
)

display(response.text)

就這么幾行代碼,看看輸出結(jié)果吧:

September 30 2023    December 31, 2022
Total Assets         $93,941              $82,338
Total Liabilities    $39,446              $36,440

完全正確!表現(xiàn)不錯。

我們再看看它能不能提取其他信息。PDF 末尾有一封寫給即將離職員工的信,概述了他們的離職條款。URL context grounding 能判斷出信中提到的離職日期為什么用星號(***)標(biāo)記嗎?以下是信的片段:

圖片圖片

圖片來自特斯拉 10-Q SEC 備案文件

離職日期被掩蓋的原因在腳注中說明:

圖片圖片

圖片來自特斯拉 10-Q SEC 備案文件

除了 prompt 外,其他代碼不變,我只展示 prompt 部分:

...
prompt = """
  根據(jù) https://ir.tesla.com/_flysystem/s3/sec/000162828023034847/tsla-20230930-gen.pdf,員工離職信中提到的離職日期為什么用 *** 標(biāo)記?
"""
...

輸出結(jié)果是:

根據(jù)提供的文件,員工離職信中的離職日期用 “[***]” 標(biāo)記,是因?yàn)楣緦⒛承┓侵匾畔⒁暈樗矫芑驒C(jī)密,故意從公開文件中省略。

文件中有一條說明:“某些特定信息已從本文件中省略,因?yàn)檫@些信息不重要且公司視為私密或機(jī)密,并用 ‘[***]’ 標(biāo)記省略處。”

再次精準(zhǔn)命中!

URL Context Grounding 的其他用途

在我看來,它開啟了許多新機(jī)會,包括:

  • 深入內(nèi)容分析與綜合
    該工具可以從多個 URL 提取特定信息,如價格、名稱或關(guān)鍵發(fā)現(xiàn)。
  • 文檔比較
    它可以分析多份報告、文章甚至 PDF,找出差異并跟蹤趨勢。
  • 內(nèi)容創(chuàng)作
    通過整合多個 URL 的信息,AI 可以生成準(zhǔn)確的摘要、博客文章或報告。例如,開發(fā)者可以用它比較兩個不同網(wǎng)站的食譜,分析食材和烹飪時間。
  • 代碼和文檔分析
    開發(fā)者可以將 AI 指向 GitHub 倉庫或技術(shù)文檔,讓它解釋代碼、生成設(shè)置說明或回答具體問題。
  • 復(fù)雜的工作流
    結(jié)合 Google Search 的廣泛發(fā)現(xiàn)能力和 URL context 工具的深入分析,可以構(gòu)建復(fù)雜多步驟任務(wù)。AI 代理可以先搜索相關(guān)文章,再用 URL context 工具深入“閱讀”并綜合最相關(guān)的搜索結(jié)果信息。
  • Gemini CLI
    一個開源 AI 代理,利用 URL context 工具的 web-fetch 命令,讓開發(fā)者可以快速總結(jié)網(wǎng)頁、提取關(guān)鍵信息或直接從終端翻譯內(nèi)容。
  • 提升事實(shí)準(zhǔn)確性,減少幻覺
    通過將回答基于特定網(wǎng)頁內(nèi)容,AI 的事實(shí)準(zhǔn)確性提高,減少生成錯誤或捏造信息的可能性。它還能為回答提供引用,增強(qiáng)用戶信任。
  • 支持多種內(nèi)容類型

PDF:AI 可以提取文本并理解 PDF 中的表格結(jié)構(gòu),適合處理報告和手冊。

圖片:它可以處理和分析多種格式(PNG、JPEG、BMP、WebP)的圖片,利用多模態(tài)能力理解圖表和圖形。

網(wǎng)頁和數(shù)據(jù)文件:繼續(xù)支持 HTML、JSON、XML、CSV 和純文本文件,適用性廣泛。

示例 2:在線產(chǎn)品價格比較

第二個例子,假設(shè)我們要買一副新耳機(jī)。我們將幾個在線商店的 URL 喂給代碼,讓模型找出符合我們規(guī)格的三款最便宜的產(chǎn)品。

這個例子可能有點(diǎn)多余,因?yàn)榫W(wǎng)上有不少購物比較網(wǎng)站,但它只是為了展示這個工具的潛力。

假設(shè)我們想買 Sony WH-1000XM5 無線降噪耳機(jī),找到了幾家價格最具競爭力的在線商店,但價格幾乎每天都在變。我們來寫一個腳本,隨時運(yùn)行都能返回三家最便宜的商店。

代碼與第一個例子相同,只有 prompt 不同:

prompt = """
  根據(jù)以下 URL,輸出 Sony WH-1000XM5 耳機(jī)的三個最便宜價格及對應(yīng)商店:

  https://electronics.sony.com/audio/headphones/headband/p/wh1000xm5-b?srsltid=AfmBOopJmjebTtZEieUvHEf5xEke7C7piVi3BdlSUdTPJH3wuBfTksJy
  https://tristatecamera.com/product/TRI_STATE_CAMERA_Sony_WH-1000XM5_Wireless_Noise-Canceling_Over-Ear_Headphones_Black_1_Yr_WH1000XM5BS2.html?refid=279&KPID=SONWH1000XM5BS2&fl=GSOrganic&srsltid=AfmBOoqnE7vgc1uOELadhkaRlhHuJx3HGRTV5ICN7ihNkFXI_UEuImZ2gXU
  https://poshmark.com/listing/Sony-WH-1000xm5-Headphones-672d0ab515ad54b37949b845#utm_source=gdm_unpaid
  https://reverb.com/item/91492218-sony-wh-1000xm5-wireless-noise-canceling-over-the-ear-headphones-silver?utm_campaign=US-Shop_unpaid&utm_medium=cpc&utm_source=google
  https://www.thetedstore.com/products/sony-wh-1000xm5blk-us?currency=USD&variant=40129045889085&utm_source=google&utm_medium=cpc&utm_campaign=Google%20Shopping&stkn=b659bcb48606&gad_source=1&gad_campaignid=22537557305&gbraid=0AAAAADAmM1cNpON24l2EbowMzKB_XcqWW&gclid=Cj0KCQjwqqDFBhDhARIsAIHTlkskFykBTXEOuxY_je01HYLPKmho4LhM3je8NJSR24vOzxXK6OCx-hIaAj5tEALw_wcB
  https://www.newegg.com/p/0TH-000U-00JZ4?item=9SIA29PK9N4805&utm_source=google&utm_medium=organic+shopping&utm_campaign=knc-googleadwords-_-headphones+and+accessories-_-sony-_-9SIA29PK9N4805&source=region&srsltid=AfmBOooONnd3a1lju0DgyhpdXlT1VtUp_skJdsx_uYH1DdHKLWPNe_DWBuY&com_cvv=8fb3d522dc163aeadb66e08cd7450cbbdddc64c6cf2e8891f6d48747c6d56d2c
"""

輸出結(jié)果:

根據(jù)提供的 URL,Sony WH-1000XM5 耳機(jī)的三個最便宜價格如下:

1. **$145.00** 在 Reverb
2. **$258.99** 在 Teds Electronics
3. **$329.99** 在 Sony

示例 3 — 公司財(cái)務(wù)分析與比較

這個例子中,我們將比較亞馬遜和微軟 2025 年第二季度的財(cái)報。我們要求模型分析兩份報告,提取關(guān)鍵信息,并總結(jié)兩家公司的關(guān)鍵優(yōu)勢和戰(zhàn)略。數(shù)據(jù)來自公開的 SEC 10-Q 財(cái)報。

from google import genai
from google.genai import types

from IPython.display import HTML, Markdown

client = genai.Client(api_key='YOUR_API_KEY_HERE')

MODEL_ID = "gemini-2.5-pro"

microsoft_earnings_url = "https://www.sec.gov/ix?doc=/Archives/edgar/data/0000789019/000095017025100235/msft-20250630.htm"
amazon_earnings_url = "https://www.sec.gov/ix?doc=/Archives/edgar/data/0001018724/000101872425000086/amzn-20250630.htm"

prompt = f"""
請扮演資深財(cái)務(wù)分析師,對亞馬遜和微軟的最新季度財(cái)報進(jìn)行比較分析。

請?jiān)L問并徹底分析以下兩個 URL 的內(nèi)容:
1. **微軟財(cái)報**:{microsoft_earnings_url}
2. **亞馬遜財(cái)報**:{amazon_earnings_url}

僅基于這兩個文件的信息,執(zhí)行以下任務(wù):

1. **提取和比較關(guān)鍵財(cái)務(wù)指標(biāo)**:
   - 提取兩家公司的總收入、凈利潤和每股攤薄收益(EPS)。
   - 用清晰的 Markdown 表格格式展示這些核心指標(biāo),便于比較。

2. **分析和總結(jié)管理層評論**:
   - 審閱包含 CEO(微軟:Satya Nadella,亞馬遜:Jeff Bezos)和 CFO 引言的部分。
   - 為每家公司寫一段總結(jié),概述他們強(qiáng)調(diào)的主題。根據(jù)他們的說法,業(yè)績的主要驅(qū)動因素是什么?評論的整體語氣如何(例如,樂觀、謹(jǐn)慎)?

3. **識別和對比戰(zhàn)略重點(diǎn)**:
   - 指出每家公司強(qiáng)調(diào)的主要增長驅(qū)動業(yè)務(wù)板塊或產(chǎn)品類別(例如,微軟的 Cloud 和 AI,亞馬遜的 AWS 服務(wù)等)。
   - 對比本季度的主要戰(zhàn)略重點(diǎn)。一家更專注于企業(yè)/云服務(wù),另一家更注重消費(fèi)者硬件和生態(tài)系統(tǒng)增長嗎?

4. **綜合結(jié)論性執(zhí)行摘要**:
   - 寫一段簡潔的總結(jié),綜合分析結(jié)果?;谶@些報告,比較兩家公司的整體健康狀況和當(dāng)前戰(zhàn)略態(tài)勢。例如,總結(jié)哪家公司在本季度表現(xiàn)出更強(qiáng)的增長,以及在哪些領(lǐng)域。

僅輸出最終分析,無需輸出中間步驟或數(shù)據(jù)。
"""

config = {
    "tools": [{"url_context": {}}],
}

response = client.models.generate_content(
    cnotallow=[prompt],
    model=MODEL_ID,
    cnotallow=config
)

display(Markdown(response.text))

輸出結(jié)果:

以下是對亞馬遜和微軟最新季度財(cái)報的比較分析。

1. 關(guān)鍵財(cái)務(wù)指標(biāo)

指標(biāo)

亞馬遜 (Q2 2025)

微軟 (FY25 Q2)

總收入

1437 億美元

619 億美元

凈利潤

104 億美元

219 億美元

每股攤薄收益

1 美元

2.94 美元

2. 管理層評論分析

微軟

微軟的管理層,以 CEO Satya Nadella 為首,保持高度樂觀的語氣,強(qiáng)調(diào) AI 對業(yè)務(wù)的變革性影響。Nadella 的評論突出 Microsoft Cloud 作為主要業(yè)績驅(qū)動因素,提到它幫助客戶大規(guī)模應(yīng)用 AI。CFO Amy Hood 進(jìn)一步指出,強(qiáng)勁的季度業(yè)績由 Microsoft Cloud 推動,收入增長 23%。微軟領(lǐng)導(dǎo)層的核心主題是,AI 投資不僅帶來回報,還從根本上重塑了產(chǎn)品和客戶關(guān)系,帶來顯著增長和市場領(lǐng)導(dǎo)地位。

亞馬遜

亞馬遜的領(lǐng)導(dǎo)層,包括 CEO Jeff Bezos,展現(xiàn)出自信和前瞻性的視角。評論突出 AWS 的強(qiáng)勁表現(xiàn),以及公司在 AI 領(lǐng)域的持續(xù)創(chuàng)新,特別是 Bedrock 服務(wù)和定制 AI 芯片的開發(fā)。Bezos 強(qiáng)調(diào)公司以客戶為中心的長期創(chuàng)新。整體語氣充滿樂觀,明確傳遞出亞馬遜在 AI 和云計(jì)算的投資正帶來豐厚成果,并將繼續(xù)成為戰(zhàn)略核心。

3. 戰(zhàn)略重點(diǎn)對比

微軟

微軟本季度的戰(zhàn)略重點(diǎn)高度集中于企業(yè)和云服務(wù),特別強(qiáng)調(diào)人工智能。報告反復(fù)提到 Microsoft Cloud 是成功的關(guān)鍵,具體提到 Azure、Dynamics 365 和 Microsoft 365 等產(chǎn)品,這些產(chǎn)品都融入了 AI 功能。CEO Satya Nadella 明確指出,幫助客戶大規(guī)模應(yīng)用 AI 是公司的關(guān)鍵差異化和增長驅(qū)動力。

亞馬遜

亞馬遜的戰(zhàn)略重點(diǎn)雖然也大力投資于 AWS 的云和 AI,但范圍更廣,涵蓋了其龐大的電子商務(wù)和面向消費(fèi)者的業(yè)務(wù)。報告強(qiáng)調(diào) AWS 的收入和營業(yè)收入增長,突出其在 AI 領(lǐng)域的創(chuàng)新,如 Bedrock 服務(wù)。但與微軟不同,亞馬遜的報告還提到其消費(fèi)者業(yè)務(wù)的實(shí)力,注重選擇、價格和便利性,以及廣告服務(wù)的增長。

4. 執(zhí)行摘要

根據(jù)最新季度報告,微軟和亞馬遜都展現(xiàn)出強(qiáng)勁的財(cái)務(wù)健康狀況,并戰(zhàn)略性地定位于云計(jì)算和人工智能的增長。微軟的報告顯示出更聚焦的戰(zhàn)略,Microsoft Cloud 及其集成的 AI 能力是增長的主要引擎,帶來令人印象深刻的盈利能力。亞馬遜在 AWS 領(lǐng)域也實(shí)現(xiàn)了顯著增長,但其戰(zhàn)略更多元化,平衡了企業(yè)云業(yè)務(wù)與龐大的電子商務(wù)和廣告業(yè)務(wù)。在本季度,微軟在凈利潤和每股收益上表現(xiàn)出更強(qiáng)勁的增長,反映了其企業(yè)軟件和云業(yè)務(wù)的高利潤率。

示例 4 — 使用 Google Search Grounding

我之前提到,你可以結(jié)合 Google search grounding 和 URL grounding 使用,但 search grounding 到底是什么?

簡單來說,search grounding 適用于需要當(dāng)前信息或外部知識的查詢。使用 Google Search,Gemini 可以訪問幾乎實(shí)時的信息,提供更好的回答。

要啟用 Google Search Grounding,在 generate_content 的 config 中添加 google_search 工具,如下:

...
cnotallow={
      "tools": [
        {
          "google_search": {}
        }
      ]
    },
...

現(xiàn)在我們可以提問了。九月最后一個周末舉辦的 Ryder Cup 是一場激動人心的 golf 賽事。但哪位選手確保了歐洲隊(duì)衛(wèi)冕成功?

from google import genai
from google.genai import types

from IPython.display import HTML, Markdown

client = genai.Client(api_key='YOUR_API_KEY_HERE')

MODEL_ID = "gemini-2.5-pro"

response = client.models.generate_content(
    model=MODEL_ID,
    cnotallow="哪位選手的推桿確保了 2025 年 Ryder Cup 歐洲隊(duì)的衛(wèi)冕?",
    cnotallow={"tools": [{"google_search": {}}]},
)

display(Markdown(response.text))

輸出結(jié)果:

Shane Lowry 的關(guān)鍵推桿確保了 2025 年 Ryder Cup 歐洲隊(duì)的衛(wèi)冕,歐洲隊(duì)在 Bethpage Black 以 15-13 擊敗美國隊(duì)的最后一天激烈反撲。

歐洲隊(duì)在周日單人賽前以 11.5-4.5 的領(lǐng)先優(yōu)勢進(jìn)入,只需再拿 2.5 分即可衛(wèi)冕。美國隊(duì)奮力反擊,贏得了前七場比賽中的五場,制造了緊張的下午。

在壓力之下,愛爾蘭選手 Shane Lowry 貢獻(xiàn)了決定性一刻。他的推桿確保歐洲隊(duì)達(dá)到 14 分,鎖定衛(wèi)冕冠軍。Tyrrell Hatton 隨后為歐洲隊(duì)鎖定了徹底的勝利。

這是歐洲隊(duì)自 2012 年以來首次在美洲土地上贏得 Ryder Cup。比賽并非沒有爭議,一些觀眾對歐洲隊(duì)的不友好行為引發(fā)了討論。

答案完全正確!

雖然我這里沒有具體展示,但你應(yīng)該能看出,結(jié)合 Google search grounding 和 Google URL context grounding 構(gòu)建引人注目的數(shù)據(jù)檢索工具是多么簡單。

總結(jié)

本文介紹了 Google 為 Gemini 推出的新功能 URL context grounding,它讓開發(fā)者可以直接查詢和分析特定網(wǎng)頁 URL(包括 PDF)的內(nèi)容,而無需傳統(tǒng) RAG 流程,如文本提取、分塊和向量化。

我通過 Jupyter notebook 展示了它的易用性,成功從特斯拉的 10-Q SEC 備案文件中檢索數(shù)據(jù),比較在線商店的產(chǎn)品價格,并分析了亞馬遜和微軟 2025 年第二季度的財(cái)務(wù)表現(xiàn)。

盡管有不支持付費(fèi)墻內(nèi)容和某些媒體內(nèi)容的限制,這篇文章強(qiáng)調(diào)了 URL context grounding 在深入文檔查詢、數(shù)據(jù)提取、比較和綜合方面的能力——通過基于真實(shí)來源的回答提升準(zhǔn)確性。

對于許多用例,這個工具有效替代了傳統(tǒng) RAG 工作流,特別是結(jié)合 Google Search grounding 時,能實(shí)現(xiàn)更復(fù)雜的代理工作流、事實(shí)可靠性以及多模態(tài)內(nèi)容分析。


責(zé)任編輯:武曉燕 來源: AI大模型觀察站
相關(guān)推薦

2024-09-30 14:10:00

2025-05-09 07:50:30

2025-10-20 09:06:00

2025-10-13 08:00:00

2024-01-29 08:49:36

RAG模型檢索

2024-06-06 08:42:01

2017-05-11 14:00:02

Flask請求上下文應(yīng)用上下文

2025-06-26 07:00:00

上下文工程AI智能體

2025-05-07 08:35:11

2012-12-31 10:01:34

SELinuxSELinux安全

2025-09-28 07:00:00

2022-09-14 13:13:51

JavaScript上下文

2025-10-27 08:25:01

2025-02-26 00:16:56

RAGAI服務(wù)

2022-09-15 08:01:14

繼承基礎(chǔ)設(shè)施基礎(chǔ)服務(wù)

2025-04-28 09:02:14

2023-07-11 10:02:23

2017-12-17 17:01:23

限界上下文系統(tǒng)模型

2025-03-18 08:14:05

2022-10-28 16:24:33

Context上下文鴻蒙
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號