10分鐘搞定Excel世錦賽難題!首個(gè)超越人類Excel Agent,網(wǎng)友:想給它磕一個(gè)
前段時(shí)間,我們報(bào)道了 5 款大模型參加了今年山東高考的事兒,為了弄清楚各大模型在 9 個(gè)科目中的具體表現(xiàn),我們對著測評明細(xì)表挨個(gè)兒分析,搞得狼狽又崩潰。要是哪個(gè) AI 能一鍵分析表格,我當(dāng)場就能給它磕一個(gè)。
現(xiàn)在,終于有 AI 來整頓 Excel 表格了!
這款 AI 工具名為 Shortcut,號稱是「第一個(gè)超越人類的 Excel Agent」。它能夠一次性完成大多數(shù) Excel 知識(shí)工作任務(wù),甚至在大約 10 分鐘內(nèi)就解決了 Excel 世界錦標(biāo)賽的復(fù)雜案例,準(zhǔn)確率超過 80%,這比人類快 10 倍。
(冷知識(shí):Excel 世界錦標(biāo)賽(MEWC)是由金融建模世界杯(FMWC)團(tuán)隊(duì)組織、微軟官方支持的全球性電子競技賽事,參賽者需通過 Excel 解決復(fù)雜場景化題目,2024 年決賽以《魔獸世界》為模擬場景,冠軍獎(jiǎng)金 5000 美元。)
Shortcut 具有與 Excel 近乎完美的功能兼容性,可以直接編輯、導(dǎo)入和導(dǎo)出文件,它不僅限于基礎(chǔ) Excel 操作,還能處理復(fù)雜的金融建模任務(wù),例如:
- 構(gòu)建多標(biāo)簽的預(yù)估上限表( Pro Forma Cap Table)。
- 分析 5000 行 CSV 數(shù)據(jù),生成圖表和儀表板,提供深入見解。
- 遞歸解決錯(cuò)誤,確保財(cái)務(wù)模型的準(zhǔn)確性。
此外,它還有隱藏功能,比如畫尤達(dá)大師。
據(jù) fundamental 聯(lián)合創(chuàng)始人 nico 演示,他只需輸入提示詞:幫我創(chuàng)作一幅精美的 50x50 像素的尤達(dá)圖像,放在 B 列,通過陰影處理和色彩運(yùn)用來展現(xiàn)它的標(biāo)志性特征。Shortcut 就開始一步步執(zhí)行任務(wù),先設(shè)置像素網(wǎng)格,并將單元格調(diào)整為正方形,接著用各種綠色陰影創(chuàng)建尤達(dá)的耳朵和基本臉型。
當(dāng)然,Shortcut 也有一些局限性,比如在格式化方面比較懶、在長時(shí)間多輪對話中表現(xiàn)不佳、處理大型 PDF 時(shí)可能遇到上下文限制。
Shortcut 目前處于早期預(yù)覽階段,大家可以在 X 上評論以獲取邀請碼。
- 邀請碼獲取地址:https://x.com/nicochristie/status/1940440489972649989
- Shortcut 地址:http://tryshortcut.ai
我們試了一下,只要使用谷歌郵箱登錄,即使沒有邀請碼也能獲得 3 次免費(fèi)體驗(yàn)機(jī)會(huì)。
接下來,我們就奉上一手實(shí)測。
一手體驗(yàn)
Shortcut 界面分為兩部分,左側(cè)類似于 Excel 表格,右側(cè)是聊天區(qū),輸入提示詞就能指使它干活。
點(diǎn)擊左上側(cè)的「Open Xlsx File」就能上傳原始的 excel 文件,當(dāng)然也可以一鍵新建、保存文檔。
比如,我們上傳了 5 款大模型挑戰(zhàn)語文高考卷的成績單,先讓它算出各個(gè)模型對應(yīng)的總分,再根據(jù)以上表格分析一下每個(gè)模型在各個(gè)題型中的得分情況。
領(lǐng)到任務(wù)后,它就開始咔咔思考,并像其他 Agent 一樣讓我們提供更多信息,比如計(jì)算的總分輸入到哪一欄、分析得分情況是使用哪種形式等。確認(rèn)完上述信息后,它就開始制定計(jì)劃。
以下紅框圈出來的部分即是 Shortcut 生成的。我專門核對了一遍,它計(jì)算的各個(gè)模型總分和相對于滿分的百分比全都準(zhǔn)確無誤。
并且能根據(jù)表格準(zhǔn)確分析出五大模型在總分、各個(gè)題型中的表現(xiàn)情況。
不過,我們對照右側(cè)的任務(wù)清單,發(fā)現(xiàn)它也漏掉了幾項(xiàng),例如條形圖、比較總分的柱狀圖以及雷達(dá)圖等,翻遍了各個(gè)角落也沒找到相應(yīng)的圖表。
難度升級。我們又上傳了那個(gè)曾把我們搞得焦頭爛額的各科評分明細(xì)表,讓它分析這 5 款大模型在語文學(xué)科中第 23 題中的最終得分分別是多少,并形成一個(gè)表格。
好家伙,Shortcut 直接罷工:由于早期訪問期間需求量大,Shortcut 正在承受壓力,我們正在擴(kuò)大容量,請稍后再試。我們換了幾臺(tái)電腦重新試了幾次,還是沒有起色。
我們還讓它生成一個(gè)像素版馬里奧圖像,輸入的提示詞:Create a beautiful 50x50 pixel art of Mario, placed in column B, showcasing his iconic features through shadowing and color usage.
Shortcut 還是先要求細(xì)化需求,比如要?jiǎng)?chuàng)建哪個(gè)版本的馬里奧、馬里奧的姿勢和表情等。
確認(rèn)完以上細(xì)節(jié),它立馬就能響應(yīng):
來看看經(jīng)典 8-bit Mario 最終效果,雖然有點(diǎn)抽象,但起碼完成了任務(wù)。
總體來說,對于一些簡單的表格生成、數(shù)據(jù)處理(比如計(jì)算總和、百分比等),Shortcut 可以輕松搞定,但如果投喂給它的表格數(shù)據(jù)過于復(fù)雜,它就很容易「宕機(jī)」。
雖然傳統(tǒng) Excel 是一款功能強(qiáng)大的工具,但其復(fù)雜性和易出錯(cuò)的特性讓打工人痛恨已久,這也就給 Shortcut 等專門處理 Excel 任務(wù)的 Agent 巨大的發(fā)展空間,不過就目前來看,它們似乎還有較長的路要走。