偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了! 精華

發(fā)布于 2025-2-26 14:08
瀏覽
0收藏

圣誕節(jié)在二月,Claude扔了個王炸!

看來爆料者的信息還挺準(zhǔn)的:

明天:Claude 4沒等到,Claude 3.7 要來了?

不是嘛,哈哈哈。

Anthropic 官方有個毛病,他們通常不會做任何的預(yù)發(fā)布,大半夜他給你扔出來了個王炸:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

這次的新模型叫:Claude 3.7 Sonnet,它帶來了一種新的思維方式。它不再把快速回答和深度思考割裂開來,而是像人類大腦一樣,在同一個模型中實現(xiàn)兩種能力。

Claude 3.7 Sonnet既能快速回答問題,也能在需要時進行深度思考,給用戶帶來更流暢的體驗。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

這種統(tǒng)一的設(shè)計讓用戶在使用時感受到更自然的互動,兩種模式下的提示詞方式基本相同,仿佛在與一個真正的助手對話。

你可以選擇標(biāo)準(zhǔn)模式,快速得到答案;也可以切換到擴展思考模式,讓Claude在回答前自我反思,這樣在數(shù)學(xué)、物理、編碼等任務(wù)上表現(xiàn)會更好。在擴展思考模式下,Claude會花更多時間分析問題,從而提供更準(zhǔn)確和深入的回答,特別是在復(fù)雜的學(xué)科領(lǐng)域。

如果你通過API使用Claude,還可以控制思考的預(yù)算,決定Claude可以思考多少個token,最高128K。這意味著你可以根據(jù)任務(wù)重要性,精確設(shè)定模型思考的深度。在速度、成本和答案質(zhì)量之間找到最佳平衡點。與其他模型不同,Claude更注重實際商業(yè)應(yīng)用,而非競賽題目。

Claude編程能力直接起飛!

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

看看這張圖,Claude 3.7 Sonnet在編程測試中拿到了70.3%的高分,把其他大模型全部甩在身后。

OpenAI的o1、o3-mini和DeepSeek R1都擠在49%左右打轉(zhuǎn),Claude直接領(lǐng)先20個百分點。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

Sonnet 3.7顯然將重點放在編碼能力上,其他領(lǐng)域似乎并不是他們的主要關(guān)注點(你可以看到 Grok3 在MMMLU、AIME2024上是超過他的)。

雖然在其他知識測試上Claude只是小幅提升,但編程能力這一下子就上了一個臺階。

這表明,Anthropic希望將Sonnet定位為一款強大的編碼AI。

Anthropic這是明擺著要把Claude打造成編程專家啊。畢竟它本來就已經(jīng)很擅長寫代碼了,現(xiàn)在更是實力大增。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

它絕對適合程序員。它將有助于創(chuàng)建應(yīng)用程序和游戲。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

使用 API,128K最大輸出(VIBE 編碼萬歲)

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

這次的更新特別加強了編碼和前端開發(fā)的能力。

Claude 3.7 Sonnet現(xiàn)在在所有計劃中都可以使用,包括免費版、專業(yè)版、團隊版和企業(yè)版。

也能在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。不過免費用戶不提供擴展思維模式。

定價方面,與前代模型相同:每百萬輸入token 3美元,每百萬輸出token 15美元(包括思考token)。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

所以,還有個3.5超大大大杯呢?

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

此外,我們很早知道Claude 能夠處理復(fù)雜的代碼庫和高級工具使用。許多開發(fā)者發(fā)現(xiàn),Claude在規(guī)劃代碼變更和處理全棧更新時,表現(xiàn)得比其他模型更為出色,極大地提高了工作效率。

在實際測試中,它的編程能力全面領(lǐng)先:Cursor發(fā)現(xiàn)它處理復(fù)雜代碼庫的能力顯著提升;Cognition認為它在規(guī)劃代碼變更和全棧更新方面遠超其他模型;Vercel強調(diào)了它在復(fù)雜工作流程中的精確性;Replit成功用它構(gòu)建了其他模型無法完成的復(fù)雜應(yīng)用;Canva則證實它能生成具有設(shè)計品味的生產(chǎn)級代碼。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

所以。現(xiàn)在Sonnet 3.7 這個代碼提升。。。刷卡吧 ~

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

網(wǎng)友:“ 感謝@cursor_ai提供所有訓(xùn)練數(shù)據(jù)... ”

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

這一點確實需要關(guān)注,當(dāng)一個LLM被作為主流模型用在最真實開發(fā)場景中時,這種珍貴數(shù)據(jù)帶來的能力提升可想而知。。。

就在Sonnet 3.7 凌晨2:30發(fā)布之后,有網(wǎng)友馬上催Cursor官方:該上號了!

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

而僅僅過了4分鐘。

凌晨 2:34 我就看到我的Cursor它更新了,集成了Sonnet 3.7。。。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

并且官方更新了推文:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

他們肯定是串通好的。。。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

官方建議啟用代理模式使用Sonnet 3.7。

我還看到了Cursor UI大更新,比較清爽簡潔了。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

是覆蓋各個小操作細節(jié)的清爽簡潔。

上次還在夸Trae的界面,這次Cursor似乎也往這個方向優(yōu)化了。

還有現(xiàn)在跨聊天對話,你不需要通過復(fù)制上一個聊天窗口的內(nèi)容作為上下文加入新窗口。

他現(xiàn)在有一個功能是總結(jié)整個聊天的摘要然后直接繼承到新開的聊天窗口中,所以這又是一個痛點被解決。

。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

還有網(wǎng)友建議Cursor 后續(xù)把 Sonnet 3.7 思維動態(tài)選擇加上,畢竟現(xiàn)在只更新了模型。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

好了,繼續(xù)看基準(zhǔn)測試。

TAU-bench零售場景達81.2%,航空場景達58.4%,全面領(lǐng)先其他模型。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

TAU-bench 是一個框架,用于測試 AI 代理在復(fù)雜的現(xiàn)實任務(wù)中與用戶和工具交互。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

Claude 3.7 Sonnet幾乎是全能選手,它在指令理解、推理能力、多模態(tài)處理和代碼編寫上都表現(xiàn)出色。開啟擴展思考模式后,在數(shù)學(xué)和科學(xué)問題上更是突飛猛進。

Claude也玩起了寶可夢,還玩得挺溜!

有意思的是,它不僅在傳統(tǒng)測試中表現(xiàn)優(yōu)秀,連玩寶可夢游戲都比之前的所有模型強:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

看看這張圖,太有意思了。Anthropic讓Claude玩起了經(jīng)典的Game Boy游戲《寶可夢紅版》,還把不同版本的Claude放在一起比賽。

最老的Claude 3.0連主角家門都出不去,卡在游戲最開始的小鎮(zhèn)上。Claude 3.5稍微好點,能到達森林和第一個城市。

但Claude 3.7 Sonnet簡直是開掛,它不僅能探索多個城市,還打敗了三個道館館主,拿到了三個徽章。

秘訣在哪?研究人員給了Claude基本的記憶能力、屏幕像素輸入和按鍵功能,讓它能持續(xù)游戲數(shù)萬次交互。Claude 3.7會嘗試不同策略,質(zhì)疑自己之前的假設(shè),隨著游戲進行不斷提升自己的能力。

這不僅是個有趣的測試,也展示了Claude在復(fù)雜任務(wù)中的學(xué)習(xí)和適應(yīng)能力。

長時間保持專注,完成沒有明確終點的任務(wù)。

這種能力放到實際工作中有多強?開發(fā)者可以用它來打造各種高級AI助手,處理那些需要持續(xù)思考和靈活應(yīng)對的復(fù)雜任務(wù)。

游戲只是測試場,真正的價值在于現(xiàn)實世界的應(yīng)用。

看看網(wǎng)友們的評價:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

關(guān)于為什么會有寶可夢這個基準(zhǔn)測試,官方說的很清楚,想要詳細了解的看這里:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

https://www.anthropic.com/research/visible-extended-thinking

網(wǎng)上已經(jīng)有了關(guān)于Sonnet 3.7的實際測試例子:

你在開玩笑吧,哥們? 之 測試非標(biāo)準(zhǔn)草莓單詞計數(shù):

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

 網(wǎng)友辣評:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

這可真是真正的硬編碼種子選手啊。。。

還有解決復(fù)雜的3d布料模擬:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

三維可視化微分音樂:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

最好看的網(wǎng)站登陸頁:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

Sparks of AGI paper:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

UI很好看的心率綁定Snake 游戲:

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

C語言流體模擬器

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

同時,Anthropic還發(fā)布了智能編碼工具:Claude Code。專為開發(fā)者設(shè)計。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

自2024年6月以來,Sonnet已成為全球開發(fā)者的首選模型。Claude Code是首個主動協(xié)作的編碼工具,能夠搜索和閱讀代碼、編輯文件、編寫和運行測試、提交代碼到GitHub,并使用命令行工具。

你可以直接在終端里把工程任務(wù)交給Claude,省時省力。(你應(yīng)該知道Aider)

在實際應(yīng)用中,Claude Code在測試驅(qū)動開發(fā)、調(diào)試復(fù)雜問題和大規(guī)模重構(gòu)中表現(xiàn)出色,完成任務(wù)的時間從45分鐘縮短到一次性完成。

未來,Anthropic 將持續(xù)改進Claude Code,增強工具調(diào)用的可靠性,支持長時間運行的命令,改進應(yīng)用內(nèi)渲染,并擴展Claude對自身能力的理解。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

限量預(yù)覽:https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/overview

And 。。。

我們這三天的時間線,可能是這樣的。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

以及Grok。。。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

關(guān)于Claude3.7 這個命名。。。claude-3-7-sonnet-20250219。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

 One More Thing 

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

根據(jù)圖表,Claude的發(fā)展路線圖顯示到2024年,它將幫助個人更好地完成當(dāng)前工作,提升每個人的能力。

到2025年,Claude將開始與專家進行深入合作,獨立完成大量工作,擴展個人和團隊的能力。

而到了2027年,Claude將能夠找到突破性解決方案,解決那些需要團隊多年才能完成的復(fù)雜問題。

這意味著我們可能在接下來的幾年里,見證一個“幾乎”快速起飛的階段,朝著超人工智能(ASI)邁進。

這樣的進展確實令人興奮,未來的可能性似乎越來越近了!

大家如此深愛的一個模型,可能叫Claude吧。

沸騰了!新的推理模型編碼能力爆表!是的,那個王,他又回來了!-AI.x社區(qū)

參考鏈接:[1] https://x.com/AnthropicAI/status/1894092430560965029

本文轉(zhuǎn)載自??AI進修生??,作者: Aitrainee ????


標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦