偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！精華

發(fā)布于 2025-2-26 14:08

瀏覽

0收藏

圣誕節(jié)在二月，Claude扔了個王炸！

看來爆料者的信息還挺準(zhǔn)的：

明天：Claude 4沒等到，Claude 3.7 要來了？

不是嘛，哈哈哈。

Anthropic 官方有個毛病，他們通常不會做任何的預(yù)發(fā)布，大半夜他給你扔出來了個王炸：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

這次的新模型叫：Claude 3.7 Sonnet，它帶來了一種新的思維方式。它不再把快速回答和深度思考割裂開來，而是像人類大腦一樣，在同一個模型中實現(xiàn)兩種能力。

Claude 3.7 Sonnet既能快速回答問題，也能在需要時進行深度思考，給用戶帶來更流暢的體驗。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

這種統(tǒng)一的設(shè)計讓用戶在使用時感受到更自然的互動，兩種模式下的提示詞方式基本相同，仿佛在與一個真正的助手對話。

你可以選擇標(biāo)準(zhǔn)模式，快速得到答案；也可以切換到擴展思考模式，讓Claude在回答前自我反思，這樣在數(shù)學(xué)、物理、編碼等任務(wù)上表現(xiàn)會更好。在擴展思考模式下，Claude會花更多時間分析問題，從而提供更準(zhǔn)確和深入的回答，特別是在復(fù)雜的學(xué)科領(lǐng)域。

如果你通過API使用Claude，還可以控制思考的預(yù)算，決定Claude可以思考多少個token，最高128K。這意味著你可以根據(jù)任務(wù)重要性，精確設(shè)定模型思考的深度。在速度、成本和答案質(zhì)量之間找到最佳平衡點。與其他模型不同，Claude更注重實際商業(yè)應(yīng)用，而非競賽題目。

Claude編程能力直接起飛！

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

看看這張圖，Claude 3.7 Sonnet在編程測試中拿到了70.3%的高分，把其他大模型全部甩在身后。

OpenAI的o1、o3-mini和DeepSeek R1都擠在49%左右打轉(zhuǎn)，Claude直接領(lǐng)先20個百分點。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

Sonnet 3.7顯然將重點放在編碼能力上，其他領(lǐng)域似乎并不是他們的主要關(guān)注點（你可以看到 Grok3 在MMMLU、AIME2024上是超過他的）。

雖然在其他知識測試上Claude只是小幅提升，但編程能力這一下子就上了一個臺階。

這表明，Anthropic希望將Sonnet定位為一款強大的編碼AI。

Anthropic這是明擺著要把Claude打造成編程專家啊。畢竟它本來就已經(jīng)很擅長寫代碼了，現(xiàn)在更是實力大增。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

它絕對適合程序員。它將有助于創(chuàng)建應(yīng)用程序和游戲。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

使用 API，128K最大輸出（VIBE 編碼萬歲）

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

這次的更新特別加強了編碼和前端開發(fā)的能力。

Claude 3.7 Sonnet現(xiàn)在在所有計劃中都可以使用，包括免費版、專業(yè)版、團隊版和企業(yè)版。

也能在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。不過免費用戶不提供擴展思維模式。

定價方面，與前代模型相同：每百萬輸入token 3美元，每百萬輸出token 15美元（包括思考token）。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

所以，還有個3.5超大大大杯呢？

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

此外，我們很早知道Claude 能夠處理復(fù)雜的代碼庫和高級工具使用。許多開發(fā)者發(fā)現(xiàn)，Claude在規(guī)劃代碼變更和處理全棧更新時，表現(xiàn)得比其他模型更為出色，極大地提高了工作效率。

在實際測試中，它的編程能力全面領(lǐng)先：Cursor發(fā)現(xiàn)它處理復(fù)雜代碼庫的能力顯著提升；Cognition認為它在規(guī)劃代碼變更和全棧更新方面遠超其他模型；Vercel強調(diào)了它在復(fù)雜工作流程中的精確性；Replit成功用它構(gòu)建了其他模型無法完成的復(fù)雜應(yīng)用；Canva則證實它能生成具有設(shè)計品味的生產(chǎn)級代碼。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

所以。現(xiàn)在Sonnet 3.7 這個代碼提升。。。刷卡吧 ~

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

網(wǎng)友：“ 感謝@cursor_ai提供所有訓(xùn)練數(shù)據(jù)... ”

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

這一點確實需要關(guān)注，當(dāng)一個LLM被作為主流模型用在最真實開發(fā)場景中時，這種珍貴數(shù)據(jù)帶來的能力提升可想而知。。。

就在Sonnet 3.7 凌晨2:30發(fā)布之后，有網(wǎng)友馬上催Cursor官方：該上號了！

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

而僅僅過了4分鐘。

凌晨 2:34 我就看到我的Cursor它更新了，集成了Sonnet 3.7。。。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

并且官方更新了推文：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

他們肯定是串通好的。。。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

官方建議啟用代理模式使用Sonnet 3.7。

我還看到了Cursor UI大更新，比較清爽簡潔了。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

是覆蓋各個小操作細節(jié)的清爽簡潔。

上次還在夸Trae的界面，這次Cursor似乎也往這個方向優(yōu)化了。

還有現(xiàn)在跨聊天對話，你不需要通過復(fù)制上一個聊天窗口的內(nèi)容作為上下文加入新窗口。

他現(xiàn)在有一個功能是總結(jié)整個聊天的摘要然后直接繼承到新開的聊天窗口中，所以這又是一個痛點被解決。

。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

還有網(wǎng)友建議Cursor 后續(xù)把 Sonnet 3.7 思維動態(tài)選擇加上，畢竟現(xiàn)在只更新了模型。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

好了，繼續(xù)看基準(zhǔn)測試。

TAU-bench零售場景達81.2%，航空場景達58.4%，全面領(lǐng)先其他模型。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

TAU-bench 是一個框架，用于測試 AI 代理在復(fù)雜的現(xiàn)實任務(wù)中與用戶和工具交互。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

Claude 3.7 Sonnet幾乎是全能選手，它在指令理解、推理能力、多模態(tài)處理和代碼編寫上都表現(xiàn)出色。開啟擴展思考模式后，在數(shù)學(xué)和科學(xué)問題上更是突飛猛進。

Claude也玩起了寶可夢，還玩得挺溜！

有意思的是，它不僅在傳統(tǒng)測試中表現(xiàn)優(yōu)秀，連玩寶可夢游戲都比之前的所有模型強：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

看看這張圖，太有意思了。Anthropic讓Claude玩起了經(jīng)典的Game Boy游戲《寶可夢紅版》，還把不同版本的Claude放在一起比賽。

最老的Claude 3.0連主角家門都出不去，卡在游戲最開始的小鎮(zhèn)上。Claude 3.5稍微好點，能到達森林和第一個城市。

但Claude 3.7 Sonnet簡直是開掛，它不僅能探索多個城市，還打敗了三個道館館主，拿到了三個徽章。

秘訣在哪？研究人員給了Claude基本的記憶能力、屏幕像素輸入和按鍵功能，讓它能持續(xù)游戲數(shù)萬次交互。Claude 3.7會嘗試不同策略，質(zhì)疑自己之前的假設(shè)，隨著游戲進行不斷提升自己的能力。

這不僅是個有趣的測試，也展示了Claude在復(fù)雜任務(wù)中的學(xué)習(xí)和適應(yīng)能力。

長時間保持專注，完成沒有明確終點的任務(wù)。

這種能力放到實際工作中有多強？開發(fā)者可以用它來打造各種高級AI助手，處理那些需要持續(xù)思考和靈活應(yīng)對的復(fù)雜任務(wù)。

游戲只是測試場，真正的價值在于現(xiàn)實世界的應(yīng)用。

看看網(wǎng)友們的評價：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

關(guān)于為什么會有寶可夢這個基準(zhǔn)測試，官方說的很清楚，想要詳細了解的看這里：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

https://www.anthropic.com/research/visible-extended-thinking

網(wǎng)上已經(jīng)有了關(guān)于Sonnet 3.7的實際測試例子：

你在開玩笑吧，哥們？之測試非標(biāo)準(zhǔn)草莓單詞計數(shù)：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

網(wǎng)友辣評：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

這可真是真正的硬編碼種子選手啊。。。

還有解決復(fù)雜的3d布料模擬：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

三維可視化微分音樂：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

最好看的網(wǎng)站登陸頁：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

Sparks of AGI paper：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

UI很好看的心率綁定Snake 游戲：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

C語言流體模擬器

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

同時，Anthropic還發(fā)布了智能編碼工具：Claude Code。專為開發(fā)者設(shè)計。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

自2024年6月以來，Sonnet已成為全球開發(fā)者的首選模型。Claude Code是首個主動協(xié)作的編碼工具，能夠搜索和閱讀代碼、編輯文件、編寫和運行測試、提交代碼到GitHub，并使用命令行工具。

你可以直接在終端里把工程任務(wù)交給Claude，省時省力。（你應(yīng)該知道Aider）

在實際應(yīng)用中，Claude Code在測試驅(qū)動開發(fā)、調(diào)試復(fù)雜問題和大規(guī)模重構(gòu)中表現(xiàn)出色，完成任務(wù)的時間從45分鐘縮短到一次性完成。

未來，Anthropic 將持續(xù)改進Claude Code，增強工具調(diào)用的可靠性，支持長時間運行的命令，改進應(yīng)用內(nèi)渲染，并擴展Claude對自身能力的理解。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

限量預(yù)覽：https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/overview

And 。。。

我們這三天的時間線，可能是這樣的。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

以及Grok。。。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

關(guān)于Claude3.7 這個命名。。。claude-3-7-sonnet-20250219。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

One More Thing

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

根據(jù)圖表，Claude的發(fā)展路線圖顯示到2024年，它將幫助個人更好地完成當(dāng)前工作，提升每個人的能力。

到2025年，Claude將開始與專家進行深入合作，獨立完成大量工作，擴展個人和團隊的能力。

而到了2027年，Claude將能夠找到突破性解決方案，解決那些需要團隊多年才能完成的復(fù)雜問題。

這意味著我們可能在接下來的幾年里，見證一個“幾乎”快速起飛的階段，朝著超人工智能（ASI）邁進。

這樣的進展確實令人興奮，未來的可能性似乎越來越近了！

大家如此深愛的一個模型，可能叫Claude吧。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區(qū)

參考鏈接：[1] https://x.com/AnthropicAI/status/1894092430560965029

本文轉(zhuǎn)載自??AI進修生??，作者： Aitrainee ????

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

曾爆火的 InstantID又有了新玩法：風(fēng)格化圖像生成，已開源

輕薄滴假象 ? 4337瀏覽 ? 0回復(fù)
又又又又翻車！谷歌新AI功能再遭公眾批評，稱前總統(tǒng)奧巴馬是穆斯林，“承認谷歌違反反壟斷法”

51CTO技術(shù)棧 ? 3504瀏覽 ? 0回復(fù)
技術(shù)最牛逼的阿里，又回來了！

51CTO技術(shù)棧 ? 3635瀏覽 ? 0回復(fù)
OpenAI o1推理模型基礎(chǔ)入門

51CTO內(nèi)容精選 ? 3408瀏覽 ? 0回復(fù)
小模型界o1來了：微軟推出Phi-4，數(shù)學(xué)推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷

51CTO技術(shù)棧 ? 3581瀏覽 ? 0回復(fù)
清華&人大：search-o1 讓推理模型具有主動能力

鴻煊的學(xué)習(xí)筆記 ? 3290瀏覽 ? 0回復(fù)
Anthropic秘密「混合模型」 Claude 4首曝細節(jié)，硬剛GPT-5！深度推理模型來了

duhorse ? 3725瀏覽 ? 0回復(fù)
英偉達蒸發(fā)的6000億又回來了：市場誤判了R1的影響，計算仍然重要！

51CTO技術(shù)棧 ? 2702瀏覽 ? 0回復(fù)
吳泳銘預(yù)告的旗艦推理模型更了！阿里重磅推出QwQ-Max預(yù)覽版，Agent或成正式版王炸！

51CTO技術(shù)棧 ? 3159瀏覽 ? 0回復(fù)
推理模型+Multi-Agent，可能就是Deep Research的全貌！

探索AGI ? 4127瀏覽 ? 0回復(fù)
全球首個混合推理模型Claude 3.7 Sonnet發(fā)布，編碼能力直接起飛！

AI博物院 ? 3876瀏覽 ? 0回復(fù)
Mistral殺回來了！Small 3.1開源發(fā)布，性能完勝Gemma 3，RTX 4090就能跑

老蛀蟲 ? 4351瀏覽 ? 0回復(fù)
理解什么是推理模型，看懂這篇就夠了

AIGC新知 ? 3871瀏覽 ? 0回復(fù)
Google Gemini 2.5 Pro：AI界的“全能王”來了！

Halo咯咯 ? 3328瀏覽 ? 0回復(fù)
大模型推理能力的局限性

JavaEdge1 ? 2682瀏覽 ? 0回復(fù)
OpenAI 深夜王炸！ o3 推理模型徹底顛覆認知，AGI真的來了？

算家計算 ? 2171瀏覽 ? 0回復(fù)
剛剛，Qwen3強勢登頂，成開源新王！國內(nèi)首個混合推理模型，235B擊敗R1、o1!源神火力全開

51CTO技術(shù)棧 ? 3560瀏覽 ? 0回復(fù)
循環(huán)網(wǎng)絡(luò)能否提升推理能力？分層推理模型已經(jīng)問世！

51CTO內(nèi)容精選 ? 1627瀏覽 ? 0回復(fù)
字節(jié)的這個新模型，牛了！

NLP前沿1 ? 3829瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Andrej Karpathy 2小時訪談：我們召喚的是幽靈，不是造動物 | AGI 還有十年路 2025-10-22 07:36:37發(fā)布
Cursor 1.3 ~ 1.6 版本更新全梳理：終端不再掛、Agent 更聰明、上下文更可控 2025-09-24 07:20:23發(fā)布

熱門推薦

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯誤，都錯在你下達指令的第一句話 0回復(fù)

Deepseek發(fā)布最新OCR模型在實測中展現(xiàn)出驚人效率，僅用15秒便將百頁PDF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對比，你的選擇是？ 0回復(fù)

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復(fù)

上一篇： Windsurf Wave3：MCP協(xié)議讓AI直接讀取控制臺錯誤，自動化網(wǎng)頁調(diào)試不用復(fù)制粘貼了！Tab智能跳轉(zhuǎn)、Turbo模式

下一篇：接入 Deepseek 能讓百度文庫煥發(fā)第二春嗎？

社區(qū)精華內(nèi)容

目錄

<pre id="6fuxx"><th id="6fuxx"></th></pre>