偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

「性價比王者」Claude Haiku 4.5來了,速度更快,成本僅為Sonnet 4的1/3

人工智能 新聞
據(jù) Anthropic 介紹,Claude Haiku 4.5 的編碼性能可與中高端模型 Claude Sonnet 4(這是 Anthropic 于 5 個月前發(fā)布的模型)相媲美。

距離上次新品發(fā)布僅僅兩周后,Anthropic 又出手了。

最新消息,Anthropic 發(fā)布輕量級模型 Claude Haiku 4.5,主打「更便宜、更快速」。

據(jù) Anthropic 介紹,Claude Haiku 4.5 的編碼性能可與中高端模型 Claude Sonnet 4(這是 Anthropic 于 5 個月前發(fā)布的模型)相媲美,但成本更低,每百萬輸入 token 的成本為 1 美元,每百萬輸出 token 的成本為 5 美元,僅為 Claude Sonnet 4 的三分之一。而推理速度卻提升一倍多。

用 Anthropic 發(fā)言人的話來說就是,「Haiku 4.5 在性能上有了明顯的飛躍,現(xiàn)在基本上和 Sonnet 4 一樣智能,但速度卻快得多,成本卻只有 Sonnet 4 的三分之一?!?/span>

不僅如此,從測試數(shù)據(jù)來看,Claude Haiku 4.5 在某些任務,甚至超越了 Claude Sonnet 4。比如 computer use 「OSWorld」(一個在現(xiàn)實世界計算機任務中測試人工智能模型的基準測試平臺)上,前者得分 50.7%,后者得分 42.2%;數(shù)學推理(AIME 2025)測試中,前者借助 Python 工具,成績高達 96.3%,后者為 70.5%。

整體來看,Claude Haiku 4.5 核心面向?qū)崟r、低延遲的任務場景,比如聊天助手、客服人員、協(xié)同編程等。這些場景用戶將會體驗到 Claude Haiku 4.5 的高智能、極快速度。而 Claude Code 用戶則會發(fā)現(xiàn) Claude Haiku 4.5 顯著提升了編碼體驗的響應速度,包括多智能體項目到快速原型開發(fā)設計等。

早期客戶的一些體驗評價也體現(xiàn)了 Claude Haiku 4.5 的能力水平:

比如,Augment Code 的聯(lián)合創(chuàng)始人 Guy Gur-Ari 表示,「Claude Haiku 4.5 達到了我們意想不到的最佳狀態(tài):接近前沿的編碼質(zhì)量、驚人的速度和成本效益。在 Augment 的內(nèi)部編碼評估測試中,Haiku 4.5 的性能達到了 Sonnet 4.5 的 90%,甚至可以與規(guī)模更大的模型相媲美。」

Windsurf 的首席執(zhí)行官 Jeff Wang 也表示,「歷史上,模型總是為了質(zhì)量而犧牲速度和成本,而 Haiku 4.5 正在「模糊」這種傳統(tǒng)權(quán)衡的界限:它是一種快速的前沿模型,既保持了成本高效,又預示了這類模型的發(fā)展方向?!?/span>

其實,從測試數(shù)據(jù)上也不難看出,目前,Claude Sonnet 4.5 仍然是 Anthropic 最好的模型,在各項性能表現(xiàn)上都超過 Claude Haiku 4.5,而 Claude Haiku 4.5 的長處在于能以更高的成本效益為用戶提供「近乎前沿的性能」。

另外,Anthropic 表示,兩者的配合使用還將為企業(yè)客戶帶來極大優(yōu)勢:前者可以構(gòu)建前沿多步驟計劃,而后者則并行完成子任務,「從而支持多智能體系統(tǒng)快速高質(zhì)量地處理復雜的重構(gòu)、遷移和大型功能構(gòu)建。」

比如,在金融服務領域,Claude Sonnet 4.5 和 Haiku 4.5 的結(jié)合所帶來的多智能體架構(gòu),將徹底改變企業(yè)監(jiān)控市場和管理風險的方式。在 Anthropic 的設想中,Haiku 4.5 將同時監(jiān)控數(shù)千個數(shù)據(jù)流 —— 追蹤監(jiān)管變化、市場信號和投資組合風險,而 Sonnet 4.5 則負責處理復雜的預測模型和戰(zhàn)略分析。

而對于研究機構(gòu)來說,分工可以大幅壓縮時間。比如,Claude Sonnet 4.5 可以協(xié)調(diào)全面的分析,而多個 Haiku 4.5 Agent 則可以并行處理數(shù)十個來源的文獻綜述、數(shù)據(jù)收集和文檔合成,根據(jù) Anthropic 的描述,這可能「將數(shù)周的研究壓縮到數(shù)小時」。

還有一點非常重要的是,Claude Haiku 4.5 不僅速度快、價格低,而且安全。

Anthropic 表示,他們對 Claude Haiku 4.5 進行了一系列詳細的安全性和一致性評估,結(jié)果顯示,該模型表現(xiàn)出較低的令人擔憂的行為發(fā)生率,并且比其前身 Claude Haiku 3.5 的一致性顯著提高。而在自動一致性評估中,Claude Haiku 4.5 的總體偏差行為發(fā)生率也顯著低于 Claude Sonnet 4.5 和 Claude Opus 4.1。

因此,根據(jù)這一指標,Claude Haiku 4.5 可以堪稱是他們「迄今為止最安全的模型。」

所以綜合來看,Claude Haiku 4.5 是目前 Anthropic「更快、性價比更高、更安全」的模型版本。

目前,Claude Haiku 4.5 已在全球上線,作為 Claude Haiku 3.5 與 Sonnet 4 的「直接替代品」,用戶可通過 Claude 官方平臺、API 接口,以及亞馬遜 Bedrock、Google Cloud Vertex AI 等云服務渠道訪問使用。

業(yè)界的朋友應該感受到了,最近 Anthropic 真是動作頻頻,兩個月內(nèi)接連發(fā)布三大 AI 模型,「太卷了」。

今年 8 月上旬,Anthropic 發(fā)布新模型 Opus 4.1,在編程評估基準 SWE-Bench Verified 上得分達到 74.5%,較 Opus 4 的 72.5% 提升兩個百分點。

緊接著,9 月 30 日,重磅發(fā)布了自詡為「世界上最好的編碼模型」的 Claude Sonnet 4.5。之后就是兩周后的今天,再次帶來新模型,自己卷自己。

而有意思的是,最近有報道傳出,Anthropic 到今年年底有望實現(xiàn) 90 億美元的年化營收目標,此外,更是明年設定了更激進的「小目標」:基準情況下年化營收超過 200 億美元,最佳情況下可達 260 億美元,相當于今年營收的近兩倍。而據(jù) Anthropic 的發(fā)言人在接受媒體采訪時透露,Anthropic 本月的年化營收正接近 70 億美元……

似乎「自卷」的理由找到了……

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-05-08 09:07:13

2025-09-30 09:05:00

2025-10-10 02:10:00

2024-03-05 10:55:22

OpenAISOTAClaude 3

2025-10-31 10:24:42

2025-10-02 08:25:13

2025-10-03 00:00:00

Sonnet 4.5LLM軟件開發(fā)

2024-04-17 16:51:17

2024-10-23 08:54:07

2025-10-30 16:23:47

Cursor 2.0人工智能智能體

2024-03-27 15:37:24

2025-09-30 07:29:02

2023-03-16 19:17:57

2024-06-21 09:57:00

2024-06-21 09:58:38

2022-03-29 15:05:17

iOS蘋果自定義功能

2025-05-09 09:02:00

2024-10-17 13:30:00

2025-08-14 14:45:15

2025-02-25 09:13:16

點贊
收藏

51CTO技術(shù)棧公眾號