AI圈卷瘋了!xAI、Anthropic同日上線API:Grok免費(fèi)公測(cè),Claude 3.5 Haiku價(jià)格暴漲
就在剛剛,Anthropic宣布,Claude 3.5 Haiku已經(jīng)可以通過(guò)API訪問(wèn)。
圖片
與此同時(shí),就在今天,Grok API也官宣正式開啟公測(cè)。
圖片
Claude 3.5 Haiku正式開放API
Claude 3.5 Haiku現(xiàn)已在Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI上提供。
Anthropic的開發(fā)者關(guān)系運(yùn)營(yíng)負(fù)責(zé)人Alex Albert發(fā)帖說(shuō),「該模型還更新了截至2024年7月的知識(shí)——是所有Claude模型中最新的?!?/span>
圖片
性能方面,Claude 3.5 Haiku可謂是表現(xiàn)不俗,已經(jīng)在接近Sonnet的表現(xiàn)了。
圖片
它在編程和代理任務(wù)上的表現(xiàn)也超越了除新款3.5 Sonnet外的所有此前Claude模型。
圖片
SWE-bench Verified測(cè)試衡量了模型解決實(shí)際軟件問(wèn)題的能力
AI公司iGent的CEO評(píng)價(jià)道:「Claude 3.5 Haiku展現(xiàn)了令人印象深刻的推理和代碼生成能力,包括展示強(qiáng)大的多輪代碼優(yōu)化功能,使與代碼相關(guān)的錯(cuò)誤減少了60%。它和其他體積更大的模型處于同一水平。」

憑借這些特性,Claude 3.5 Haiku非常適合面向用戶的產(chǎn)品、專業(yè)化子代理任務(wù),以及從大量數(shù)據(jù)(如購(gòu)買歷史、定價(jià)或庫(kù)存記錄)中生成個(gè)性化體驗(yàn)。
基于此,Anthropic列舉了一些適用于Haiku的使用場(chǎng)景:
1. 代碼補(bǔ)全:Claude 3.5 Haiku提供快速、準(zhǔn)確的代碼建議和補(bǔ)全,能加速開發(fā)工作流。
2. 交互式聊天機(jī)器人:憑借增強(qiáng)的對(duì)話能力和快速響應(yīng),Claude 3.5 Haiku非常適合支持響應(yīng)迅速的聊天機(jī)器人,能夠處理大量用戶互動(dòng)。這對(duì)需要大規(guī)?;?dòng)的客戶服務(wù)、電商和教育平臺(tái)尤為有價(jià)值。
3. 數(shù)據(jù)提取和標(biāo)注:Claude 3.5 Haiku能夠高效處理和分類信息,使其在快速數(shù)據(jù)提取和自動(dòng)化標(biāo)注任務(wù)中表現(xiàn)出色。此功能對(duì)處理大量非結(jié)構(gòu)化數(shù)據(jù)的金融、醫(yī)療和研究機(jī)構(gòu)尤為實(shí)用。
4. 實(shí)時(shí)內(nèi)容審核:Claude 3.5 Haiku通過(guò)其改進(jìn)的推理和內(nèi)容理解能力,提供可靠的即時(shí)內(nèi)容審核。這對(duì)需要大規(guī)模維持安全、適當(dāng)內(nèi)容的社交平臺(tái)、在線社區(qū)和媒體組織而言非常有價(jià)值。
然而,隨著性能提升,Haiku的價(jià)格提升至之前的4倍!它現(xiàn)在的定價(jià)起步為每百萬(wàn)輸入tokens $1,每百萬(wàn)輸出tokens $5。
圖片
圖片
網(wǎng)友:能力不咋行,漲價(jià)第一名
看到這個(gè)價(jià)格,網(wǎng)友們紛紛吐槽「太貴了」!
「Jimmy Apples」感慨道:如今,Anthropic的光芒正在褪去。
比起隔壁的4o-mini,3.5 Haiku在很多基準(zhǔn)測(cè)試上的表現(xiàn)更差,但價(jià)格卻更貴。
圖片
而網(wǎng)友「John」則特地做了一個(gè)Claude 3.5 Haiku和Gemini 1.5 Flash的性能/價(jià)格對(duì)比。
從表格中不難看出,3.5 Haiku要花多幾十倍的錢,但換來(lái)的卻只有一點(diǎn)點(diǎn)性能提升。
圖片
圖片
網(wǎng)友「elvis」甚至還畫了更直觀的柱狀圖來(lái)體現(xiàn)Haiku夸張的漲價(jià)幅度——
圖片
并對(duì)比了Claude 3.5 Haiku和GPT-4o Mini、Gemini 1.5 Flash在MATH Benchmark和GPQA Diamond Benchmark兩個(gè)基準(zhǔn)測(cè)試上的表現(xiàn)——
圖片
可以看到,比起上一代模型,新版的3.5 Haiku在價(jià)格上提升了4倍之多。
而那些表現(xiàn)基本差不多(甚至更好)的同類模型,價(jià)格更是「斷崖式」地便宜。
圖片
當(dāng)然,網(wǎng)上也不乏有驚喜的歡呼聲。
圖片
Grok API開啟公測(cè)
如前所述,由馬斯克xAI推出的大模型Grok,也正式開啟API的公測(cè)了。
到2024年底,每月有25美金免費(fèi)額度,人人均可參與。
如果你之前已經(jīng)購(gòu)買了預(yù)付費(fèi)額度,比如50美元,那么在11月和12月,你每月都能獲得75美元(25+50)的免費(fèi)額度
圖片
模型性能
根據(jù)其官方博客介紹:此次,xAI公開了一個(gè)全新的Grok模型,代號(hào)「grok-beta」,該模型目前正處于開發(fā)的最后階段。
圖片
該模型上下文長(zhǎng)度為128000 token,這意味著Grok可以處理更長(zhǎng)的文本輸入,理解更復(fù)雜的上下文關(guān)系。
圖片
此外,該模型不僅支持函數(shù)調(diào)用,也能支持系統(tǒng)提示詞。從而讓開發(fā)者能夠更靈活地控制模型的行為。
這意味著它可以與外部工具進(jìn)行高效的連接和交互,為各種復(fù)雜應(yīng)用場(chǎng)景的實(shí)現(xiàn)提供了可能。
借此機(jī)會(huì),xAI還透露,除了純文本版本外。下周還將發(fā)布一個(gè)支持圖像輸入的多模態(tài)版本。
也就是說(shuō),以后Grok不僅能夠讀懂文字,也能看懂圖片了。
兼容OpenAI和Anthropic API
值得一提的是,考慮到開發(fā)者的使用體驗(yàn),xAI的REST API完全兼容Open AI和Anthropic的API,遷移起來(lái)也非常簡(jiǎn)單。
如果你正在使用OpenAI的Python SDK,只需要做兩個(gè)簡(jiǎn)單的改動(dòng):
- 將base_url改為https://api.x.ai/v1
- 使用在console.x.ai創(chuàng)建的xAI API密鑰
就這么簡(jiǎn)單,你的應(yīng)用就能無(wú)縫切換到Grok了!
參考資料:




































