偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

馬斯克推出Grok-1.5，接近GPT-4級別的性能

作者：Shubham Sharma 2024-04-01 13:06:52

定于下周發(fā)布的Grok-1.5帶來了增強的推理和解決問題的能力，并接近于已知的開源和閉源的LLM的性能，包括OpenAI的GPT-4和Anthropic的Claude 3。

馬斯克指出，Grok-1.5將為xAI在X平臺上的ChatGPT挑戰(zhàn)者聊天機器人提供支持，而Grok-2(新模型的繼任者)仍在訓練階段。他表示，下一個版本應該能夠“在所有指標上超越當前的AI”，但沒有分享它可能何時變得可用的具體細節(jié)。

Grok-1.5帶來了什么?

xAI去年11月宣布了Grok-1，稱這個AI是以《銀河系漫游指南》為模型，幾乎可以回答任何問題，以幫助人類在尋求理解和知識的征途中——無論背景或政治觀點如何。在GSM8K、HumanEval和MMLU等基準測試中，由xAI分享的數據顯示，Grok-1的表現超過了Llama-2-70B和GPT-3.5。

現在，隨著Grok-1.5的發(fā)布，該公司在先前模型的基礎上取得了顯著改進，在所有主要基準測試中，包括與編碼和數學相關的任務，都實現了顯著提升。

xAI在博客文章中指出：“在我們的測試中，Grok-1.5在MATH基準測試中達到了50.6%的分數，在GSM8K基準測試中達到了90%的分數，這兩個數學基準測試涵蓋了從小學到高中競賽問題的廣泛范圍。此外，它在評估代碼生成和問題解決能力的HumanEval基準測試中得分為74.1%?！?nbsp;

在MMLU基準測試上，評估AI模型在不同任務上的語言理解能力，新模型得分為81.3%，比Grok-1的73%高出顯著幅度。

此外，xAI還確認，Grok-1.5的上下文窗口可達128,000個標記(標記是單詞、圖像、視頻、音頻或代碼的整個部分或子部分)。這使得模型能夠一次性處理和處理大量信息，比Grok-1多16倍，使其更適合分析、總結和提取長文檔中的信息。它甚至可以處理更長、更復雜的提示，同時仍然保持遵循指令的能力。

接近OpenAI和Anthropic

憑借增強的推理和解決問題的能力，Grok-1.5不僅在基準測試中勝過其前身，而且還接近流行的開放和封閉源模型，包括Gemini 1.5 Pro、GPT-4和Claude 3。

例如，在MMLU上，Grok-1.5的81.3%得分超過了最近推出的Mistral Large，但落后于Gemini 1.5 Pro(83.7%)、GPT-4(86.4%，

截至2023年3月)和Claude 3 Opus(86.8%)。在GSM8K基準測試上也注意到了類似的差距，xAI模型僅落后于Google、OpenAI和Anthropic的產品。

值得注意的是，Grok-1.5唯一看起來有優(yōu)勢的基準是HumanEval，在那里它的表現超過了所有模型，除了Claude 3 Opus。xAI希望繼續(xù)這些改進，并通過Grok-2提供進一步的性能提升，據馬斯克稱，應該在所有指標上超越當前的AI。該模型目前正在訓練中。

技術顧問Brian Roemmele表示，根據他與Grok-1的工作，Grok-2“在發(fā)布時將成為最強大的LLM AI平臺之一。它將在幾乎所有指標上超越OpenAI。”

Grok-1.5的可用性

至于Grok-1.5，xAI計劃下周開始部署。公司表示，該模型最初將提供給早期測試者和那些已經在X平臺(Twitter)上使用Grok聊天機器人的用戶——實時訪問平臺上的所有帖子。推出將分階段進行，公司將改進模型并引入幾個新功能——可能包括一種新的不受限制的有趣模式——同時逐步使其對更廣泛的用戶群體可用。

當馬斯克在X上推出Grok時，被視為推動Grok和X的采用。他首先將AI作為平臺的“高級+”訂閱的一部分，價格為每月16美元。然而，就在幾天前，這位億萬富翁分享說，聊天機器人也將為支付8美元每月的高級訂閱者啟用。在另一個更新中，他還確認，擁有一定級別的驗證訂閱者的關注者將免費獲得高級和高級+訂閱的好處，包括Grok。

責任編輯：龐桂玉來源：企業(yè)網D1Net

Grok-1.5 GPT-4 人工智能

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<wbr id="hgfxp"></wbr>

<pre id="hgfxp"></pre>

<sub id="hgfxp"><p id="hgfxp"></p></sub>

<tfoot id="hgfxp"><option id="hgfxp"><del id="hgfxp"></del></option></tfoot>