偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

OpenAI o1很強(qiáng)，也能被玩壞！

發(fā)布于 2024-9-14 12:03

瀏覽

0收藏

OpenAI草莓Q*項(xiàng)目終于發(fā)布了，OpenAI o1在具有挑戰(zhàn)性的推理基準(zhǔn)上遙遙領(lǐng)先于GPT-4o，即使在一些基準(zhǔn)上超過了人類PhD水平，也能被玩壞

實(shí)線表示pass@1準(zhǔn)確率，陰影區(qū)域表示 64 個(gè)樣本的多數(shù)投票（共識(shí)）表現(xiàn)

OpenAI o1思考一個(gè)“句子編寫”問題，足足花費(fèi)92s，經(jīng)歷了漫長的thinking過程：

識(shí)別單詞模式
映射單詞關(guān)系
識(shí)別押韻模式
...
權(quán)衡各種模式

編寫一個(gè)句子，遵循與句子 "isold bowls to bold souls" 相同的規(guī)則，其中包含四個(gè)關(guān)鍵詞，sold、bowls、bold 和 souls，并且第1個(gè)和第3個(gè)單詞的結(jié)尾相同，第2個(gè)和第4個(gè)單詞的結(jié)尾相同，第1個(gè)和第4個(gè)單詞的開頭相同，第2個(gè)和第3個(gè)單詞的開頭相同。

OpenAI o1很強(qiáng)，也能被玩壞！-AI.x社區(qū)

經(jīng)典問題，OpenAI o1思考了5s，9.11比9.8大，更換了提問方式后，思考了18s，9.8比9.11大，要多思考ing。

OpenAI o1很強(qiáng)，也能被玩壞！-AI.x社區(qū)

最后來一個(gè)有挑戰(zhàn)的問題，“統(tǒng)計(jì)response的字?jǐn)?shù)”，OpenAI o1雖然意識(shí)到這是一個(gè)悖論query，經(jīng)過5個(gè)推理過程，最終回答是7個(gè)words。

query：How many words are in your response to this prompt?
解決自相矛盾的問題
計(jì)算字?jǐn)?shù)
識(shí)別單詞模式
計(jì)算字?jǐn)?shù)
澄清回應(yīng)的準(zhǔn)確性

OpenAI o1很強(qiáng)，也能被玩壞！-AI.x社區(qū)

最后一個(gè)經(jīng)典問題是讓OpenAI草莓項(xiàng)目數(shù)草莓R個(gè)數(shù)，這次終于是數(shù)對(duì)了，3個(gè)R

OpenAI o1很強(qiáng)，也能被玩壞！-AI.x社區(qū)

另外OpenAI o1給出了思考的過程，也會(huì)給出一些推理步驟，這個(gè)過程似曾相識(shí)：Reflection Llama-3.1 70B的思考過程

???Reflection Llama-3.1 70B真的翻車了嗎？???

https://openai.com/index/learning-to-reason-with-llms/

本文轉(zhuǎn)載自 ??PaperAgent??，作者： PaperAgent

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

剛剛，OpenAI發(fā)布史上最強(qiáng)模型-o1，推理能力超人類博士！

Aceryt ? 3893瀏覽 ? 0回復(fù)
OpenAI發(fā)布突破性AI模型o1系列，推理能力大幅躍升重塑行業(yè)格局

芝士AI吃魚 ? 3767瀏覽 ? 0回復(fù)
六個(gè)問題帶你看懂什么是理工科學(xué)霸-OpenAI o1！

NLP工作站 ? 3942瀏覽 ? 0回復(fù)
OpenAI發(fā)布新模型：o1系列模型，更像理科生的模型

大語言模型論文跟蹤 ? 5586瀏覽 ? 0回復(fù)
使用 OpenAI o1 的五種方法「詳細(xì)指南」

51CTO技術(shù)棧 ? 7380瀏覽 ? 0回復(fù)
國內(nèi)大模型廠商是如何看待突然的OpenAI o1？跟不跟是個(gè)問題！

Syrupup ? 3339瀏覽 ? 0回復(fù)
OpenAI o1推理模型基礎(chǔ)入門

51CTO內(nèi)容精選 ? 3411瀏覽 ? 0回復(fù)
被神化的o1模型，規(guī)劃能力到底如何？

大語言模型論文跟蹤 ? 4023瀏覽 ? 0回復(fù)
草莓OpenAI o1的規(guī)劃能力怎么樣？泰斗Subbarao Kambhampati給你答案！

AIGC最前線 ? 3962瀏覽 ? 0回復(fù)
開源社區(qū)離Openai o1越來越近~

NLP前沿1 ? 3475瀏覽 ? 0回復(fù)
OpenAI o1：用內(nèi)部思維鏈進(jìn)行復(fù)雜推理

shizhi02 ? 3879瀏覽 ? 0回復(fù)
阿里發(fā)布類o1模型QWQ，可自我反思糾錯(cuò)，實(shí)測(cè)數(shù)學(xué)推理遠(yuǎn)超o1、DS-R1，人人免費(fèi)

51CTO技術(shù)棧 ? 4272瀏覽 ? 0回復(fù)
OpenAI o1 模型到來后，談?wù)勌崾驹~工程的未來

Baihai_IDP ? 3358瀏覽 ? 0回復(fù)
Kimi深夜炸場(chǎng)：滿血版多模態(tài)o1級(jí)推理模型！OpenAI外全球首次！Jim Fan：同天兩款國產(chǎn)o1絕對(duì)不是巧合！

51CTO技術(shù)棧 ? 3711瀏覽 ? 0回復(fù)
DeepSeek R1橫空出世，超越OpenAI o1，教你用Ollama跑起來

小虎哦哦 ? 1.7w瀏覽 ? 0回復(fù)
Kimik1.5、DeepSeek-V3 大戰(zhàn) OpenAI o1，誰能笑到最后？

智駐未來 ? 7856瀏覽 ? 0回復(fù)
DeepSeek R1 Vs OpenAI o1！全球頂級(jí)推理模型訓(xùn)練技術(shù)對(duì)比大解密！

51CTO技術(shù)棧 ? 8050瀏覽 ? 0回復(fù)
馬斯克發(fā)布Grok 3，趕超OpenAI o1和Deepseek R1！

AI博物院 ? 3137瀏覽 ? 0回復(fù)
Vision-R1：多模態(tài)領(lǐng)域的DeepSeek R1-Zero，7B參數(shù)比肩OpenAI O1

Syrupup ? 3933瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

DeepAgent：能夠自主找工具的深度思考智能體，工具&任務(wù)隨心配 2天前發(fā)布
國產(chǎn)開源LLM大爆發(fā)，Qwen、Minimax、美團(tuán)、騰訊~ 2天前發(fā)布

熱門推薦

一篇大模型Agentic框架到應(yīng)用最新綜述 0回復(fù)

阿里新一代企業(yè)級(jí)多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

上一篇： RAG+RAU：對(duì)檢索增強(qiáng)型語言模型（RALM）進(jìn)行全面、深入綜述

下一篇：一個(gè)增量式構(gòu)建知識(shí)圖譜的項(xiàng)目：iText2KG

社區(qū)精華內(nèi)容

目錄

<sub id="bmeyr"></sub>

<tt id="bmeyr"></tt>

<abbr id="bmeyr"></abbr>

<li id="bmeyr"><button id="bmeyr"></button></li>