OpenAI公開了大模型o3-mini的推理思維鏈

2月8日消息,據(jù)外媒報(bào)道,OpenAI更新了o3-mini?AI模型的“思維鏈”功能,讓用戶可以看到模型的思考過程。這是在DeepSeek-R1發(fā)布之后發(fā)生的,DeepSeek-R1是一個(gè)競爭對手的推理模型,也顯示了其反應(yīng)背后的思維過程。
推理模型旨在逐步分解其決策過程,因此需要更長的時(shí)間來生成響應(yīng)。這樣的解釋可以更容易地理解為什么給出了特定的響應(yīng),允許用戶看到為什么他們的提示可能會或可能不會產(chǎn)生期望的答案。它們還允許人工智能研究人員識別潛在的偏見或錯(cuò)誤,并提高其推理能力。
OpenAI在一篇文章中表示,該公司已經(jīng)為免費(fèi)和付費(fèi)用戶發(fā)布了“更新的OpenAI?o3-mini思維鏈”,并為付費(fèi)用戶發(fā)布了o3-mini-high思維鏈?!皁3-mini-high是o3-mini的付費(fèi)版本,具有更深入的推理能力和更詳細(xì)的思維過程,但代價(jià)是反應(yīng)時(shí)間較慢。
在此更新之前,OpenAI模型o3-mini、o1和o1-mini只能讓用戶訪問思想鏈摘要,而不是完整的推理;該公司表示,這是為了“在速度和準(zhǔn)確性之間提供一個(gè)平衡的權(quán)衡”,盡管它過去也提到“競爭優(yōu)勢”是決定的一個(gè)因素。
然而,由于DeepSeek的開源R1展示了其反應(yīng)背后的整個(gè)過程,OpenAI決定將該過程公布。在更新中,“模型的原始(思維鏈)仍然隱藏,因?yàn)樗茈y理解”,但以一種“易于閱讀”的方式呈現(xiàn)。
新的、更深入的推理總結(jié)將經(jīng)過后處理步驟,簡化任何過于復(fù)雜的解釋,刪除任何“不安全”的推理解釋,并將其翻譯成用戶的母語。
OpenAI的首席產(chǎn)品官Kevin?Weil表示:“展示所有的思維鏈會帶來競爭的升華,但我們也知道人們需要它,所以我們會找到平衡它的正確方法?!边@就是這種平衡的結(jié)果。





































