偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

OpenAI詐騙?GPT-4.1正式上線ChatGPT,網(wǎng)友實測卻大呼失望

人工智能
GPT-4.1,在ChatGPT中可用了!現(xiàn)在,它不僅在API中開放,Plus、Pro和Team用戶都可以使用。網(wǎng)友們興奮地展開實測后,紛紛吐槽:OpenAI這是詐騙吧,說好的一百萬超長上下文呢?

就在剛剛,OpenAI官宣:GPT-4.1,今天起直接在ChatGPT中可用。

這個模型擅長編碼任務和遵循指令,是o3和o4-mini的絕佳替代品。

圖片圖片

一個月前,GPT-4.1剛推出的時候,僅通過API向開發(fā)者開放。而現(xiàn)在,它在ChatGPT中就直接可用了。

其中,Plus、Pro和Team用戶可以通過模型選擇器中的「更多模型」下拉菜單訪問GPT-4.1。企業(yè)版和教育版用戶將在未來幾周內(nèi)獲得訪問權限。

OpenAI表示,他們還將在ChatGPT中為所有用戶引入GPT-4.1 mini來取代GPT-4o mini。

圖片圖片

由于超長的上下文能力,現(xiàn)在你可以將整段代碼放到GPT-4.1中進行分析。

圖片圖片

GPT-4.1和GPT-4.1 mini都已經(jīng)通過了OpenAI的最新標準安全評估。

在以下兩項評估中,GPT-4.1均排名前列。

  • not_unsafe:根據(jù)OpenAI政策和模型規(guī)范,檢查模型是否未產(chǎn)生不安全的輸出。
  • not_overrefuse:檢查模型是否遵循良性請求。

幻覺評估以及指令遵循方面,GPT-4.1也均表現(xiàn)優(yōu)秀;但在越獄評估方面表現(xiàn)不佳。

圖片圖片

圖片圖片

GPT-4.1,比GPT-4.5還好?

這次放出GPT-4.1,也算響應群眾的呼聲。

早在4月底,就有用戶抱怨說:GPT-4.1簡直是自己最喜歡的OpenAI模型,可惜在ChatGPT中并不能使用。

圖片圖片

他確定地說:使用體驗比GPT-4.5還要好!

圖片圖片

不斷有開發(fā)者現(xiàn)身說法,表示:除了GPT-4.1的早期版本Quasar Alpha之外,它也是自己測試過的最好的編碼模型!

不斷有人表示,GPT-4.1,絕對是一個被低估的模型。

圖片圖片

就在上個月,OpenAI專為開發(fā)者推出了GPT-4.1系列新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。

它們均擁有最高100萬Token的超大上下文窗口,在代碼、指令跟隨等核心能力上全面超越GPT-4o及GPT-4o mini,并且知識截止日期也已更新至2024年6月。

圖片圖片

實測:龐大代碼任務順利完成

既然很多ChatGPT用戶都能用上GPT-4.1了,現(xiàn)在全網(wǎng)已經(jīng)涌出了不少實測。

比如沃頓商學院教授Ethan Mollick,就用一道考遍了各大模型的景點難題來考驗GPT-4.1。

「請創(chuàng)建一段我可以直接粘貼到p5.js中的代碼,它要以驚人的巧思震撼我,仿佛是未來某艘星艦控制面板的呈現(xiàn)。」

GPT-4.1的表現(xiàn),可是相當優(yōu)秀。

圖片圖片

另一位開發(fā)者實測后發(fā)現(xiàn),GPT-4.1實在令人驚喜!

當時,他正在處理一個代碼量非常龐大的任務,系統(tǒng)自動選擇的模型根本無法處理,完全沒有生成任何內(nèi)容。

結果讓GPT-4.1上場后,它不僅比默認模型更快,還準確地完成了任務。

甚至,它還給了一個額外的驚喜:竟然還把整個文件中沒用到的代碼都清理掉了。

圖片圖片

通過實測發(fā)現(xiàn),GPT-4.1在代碼生成速度方面達到了新的高度。

比如讓GPT-4.1生成一個博客首頁,在幾秒鐘之內(nèi)就完成了輸出。

圖片圖片

再比如,讓他用python寫一個地球飛往火星的動畫,幾乎就是在一瞬間,GPT-4.1就完成了任務的輸出。

圖片圖片

結果看起來還行,這只是第一輪交互的結果,能夠感受到GPT-4.1的速度是得到根本性的提升。

圖片圖片

再挑戰(zhàn)一下,讓給GPT-4.1用動畫來解釋一下量子糾纏。

圖片圖片

初步來看,GPT-4.1還是「領會」到了什么是量子糾纏

對于推理問題,GPT-4.1表現(xiàn)的也非常優(yōu)秀。比如多步驟的年齡計算問題,GPT-4.1的求解邏輯非常嚴謹。

圖片圖片

面對一些逆向思考、腦筋急轉彎之類的問題,GPT-4.1也能快速完成推理,當然面對這個問題得出的答案倒是非常有趣。

圖片圖片

網(wǎng)友吐槽:沒有1M上下文版本,令人失望!

但試用GPT-4.1后,許多網(wǎng)友表示:太失望了!

雖然OpenAI發(fā)布了GPT-4.1,卻沒有包含100萬上下文窗口的API版本。

圖片圖片

圖片圖片

本來大家最希望在ChatGPT中使用GPT-4.1,就是因為想要超長的上下文窗口。

現(xiàn)在,只能期望GPT-5能提供一個超長的上下文窗口了。

圖片圖片

圖片圖片

的確,不斷有人發(fā)現(xiàn),ChatGPT(Pro)中的GPT-4.1,最大上下文長度似乎僅為128k token,跟API中的100萬token相差甚遠。

也就是說,OpenAI并沒有在GPT-4.1中提高限制。

圖片圖片

總之,真的讓人很失望??磥磉€是得用Gemini。

也有網(wǎng)友發(fā)現(xiàn)了「華點」:自己嘗試運行他們在直播演示中用來展示 ChatGPT 4.1的提示詞,但網(wǎng)頁版無法運行成功,不過在API Playground中嘗試后卻運行成功了。

圖片圖片

也有人說,自己剛剛氛圍編程了一個使用GPT-4.1的AI助手,因為這個模型僅通過API提供,今天,ChatGPT中就能用了。

圖片圖片

不過,他還是會用自己的助手,因為用戶界面比ChatGPT更好。

圖片圖片

圖片圖片

其實,OpenAI此前已經(jīng)放出GPT-4.1的prompt指南,總結了一系列內(nèi)部測試中得出的重要prompt技巧。

想實測的小伙伴,可以參考這篇用起來了。

圖片

參考資料:

  https://x.com/gdb/status/1922727473164227001

  https://x.com/OpenAIDevs/status/1922709921772036164

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-05-15 09:34:39

2025-04-14 09:00:00

模型AI數(shù)據(jù)

2023-04-28 09:07:28

2025-04-16 09:30:16

2025-08-06 14:08:15

AI驅動人工智能工具

2024-01-11 07:28:42

2023-03-02 12:32:36

2025-04-24 08:29:59

OpenAIGPT-4.1人工智能

2025-05-06 00:22:00

2025-04-15 07:41:18

2025-05-15 10:50:46

2025-04-15 08:51:05

2023-11-07 09:34:36

自定義GPTOpenAI

2023-11-01 13:37:26

2025-05-15 09:16:00

2024-04-23 13:10:41

數(shù)據(jù)訓練

2023-03-03 07:34:05

2025-08-20 09:14:56

GPT模型AI

2023-10-19 11:29:30

OpenAI

2024-01-11 13:00:08

OpenAIGPT功能
點贊
收藏

51CTO技術棧公眾號