偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Devin退位!這家公司宣布打造了世界上最強編程 Agents:Genie!能模擬人類工程師思考和行動

原創(chuàng) 精選
人工智能
Genie能夠使用多種語言編寫軟件 —— 在其技術(shù)報告中列出了15種源數(shù)據(jù)語言,包括JavaScript、Python、TypeScript、TSX、Java、C#、C++、C、Rust、Scala、Kotlin、Swift、Golang、PHP、Ruby等。

不久之前,初創(chuàng)公司Cognition憑借其產(chǎn)品Devin震撼了人們。

這是第一個AI軟件工程師,由OpenAI的GPT-4大語言模型驅(qū)動。Devin能夠在自然語言文本指令下自主編寫和編輯代碼。

不過,Devin是在2024年3月推出的 —— 五個月前 —— 這在快速發(fā)展的生成式AI領(lǐng)域可以說是一個漫長的季節(jié)。

現(xiàn)在,另一家以“C”命名的初創(chuàng)公司Cosine,通過著名的Y Combinator初創(chuàng)加速器在舊金山成立,宣布推出了他們自己的全新自主AI工程師Genie。據(jù)稱,Genie在第三方基準測試SWE-Bench上表現(xiàn)優(yōu)異,得分30%,遠超過Devin的13.8%,甚至超過亞馬遜的Q和Factory的Code Droid的19%。

圖片圖片

上圖:Cosine 網(wǎng)站的截圖展示了 Genie 在 SWE-Bench 上與其他 AI 編碼工程師模型相比的表現(xiàn)。

“這個模型遠不止一個基準測試分數(shù)(所能概括的):它從一開始就被訓練得像一名人類軟件工程師(SWE)一樣思考和行為,”Cosine的聯(lián)合創(chuàng)始人兼CEO阿利斯泰爾·普倫在社交網(wǎng)絡(luò)X上發(fā)布的一篇帖子中寫道。

圖片圖片

1.Genie 是什么?它能做什么?

Genie是一種先進的AI軟件工程模型,旨在自主處理各種編碼任務(wù),從修復錯誤到構(gòu)建功能,進行代碼重構(gòu)和通過全面測試驗證,如同被人工程師或管理者指示的那樣。

它可以完全自主運行,也可以與用戶協(xié)作,旨在提供與熟練同事共事的體驗。

Genie能夠使用多種語言編寫軟件 —— 在其技術(shù)報告中列出了15種源數(shù)據(jù)語言,包括JavaScript、Python、TypeScript、TSX、Java、C#、C++、C、Rust、Scala、Kotlin、Swift、Golang、PHP、Ruby等。

Cosine聲稱Genie能夠模擬人類工程師的認知過程。

“我的論點很簡單:讓它觀察人類工程師如何完成他們的工作,并模仿這個過程”,Pullen在博客文章中解釋道。

Genie生成的代碼存儲在用戶的GitHub存儲庫中,意味著Cosine不保留副本,也不涉及任何相關(guān)的安全風險。

此外,Cosine的軟件平臺已經(jīng)與Slack和系統(tǒng)通知集成,可以使用這些工具來提醒用戶其狀態(tài)、提問或標記問題,就像一個好的人類同事一樣。

“Genie還可以向用戶詢問澄清問題,并回應其生成的PR(拉取請求)上的審查/評論”,Pullen在接受媒體VentureBeat采訪時寫道。“我們試圖讓Genie像一個同事一樣行事,因此讓模型使用同事通常會使用的通道是最合理的?!?/p>

2.長上下文能力成為 Genie 研發(fā)突破口

與許多依賴于基礎(chǔ)模型和少量工具的AI模型不同,Genie是通過OpenAI的長token輸出AI模型進行了專有過程開發(fā)的。

“就我們使用的模型而言,這是OpenAI允許我們在實驗性訪問計劃的一部分進行訓練的GPT-4o變種”,Pullen通過電子郵件告訴VentureBeat?!澳P捅憩F(xiàn)出色,我們已經(jīng)與OpenAI的微調(diào)團隊和工程領(lǐng)導層分享了我們的經(jīng)驗和技術(shù)領(lǐng)導地位。這對我們來說是一個真正的轉(zhuǎn)折點,因為它說服他們投入資源和注意力來支持我們的新技術(shù)。”

Cosine 的技術(shù)報告中寫到了模型的長上下文能力對產(chǎn)品的支持:“我們剛開始開發(fā) Genie 時,只能對 16-32k 范圍內(nèi)相對較短的上下文窗口模型進行微調(diào)。我們對這些模型進行了大量的早期探索,在超過 1 億個標記的大型數(shù)據(jù)集上對其進行了訓練,并很快意識到我們提出的架構(gòu)有其優(yōu)點,但在根本上受到了模型在任何給定時刻可表示的信息量的限制。在嘗試了各種壓縮/分塊方法后,我們得出結(jié)論:唯一的辦法就是使用更大的上下文模型,盡管當時還沒有可用的模型可供訓練。幸運的是,不久之后,我們獲得了訓練長語境 OpenAI 模型的能力,這正是我們真正了解 Genie 能力所需的突破口。”

雖然 Cosine 沒有明確具體使用的模型,但OpenAI 最近宣布了新的 GPT-4o 長輸出上下文模型的有限可用版,該模型可以輸出多達 64,000 個 token,而不是 GPT-4o 最初的 4,000 個,增加了 16 倍。

圖片圖片

3.數(shù)十億訓練數(shù)據(jù)的千錘百煉

Pullen 在 Cosine 的代理技術(shù)報告中寫道:“在最近的訓練中,Genie 接受了數(shù)十億個數(shù)據(jù)標記的訓練,這些數(shù)據(jù)的組合選擇是為了讓模型盡可能地勝任我們用戶當前最關(guān)心的語言?!?/p>

Genie 憑借其廣泛的上下文窗口和持續(xù)的改進循環(huán),不斷迭代和改進其解決方案,直到達到預期的結(jié)果。

Genie的訓練數(shù)據(jù)至關(guān)重要,Cosine表示他們花費了近一年時間篩選數(shù)據(jù)集,包括從真實工程師那里收集的各種軟件開發(fā)活動。

“在實踐中,獲取這樣的數(shù)據(jù)并有效利用它是非常困難的,因為本質(zhì)上它并不存在”,Pullen在博客文章中詳細解釋道?!拔覀兊臄?shù)據(jù)管道使用了工件、靜態(tài)分析、自我對弈、逐步驗證和在大量標記數(shù)據(jù)上訓練的微調(diào)AI模型的組合,以推導出必須到達最終輸出的詳細過程。標記數(shù)據(jù)的影響不容小覷,從有能力的軟件工程師那里獲得高質(zhì)量數(shù)據(jù)是困難的,但結(jié)果是值得的,因為它提供了開發(fā)人員如何隱式思考解決問題的深刻洞察?!?/p>

此數(shù)據(jù)集不僅代表了完美的信息來源和增量知識發(fā)現(xiàn),還捕捉了人類工程師的逐步?jīng)Q策過程。

“通過實際訓練我們的模型,而不僅僅是提示基礎(chǔ)模型,這是其他人正在做的事情,我們已經(jīng)看到我們不再僅僅是生成隨機代碼直到某些代碼有效,而是像人類一樣解決問題”,Pullen強調(diào)道。

4.Genie的價格方案

至于Genie的定價結(jié)構(gòu),Pullen在后續(xù)電子郵件中解釋了如何工作。

他說將最初分為兩個層次:

1.一個價格競爭力強的可訪問選項,大約在20美元左右。這個層次將有一些功能和使用限制,但將展示Genie的能力,適合個人和小團隊使用。

2.一個企業(yè)級的選擇,具有擴展功能,幾乎無限使用的能力,并且能夠創(chuàng)建一個完美的AI同事,精通內(nèi)部編寫的每一行代碼。這個層次將更顯貴,反映其作為完整AI工程同事的價值。

5.寫在最后

Genie的推出對軟件開發(fā)團隊有廣泛的影響,特別是那些希望提高生產(chǎn)力并減少在常規(guī)任務(wù)上花費時間的團隊。憑借其處理復雜編程挑戰(zhàn)的自主能力,Genie可能會徹底改變工程資源分配的方式,讓團隊能夠集中精力處理更戰(zhàn)略性的事務(wù)。

Cosine對Genie未來發(fā)展有著宏大的計劃,他們打算擴展其模型組合,包括用于簡單任務(wù)的較小模型以及處理更復雜挑戰(zhàn)的更大模型。此外,Cosine計劃通過擴展一個領(lǐng)先的開源模型和在廣泛數(shù)據(jù)集上進行預訓練,進一步拓展他們的工作領(lǐng)域到開源社區(qū)。

感興趣的朋友可以移步Cosine網(wǎng)站申請測試訪問,在項目中嘗試使用Genie:https://cosine.sh/register

參考鏈接:https://venturebeat.com/programming-development/move-over-devin-cosines-genie-takes-the-ai-coding-crown/

想了解更多AIGC的內(nèi)容,請訪問:

51CTO AI.x社區(qū)

http://www.szyisi.cn/aigc/

責任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2024-08-13 13:50:00

數(shù)據(jù)模型

2024-08-14 09:13:28

2022-11-21 10:59:02

人工智能

2018-12-04 15:46:53

編程語言Python

2018-07-19 19:07:33

語言編程語言程序

2023-07-31 08:59:46

軟件FossilSQLite

2025-03-27 00:45:00

2019-11-18 15:07:54

編程語言C#

2023-04-03 10:28:53

人工智能機器人

2013-09-16 11:12:51

編程環(huán)境開發(fā)

2024-08-14 14:43:00

2018-09-07 08:00:00

2022-09-19 21:34:04

PHPFacebook語言

2009-02-27 10:34:13

2015-11-17 15:50:04

A商APPAPP電商

2020-03-23 14:07:10

戴爾

2021-11-30 14:06:37

排序算法代碼

2020-07-23 18:31:55

開源數(shù)據(jù)庫PostgreSQL

2013-09-12 15:39:30

編程語言BANCStar

2025-03-13 00:35:00

點贊
收藏

51CTO技術(shù)棧公眾號