偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

3個(gè)月超3000次實(shí)驗(yàn) 虎博發(fā)布開源國(guó)產(chǎn)大模型

企業(yè)動(dòng)態(tài)
Tigerbo已經(jīng)包含大部分生成和理解類的能力,如營(yíng)銷文案、評(píng)論、新聞稿等內(nèi)容生產(chǎn)創(chuàng)作、文到圖插圖創(chuàng)作、數(shù)學(xué)題解題、寫生成、做表格、文本理解等多項(xiàng)功能。

3個(gè)月就能研發(fā)并上線大模型?這不是不可能,而且誕生于一只僅有10人的小項(xiàng)目團(tuán)隊(duì)。

這家公司是國(guó)內(nèi)的一家創(chuàng)業(yè)公司——虎博科技,他們?cè)诙潭?個(gè)月內(nèi),研發(fā)出首款自研大模型Tigerbot,并同步開源,同時(shí)發(fā)布了大模型應(yīng)用開發(fā)所需的全套 API及多領(lǐng)域?qū)I(yè)數(shù)據(jù)。

(開源地址:https://github.com/TigerResearch/TigerBot )

據(jù)了解,虎博科技成立于2017年,其專注于深度學(xué)習(xí)和NLP技術(shù)的研究和應(yīng)用得到了廣泛認(rèn)可。此次發(fā)布并開源其自研大模型TigerBot,標(biāo)志著這家專注于深度學(xué)習(xí)和自然語言處理技術(shù)的算法公司在大模型研發(fā)領(lǐng)域取得了重要突破。

虎博科技創(chuàng)始人兼CEO陳燁表示,在大模型研發(fā)方面,虎博團(tuán)隊(duì)借鑒了硅谷的經(jīng)典"車庫(kù)創(chuàng)業(yè)"模式,最初的團(tuán)隊(duì)規(guī)模只有5個(gè)人,而陳燁本人同時(shí)擔(dān)任首席程序員和首席AI科學(xué)家的角色。終于,在歷經(jīng)3 個(gè)月的封閉式開發(fā)和超過 3000 次實(shí)驗(yàn)后,迭代出第一個(gè) MVP (最小可行性模型),其表現(xiàn)效果堪比同規(guī)模大小的OpenAI的96%,且在推理式問答等個(gè)別領(lǐng)域表現(xiàn)尤其亮眼。

在陳燁眼中,頂尖團(tuán)隊(duì)不一定需要龐大的規(guī)模,但每個(gè)人技術(shù)都必須過硬,“我們的核心研發(fā)團(tuán)隊(duì)始終保持在4-5人,并保持著密切的合作狀態(tài)?!敝钡酱竽P桶l(fā)布前夕,這個(gè)小團(tuán)隊(duì)也不過10人而已。

過去三個(gè)月中,虎博科技主要基于 GPT 和 BLOOM 兩個(gè)開源模型基礎(chǔ)上,在模型架構(gòu)和算法上做了一系列優(yōu)化,特別是原創(chuàng)了監(jiān)督和微調(diào)方法,使大模型在事實(shí)性和創(chuàng)造性兩方面有了顯著突破,解決了大模型“胡說八道”的問題?!皬恼麄€(gè)技術(shù)角度來說,監(jiān)督微調(diào)的方法是大模型這件事的核心,能夠影響模型效果的七到八成",陳燁分享道。

為了使模型更懂中文指令,虎博科技還從分詞器(Tokenizer)到訓(xùn)練算法等方面做了優(yōu)化,直接賦予了問答結(jié)果更多中國(guó)文化屬性。

在并行訓(xùn)練上,虎博的大模型團(tuán)隊(duì)也突破了 deep-speed 等主流框架中若干內(nèi)存和通信問題,使得在千卡環(huán)境下,可實(shí)現(xiàn)訓(xùn)練數(shù)月而不間斷,極大加速了模型迭代速度。

由于虎博科技這只創(chuàng)業(yè)團(tuán)隊(duì)秉持了科學(xué)創(chuàng)新無國(guó)界無階層的理念,從研發(fā)之初,他們就選擇了開源這條路,使得Tigerbot成為業(yè)內(nèi)少有的開源大模型。

據(jù)悉,虎博大模型Tigerbot在模型、代碼、數(shù)據(jù)三部分內(nèi)容與廣大開發(fā)者實(shí)現(xiàn)資源共享,包含 TigerBot-7B-sft、 TigerBot-7B-base、TigerBot-180B-research 等多個(gè)模型版本;基本訓(xùn)練且覆蓋雙卡推理 180B 模型的量化和推理代碼;以及達(dá) 100G 的預(yù)訓(xùn)練數(shù)據(jù)、監(jiān)督微調(diào) 1G/100 萬條數(shù)據(jù)。值得一提的是,開源版本中,TigerBot-7B-base的綜合表現(xiàn)優(yōu)于同等可比的OpenAI和BLOOM,TigerBot-180B-research 的參數(shù)量達(dá)1800億,或是目前業(yè)內(nèi)最大的大規(guī)模語言模型,而高達(dá)100G的預(yù)訓(xùn)練數(shù)據(jù),更被視為目前業(yè)內(nèi)最大且質(zhì)量最優(yōu)的開源預(yù)訓(xùn)練數(shù)據(jù)之一。

虎博科技還將發(fā)布大模型應(yīng)用開發(fā)所需的全套API,包括對(duì)話(Chat)、插件(Plug-ins)、微調(diào)(Fine-Tunes)等,同步共享專業(yè)領(lǐng)域數(shù)據(jù),涵蓋金融,法律,百科等,以期與大模型應(yīng)用開發(fā)者,一起打造中國(guó)的世界級(jí)的應(yīng)用。

目前,Tigerbo已經(jīng)包含大部分生成和理解類的能力,如營(yíng)銷文案、評(píng)論、新聞稿等內(nèi)容生產(chǎn)創(chuàng)作、文到圖插圖創(chuàng)作、數(shù)學(xué)題解題、寫生成、做表格、文本理解等多項(xiàng)功能。未來,虎博科技還將持續(xù)投入大模型的研發(fā)和落地,或會(huì)推出研究助手 TigerDoc、文創(chuàng)和營(yíng)銷工具等大模型應(yīng)用及面向個(gè)人用戶的類助手產(chǎn)品。

責(zé)任編輯:張誠(chéng)
相關(guān)推薦

2021-03-19 09:04:15

訂單事故系統(tǒng)

2024-04-30 14:11:00

訓(xùn)練模型

2009-08-16 18:37:00

國(guó)產(chǎn)超級(jí)計(jì)算機(jī)魔方上海超級(jí)計(jì)算中心曙光

2023-05-16 14:15:00

AI開源

2023-06-08 11:06:17

OpenAITigerBot

2009-03-14 09:28:07

Symbian開源移動(dòng)OS

2025-02-28 12:32:42

2023-08-21 10:36:23

2024-09-09 14:15:00

AI訓(xùn)練

2010-12-16 15:14:39

IBM超算

2024-04-19 07:55:57

Llama 3模型人工智能開源

2018-12-18 09:45:51

5G4G通信網(wǎng)絡(luò)

2024-06-12 13:31:57

2021-04-28 07:58:16

Raft 選舉參數(shù)

2023-06-09 16:51:34

Tigerbo

2023-11-06 13:44:34

2014-05-09 10:06:13

碼農(nóng)創(chuàng)業(yè)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)