挑戰(zhàn)OpenAI!以色列AI21 Labs推最新語言模型:侏羅紀-X
最近,AI21 Labs完成了6400萬美元的B輪融資,公司估值為6.64億美元。本輪融資由阿倫創(chuàng)新資本基金牽頭,Mobileye首席執(zhí)行官兼聯合創(chuàng)始人Amnon Shashua、Walden Catalyst、Pitango、TPY Capital和Mark Leslie參與,使得A21 Labs的總融資額達到1.185億美元。
AI21 Labs由Goshen、Shashua和斯坦福大學教授Yoav Shoham于2017年共同創(chuàng)立。該公司的第一款產品是Wordtune,這是一種人工智能驅動的寫作輔助工具,旨在與Grammarly競爭,它在用戶輸入內容時給予新的措辭建議。去年8月,AI21發(fā)布了平臺AI Studio,并推出了對于Jurassic-1模型「即用即付 」的服務-開發(fā)者可以根據其要求的獨特數據集進行定制模型以及微調。
Jurassic-1系列模型可用于轉述(如從產品描述中生成簡短的產品名稱),從文本中提取數字,按主題或類別標記電子郵件和筆記。這些模型還可以通過Wordtune中被稱為Wordtune Read的功能來總結內容,包括文章、報告和PDF文件的片段。
然而由于語言模型是被互聯網上的大量數據(包括社交媒體)訓練出來的,因此它們能夠根據在訓練過程中遇到的類似語言生成有毒和有偏見的文本。AI21 Labs的模型也不例外。
雖然AI21 Labs要求客戶同意使用條款政策和使用指南,但它還沒有對其API產生的潛在有毒內容實施過濾。對此,AI21 Labs表示其模型比GPT-3「略微少一些偏見」,并說他們在手動審查并微調模型以打擊濫用。
而據Goshen說,Jurassic-1模型的最新版本Jurassic-X使用了所謂的「模塊化推理知識系統(tǒng)」,用在線計算器和貨幣轉換器等「離散推理專家」來增強其答案。Jurassic-X可以回答用自然語言表述的「非平凡」數學運算,以及簡化可能絆倒其他語言模型的「復雜」問題。相較于Jurassic-1,Jurrasic-X克服了前身模型不擅于推理、更新昂貴、不能有效處理時序數據等缺點。
當然,值得注意的是,AI21 Labs還沒有委托對其Jurassic-X模型與其他商業(yè)語言模型進行比較,所以目前的全部依據僅來自聲明。
該公司最近的營銷噱頭并沒有給人帶來巨大的信心,相反令人質疑。6月,AI21 Labs推出了一個以已故最高法院法官露絲-巴德-金斯伯格(Ruth Bader Ginsburg)的法律意見為模型的聊天機器人。然而一些人工智能技術專家將其定性為誤導。AI21 Labs在回應批評時表示,該聊天機器人「只是一個實驗」,并承認它可以給出不準確的回答,應該「謹慎對待」。
對于此輪融資,Goshen表示,新資金將用于研發(fā),特別是開發(fā)更大、更復雜的語言模型,以及招聘人才。AI21 Labs目前擁有120名員工,他們計劃在今年年底前再招聘約50名員工,以對抗宏觀經濟趨勢。
當被問及收入時,Goshen拒絕透露確切的數字,以及對增長的估計。他表示,Studio有數百個「付費客戶和設計合作伙伴」,但他也不愿意透露這些人的名字。此外他還說有超過1萬名免費計劃的用戶,而Wordtune則有「數百萬」用戶。
鑒于訓練復雜模型的成本,投資者可能面臨巨大的擴張壓力。
AI21 Labs自己的研究表明,開發(fā)一個具有15億個參數(即模型用于生成和分析文本的變量)的文本生成模型的費用高達160萬美元。而Jurassic-1模型包含了1780億個參數,這還不包括為模型提供服務的托管費用;AI21 Labs 表示,它保留了美國和國外「幾家」第三方云提供商的服務。
「缺乏市場知識是因為語言模型技術還是新生并且剛被采用。」Goshen說,「有了新的資金,AI21 Labs將繼續(xù)履行其使命來建立具有前所未有的自然語言理解和生成能力的AI系統(tǒng)?!?/span>
「隨著越來越多的公司遷移到遠程工作,人們需要用文字傳達他們通常會口頭分享的內容。我們專有的大型語言模型的核心能力允許攝取大量的企業(yè)數據使用......自定義的內容創(chuàng)建、總結和分類。」
你看好AI21嗎?