AI的未來(lái):探究下一代生成式模型
譯文作者 | Nisha Arya
譯者 | 布加迪
審校 | 重樓
目前,生成式AI具備哪些能力?為了探究下一波生成式AI模型,它需要克服哪些挑戰(zhàn)?
如果您一直關(guān)注科技界,就知道生成式AI是最熱門的話題。我們聽到了太多關(guān)于ChatGPT和DALL-E等方面的消息。
最近生成式AI方面的突破將徹底改變我們繼續(xù)對(duì)待內(nèi)容創(chuàng)建的方式和AI工具在所有行業(yè)領(lǐng)域的增長(zhǎng)率。Grand View Research在其《人工智能市場(chǎng)規(guī)模、份額和趨勢(shì)分析報(bào)告》中指出:2022年全球人工智能市場(chǎng)規(guī)模為1365.5億美元,預(yù)計(jì)從2023年到2030年將以37.3%的年復(fù)合增長(zhǎng)率增長(zhǎng)?!?/p>
如今,來(lái)自不同行業(yè)或背景的越來(lái)越多的組織希望通過(guò)使用生成式AI來(lái)提高技能。
1、生成式AI的定義
生成式AI是一種算法,用于創(chuàng)建新的獨(dú)特內(nèi)容,比如文本、音頻、代碼和圖像等。隨著AI的發(fā)展,生成式AI有望席卷各行各業(yè),幫助它們完成人們?cè)?jīng)認(rèn)為不可能完成的任務(wù)。
生成式AI已經(jīng)在創(chuàng)造可以模仿藝術(shù)大師的藝術(shù)作品了。時(shí)尚行業(yè)可以利用生成式AI為他們的下一款系列創(chuàng)造新的設(shè)計(jì)。室內(nèi)設(shè)計(jì)師可以使用生成式AI在幾天內(nèi)為客戶設(shè)計(jì)夢(mèng)想的家居,而不是幾周和幾個(gè)月。
生成式AI相當(dāng)新穎,在不斷發(fā)展中,仍然需要時(shí)間來(lái)完善。然而,像ChatGPT這樣的應(yīng)用程序已經(jīng)拉高了門檻,預(yù)計(jì)在未來(lái)幾年會(huì)看到更多創(chuàng)新的應(yīng)用程序發(fā)布。
2、生成式AI的作用
就像之前提到的,生成式AI仍在不斷完善中。截至今天,我們可以將其分成三部分:
1)生成新的內(nèi)容/信息
這可以是創(chuàng)建新的博客、視頻教程或者放在墻上的某種新奇的藝術(shù)作品。而且,它也有助于開發(fā)一種新藥。
2)取代重復(fù)的任務(wù)
生成式AI可以接管員工繁瑣而重復(fù)的任務(wù),比如撰寫電子郵件、演示文檔摘要、編程及其他類型的操作。
3)定制的數(shù)據(jù)
生成式AI可以為特定的客戶體驗(yàn)創(chuàng)建內(nèi)容,這可以用作確保成功、投資回報(bào)率、營(yíng)銷技巧和客戶參與度的數(shù)據(jù)。利用消費(fèi)者的行為模式,公司就能夠區(qū)分有效的策略和方法。
下面是其中一種最流行的生成式AI模型:Diffusion Models。
Diffusion Model(擴(kuò)散模型)
擴(kuò)散模型旨在通過(guò)將數(shù)據(jù)集映射到低維潛在空間來(lái)學(xué)習(xí)數(shù)據(jù)集的底層結(jié)構(gòu)。潛在擴(kuò)散模型是一種深度生成式神經(jīng)網(wǎng)絡(luò),由慕尼黑大學(xué)的計(jì)算機(jī)視覺小組和Runway開發(fā)。
擴(kuò)散過(guò)程是當(dāng)您慢慢地在壓縮的潛在表示中添加或擴(kuò)散噪聲,并生成一個(gè)僅僅是噪聲的圖像。然而,擴(kuò)散模型的方向恰好相反,采用了擴(kuò)散的相反過(guò)程。噪聲以一種可控的方式從圖像中逐漸減少,因此圖像慢慢看起來(lái)像原來(lái)的樣子。
3、生成式AI的用例
生成式AI已經(jīng)被來(lái)自不同行業(yè)領(lǐng)域的許多組織廣泛采用。它讓組織可以采用工具來(lái)幫助微調(diào)目前的流程和方法,并更有效地提升它們。比如說(shuō):
?媒體
假設(shè)媒體組織在創(chuàng)建一篇新的文章或一幅新的圖片放到網(wǎng)站上,或者創(chuàng)建一個(gè)很酷的視頻。生成式AI席卷了媒體行業(yè),使它們能夠以更快的速度生成高效的內(nèi)容,并降低成本。個(gè)性化內(nèi)容使組織能夠?qū)⒖蛻魠⑴c度提升到新的水平,并提供更高效的客戶保留策略。
?金融
現(xiàn)在有一些AI工具,比如面向KYC和AML流程的智能文檔處理(IDP)。而且,生成式AI使金融機(jī)構(gòu)能夠通過(guò)發(fā)現(xiàn)消費(fèi)者支出的新模式和確定潛在問(wèn)題來(lái)進(jìn)一步做好客戶分析工作。
?醫(yī)療保健
生成式AI可以幫助處理X光片和CT掃描等圖像,以提供更準(zhǔn)確的可視化結(jié)果、更好地定義圖像,并以更快的速度檢測(cè)診斷。比如說(shuō),如果使用借助GAN(生成式對(duì)抗網(wǎng)絡(luò))的插圖到照片轉(zhuǎn)換等工具,醫(yī)院保健專業(yè)人員就能夠更深入地了解患者當(dāng)前的健康狀況。
4、生成式AI的治理挑戰(zhàn)
生成式AI的興起已促使各國(guó)政府積極考慮如何能夠控制生成式AI工具的使用。
一段時(shí)間以來(lái),AI領(lǐng)域已向組織開放,可以做它們想做的事情。然而,早晚有人介入并圍繞AI制定法規(guī)。許多人擔(dān)心對(duì)生成式AI模型的監(jiān)督、它將如何影響社會(huì)經(jīng)濟(jì),以及知識(shí)產(chǎn)權(quán)和隱私侵犯等其他問(wèn)題。
生成式AI目前在治理方面面臨的主要挑戰(zhàn)如下:
?數(shù)據(jù)隱私——生成式AI模型需要大量數(shù)據(jù)才能成功導(dǎo)出準(zhǔn)確的輸出內(nèi)容。由于敏感信息可能被濫用,數(shù)據(jù)隱私是所有AI公司和工具都面臨的一個(gè)挑戰(zhàn)。
?所有權(quán)——由生成式AI創(chuàng)造的任何內(nèi)容或信息的知識(shí)產(chǎn)權(quán)仍然是開放式討論。一些人可能會(huì)說(shuō)內(nèi)容很獨(dú)特,另一些人可能會(huì)說(shuō)文本生成的內(nèi)容是從互聯(lián)網(wǎng)眾多來(lái)源拼湊而成的。
?質(zhì)量——隨著大量數(shù)據(jù)被饋送到生成式AI模型中,須關(guān)注的首要問(wèn)題是調(diào)查數(shù)據(jù)的質(zhì)量,然后調(diào)查所生成的輸出內(nèi)容的準(zhǔn)確性。醫(yī)療等行業(yè)是高度關(guān)注的領(lǐng)域,因?yàn)樘幚礤e(cuò)誤信息可能會(huì)帶來(lái)嚴(yán)重影響。
?偏誤——當(dāng)我們研究數(shù)據(jù)質(zhì)量時(shí),還需要評(píng)估訓(xùn)練數(shù)據(jù)中可能存在的偏誤。這可能會(huì)導(dǎo)致歧視性輸出,導(dǎo)致AI在許多人眼中令人反感。
5、結(jié)語(yǔ)
生成式AI在被所有人積極接受之前還有很多工作要做。這些AI模型需要更好地理解來(lái)自不同文化背景的人類語(yǔ)言。對(duì)于我們來(lái)說(shuō),與人交談時(shí)的常識(shí)對(duì)我們來(lái)說(shuō)很自然,然而對(duì)AI系統(tǒng)來(lái)說(shuō)卻不是很常見。它們竭力適應(yīng)不同的環(huán)境,因?yàn)樗鼈儽痪幊虨橛檬聦?shí)信息加以訓(xùn)練。
看到生成式AI在未來(lái)會(huì)扮演什么角色將是一件有趣的事情,我們須拭目以待。
原文鏈接:https://www.kdnuggets.com/2023/05/future-ai-exploring-next-generation-generative-models.html