企業(yè)如何安全地找到實(shí)用的GenAI用例
AI,特別是GenAI和大型語言模型,已經(jīng)在技術(shù)上取得了巨大的進(jìn)步,并正在到達(dá)行業(yè)廣泛采用的拐點(diǎn)。麥肯錫的報(bào)告稱,AI領(lǐng)域的佼佼者已經(jīng)在“全力以赴”,企業(yè)知道,他們必須接受最新的AI技術(shù),否則就會(huì)被甩在后面。
然而,AI安全領(lǐng)域仍然不成熟,這給使用該技術(shù)的企業(yè)帶來了巨大的風(fēng)險(xiǎn)。AI和ML出現(xiàn)錯(cuò)誤的例子并不難找到。在從醫(yī)學(xué)到執(zhí)法的各個(gè)領(lǐng)域,原本應(yīng)該是公正和不偏不倚的算法被暴露為存在隱藏的偏見,進(jìn)一步加劇了現(xiàn)有的社會(huì)不平等,給它們的制定者帶來了巨大的聲譽(yù)風(fēng)險(xiǎn)。
微軟的Tay聊天機(jī)器人可能是對(duì)企業(yè)最著名的警示故事:它被訓(xùn)練成用十幾歲的口頭禪說話,然后被互聯(lián)網(wǎng)巨魔重新訓(xùn)練,吐出未經(jīng)過濾的種族主義厭女者的膽汁,很快就被這位尷尬的科技巨頭下架——但在造成聲譽(yù)損害之前。即使是大肆吹噓的ChatGPT也被稱為“比你想象的更愚蠢”。
企業(yè)領(lǐng)導(dǎo)人和董事會(huì)明白,他們的企業(yè)必須開始利用GenAI的革命性潛力,但是,當(dāng)他們?cè)贏I安全問題的雷區(qū)運(yùn)營(yíng)時(shí),他們是如何開始考慮識(shí)別初始用例和原型的呢?
答案在于關(guān)注一個(gè)我稱之為“干草堆中的針”問題的類用例。對(duì)于人類來說,搜索或生成潛在的解決方案相對(duì)困難,但驗(yàn)證可能的解決方案相對(duì)容易。由于其獨(dú)特的性質(zhì),這些問題非常適合早期的行業(yè)用例和采用,而且,一旦我們認(rèn)識(shí)到這種模式,我們就會(huì)意識(shí)到干草堆問題比比皆是。
以下是一些應(yīng)用場(chǎng)景和案例:
1、文案編輯
檢查一份長(zhǎng)篇文件的拼寫和語法錯(cuò)誤是很困難的。雖然從Word的早期起,計(jì)算機(jī)就能夠發(fā)現(xiàn)拼寫錯(cuò)誤,但在AI出現(xiàn)之前,準(zhǔn)確地找到語法錯(cuò)誤被證明是更加難以捉摸的,即使是這些錯(cuò)誤也經(jīng)常錯(cuò)誤地將完全有效的短語標(biāo)記為不符合語法的。
我們可以看到復(fù)制編輯是如何適用于干草堆范例的。人類可能很難在一份冗長(zhǎng)的文檔中發(fā)現(xiàn)語法錯(cuò)誤,一旦AI發(fā)現(xiàn)了潛在的錯(cuò)誤,人類就很容易驗(yàn)證它們是否確實(shí)不符合語法,這最后一步是至關(guān)重要的,因?yàn)榧词故乾F(xiàn)代的AI工具也不完美。像Grammarly這樣的服務(wù)機(jī)構(gòu)已經(jīng)在利用大語言模型來做到這一點(diǎn)。
2、編寫樣板代碼
編寫代碼最耗時(shí)的方面之一是學(xué)習(xí)新API或庫的語法和約定,這個(gè)過程需要大量研究文檔和教程,而且每天都有數(shù)以百萬計(jì)的軟件工程師重復(fù)這個(gè)過程。利用在這些工程師編寫的集體代碼上接受培訓(xùn)的GenAI,Github Copilot和Tabine等服務(wù)已經(jīng)自動(dòng)執(zhí)行了按需生成樣板代碼的繁瑣步驟。
這個(gè)問題非常符合干草堆的范例。雖然人類在不熟悉的庫中生成工作代碼所需的研究工作很耗時(shí),但驗(yàn)證代碼是否正確工作相對(duì)容易(例如,運(yùn)行它)。最后,與其他AI生成的內(nèi)容一樣,工程師必須在將代碼交付生產(chǎn)之前進(jìn)一步驗(yàn)證代碼是否按預(yù)期工作。
3、搜索科學(xué)文獻(xiàn)
即使對(duì)于訓(xùn)練有素的科學(xué)家來說,跟上科學(xué)文獻(xiàn)也是一項(xiàng)挑戰(zhàn),因?yàn)槊磕臧l(fā)表的論文有數(shù)百萬篇,然而,這些論文提供了一座科學(xué)知識(shí)的金礦,只要他們的知識(shí)能夠被處理、吸收和結(jié)合,專利、藥物和發(fā)明就隨時(shí)可以被發(fā)現(xiàn)。
尤其具有挑戰(zhàn)性的是跨學(xué)科洞察,它需要兩個(gè)往往互不相關(guān)的領(lǐng)域的專業(yè)知識(shí),而掌握這兩個(gè)學(xué)科的專家寥寥無幾。幸運(yùn)的是,這個(gè)問題也適用于干草堆課程:通過閱讀引出這些想法的論文來檢查潛在的AI產(chǎn)生的新想法要容易得多,而不是產(chǎn)生散布在數(shù)百萬科學(xué)作品中的新想法。
而且,如果AI能夠像學(xué)習(xí)數(shù)學(xué)一樣粗略地學(xué)習(xí)分子生物學(xué),它將不會(huì)受到人類科學(xué)家面臨的學(xué)科限制的限制。像排版這樣的產(chǎn)品已經(jīng)是朝這個(gè)方向邁出的有希望的一步。
人類驗(yàn)證至關(guān)重要
上述所有用例中的關(guān)鍵洞察是,雖然解決方案可能是AI生成的,但它們始終是經(jīng)過人類驗(yàn)證的。讓AI代表一家大企業(yè)直接與世界對(duì)話(或在世界上采取行動(dòng))是可怕的風(fēng)險(xiǎn),歷史上充滿了過去的失敗。
讓人工驗(yàn)證AI生成的內(nèi)容的輸出對(duì)于AI的安全至關(guān)重要。對(duì)干草堆問題的關(guān)注改進(jìn)了對(duì)人工驗(yàn)證的成本效益分析,這讓AI專注于解決人類難以解決的問題,同時(shí)保留了人類操作員簡(jiǎn)單但關(guān)鍵的決策和復(fù)核。
在低成本管理的這些新生日子里,專注于干草堆用例可以幫助企業(yè)建立AI體驗(yàn),同時(shí)緩解潛在的嚴(yán)重的AI安全問題。