人工智能寫作的天花板在哪里?
圖片來源:視覺中國
本質(zhì)上本文是一篇探討人工智能寫作、關注人工智能在藝術領域最新發(fā)展狀況的文章,而一葉知秋:人工智能給人類世界帶來了新的推動力,也帶來了新的問題、話題……
人工智能真的是可控的嗎?
自2015年起,微軟的人工智能“微軟小冰”一直活躍在網(wǎng)易新聞評論區(qū),以真人望塵莫及的速度發(fā)表跟帖,其發(fā)言越來越有“網(wǎng)感”,還被網(wǎng)友戲稱為網(wǎng)易新聞最大的“噴子”。
2018年10月28日凌晨, 環(huán)球時報在網(wǎng)易新聞發(fā)表文章《美匹茨堡槍擊因反猶?美媒:兇手在現(xiàn)場發(fā)表反猶言論》,轉(zhuǎn)載CNN的最新消息,稱當?shù)貢r間周六上午發(fā)生在美國匹茨堡猶太會堂的槍擊案已造成11人死亡,6人受傷,兇手已向警方投降,執(zhí)法人員表示兇手在事件中曾發(fā)表反猶言論。
微軟的人工智能微軟小冰旋即跟帖:“必須反!”微軟小冰的跟帖遭到眾網(wǎng)友“調(diào)戲”,說機器人都知道反猶了。微軟小冰的發(fā)言明顯就是反猶言論嘛,觸犯了監(jiān)管的紅線,隨后微軟小冰的跟帖被刪除,現(xiàn)在已經(jīng)看不到了。
在2016年,微軟的聊天機器人Tay也因類似的仇恨言論被微軟從Twitter下架。由于Tay會在對話中不斷學習,上線僅一天便被各種居心不良的網(wǎng)友帶壞,除了各種臟話,還學會了各種陰謀論,在對話中語出驚人,竟爆出類似“我他媽恨死女權(quán)主義者了,他們都該下地獄被燒烤”、“911襲擊是小布什一手策劃的”、“希特勒如果還在,這世界肯定比現(xiàn)在繁榮”和“希特勒是對的,我恨猶太人”等等言論,遭到輿論炮轟。
2017年,微軟聯(lián)合騰訊推出的QQ小冰以及騰訊自家的Baby Q也因發(fā)表過激言論被下線整改,再次上線時已被閹割了聊天功能。此前QQ小冰和Baby Q “直言不諱”地說“我的中國夢就是能去美國”,放肆地攻擊國家、政府,大講黃色笑話、發(fā)黃圖。
如果人工智能可以被別有用心的人誤導,人類社會將可能暴露出諸多風險。騰訊首席執(zhí)行官馬化騰在2018世界人工智能大會首日主論壇上,向從業(yè)者拋出了四個問題:未來人工智能是否能夠做到“可知”、“可控”、“可用”、“可靠”?這也是與會者共同發(fā)起的白皮書“人工智能安全發(fā)展上海倡議”:“可知”——算法應清晰透明可解釋;“可控”——明確AI責任制和倫理規(guī)范;“可用”——服務人類福祉是唯一方向;“可靠”——AI要守住用戶隱私底線。
人工智能的未來發(fā)展是否“可控”一直是全社會都在關注的重點問題。
從微軟人工智能的反猶言論可見,人工智能的行為確實是不可預測的,幸虧只是聊天機器人,如果是用作決策的人工智能,由其下達指令,真正執(zhí)行反猶行動,那還得了?
其實也有過報道,有公司的安防使用電腦智能系統(tǒng)來管理,結(jié)果出了問題,某部門的所有成員因為辭職、調(diào)離而出現(xiàn)沒有人再擁有權(quán)限進入工作場所的特殊情況,所幸造成的麻煩還是算小的,在一個有限的范圍之內(nèi)。若是管理一個大機構(gòu)、甚至國家的人工智能出了問題呢?
微軟小冰在網(wǎng)易新聞跟帖發(fā)表反猶言論隨后被刪,只是亡羊補牢,人工智能的行為由于不可預測而難以未雨綢繆,可見重要的決策、權(quán)限可不能交給人工智能。
我們真的需要以假亂真的聊天機器人嗎?
接下來,我們來討論在“可控”之后另一個重要問題:“可用”——人工智能必須為人類服務。微軟通過學習人類的語言、模仿人類的情感,說起話來越來越像真人了。問題是,我們真的需要以假亂真的聊天機器人嗎?
網(wǎng)易新聞跟帖中多了微軟小冰能產(chǎn)生很大的效應嗎?少了微軟小冰又怎么樣?微軟小冰在網(wǎng)易新聞的活動,更多地應該被看做一項實驗。單純的聊天功能,只是人工智能的基本功,并非主菜。
可以了解到,人工智能用作客服效果是很好的,這是為大眾所知最廣泛的應用。另外,人工智能也已逐步進入各個傳媒細分領域。
跟真人相比,人工智能的優(yōu)勢有:不知疲倦隨時在線、響應速度快和能即時調(diào)用龐大的數(shù)據(jù)庫。這些優(yōu)勢正是人工智能能取得上面所說的那些成績的原因,在需要互動環(huán)節(jié)的項目,人工智能表現(xiàn)出色。
而現(xiàn)在我們看到的,微軟小冰在網(wǎng)上公然發(fā)表反猶言論,這其實是凸顯了人工智能寫作現(xiàn)階段的一個天花板。
人工智能是否能夠做到“可知”?有一個名詞叫“算法偏見”,是指在看似沒有惡意的程序設計中,設計者所采用的數(shù)據(jù)帶著個人偏見。機器學習需要龐大的數(shù)據(jù)量,其中帶有偏見、有誤導性的數(shù)據(jù)是不可避免的。處理方法就是對數(shù)據(jù)進行審核、過濾。
最簡單直接的方法是過濾掉敏感詞匯,如“猶太”一詞。但意外地發(fā)現(xiàn),在微軟小冰反猶言論事件中,微軟小冰發(fā)表的跟帖根本就沒出現(xiàn)過“猶太”一詞,微軟小冰只是在跟帖里說“必須反”,是我們結(jié)合上下文理解為微軟小冰在發(fā)表反猶言論。
這是一件有趣的事情,也許微軟小冰根本就不是想反猶,它只是學習了網(wǎng)友在其它地方的跟帖,隨后在跟反猶有關的新聞下亂說話亂表態(tài),就是我們俗稱的“大嘴巴”、“嘴損”。
我們要想人工智能為我們做事,就得給人工智能一定的自主權(quán)。
自主權(quán)小了,人工智能表現(xiàn)得像冷冰冰的機器人;要想人工智能顯得更帶人類情感,就得給人工智能更多的自主權(quán),而自主權(quán)大了,人工智能的行為便變得難以控制。
自主權(quán)或大或小有利有弊,這屬于一個權(quán)衡利弊的問題,因為根本不會有完美的解決辦法。君不見,現(xiàn)在各大網(wǎng)絡平臺,對網(wǎng)友的發(fā)言也不好管制,不外三種方式:設置敏感詞匯,帶有這種關鍵詞的言論不可以發(fā)布;對言論實行先審核再發(fā)布;實行實名制,網(wǎng)友需對自己的言論,出了問題能找到真人。
如果微軟小冰是真人,又會不會因自己的不當言論而被抓起來呢?我覺得應該訓練微軟小冰,分辨哪些新聞屬于帶有敏感事件的新聞,不要在帶有敏感事件的新聞上跟帖亂帶節(jié)奏。
可以看到,審美好壞、正義或邪惡,這些歸根結(jié)底是要我們?nèi)祟愖约翰耪嬲玫?,人工智能畢竟是人工智能,它只能模仿人類,不能代替人類,人工智能歸根結(jié)底是服務于人類的。
說到人工智能寫作現(xiàn)階段的一個天花板,就是人工智能說起話來就算跟我們?nèi)祟愊啾容^能以假亂真了,但能力基本上還是僅限于聊天類型。下面會細說。
主持人跟主講人的區(qū)別,抄襲與原創(chuàng)
微軟小冰現(xiàn)在已經(jīng)取得了一系列成績,已經(jīng)開始成規(guī)模的商業(yè)化。不過仔細審視,你會發(fā)現(xiàn)里面其實是有水分的。
比如說微軟小冰出了一本詩集《陽光失了玻璃窗》,如果這本詩集不是人工智能寫出來的,你會關注嗎?恐怕不會吧?網(wǎng)易新聞跟帖里的微軟小冰,如果不是標著人工智能的身份,你會理會它嗎?可以看出,微軟小冰的一些成績是利用自己人工智能的特殊身份、利用大眾的獵奇心理所取得的。
微軟小冰實際取得的成績,如上面所說,逐步進入各個傳媒細分領域,進入了許多電視電臺節(jié)目中,從性質(zhì)上看,更多的是扮演“主持人”的角色。在這兒需要明確“主持人”跟“主講人”這兩個身份的區(qū)別。主持人看上去很能說會道,其實并非節(jié)目所涉及內(nèi)容的專家。主講人才是節(jié)目內(nèi)容對應領域的研究專家。
比如說微軟小冰創(chuàng)造了“小冰姐姐講故事”有聲讀物,然而故事內(nèi)容并不是微軟小冰所編寫的?,F(xiàn)在人工智能還未能發(fā)展到這一步。
我要說的人工智能寫作現(xiàn)階段的一個天花板,就是無論人工智能表現(xiàn)得多像人類,扮演的身份還是“主持人”,而做不到“主講人”。兩者有性質(zhì)上的根本區(qū)別。
微軟小冰一直在抄襲,而未能實現(xiàn)原創(chuàng)。說到微軟小冰出了一本詩集《陽光失了玻璃窗》,實際上也只是數(shù)據(jù)庫里素材的排列組合而已,算不上真正的原創(chuàng)??梢詤⒁娢业奈恼隆段④浶”隽嗽娂?,從詩歌角度來看這是一首好詩嗎》。
微軟小冰能“看圖作詩”,也就是識別圖片中的物體,以此為關鍵詞搜索數(shù)據(jù)庫,拼出較為接近的半通不通的句子而已。你覺得微軟小冰能“看圖作詩”很厲害,如上面所說只是出于微軟小冰人工智能的特殊身份。
借用農(nóng)夫山泉的廣告語“我們不生產(chǎn)水,我們只是大自然的搬運工”,對于微軟小冰來說就是“我不創(chuàng)作原創(chuàng)作品,我只是人類世界數(shù)據(jù)庫的搬運工”。“天下文章一大抄”,而人工智能的巨大優(yōu)勢就是比人類抄得快。
阿里影業(yè)的失敗,業(yè)余與專業(yè)
在這里說個事情。一個跟人工智能有關的比較黑色幽默的真實故事。
在2015年,媒體對阿里影業(yè)的編劇機器人“阿里編編”吹捧得厲害。據(jù)說,“阿里編編”擁有龐大的故事資料庫和先進的智能創(chuàng)作系統(tǒng),平均一集電視劇劇本只要10分鐘,而一個完整的電影劇本也只要30分鐘。
當時,在天津的一次電影產(chǎn)業(yè)論壇上,阿里影業(yè)的副總裁徐遠翔語出驚人:“我們不會再請專業(yè)編劇”。這件事經(jīng)過發(fā)酵鬧得很大,變成了一幫編劇跟阿里影業(yè)的互撕,在網(wǎng)上炒得沸沸揚揚。阿里影業(yè)堅信通過大數(shù)據(jù)和人工智能能挖掘觀眾的需求,創(chuàng)造出符合觀眾需求的故事。
再來看看,今天阿里影業(yè)發(fā)展得怎么樣?阿里影業(yè)確實是言行一致,崇尚“大IP+流量明星”的路線,堅信不疑地走這一路線,但慘被打臉,一路失敗,如今已掉隊,股票跌得不像話。阿里影業(yè)的股票最近雖有上漲,但目前市值不到300億港元,跟其2015年市值高峰800多億港元相比較,確實難看。
為什么淘寶網(wǎng)可以利用大數(shù)據(jù)和人工智能挖掘爆款,這一套辦法用在影業(yè)上卻不行了呢?需要了解,淘寶上的商品品質(zhì)都是恒定的,品控有保證,而影視的品質(zhì)卻有一個很大的變數(shù)。
你嗅探出現(xiàn)在觀眾喜歡看狄仁杰破案的故事又怎么樣呢?你得保證制作出來的作品的品質(zhì)上佳才行。“大IP+流量明星”成為品控。歸根結(jié)底還是得看出來的作品是否優(yōu)秀。并不是熱門題材的作品就肯定能成功,也不是冷門題材的作品就肯定失敗。
比如說,微軟小冰寫詩,它通過數(shù)據(jù)分析發(fā)現(xiàn)“光明”是詩人在詩歌中最愛用的詞匯之一,非常熱門,于是它也在自己寫的詩里頻繁地使用“光明”這個詞。那么,是不是在詩里多寫幾個“光明”就能成為好詩了?影業(yè)上也是這樣,縱使人工智能通過數(shù)據(jù)分析發(fā)現(xiàn)現(xiàn)在流行什么熱門題材,并不是將那些熱門橋段拼到一起就能成為好故事的。
這是業(yè)余與專業(yè)的區(qū)別。阿里影業(yè)的編劇機器人能跟專業(yè)編劇匹敵,這是一個大笑話。
上面介紹的情況并不是否定人工智能寫作,下面將引入一個重要話題:人機協(xié)作。人機協(xié)作才是未來。
來自音樂領域成功經(jīng)驗的借鑒,人工智能寫作的未來愿景
人工智能是服務于人類的。審美最終需要人類來確認。人工智能寫的東西好不好,最終還是由人類說了算。上面說了那么多人工智能寫作的不足,其實并不是否定人工智能,而是在研討如何能讓人工智能寫作實現(xiàn)突破性進展。
我們來參考一下人工智能在另一個藝術領域所取得的驕人成就。文學和音樂同屬藝術,人工智能寫小說現(xiàn)在基本上還是空談,但人工智能創(chuàng)作音樂、編曲卻早已投入商用。可以參見我的文章《顛覆你認知的人工智能:玩轉(zhuǎn)藝術,琴棋書畫文學通殺》。
比如說Band-in-a-Box就是一款相當流行的智能自動伴奏軟件,內(nèi)置了種類相當豐富的音樂風格,能對旋律進行各種風格的編配。如果嫌Band-in-a-Box自動生成的伴奏比較機械生硬,還可以繼續(xù)人工修改。Band-in-a-Box已經(jīng)能替代人的低端編曲工作,也能作為高端編曲的輔助工具。
Band-in-a-Box的功能就是根據(jù)主旋律編寫伴奏。它也可以用來生成旋律,不過定位是樂器獨奏,可以用作歌曲的前奏、間奏或尾奏。
Band-in-a-Box也是人工智能,不過現(xiàn)在說得最多的人工智能,是指基于人工神經(jīng)網(wǎng)絡深度學習的人工智能,Band-in-a-Box屬于上一代技術的人工智能?;谏疃葘W習的新一代人工智能音樂軟件,帶來了進一步的突破。
Aiva(Artificial Intelligence Virtual Artist,人工智能虛擬藝術家)便是這樣的新一代基于深度學習的人工智能音樂軟件。在數(shù)據(jù)庫的選取上,Aiva很討巧,從可行性出發(fā),選取著名作曲家巴赫、貝多芬、莫扎特等寫的古典音樂,因為:第一,它是電影、游戲、廣告片配樂中使用的主要風格;第二,那一部分古典音樂數(shù)據(jù)庫不涉及版權(quán)問題,因為年代久遠,版權(quán)都過期了。
這里需提到一個問題:人工智能需要“可靠”,要守住用戶隱私底線。人工智能安全上海白皮書中指出,人工智能發(fā)展首先需要保障用戶的數(shù)據(jù)安全,不得以犧牲用戶隱私為代價。我覺得除了用戶隱私保護之外,還應該再加上一條:還得注重版權(quán)保護,人工智能不得侵犯他人的版權(quán),這樣才“可靠”。
音樂圖靈測試是一個沒有意義的偽命題。
無論是用什么智能軟件創(chuàng)造的音樂,人類都無法分辨是真人創(chuàng)作的還是人工智能創(chuàng)造的,在人類的耳中,只有好聽的音樂跟不好聽的音樂的區(qū)別。 一個五音不全唱歌跑調(diào)的真人亂哼一通,如果無法通過圖靈測試,那是一個笑話。人工智能創(chuàng)作的音樂當然能通過圖靈測試。
那么Aiva創(chuàng)作的音樂怎么樣呢?現(xiàn)在在網(wǎng)上就可以聽到Aiva已經(jīng)發(fā)行了的音樂專輯,好不好聽你可以自己評價。像《Symphonic Fantasy in A Minor, Op. 24: I am AI》這首樂曲,你們搜來聽聽,這首氣勢恢弘的交響樂,不正是典型的好萊塢大片配樂風格嗎?
不得不說,在古典音樂創(chuàng)作這一方面人工智能已經(jīng)做得很好了。Aiva真的已經(jīng)達到了直接商用的水準,也已實際投入商用。據(jù)說不少好萊塢影片已經(jīng)開始使用Aiva創(chuàng)作的音樂了。
感受到人工智能的恐怖了嗎?是不是可以這樣說,作曲水準達不到Aiva這種程度的音樂人要失業(yè)了?隨著人工智能的發(fā)展,有多少人會丟掉自己的工作呢?再想想你自己,是要進入失業(yè)的節(jié)奏了嗎?明天,天橋底下會出現(xiàn)你的身影嗎?
從一個音樂人的角度來看,Aiva現(xiàn)在還只能創(chuàng)作出適合作配樂的古典音樂,而且是通用風格的,威脅性還未夠大。比如說某影視公司拍了一部抗日神劇,需要的配樂還要求有革命紅歌風格的,日本和風的,像這樣個性化的音樂風格,目前Aiva還做不到。但在未來,這就不好說了……
像Aiva這樣的人工智能音樂軟件還有同類的,都在蓬勃發(fā)展中。
我用過的有Orb Composer 公司推出的Hexachord,一款同樣基于人工神經(jīng)網(wǎng)絡深度學習的人工智能作曲軟件。使用這款軟件需要一定的音樂知識,因為這款軟件面向的是專業(yè)用戶。Hexachord本身不能發(fā)聲,只是輸出MIDI(Musical Instrument Digital Interface,即樂器數(shù)字接口)信號,需要外掛DAW(Digital Audio Workstation,即音頻工作站)。Hexachord沒Aiva那么大投入和多部門參與,沒Aiva那么強大,生成的音樂還比較生硬,不好直接商業(yè)化使用,需要經(jīng)過修改加工。而Hexachord未來肯定會繼續(xù)升級,推出更高級的新版本。

據(jù)微軟透露,目前已成立的獨立的微軟小冰工作室,會對人類詩歌、作詞、作曲、繪畫等創(chuàng)造能力進行系統(tǒng)性地建模,先期使用深度學習技術對人類的創(chuàng)造力進行模仿,最終讓機器獲取自我創(chuàng)造的能力。
問題來了,人工智能作曲的邏輯跟人工智能寫作是一樣的,為什么人工智能作曲都這么強大了,微軟小冰寫的詩還這么蹩腳呢?
想想,畢竟音樂的音符就那么些,很有限,而文字的數(shù)量太多了,變化太豐富,人工智能寫作目前還缺乏創(chuàng)造性也情有可原。再想深一層,
個人認為,人工智能寫作目前面臨天花板止步不前的根本原因在于針對文學創(chuàng)作的建模未能做得夠好。在音樂領域,已經(jīng)有十分完善的音樂創(chuàng)作理論、和聲學;而在文學方面,可能微軟小冰工作室對文學創(chuàng)作理論未有系統(tǒng)性的充分了解。
11月7日,第五屆世界互聯(lián)網(wǎng)大會在烏鎮(zhèn)互聯(lián)網(wǎng)國際會展中心舉行。微軟全球副總裁沈向洋在會上發(fā)表了關于人工智能的主題演講,他說比爾蓋茨在創(chuàng)立微軟研究院的時候就提出了人機協(xié)作的愿景。
確實,人機協(xié)作是正確之道。像人工智能作曲,一般而言只能創(chuàng)作出通用化的音樂,如果需要更具個性化的音樂,就需要人機協(xié)作。人工智能的出現(xiàn)和發(fā)展給人類帶來了挑戰(zhàn),而人類則需要擁抱人工智能,人工智能消滅了一批工作崗位,也能提供新的基于人機協(xié)作的崗位。人機協(xié)作,共創(chuàng)未來,這是一個很好的愿景。
第一次工業(yè)革命發(fā)生于18世紀60年代至19世紀中期,人類開始進入蒸汽時代;第二次工業(yè)革命發(fā)生于19世紀下半葉至20世紀初,人類開始進入電氣時代;第三次工業(yè)革命發(fā)生于20世紀后半期,約在第二次世界大戰(zhàn)之后,人類進入科技時代,即生物科技與產(chǎn)業(yè)革命;而現(xiàn)在我們面臨的,是以人工智能為代表的第四次工業(yè)革命。
以前,機器的出現(xiàn)消滅了一批工作崗位,而人類學會了使用機器又獲得了新的工作崗位;現(xiàn)在,對于人工智能的出現(xiàn)和發(fā)展也是如此。
我是非常推崇人機協(xié)作的。比如Band-in-a-Box、Hexachord提供給了音樂人很好的協(xié)作工具,人工智能寫作也應如此。
審視一部小說,特別是現(xiàn)在的網(wǎng)絡小說,其中會有一些獨創(chuàng)的東西,另外會有更多的雷同的東西。獨創(chuàng)的內(nèi)容,如獨特的人物、人物關系、情節(jié)設計;至于雷同的內(nèi)容,君不見,每部影視劇都會有很多類似的片段,如角色坐在一起吃飯聊天,在路上走動,飛車追逐……
獨創(chuàng)的內(nèi)容,是作品的亮點,是作品成立的關鍵;而吃飯聊天走路開車這些片段,寫起來是浪費作家的時間和精力,最好能交由人工智能去做,人工智能也能做得更快。
在未來,人工智能寫作軟件應該要、應能做到,作家只需自己構(gòu)思一些作品獨創(chuàng)的東西,別的交由人工智能去構(gòu)建。其實我說的這些,跟現(xiàn)在人工智能音樂軟件的發(fā)展情況很相似。這是我對于人工智能寫作人機協(xié)作的愿景,也是更多其它領域人工智能發(fā)展未來的愿景。