打工人遇見大模型:外面的世界已經(jīng)這樣辦公了嗎?
在辦公場景中,制作 PPT 是最常見的工作之一。工作匯報、產(chǎn)品發(fā)布、活動策劃、專業(yè)講座等都需要使用 PPT。
傳統(tǒng)的 PPT 制作過程枯燥瑣碎,耗費(fèi)時間、精力。特別是將 word 格式的報告文檔轉(zhuǎn)換成 PPT,要花費(fèi)大量時間閱讀文檔內(nèi)容、梳理要點(diǎn),還要精心排版、調(diào)整字體圖片等等,并且改動 word 文檔 PPT 就要重新梳理調(diào)整。
有沒有一種可能,做 PPT 這件事可以自動化?
在大模型的加持下,百度文庫做到了。百度文庫在接入文心一言后已從「文檔搜索工具」全面重構(gòu)成「一站式智能文檔平臺」,涵蓋 PPT 智能生成、文檔智能生成、智能編輯、智能輔助閱讀等多個功能。
例如,對下面這篇文章,上傳 word 文檔,AI 就能根據(jù)文檔內(nèi)容迅速生成一份直接可用的 PPT。
早在今年 3 月,百度文庫就宣布接入「文心一言」,并開啟用戶內(nèi)測。8 月 31 日,百度文心一言正式向公眾開放,作為行業(yè)首個「一站式智能文檔平臺」,百度文庫的「PPT 智能生成」等文檔創(chuàng)作功能在開放首日就迎來超 200 萬人次體驗(yàn)。
為了收獲「一站式」的智能創(chuàng)作體驗(yàn),我們對百度文庫新上線的 AI 功能進(jìn)行了全面的測試。
PPT 智能生成
最近幾年,制作 PPT 越來越卷,各種 PPT 神器受到大家追捧。但這些制作工具需要按其要求使用,有時甚至?xí)?PPT 的制作復(fù)雜化。
為了把制作 PPT 簡單化、自動化,百度文庫文檔助手推出了兩種 PPT 智能生成功能:一句話直接生成 PPT 和上傳 word 生成 PPT。
輸入主題直接生成 PPT
隨著生成式 AI 取得進(jìn)展,行業(yè)內(nèi)出現(xiàn)了一些 AI 生成 PPT 的工具,其中大部分工具的主要功能就是輸入主題生成 PPT,例如 Gamma。
為了衡量百度文庫的生成效果,我們用「生成一個關(guān)于恐龍的歷史的 PPT」這句話,對 Gamma 和百度文庫進(jìn)行了測試和對比。
Gamma 首先生成了一個內(nèi)容大綱,但最終生成的 PPT 只有 7 頁,沒有目錄的展示頁:
且 PPT 內(nèi)容簡單,排版格式也比較單調(diào):
Gamma 輸入主題生成 PPT 效果示例。
同樣的語句,百度文庫首先也是生成內(nèi)容大綱,但是比較詳細(xì),包含兩級內(nèi)容要點(diǎn):
最終百度文庫生成的 PPT 共 24 頁,從恐龍的特征、演化到恐龍研究的概況,內(nèi)容豐富完備,排版多樣美觀,幾乎可以直接使用,生成效果和實(shí)用價值遠(yuǎn)超 Gamma 等 PPT 工具。
百度文庫「輸入主題直接生成 PPT」效果示例。
上傳 word 生成 PPT
相比于輸入主題生成 PPT,將 word 文檔轉(zhuǎn)換成 PPT 難度更大。
一方面,解析一句話是模型根據(jù)話題進(jìn)行擴(kuò)展;而解析一篇文章需要從文章本身的主次結(jié)構(gòu)出發(fā),分析全文的重點(diǎn)要點(diǎn)、行文邏輯、內(nèi)容風(fēng)格,對文章進(jìn)行充分的理解和解構(gòu),才能生成合乎文章邏輯、完整豐富的 PPT。
另一方面,word 文章的質(zhì)量往往是參差不齊的。有的文章內(nèi)容非常簡單,需要 AI 模型在生成 PPT 的過程中加以豐富;有的文章內(nèi)容復(fù)雜、專業(yè),需要 AI 模型提煉總結(jié),可能還會用到大模型的知識儲備。這對大模型的能力提出了更高的要求。
此外,PPT 中通常需要一些配圖,輸入主題生成 PPT 只需根據(jù)主題找到合適的圖片;而根據(jù) word 生成 PPT,配圖要符合文章主題、段落大意,還要與文章風(fēng)格適配等等,限制較多。
為了測試百度文庫將 word 文檔轉(zhuǎn)換成 PPT 的能力,我們上傳了一篇題為《智能家居技術(shù)的前沿發(fā)展》的文章:
《智能家居技術(shù)的前沿發(fā)展》word 文檔部分截圖。
百度文庫的文檔助手還是先根據(jù) word 文檔的內(nèi)容生成了一份詳細(xì)的大綱:
點(diǎn)擊「生成 PPT」,選擇模板后生成了一份 36 頁的 PPT:
總體上講,這份 PPT 內(nèi)容豐富、排版美觀,整體帶有與文章相符的科技感。人工制作這樣一份 PPT 可能至少要花費(fèi)數(shù)十分鐘,但 AI 加持的百度文庫只用了大約 30 秒。
具體來說,PPT 在 word 文檔的基礎(chǔ)上擴(kuò)展了很多內(nèi)容。以「智能照明」為例,word 文檔中的內(nèi)容只有短短數(shù)行文字:
word 文檔中關(guān)于「智能照明」的全部內(nèi)容。
而在百度文庫生成的 PPT 中,「智能照明」部分首先介紹了智能照明控制系統(tǒng)和智能照明器具,其次闡述了智能照明市場的規(guī)模和發(fā)展趨勢,然后指出智能照明系統(tǒng)的優(yōu)勢和不足,最后展望了智能照明技術(shù)的發(fā)展趨勢和面臨的挑戰(zhàn)。
我們發(fā)現(xiàn),百度文庫生成的 PPT 中包含了很多 word 文檔以外的信息。這就需要百度文庫借助「文心一言」大模型,對 word 文檔的內(nèi)容進(jìn)行深入解析,并生成知識型內(nèi)容。此外,PPT 中的配圖也很符合 word 文章的主題 —— 智能家居,這也需要利用大模型強(qiáng)大的理解能力。
生成帶有圖表的 PPT
數(shù)據(jù)圖表是 PPT 中常見的一種內(nèi)容形式,它能夠?qū)ο嚓P(guān)成果進(jìn)行量化展示,直觀清晰。為了測試百度文庫能否生成含有數(shù)據(jù)圖表的 PPT,我們在文檔助手的對話框中輸入需求:「生成一份 A 智能家居公司的財(cái)報分析 PPT」。
文檔助手還是先生成一份 PPT 大綱,值得注意的是,大綱中不僅有財(cái)務(wù)數(shù)據(jù)及分析的內(nèi)容,還有公司的基本介紹和行業(yè)的趨勢展望。這說明文檔助手了解財(cái)報分析 PPT 的常見用途是什么,并且知道財(cái)報分析需要哪些專業(yè)數(shù)據(jù),例如利潤、資產(chǎn)、現(xiàn)金流、總營收等等。
在生成的 PPT 中,文檔助手為不同的財(cái)務(wù)數(shù)據(jù)生成了不同類型的數(shù)據(jù)圖表,包括柱狀圖、折線圖、數(shù)據(jù)表格等,并且每張圖表均有文字解讀。
例如,總資產(chǎn)詳情數(shù)據(jù)頁面包含一張總資產(chǎn)柱狀圖、一張總資產(chǎn)同比增長率的數(shù)據(jù)表和一段對總資產(chǎn)變化情況的分析文本。其中,同比增長率是根據(jù)總資產(chǎn)數(shù)據(jù)計(jì)算得來。在人工制作財(cái)報分析 PPT 時,同比增長率等數(shù)據(jù)需要單獨(dú)計(jì)算再添加到 PPT 中,而百度文庫的文檔助手借助 AI 大模型直接生成了全部數(shù)據(jù)。
如果我們需要對文檔助手生成的 PPT 加以修改,也可以直接讓文檔助手幫忙操作,例如修改 PPT 的主題色:
如此一來,制作一份 PPT,從需求到成稿大約只需幾分鐘,辦公效率提升的不是一點(diǎn)半點(diǎn)。
動動嘴生成 PPT
最后,我們發(fā)現(xiàn)上述所有功能在百度文庫 app 上均可使用,并且還有一個額外的功能:動動嘴就能生成 PPT,即在移動端百度文庫 app 上我們可以直接語音輸入需求,文檔助手就能完成生成 PPT 的任務(wù)。
例如,我們語音描述需求:「生成一個介紹玫瑰花的 PPT」,百度文庫 app 生成 PPT 的全過程如下視頻所示:
文檔智能生成
有了 word 文檔,AI 可以生成 PPT,而 word 文檔也可以直接 AI 生成。
我們知道,大語言模型最擅長的任務(wù)之一就是文本生成,AI 輔助文本創(chuàng)作也是當(dāng)前大模型最常見的應(yīng)用方向之一,特別是在辦公場景中有著廣泛的應(yīng)用前景。
作為一站式智能文檔平臺,百度文庫已經(jīng)上線「生成大綱」、「頭腦風(fēng)暴」等多個面向文本的功能,在百度文庫中新建文檔就可以直接使用這些 AI 功能。
AI 幫你寫
為了測試從頭開始創(chuàng)作文本的能力,我們用百度文庫擬了一份「編輯招聘文案」。
如下圖所示,智能生成的結(jié)果符合招聘文案格式要求,包括公司簡介、職位描述、崗位要求、福利待遇、應(yīng)聘方式、公司地址幾個方面,并根據(jù)「編輯」這個具體的崗位展開介紹職位描述和崗位要求。只需根據(jù)具體情況調(diào)整部分信息就可以實(shí)際使用。
然后我們又測試了百度文庫的英文寫作能力,用中文輸入需求:「寫一篇英文作文,題目是《秋》」。百度文庫生成的文章從秋天的景象寫到秋天人們的行為活動,行文流暢、詞匯豐富。
寫大綱
與招聘文案、電子郵件等辦公文本不同,撰寫知識型介紹文章往往需要搜集資料、寫大綱等前期準(zhǔn)備工作。百度文庫作為一個收錄大量知識型文檔的平臺,在 AI 寫大綱這個功能可以根據(jù)用戶提供的主題迅速列出文章的大綱框架。
例如,我們用「茶」這個主題測試了百度文庫的「寫大綱」功能,生成的大綱框架中包括茶的歷史、分類、制作、品鑒、文化、未來幾大部分,每部分又細(xì)分出幾個小節(jié)。
頭腦風(fēng)暴
除了擬大綱和寫作,在實(shí)際的工作生活中,文本創(chuàng)作最關(guān)鍵的一步是尋找思路?;谖男囊谎源竽P偷纳赡芰桶俣任膸熵S富的文檔儲備,「頭腦風(fēng)暴」這個功能可以為用戶迅速找到多個角度。
例如,以「洗發(fā)水產(chǎn)品營銷方案」為例,「頭腦風(fēng)暴」功能迅速給出了「品牌故事」、「目標(biāo)市場分析」、「產(chǎn)品特點(diǎn)」、「價格策略」等多個思路。
當(dāng)然,這些功能也可以在文檔助手中直接使用,例如在對話框中直接輸入需求:「幫我寫一篇產(chǎn)品促銷活動策劃方案」,文檔助手的生成結(jié)果如下圖所示:
整個文案共包括目標(biāo)市場分析、促銷目的和目標(biāo)、促銷策略制定、促銷活動內(nèi)容、促銷執(zhí)行方案、促銷預(yù)算和資源需求、促銷效果評估和總結(jié)七個部分,覆蓋了活動策劃的各個方面。
值得注意的是,百度文庫生成的文本質(zhì)量很高,完備且詳細(xì),這源于百度文庫超大規(guī)模的高質(zhì)量文檔資源。多年來,百度文庫收錄內(nèi)容總量已突破 12 億,這讓百度文庫文檔助手在智能文本編輯方面具有獨(dú)特的優(yōu)勢。
在實(shí)際工作中,活動策劃、工作報告等文案撰寫是極為常見的日常工作。人工完成這些工作可能需要數(shù)天時間,而百度文庫的文檔助手可以又快又好地完成這些任務(wù)??磥?,只要盡可能詳細(xì)地描述寫作需求,我們就可以用 AI 輔助完成很多工作任務(wù),工作效率將呈數(shù)量級提升。
智能編輯
相比于從頭開始創(chuàng)作文本,大模型在編輯文本方面并不擅長。這是因?yàn)榇竽P偷纳墒潜容^隨機(jī)的、生成文本長短不一,而文本編輯要求對文本做出準(zhǔn)確、細(xì)致的調(diào)整,并且往往有字?jǐn)?shù)限制。
當(dāng)前,大模型在表述完整性和嚴(yán)格字?jǐn)?shù)限制之間,很難做到平衡。模型在訓(xùn)練過程中學(xué)習(xí)到的知識會影響其輸出的字?jǐn)?shù),而大模型本身輸出內(nèi)容的多樣性要求,可能會導(dǎo)致輸出不穩(wěn)定。因此,將大模型應(yīng)用于文本編輯具備一定的挑戰(zhàn)性。
我們發(fā)現(xiàn)百度文庫目前已經(jīng)上線多個智能編輯功能,克服了一些技術(shù)難點(diǎn)。在百度文庫中編輯文檔時,選中文檔中的段落就會自動彈出「AI 智能編輯」按鈕,點(diǎn)擊會出現(xiàn)一個 AI 編輯文本的功能菜單,可以對文本進(jìn)行潤色、修訂、總結(jié)、縮寫、擴(kuò)寫、改變語氣等。
我們嘗試對一段文本進(jìn)行 AI 潤色,結(jié)果如下圖所示,一段文本被豐富成兩段,文字描述更加細(xì)膩:
為了測試 AI 文本修訂功能,我們對原文稍作修改,使其含有語病,句子不通順,然后選擇「詞匯 & 語法修訂」功能,百度文庫 AI 修訂的結(jié)果如下圖所示:
我們還在百度文庫中選擇了一篇自動駕駛相關(guān)的文章來測試縮寫和擴(kuò)寫功能,旨在評估智能編輯對于專業(yè)性較強(qiáng)的文章效果如何。
如下圖所示,選擇縮寫功能后,百度文庫把兩段文字縮寫成了一段,并且清楚闡述了原文中重要的概念和因果關(guān)系。
在擴(kuò)寫方面,我們發(fā)現(xiàn)擴(kuò)寫后的內(nèi)容添加了「自動駕駛汽車通過激光雷達(dá)、攝像頭、超聲波傳感器等設(shè)備獲取周圍環(huán)境的信息」等專業(yè)表述,這是百度文庫根據(jù)自動駕駛發(fā)展現(xiàn)狀延伸擴(kuò)展的,這說明百度文庫已經(jīng)掌握了一些知識,能夠?qū)I(yè)性較強(qiáng)的內(nèi)容進(jìn)行智能編輯。
百度文庫能夠借助 AI 完成多種文本編輯任務(wù),這說明其已經(jīng)熟練掌握文本的語法、語義和語言風(fēng)格等。在實(shí)際的文本編寫工作中,這樣的輔助編輯工具會為我們節(jié)省大量時間和精力。
此外,我們還發(fā)現(xiàn)文檔助手可以根據(jù)文本內(nèi)容生成數(shù)據(jù)圖表:選中含有數(shù)據(jù)的段落,右側(cè)文檔助手就會自動彈出「生成圖表」的選項(xiàng)。該功能不僅可以生成數(shù)據(jù)圖表,還會根據(jù)文章內(nèi)容和數(shù)據(jù)情況作出解析。
例如,我們用一篇《公司財(cái)務(wù)報表分析案例》中一段涉及銷售利潤率的段落測試了該功能。結(jié)果如下圖所示,文檔助手生成了一張銷售利潤率柱狀圖,并給出了原因分析、解決方案、洞察和建議等等。
智能輔助閱讀
在辦公場景中,大模型的長文總結(jié)能力也具有很多實(shí)際用途,例如查閱參考資料、提煉會議記錄、速讀合同條款等等。
作為一個月活躍用戶超過 1 億的平臺,在百度文庫上,以前我們搜索資料通常是用搜索關(guān)鍵詞的方法,找到資料后,我們需要粗略查看文獻(xiàn)目錄和內(nèi)容,以找到所需信息。
現(xiàn)在,百度文庫可以借助文心一言大模型為其收錄的文檔生成簡短的摘要,讓用戶能夠迅速了解文檔內(nèi)容,做到智能輔助閱讀,節(jié)省辦公時間。這讓上億用戶在百度文庫查閱資料更加方便迅速,成為 AI 學(xué)習(xí)辦公的「原住民」。
例如,我們讓文檔助手總結(jié)百度文庫中一篇題為《人工智能的發(fā)展及應(yīng)用》的長文:
還可以根據(jù)文檔內(nèi)容回答相關(guān)問題。例如根據(jù)該文章回答:「人工智能是何時提出的?」文檔助手可以給出正確的回答,并且會指出參照的文章依據(jù)是什么。
總結(jié)文檔內(nèi)容、回答相關(guān)問題等功能也適用于 PDF 文檔。例如,在閱讀一篇關(guān)于多智能體強(qiáng)化學(xué)習(xí)的基礎(chǔ)和應(yīng)用的萬字長文時,直接選擇右側(cè)文檔助手中的「幫我總結(jié)文檔大意」,AI 就迅速給出了一份文檔內(nèi)容總結(jié),這樣只需幾秒我們就能大體了解一篇萬字長文的內(nèi)容。
以秒計(jì)時的全新辦公模式
今年,生成式 AI 掀起了一場生產(chǎn)工具變革浪潮。大模型從最初的生成效果驚艷,到開始探索應(yīng)用方向,再到現(xiàn)在有了一些較為成熟的應(yīng)用,大模型已經(jīng)從技術(shù)走向落地。文心一言加持的百度文庫就是一個很好的例子。
以前,word 文檔、PPT、搜索工具在辦公場景中各司其職,辦公往往需要跨平臺。雖然內(nèi)容有很大的相關(guān)性,但編寫 word 文檔和制作 PPT 是兩項(xiàng)單獨(dú)的工作,并且每個工作都需要花費(fèi)較多的時間來完成,例如編寫文檔就需要搜索資料、構(gòu)建大綱、撰寫文章、潤色編輯等步驟。
現(xiàn)在,只需要一句話,百度文庫就能生成完備詳盡的文檔內(nèi)容,上傳文檔就能直接生成 PPT,整個過程可能只需要幾分鐘。從這個角度看,百度文庫解決了「辦公跨平臺」這個長期存在的痛點(diǎn),「一站式」辦公成為現(xiàn)實(shí)。
那么,百度文庫可以給日常工作帶來哪些具體的益處呢?
從工作效率上講,百度文庫生成 PPT 大約需要 30 秒,創(chuàng)作文檔約 15 秒,總結(jié)萬字長文只需 10 秒。其中任何一項(xiàng)任務(wù),人工完成的時間至少是數(shù)十分鐘,有時甚至需要數(shù)天時間。我們可以用節(jié)省出來的時間完成更有創(chuàng)新性的工作,制作 PPT 等相對程式化的工作交給 AI 來完成,讓辦公效率呈數(shù)量級提升。
從生成質(zhì)量上看,百度文庫生成的內(nèi)容質(zhì)量非常高,邏輯清晰、內(nèi)容豐富,往往只需要人們根據(jù)實(shí)際情況對生成內(nèi)容進(jìn)行調(diào)整就可以直接使用。這也是百度文庫作為「一站式智能文檔創(chuàng)作平臺」可以實(shí)際應(yīng)用的重要原因。全面上線僅一個月的時間,百度文庫 AI 新功能的累計(jì)用戶已超過千萬,累計(jì)生成內(nèi)容超 2000 萬,累計(jì)生成 PPT 超 200 萬。
從使用場景看,以前我們辦公通常是依賴于 PC 端,時空條件有所限制?,F(xiàn)在,使用百度文庫 app,在移動端僅用非常簡單的操作就能完成編寫文檔、制作 PPT 等任務(wù),打破了辦公場景在時間和空間上的限制。
實(shí)際上,自大模型嶄露頭角以來,行業(yè)內(nèi)一直在努力提升大模型的性能,以使其能夠投入實(shí)際應(yīng)用。百度文庫能成為行業(yè)首個一站式智能文檔創(chuàng)作平臺,來源于三個關(guān)鍵因素。
首先,文心一言大模型基于非常精細(xì)的數(shù)據(jù)訓(xùn)練出了強(qiáng)大的理解能力、生成能力和邏輯能力,這幾方面的能力會讓其加持的百度文庫能夠精準(zhǔn)理解用戶需求、生成內(nèi)容邏輯清晰、豐富合理。
其次,百度文庫本身具有 12 億高質(zhì)量文檔,這是百度文庫重構(gòu)的內(nèi)容優(yōu)勢。這些文檔也是文心一言大模型的重要訓(xùn)練數(shù)據(jù)之一,百度文庫和文心一言相輔相成。
第三,百度文庫自身的研發(fā)團(tuán)隊(duì)多年來一直在算法開發(fā)、應(yīng)用落地等層面努力探索。這為百度文庫重構(gòu)為「一站式智能文檔創(chuàng)作平臺」提供了技術(shù)保障。
文心一言問世不過幾個月的時間,百度文庫已經(jīng)攻克了多個技術(shù)難點(diǎn),未來還將持續(xù)迭代升級。
「我們給自己定的黃金標(biāo)準(zhǔn)就是最可用和最便捷」,百度副總裁、互娛和垂類平臺負(fù)責(zé)人王穎說道。
我們期待看到百度文庫上線更多智能創(chuàng)作功能,也期待看到大模型為生產(chǎn)力帶來進(jìn)一步的提升。