偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

利用人工智能對(duì)文本內(nèi)容進(jìn)行自動(dòng)摘要

原創(chuàng) 精選
人工智能
文本自動(dòng)摘要,對(duì)于閱讀長(zhǎng)篇幅的文本,比如博士畢業(yè)論文、咨詢報(bào)告、審計(jì)報(bào)告等內(nèi)容,非常有幫助。對(duì)于趕時(shí)間的當(dāng)代人來(lái)說(shuō),文本自動(dòng)摘要無(wú)疑是隨身辦公的文書(shū)利器。希望通過(guò)本文,廣大的互聯(lián)網(wǎng)從業(yè)者能夠有所收獲。

想了解更多AIGC的內(nèi)容,請(qǐng)?jiān)L問(wèn):

51CTO AI.x社區(qū)

http://www.szyisi.cn/aigc/

隨著互聯(lián)網(wǎng)上各種 UGC 越來(lái)越多,各種原創(chuàng)性的長(zhǎng)文本內(nèi)容也不斷地涌現(xiàn)出來(lái)。例如,在人工智能領(lǐng)域的三大頂會(huì)之一的  ICML,許多論文的長(zhǎng)度都達(dá)到了二三十頁(yè)。因此,如何快速的從長(zhǎng)文本中提取出有用的信息,成為困擾許多包括科研人員在內(nèi)的互聯(lián)網(wǎng)網(wǎng)民的難題。

在 2012 年結(jié)束的人工智能領(lǐng)域頂會(huì) AAAI 2012 上,來(lái)自中國(guó)浙江大學(xué)的研究團(tuán)隊(duì),發(fā)表了一篇題為 Document Summarization Based on Data Reconstruction 的論文。該篇論文提出了 DSDR 算法,描述了如何利用貪心算法進(jìn)行文本摘要提取的方法。論文下載地址在這里:Document Summarization Based on Data Reconstruction (nju.edu.cn)。下面我們介紹一下他們的方法。

所謂的文本自動(dòng)摘要問(wèn)題,本質(zhì)上就是從原始的長(zhǎng)文本中抽取一個(gè)文本的子集合,使得利用這個(gè)子集合的線性組合能盡可能的恢復(fù)出原始文本。我們按照如下方式定義文本自動(dòng)摘要問(wèn)題:

其中, f 是線性組合摘要句子之后的轉(zhuǎn)換函數(shù)。X 是摘要生成的句子,a 是線性組合的系數(shù),而  v 是原始文本,也就是輸入數(shù)據(jù)。

首先,f 可以是線性組合,也就是:

因此,文本自動(dòng)摘要問(wèn)題轉(zhuǎn)換成為了下述問(wèn)題:

上述損失函數(shù)公式,等價(jià)于下面的公式:

利用貪心算法,我們?cè)O(shè)計(jì)了如下?lián)p失函數(shù):

整個(gè)算法的偽代碼流程如下所示:

在上面介紹的算法中,線性組合的系數(shù) a 有可能是負(fù)數(shù),為了保證 a 非負(fù),我們重構(gòu)了算法的損失函數(shù):

經(jīng)過(guò)重新設(shè)計(jì)之后,算法的偽代碼如下:

通過(guò)對(duì)比實(shí)驗(yàn),我們發(fā)現(xiàn)新設(shè)計(jì)的算法,取得了優(yōu)異的實(shí)驗(yàn)結(jié)果:

文本自動(dòng)摘要,對(duì)于閱讀長(zhǎng)篇幅的文本,比如博士畢業(yè)論文、咨詢報(bào)告、審計(jì)報(bào)告等內(nèi)容,非常有幫助。對(duì)于趕時(shí)間的當(dāng)代人來(lái)說(shuō),文本自動(dòng)摘要無(wú)疑是隨身辦公的文書(shū)利器。希望通過(guò)本文,廣大的互聯(lián)網(wǎng)從業(yè)者能夠有所收獲。

作者介紹

汪昊,前 Funplus 人工智能實(shí)驗(yàn)室負(fù)責(zé)人。曾在 ThoughtWorks, 豆瓣,百度,新浪,網(wǎng)易等公司有超過(guò) 13 年的技術(shù)研發(fā)和技術(shù)高管經(jīng)驗(yàn)。先后在科技公司上線過(guò) 10 余款成功的商業(yè)產(chǎn)品。擔(dān)任過(guò)創(chuàng)業(yè)公司的 CTO和技術(shù)副總裁。精通數(shù)據(jù)挖掘、計(jì)算機(jī)圖形學(xué)和數(shù)字博物館領(lǐng)域的技術(shù)、技術(shù)管理和技術(shù)變現(xiàn)等內(nèi)容。在國(guó)際學(xué)術(shù)會(huì)議和期刊如  IEEE TVCG 和  IEEE / ACM ASONAM 上發(fā)表論文 39 篇,獲得最佳論文獎(jiǎng) 1 次(IEEE SMI 2008)和最佳論文報(bào)告獎(jiǎng) 4 次(ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 / ICSIM 2024)。

想了解更多AIGC的內(nèi)容,請(qǐng)?jiān)L問(wèn):

51CTO AI.x社區(qū)

http://www.szyisi.cn/aigc/

責(zé)任編輯:姜華 來(lái)源: 51CTO內(nèi)容精選
相關(guān)推薦

2024-03-14 08:00:00

人工智能生成式對(duì)抗網(wǎng)絡(luò)網(wǎng)絡(luò)釣魚(yú)

2021-08-13 09:47:58

人工智能保險(xiǎn)業(yè)AI

2020-04-17 10:14:47

人工智能AI客戶服務(wù)

2025-02-10 10:00:33

2021-09-06 10:29:08

保險(xiǎn)行業(yè)人工智能AI

2022-03-03 09:43:34

人工智能電網(wǎng)機(jī)器學(xué)習(xí)

2022-06-20 11:05:58

通用人工智能機(jī)器人

2021-04-16 11:28:26

人工智能人工智能工程AI

2022-05-24 15:29:48

人工智能大數(shù)據(jù)心理測(cè)量

2024-11-20 13:20:32

2022-10-18 16:15:22

人工智能塑料廢物

2024-02-28 14:45:39

人工智能數(shù)據(jù)管理AI

2019-08-14 15:27:39

人工智能技術(shù)經(jīng)濟(jì)

2020-08-11 23:19:08

人工智能生物多樣性A

2022-05-27 08:16:35

端點(diǎn)安全人工智能網(wǎng)絡(luò)安全

2017-11-23 08:24:31

人工智能網(wǎng)頁(yè)設(shè)計(jì)

2023-03-11 22:44:04

人工智能特斯拉

2024-01-24 18:00:57

2019-08-28 06:32:19

食物物聯(lián)網(wǎng)人工智能

2020-10-26 14:20:30

人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)