偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

不同的語(yǔ)言,相同的信息:17種語(yǔ)言研究揭示如何以相似的速度交流

大數(shù)據(jù) 數(shù)據(jù)分析
如果準(zhǔn)備去另一個(gè)國(guó)家旅行,最令人頭大的肯定是語(yǔ)言不通的問(wèn)題,有時(shí)甚至還會(huì)抱怨語(yǔ)言的分類過(guò)于細(xì)化。但是,里昂大學(xué)研究人員的一項(xiàng)新研究表明,語(yǔ)言之間的差異可能比想象的要小。

大數(shù)據(jù)文摘出品

編譯:李世林、劉俊寰

如果準(zhǔn)備去另一個(gè)國(guó)家旅行,最令人頭大的肯定是語(yǔ)言不通的問(wèn)題,有時(shí)甚至還會(huì)抱怨語(yǔ)言的分類過(guò)于細(xì)化。

但是,里昂大學(xué)研究人員的一項(xiàng)新研究表明,語(yǔ)言之間的差異可能比想象的要小。

“語(yǔ)言在音節(jié)所包含的信息以及說(shuō)話的速度方面差異很大。但有趣的是,這兩種語(yǔ)言是相互平衡的,因此信息密集的語(yǔ)言說(shuō)得慢,而信息較少的語(yǔ)言說(shuō)得快。這意味著不同語(yǔ)言之間有一個(gè)非常相似的穩(wěn)定的信息率。”該研究的共同作者,來(lái)自里昂大學(xué)的語(yǔ)言動(dòng)力學(xué)實(shí)驗(yàn)室研究員Dediu說(shuō)道。

通用常數(shù)的探尋

在試圖為語(yǔ)言找到一個(gè)“通用”常數(shù)的過(guò)程中,Dediu的團(tuán)隊(duì)面臨著相當(dāng)大的挑戰(zhàn)。世界上有超過(guò)7000種不同的語(yǔ)言,它們之間的聯(lián)系非常少。這甚至擴(kuò)展到信息如何用文字編碼的基本度量。

例如,不同語(yǔ)言中每個(gè)單詞的音節(jié)數(shù)量差別很大,這意味著香農(nóng)信息率也不同。然而,Dediu和他的團(tuán)隊(duì)很有遠(yuǎn)見(jiàn),不僅考慮了單詞,也考慮了單詞的使用頻率。

Dediu和他的同事使用了來(lái)自歐洲和亞洲17種不同語(yǔ)言的170名成年人的錄音。每位演講者的任務(wù)是閱讀一組15個(gè)大段的文本,大約由24萬(wàn)個(gè)音節(jié)組成。

一秒鐘有幾個(gè)音節(jié)?

研究人員選擇音節(jié)作為他們唯一的信息單位,這是基于在另外兩種選擇上采用的:

  • 音素:幫助我們區(qū)分單個(gè)單詞的聲音單位,被排除在外,因?yàn)榈碌蠚W的團(tuán)隊(duì)意識(shí)到,它們?cè)谥v話中很容易被省略
  • 詞匯:被認(rèn)為是過(guò)于語(yǔ)言特異性,不便于比較

有了數(shù)據(jù)集和度量標(biāo)準(zhǔn)之后,科學(xué)家們檢驗(yàn)了他們的結(jié)果,由此揭示了世界語(yǔ)言之間的一些有趣的差異:

  • 英語(yǔ)中有近7000個(gè)音節(jié),而日語(yǔ)只有幾百個(gè)
  • 語(yǔ)速?gòu)?.3個(gè)音節(jié)到每秒9.1個(gè)音節(jié)不等
  • 元音和諧(一種引人入勝的語(yǔ)言創(chuàng)新,要求后綴與所連接的單詞保持“和諧”)出現(xiàn)在四種語(yǔ)言中

簡(jiǎn)而言之,這些語(yǔ)言聽(tīng)起來(lái)完全不同。

盡管如此,Dediu的團(tuán)隊(duì)注意到,考慮到書面文本的語(yǔ)速和信息密度,所有記錄的語(yǔ)言信息率基本一致;信息豐富的文本閱讀速度較慢,而信息較少的語(yǔ)言閱讀速度更快。

[[276772]]

語(yǔ)言就像姜餅人和馴鹿:這兩個(gè)B/W版本使用不同的分辨率和灰度級(jí)別,但編碼的信息相同,就像語(yǔ)言交換不同的策略,但同樣有效。資料來(lái)源:丹·德迪歐,里昂第二大學(xué)。

研究人員確定了一個(gè)數(shù)字——39.15位/秒,作為17種語(yǔ)言的平均信息率,這就又引出一些有趣的發(fā)現(xiàn),例如,女性演講者的演講和信息率較低。

研究小組發(fā)現(xiàn),書面文本的差異對(duì)信息率幾乎沒(méi)有影響,這表明研究結(jié)果可以推廣到本文基于文本的研究之外。語(yǔ)音速率和音節(jié)數(shù)的變化明顯大于信息速率,信息速率是有效的跨語(yǔ)言連接手段。

這對(duì)我們的大腦意味著什么?

研究人員認(rèn)為,這一發(fā)現(xiàn)意味著信息率必須穩(wěn)定在一個(gè)較緊的平均值附近,因?yàn)檫^(guò)高的信息率會(huì)阻礙大腦處理數(shù)據(jù)和清晰表達(dá)語(yǔ)言的能力;另一方面,低信息率要求大腦在提取意思之前記住太多的單詞。

這突出了語(yǔ)言的雙重角色, Dediu總結(jié)道:“就如同硬幣的兩面性,談及語(yǔ)言也有兩面性,一個(gè)是文化上,一個(gè)是生物性的,當(dāng)說(shuō)一門語(yǔ)言的信息變得更加密集,說(shuō)話者也會(huì)開(kāi)始放慢語(yǔ)速。”

相關(guān)報(bào)道:

https://www.technologynetworks.com/neuroscience/news/different-tongue-same-information-17-language-study-reveals-how-we-all-communicate-at-a-similar-323584

【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】

     大數(shù)據(jù)文摘二維碼

 

戳這里,看該作者更多好文 

 

 

責(zé)任編輯:趙寧寧 來(lái)源: 51CTO
相關(guān)推薦

2021-11-04 23:17:50

人工智能自然語(yǔ)言技術(shù)

2023-06-01 17:06:49

模型思維

2013-03-12 14:07:06

Java編程

2021-07-20 15:42:05

編程語(yǔ)言PythonJava

2023-04-10 18:34:25

編程語(yǔ)言開(kāi)發(fā)

2017-10-30 08:53:22

2010-01-21 16:24:02

C++語(yǔ)言

2022-04-24 15:55:22

Go語(yǔ)言語(yǔ)言函數(shù)

2021-01-29 12:28:13

編程語(yǔ)言開(kāi)發(fā)代碼

2021-01-28 23:40:58

編程語(yǔ)言PythonPerl

2010-07-30 13:25:36

Flex

2010-01-25 15:09:17

C++語(yǔ)言

2024-04-24 12:03:20

2015-01-04 13:42:15

編程語(yǔ)言

2020-02-05 17:09:28

編程語(yǔ)言代碼Ruby

2021-11-22 17:47:21

模型人工智能深度學(xué)習(xí)

2017-05-23 08:50:17

AI機(jī)器人

2010-01-20 15:12:45

C++語(yǔ)言

2010-03-09 16:26:08

Python列表

2010-08-19 09:51:00

C# 4
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)