不同的語(yǔ)言,相同的信息:17種語(yǔ)言研究揭示如何以相似的速度交流
大數(shù)據(jù)文摘出品
編譯:李世林、劉俊寰
如果準(zhǔn)備去另一個(gè)國(guó)家旅行,最令人頭大的肯定是語(yǔ)言不通的問(wèn)題,有時(shí)甚至還會(huì)抱怨語(yǔ)言的分類過(guò)于細(xì)化。
但是,里昂大學(xué)研究人員的一項(xiàng)新研究表明,語(yǔ)言之間的差異可能比想象的要小。
“語(yǔ)言在音節(jié)所包含的信息以及說(shuō)話的速度方面差異很大。但有趣的是,這兩種語(yǔ)言是相互平衡的,因此信息密集的語(yǔ)言說(shuō)得慢,而信息較少的語(yǔ)言說(shuō)得快。這意味著不同語(yǔ)言之間有一個(gè)非常相似的穩(wěn)定的信息率。”該研究的共同作者,來(lái)自里昂大學(xué)的語(yǔ)言動(dòng)力學(xué)實(shí)驗(yàn)室研究員Dediu說(shuō)道。
通用常數(shù)的探尋
在試圖為語(yǔ)言找到一個(gè)“通用”常數(shù)的過(guò)程中,Dediu的團(tuán)隊(duì)面臨著相當(dāng)大的挑戰(zhàn)。世界上有超過(guò)7000種不同的語(yǔ)言,它們之間的聯(lián)系非常少。這甚至擴(kuò)展到信息如何用文字編碼的基本度量。
例如,不同語(yǔ)言中每個(gè)單詞的音節(jié)數(shù)量差別很大,這意味著香農(nóng)信息率也不同。然而,Dediu和他的團(tuán)隊(duì)很有遠(yuǎn)見(jiàn),不僅考慮了單詞,也考慮了單詞的使用頻率。
Dediu和他的同事使用了來(lái)自歐洲和亞洲17種不同語(yǔ)言的170名成年人的錄音。每位演講者的任務(wù)是閱讀一組15個(gè)大段的文本,大約由24萬(wàn)個(gè)音節(jié)組成。
一秒鐘有幾個(gè)音節(jié)?
研究人員選擇音節(jié)作為他們唯一的信息單位,這是基于在另外兩種選擇上采用的:
- 音素:幫助我們區(qū)分單個(gè)單詞的聲音單位,被排除在外,因?yàn)榈碌蠚W的團(tuán)隊(duì)意識(shí)到,它們?cè)谥v話中很容易被省略
- 詞匯:被認(rèn)為是過(guò)于語(yǔ)言特異性,不便于比較
有了數(shù)據(jù)集和度量標(biāo)準(zhǔn)之后,科學(xué)家們檢驗(yàn)了他們的結(jié)果,由此揭示了世界語(yǔ)言之間的一些有趣的差異:
- 英語(yǔ)中有近7000個(gè)音節(jié),而日語(yǔ)只有幾百個(gè)
- 語(yǔ)速?gòu)?.3個(gè)音節(jié)到每秒9.1個(gè)音節(jié)不等
- 元音和諧(一種引人入勝的語(yǔ)言創(chuàng)新,要求后綴與所連接的單詞保持“和諧”)出現(xiàn)在四種語(yǔ)言中
簡(jiǎn)而言之,這些語(yǔ)言聽(tīng)起來(lái)完全不同。
盡管如此,Dediu的團(tuán)隊(duì)注意到,考慮到書面文本的語(yǔ)速和信息密度,所有記錄的語(yǔ)言信息率基本一致;信息豐富的文本閱讀速度較慢,而信息較少的語(yǔ)言閱讀速度更快。
語(yǔ)言就像姜餅人和馴鹿:這兩個(gè)B/W版本使用不同的分辨率和灰度級(jí)別,但編碼的信息相同,就像語(yǔ)言交換不同的策略,但同樣有效。資料來(lái)源:丹·德迪歐,里昂第二大學(xué)。
研究人員確定了一個(gè)數(shù)字——39.15位/秒,作為17種語(yǔ)言的平均信息率,這就又引出一些有趣的發(fā)現(xiàn),例如,女性演講者的演講和信息率較低。
研究小組發(fā)現(xiàn),書面文本的差異對(duì)信息率幾乎沒(méi)有影響,這表明研究結(jié)果可以推廣到本文基于文本的研究之外。語(yǔ)音速率和音節(jié)數(shù)的變化明顯大于信息速率,信息速率是有效的跨語(yǔ)言連接手段。
這對(duì)我們的大腦意味著什么?
研究人員認(rèn)為,這一發(fā)現(xiàn)意味著信息率必須穩(wěn)定在一個(gè)較緊的平均值附近,因?yàn)檫^(guò)高的信息率會(huì)阻礙大腦處理數(shù)據(jù)和清晰表達(dá)語(yǔ)言的能力;另一方面,低信息率要求大腦在提取意思之前記住太多的單詞。
這突出了語(yǔ)言的雙重角色, Dediu總結(jié)道:“就如同硬幣的兩面性,談及語(yǔ)言也有兩面性,一個(gè)是文化上,一個(gè)是生物性的,當(dāng)說(shuō)一門語(yǔ)言的信息變得更加密集,說(shuō)話者也會(huì)開(kāi)始放慢語(yǔ)速。”
相關(guān)報(bào)道:
https://www.technologynetworks.com/neuroscience/news/different-tongue-same-information-17-language-study-reveals-how-we-all-communicate-at-a-similar-323584
【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】