2500頁(yè)算法文檔泄露!搜索史上最強(qiáng)黑箱曝光,谷歌翻車再升級(jí)? 原創(chuàng)
撰稿丨諾亞
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
谷歌有點(diǎn)流年不利。
前兩天剛被曝出,其搜索新推出的“AI 摘要(AI Overviews)”功能經(jīng)常提供嚴(yán)重錯(cuò)誤的搜索結(jié)果信息,例如,荒唐地建議用戶用膠水來(lái)防止披薩上的奶酪滑落。對(duì)此,CEO皮查伊也不得不承認(rèn)這是大語(yǔ)言模型的幻覺(jué)所致,且目前還沒(méi)有解決方案。
最近谷歌疑似再次“翻車”。一份據(jù)稱包含2500頁(yè)的谷歌內(nèi)部文件被泄露,這份文件可能首次向公眾揭示了谷歌搜索引擎的運(yùn)作機(jī)制。截至本文發(fā)布,谷歌尚未就泄露事件做出官方回應(yīng),也沒(méi)有對(duì)文件的真實(shí)性提出異議。
長(zhǎng)期以來(lái),谷歌作為當(dāng)今互聯(lián)網(wǎng)上最毋庸置疑的霸主,如何對(duì)網(wǎng)站進(jìn)行排名的細(xì)節(jié)一直是個(gè)謎。而這次泄露事件提供了一個(gè)新視角,讓我們得以窺見(jiàn)谷歌高度保密的搜索算法系統(tǒng),以及運(yùn)作機(jī)制里與谷歌此前的公開(kāi)聲明里相矛盾的地方。
1.2500頁(yè)泄露文件
谷歌的搜索算法或許是互聯(lián)網(wǎng)上最具影響力的系統(tǒng),它決定了網(wǎng)站的生死存亡及網(wǎng)絡(luò)內(nèi)容的呈現(xiàn)形態(tài)。但谷歌究竟是如何對(duì)網(wǎng)站進(jìn)行排名的具體細(xì)節(jié),從來(lái)都是“黑箱”,雖然也有媒體、研究人員以及從事搜索引擎優(yōu)化工作的人士進(jìn)行過(guò)種種猜測(cè),但也只是盲人摸象。我們始終難以窺見(jiàn)完整的拼圖。
如今,據(jù)外媒The Verge報(bào)道,這起堪稱炸裂的泄露事件似乎首次揭開(kāi)了搜索功能背后的神秘面紗,并暗示谷歌多年來(lái)并未完全誠(chéng)實(shí)地公開(kāi)其運(yùn)作方式。到目前為止,谷歌尚未對(duì)有關(guān)文件真實(shí)性的多次置評(píng)請(qǐng)求作出回應(yīng)。
從事SEO工作超過(guò)十年的Rand Fishkin是這起事件的主角。他透露,一位消息人士與他分享了長(zhǎng)達(dá)2500頁(yè)的文件,希望借此來(lái)揭露谷歌關(guān)于搜索算法運(yùn)作方式所散布的對(duì)外“謊言”。
據(jù)Fishkin介紹,這些文件概述了谷歌的搜索API,并分解了向員工提供的信息內(nèi)容。Fishkin分享的細(xì)節(jié)繁復(fù)且技術(shù)性強(qiáng),對(duì)于開(kāi)發(fā)者和SEO專家來(lái)說(shuō)可能比普通人更容易理解。
泄露內(nèi)容本身并不一定證明谷歌使用了特定數(shù)據(jù)和信號(hào)來(lái)進(jìn)行搜索排名。相反,泄露文件概述了谷歌從網(wǎng)頁(yè)、網(wǎng)站和搜索者那里收集了哪些數(shù)據(jù),并間接向SEO專家提供了關(guān)于谷歌關(guān)注點(diǎn)的線索。
2.與谷歌公開(kāi)聲明相矛盾
正如SEO專家Mike King在其對(duì)文件概述中所寫的那樣,泄露的文件涉及多個(gè)主題,如谷歌收集和使用的數(shù)據(jù)類型、谷歌針對(duì)選舉等敏感話題如何提升某些網(wǎng)站的權(quán)重、谷歌如何處理小型網(wǎng)站等。更值得關(guān)注的是,據(jù)Fishkin和Mike King所述,文件中的某些信息似乎與谷歌的公開(kāi)聲明相矛盾。
“說(shuō)‘撒謊’可能太過(guò)嚴(yán)重,但在這種情況下,這是最貼切的說(shuō)法,”Mike King這樣表述:“我理解谷歌的公關(guān)人員為了保護(hù)公司秘密所做的努力,但我不能接受的是,他們會(huì)去貶低那些在營(yíng)銷、科技和新聞?lì)I(lǐng)域內(nèi),發(fā)現(xiàn)并提出質(zhì)疑的人?!?/p>
谷歌尚未就涉及這些文件的The Verge的置評(píng)請(qǐng)求做出回應(yīng),其中包括直接要求反駁文件的真實(shí)性。Fishkin在給The Verge的電子郵件中表示,谷歌并未對(duì)泄露的真實(shí)性提出異議,但有一位員工要求他更改帖子中關(guān)于某個(gè)事件描述的部分措辭。
谷歌保密的搜索算法催生了一個(gè)由營(yíng)銷者組成的行業(yè),他們緊跟著谷歌的公開(kāi)指南,為全世界數(shù)百萬(wàn)公司實(shí)踐SEO策略。然而,這些廣泛應(yīng)用的手段,逐漸使人們普遍感覺(jué)到:谷歌的搜索結(jié)果正每況愈下,充滿了垃圾信息。
網(wǎng)站運(yùn)營(yíng)者感覺(jué)不得不生產(chǎn)這類內(nèi)容以使自己的網(wǎng)站被看到。但面對(duì)這樣的質(zhì)疑,谷歌的對(duì)外發(fā)言人總會(huì)搬出一套熟悉的說(shuō)辭:我們的指南并非如此指示。
但泄露文件中的某些細(xì)節(jié)讓人質(zhì)疑谷歌關(guān)于搜索功能運(yùn)作方式的公開(kāi)聲明的準(zhǔn)確性。
Fishkin和Mike King引用的一個(gè)例子是谷歌是否在排名中使用Chrome數(shù)據(jù)。谷歌代表多次表示不使用Chrome數(shù)據(jù)來(lái)排名頁(yè)面,但Chrome在關(guān)于網(wǎng)站如何出現(xiàn)在搜索中的部分被特別提及。
圖片
在上面的截圖中,根據(jù)文件顯示,主要vogue.com網(wǎng)址下方出現(xiàn)的鏈接部分可能就是利用Chrome數(shù)據(jù)創(chuàng)建的。
另一個(gè)引起關(guān)注的問(wèn)題是E-A-T(專業(yè)知識(shí)、權(quán)威性和可信度)在排名中扮演的角色。眾所周知,多年來(lái)E-A-T一直是谷歌搜索質(zhì)量評(píng)估指南的基石。
谷歌的代表此前曾表示,E-A-T并不是一個(gè)排名因素。Fishkin指出,他在文件中沒(méi)有找到太多直接提到E-A-T的內(nèi)容。
還有,谷歌的代表以前曾堅(jiān)稱,署名是網(wǎng)站所有者應(yīng)該為讀者而不是為谷歌做的,因?yàn)樗挥绊懪琶5坪醪⒎侨绱恕?/p>
邁克·金詳述了谷歌如何收集頁(yè)面的作者數(shù)據(jù),并指出文件中存在一個(gè)用于辨識(shí)實(shí)體是否為作者的字段,該字段雖主要為新聞文章設(shè)計(jì),但也涵蓋其他諸如科學(xué)文章的內(nèi)容。盡管這并不能證實(shí)署名是明確的排名要素之一,但它確實(shí)表明谷歌至少在密切跟蹤這一屬性。
3.搜索算法革新,從此互聯(lián)網(wǎng)生態(tài)“變天”
盡管這些文件并非確鑿無(wú)疑的證據(jù),但它們提供了一個(gè)深度且未經(jīng)過(guò)濾的視角,讓我們得以窺見(jiàn)這個(gè)高度保密的黑箱系統(tǒng)。
事實(shí)上,在過(guò)去的兩年里,谷歌搜索經(jīng)歷了一系列重大更新,有些甚至是前所未有的顛覆式更新。比如本文開(kāi)頭提到的,飽受詬病的“AI概覽”功能就是很有代表性的革新之一。
變革之初,谷歌掌舵人皮查伊表示,未來(lái)谷歌搜索將為你的許多問(wèn)題提供自己生成的AI答案,并對(duì)這一產(chǎn)品功能表達(dá)了強(qiáng)大的信心。
谷歌的一位發(fā)言人曾告訴BBC,公司只有在經(jīng)過(guò)嚴(yán)格測(cè)試,確認(rèn)變化對(duì)用戶有益后才會(huì)推出搜索變更,并且公司為網(wǎng)站所有者提供了幫助、資源和就其搜索排名反饋的機(jī)會(huì)。
但現(xiàn)實(shí)卻總是脫軌于理想。
無(wú)論是關(guān)于AI概覽功能的“致命幻覺(jué)”,還是在這份疑似泄露文件里傳達(dá)出的“表里不一”的信息,都在引發(fā)人們對(duì)于谷歌搜索的猜疑和警惕。
回顧整個(gè)互聯(lián)網(wǎng)發(fā)展史,沒(méi)有哪家企業(yè)像谷歌一樣,不僅改變了這個(gè)藍(lán)星上大多數(shù)人獲取信息的方式,也重塑了內(nèi)容創(chuàng)造和分發(fā)的格局。
就用生成式AI加持搜索舉例,谷歌似乎志在通過(guò)這些技術(shù)革新來(lái)更高效地連接用戶與信息,提升搜索體驗(yàn)的整體質(zhì)量。
但事實(shí)上,正如批評(píng)者所說(shuō),這種轉(zhuǎn)變可能加劇信息同質(zhì)化,減少用戶探索網(wǎng)絡(luò)的深度和廣度,因?yàn)樗麄冊(cè)絹?lái)越依賴于谷歌直接提供的簡(jiǎn)短答案,而不是親自訪問(wèn)源網(wǎng)站。這不僅可能削弱獨(dú)立網(wǎng)站和博客的可見(jiàn)度及盈利模式,還可能影響到網(wǎng)絡(luò)生態(tài)的健康和多樣性,限制了用戶接觸多元觀點(diǎn)和深入分析的機(jī)會(huì)。
對(duì)強(qiáng)大如谷歌的搜索玩家來(lái)說(shuō),如何確保搜索算法優(yōu)化既能服務(wù)于大眾,又不會(huì)破壞那些為網(wǎng)絡(luò)貢獻(xiàn)高質(zhì)量?jī)?nèi)容的生態(tài)基石,也許才是能夠長(zhǎng)遠(yuǎn)發(fā)展的根本所在。
參考鏈接:
??https://www.bbc.com/future/article/20240524-how-googles-new-algorithm-will-shape-your-internet??
?本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:諾亞
