百度廖若雪談搜索:用最直接的方式滿足人的需求
原創(chuàng)【51CTO專訪】百度主任架構(gòu)師廖若雪,百度技術(shù)委員會主席,“阿拉丁”項(xiàng)目負(fù)責(zé)人。一開始在ArchSummit官方介紹上看到廖若雪的簡介,只是對他的Title感到好奇:主任架構(gòu)師?架構(gòu)師也有主任么?后來聽在百度的朋友介紹,主任架構(gòu)師就是比架構(gòu)師還高一級的架構(gòu)師。再后來看到了他之前的一些采訪資料,得知他是北大材料化學(xué)系畢業(yè),畢業(yè)后還做過一段時間的游戲開發(fā),之后加入百度開始做搜索,一做就是7年。
聽起來很有意思,不是嗎?
所以,這次在ArchSummit峰會上,筆者找了個機(jī)會,跟廖若雪先生簡單的聊了聊對搜索的看法,以及對職業(yè)、成長的看法。剃光了頭發(fā)、體態(tài)彪悍的若雪說起話來意外的溫柔,頗有學(xué)院派的風(fēng)范。
百度主任架構(gòu)師 廖若雪
下面是本次的采訪實(shí)錄。
51CTO:首先,您做搜索領(lǐng)域這么多年,您對搜索、推薦、信息整理之間的關(guān)系是怎樣理解的?
廖若雪:信息整理是一個更加泛的領(lǐng)域,它更多涉及的是我們怎么把互聯(lián)網(wǎng)的信息整理起來;那么整理起來了怎么用呢?推薦和搜索就是兩種用法。所以信息整理跟另外兩種不太一樣。
推薦和搜索之間的關(guān)系是比較微妙的:我們可以從多種角度找到不同的答案。我個人來說,搜索是一種滿足用戶需求的方式,推薦也是一種滿足用戶需求的方式。嚴(yán)格意義上來說,如果我們定義推薦是滿足用戶明確需求之外的信息,那么我們可以說,推薦是搜索的擴(kuò)展。
我舉一個例子。比如說我想要去吃飯,查一家飯館,找肯德基,看這附近的肯德基怎么去,這是一種搜索,非常明確的需求。但我如果并不清楚這附近有什么飯吃,那么我想知道附近好吃的餐館,那么這其實(shí)就是在搜索和推薦之間的一種需求了。用戶很明確的說我現(xiàn)在想吃飯,也明確說是附近的,那么搜索引擎就要去找,首先用戶的位置在哪里,然后我對好吃的定義是什么,比如口味偏重或者偏淡,這種其實(shí)就是基于搜索的推薦。
再進(jìn)一步的話,比如我一看現(xiàn)在到晚飯時間了,要不要到新的地方吃點(diǎn)什么東西,那么可能我就會主動地告訴用戶,附近有一家評分很不錯的海鮮店,因?yàn)槲抑肋@個用戶以前到海邊的時候都會去找一家海鮮店吃吃,他有這個歷史記錄。那么這就是一個完全的推薦。但是你會發(fā)現(xiàn)這中間沒有一個很明確的界限,它們更多的是一種交叉和互替代。
當(dāng)然我們來說,無論是推薦還是搜索,都是滿足用戶需求的一種方式,并沒有硬性要說這到底是搜索還是推薦。
51CTO:所以它們從實(shí)現(xiàn)上來說其實(shí)也是非常相似的?
廖若雪:對。搜索和推薦實(shí)際上來說,底層的很多技術(shù)是類似的。兩者都需要處理大量的信息,比如網(wǎng)頁信息;現(xiàn)在搜索發(fā)展的很快,也會出現(xiàn)結(jié)構(gòu)化的信息;我們也處理了很多信息質(zhì)量的問題;再往前我們還有很多信息安全、機(jī)器學(xué)習(xí)這些方面的擴(kuò)展,這些都是相關(guān)的。當(dāng)然,推薦會更加偏向于用戶的分析。比如對用戶進(jìn)行建模。當(dāng)然,搜索也有可能會發(fā)展這個方向。總之,整個底層的技術(shù)是相通的。
個人經(jīng)歷
51CTO:您一開始是化學(xué)系畢業(yè)的,然后又做過一段時間的游戲開發(fā),現(xiàn)在在做搜索開發(fā)。您覺得它們之間有什么共通之處么?
廖若雪:其實(shí)沒有什么共通之處。
如果說有共通之處的話,就是一些底層的東西?;瘜W(xué)本身其實(shí)更多是一種理性思維的訓(xùn)練。而游戲開發(fā)和搜索引擎開發(fā),都是計算機(jī)科學(xué)里面的東西,對編碼能力、算法、基本的編程方法和思路,這些方面是共通的。
51CTO:那您當(dāng)時為什么會開始做搜索這塊?
廖若雪:比較偶然。當(dāng)時做游戲做了一段時間了,想換一個方向,然后正好看到百度在招聘,社招。當(dāng)時正好是周末,又不遠(yuǎn),就去看了看。
51CTO:然后就過去了?
廖若雪:對。然后就一直做搜索,做了7年吧。
51CTO:那么,您現(xiàn)在作為百度的主任架構(gòu)師,其實(shí)在普通程序員看來是層級很高的。您覺得這個Title對您來說更多的是一種能力,還是責(zé)任?
廖若雪:其實(shí)我覺得無論是叫架構(gòu)師還是主任架構(gòu)師什么的,都沒什么太大關(guān)系。責(zé)任和能力是相對的。你有多少責(zé)任,就會需要相應(yīng)的能力,反過來也是。我個人其實(shí)并不傾向于設(shè)置架構(gòu)師這樣一個Title。其實(shí)沒必要,我覺得大家都叫工程師就挺好的。為什么要叫架構(gòu)師?架構(gòu)能力對工程師是必要的。無論你希望在計算機(jī)科學(xué)的哪個方向上發(fā)展,你都需要有足夠的架構(gòu)能力,否則你的東西經(jīng)不起時間的檢驗(yàn)。現(xiàn)在的趨勢是,即使你是在某個特定方向做的很深的人,架構(gòu)能力也都是必須的。尤其是現(xiàn)在的規(guī)模越來越大,無論你是做機(jī)器學(xué)習(xí),還是專研算法,如果你在架構(gòu)上面沒有理解,沒有辦法去解決的話,那么你會遇到門檻。架構(gòu)能力應(yīng)該是工程師核心能力的一部分。
51CTO:嗯。而且最終不是所有的程序員都會走上架構(gòu)師這條路的。
廖若雪:對。所以為什么我不建議設(shè)立架構(gòu)師這個Title,就是這樣。你看,程序員一開始都是寫代碼吧,他可以往深的走,也可以往廣的走。他可以往架構(gòu)方面走,也可以往專精的方向走。但他都是要解決問題的。最終我們要做成一件事情的時候,其實(shí)有很多能力都是需要的。不是說一個架構(gòu)師在這里,他只需要架構(gòu)能力,別的能力不需要。
51CTO:您這邊的搜索技術(shù)部,前端、DBA、運(yùn)維這些是怎么劃分的?
廖若雪:我們倒不是這么分的,比如搜索,我們有搜索策略的,有檢索架構(gòu)的,這樣一個劃分。就是按他們負(fù)責(zé)的事情,而不是按職能來劃分。
51CTO:那是說每個工程師都懂得很多方面的東西?
廖若雪:那倒也不一定。團(tuán)隊(duì)里面會有不同背景的組成,比如算法比較強(qiáng)的。
51CTO:運(yùn)維也是自己做?
廖若雪:運(yùn)維這塊跟各個公司的關(guān)系很大,百度這邊有專門的運(yùn)維團(tuán)隊(duì),比如這個項(xiàng)目需要運(yùn)維,那么他們會專門加入到這個項(xiàng)目組里面來。
51CTO:那么,您感覺您工作這么多年,成長最快的一段時間是哪個時候?
廖若雪:成長最快的時候?其實(shí)我覺得整個在百度的成長過程都蠻快的。當(dāng)然,最開始進(jìn)來兩三年是最快的。
51CTO:不是做阿拉丁的時候?
廖若雪:哦,那個時候其實(shí)更多的是把自己的個人能力貢獻(xiàn)出來的時候了。當(dāng)然那時候也有成長,不過單從個人能力提升的角度來看,還是剛進(jìn)來兩三年的時候。
51CTO:是哦?那當(dāng)時是怎樣的一個過程?有前輩指導(dǎo)還是什么的。
廖若雪:對,一方面是有前輩帶,另一方面當(dāng)你被賦予一些比較有挑戰(zhàn)性的任務(wù)的時候,你會感到壓力,學(xué)習(xí)的會更快。
未來的搜索
51CTO:那么您對未來在搜索這塊的成長怎么看的?這個領(lǐng)域感覺中文界和英文界可以互相借鑒的地方相對少一些,您覺得搜索未來是什么樣的呢?
廖若雪:其實(shí)中文搜索和英文搜索不是說沒有借鑒,大家都在共同發(fā)展。比如百度那時候我們做阿拉丁,最近蘋果的Siri和Google Now,都出現(xiàn)了類似的東西——這些東西本質(zhì)上是相通的。搜索原先是一個檢索,但是現(xiàn)在我們越來越希望它成為滿足需求的一個入口——直接滿足用戶需求。比如很常見的一個例子,搜索天氣,現(xiàn)在在搜索頁里就是直接展示的,你不需要再點(diǎn)一次。再好比Siri那種,你直接用語音問它,它就告訴你了。
51CTO:Siri背后不也是Wolfram Alpha么?
廖若雪:其實(shí)背后是什么無所謂。比如我們現(xiàn)在做百度的搜索中有框計算的結(jié)果,可以很好的滿足用戶的自然需求,那么我只需要加上一個語音識別,接上百度搜索,你去問它天氣怎么樣,那么它直接會給出天氣,然后再進(jìn)行語音的合成,你體驗(yàn)到的就是類似Siri那個樣子了。
51CTO:嗯,如果它聽得懂你在說什么的話。
廖若雪:語音識別和語音合成的技術(shù)其實(shí)已經(jīng)發(fā)展了很多年了,只是我們把它做到多好的一個問題。但你會發(fā)現(xiàn),我們在交互方式上的這種改變單獨(dú)拿出來看的話,后臺其實(shí)是類似的,我們只是需要搜索引擎更好的去理解,去返回用戶那些能夠直接滿足他們需求的結(jié)果。這個我覺得是未來的一個方向。
其實(shí)今天會上有一個說法我很認(rèn)同,就是以后,人能夠用最自然的方式將需求表達(dá)給搜索引擎,然后搜索引擎用最直接的方式去滿足人的需求。
51CTO:那機(jī)器理解這一塊,您覺得現(xiàn)在我們做到什么樣的程度了?
廖若雪:還是比較初級。能解決部分的問題,但還是沒有太跳出工程系統(tǒng)的模式。但是我覺得這方面將會發(fā)展的比較快,因?yàn)槲覀兛吹浆F(xiàn)在很多前沿的公司,大家都在發(fā)展這一塊?,F(xiàn)在這一塊是一個比較好的形勢吧。
51CTO:好的。那么本次問題就到這里,十分感謝若雪接受我們的采訪!