計(jì)算廣告與推薦系統(tǒng)有哪些區(qū)別?
在Facebook工作的時(shí)候做的是newsfeed ranking (新鮮事排序),算是一種推薦系統(tǒng)吧,而且newsfeed中也包含了廣告(Feed Ads)。說說我的理解。
結(jié)論:推薦系統(tǒng)和計(jì)算廣告是不同維度上的概念。推薦系統(tǒng)是一種技術(shù),廣告是一項(xiàng)業(yè)務(wù)。個(gè)性化推薦可以用在廣告中,更可以用在別的產(chǎn)品層面。同時(shí),個(gè)性化推薦只是計(jì)算廣告的一個(gè)環(huán)節(jié),一個(gè)完整的廣告系統(tǒng)還需要其他很多重要的技術(shù)組件。
0. 個(gè)性化推薦在廣告之外的很多產(chǎn)品層面都有應(yīng)用
幾個(gè)常見的應(yīng)用領(lǐng)域:
有機(jī)內(nèi)容(organic content)的篩選與排序: Facebook,知乎,今日頭條的新鮮事都是個(gè)性化排序的結(jié)果。Spotify也是類似的例子。個(gè)性化推薦做的好不好直接影響產(chǎn)品的活躍度(engagement)和存留(retention)。
一些Growth Hack也極為依賴個(gè)性化推薦的質(zhì)量:最為常見的例子就是Facebook/知乎上“你可能認(rèn)識(shí)/感興趣的人”。關(guān)注的人越多質(zhì)量越好,用戶存留的可能性就越大。
Amazon和Netflix的推薦購買/觀看:這個(gè)就比較接近廣告了。
1. 廣告系統(tǒng)也不僅僅只有個(gè)性化推薦
一個(gè)完整的廣告系統(tǒng),從廣告商投放廣告到用戶看到廣告,需要以下幾個(gè)重要組件:
- [面向廣告商的工具] 廣告商可以根據(jù)自己的需要定制投放人群:年齡,性別,地理位置,職業(yè),興趣等等。
- [算法] 個(gè)性化推薦:在眾多符合條件的廣告中選擇最合適的一個(gè)。
- [算法] 決定在哪里放廣告:這在以前其實(shí)不是個(gè)事,因?yàn)榫蛶讉€(gè)能放廣告的固定位置(banner,頁面右側(cè))。然而隨著Facebook發(fā)明了Feed Ads,在新鮮事里放原生廣告成了社交類產(chǎn)品的標(biāo)配。以微信為例,在朋友圈里的第幾個(gè)位置放廣告其實(shí)是個(gè)挺有學(xué)問的事。放高了影響用戶正常體驗(yàn),放低了沒人看得到。這大該就是微信口中的“實(shí)時(shí)社交混排算法”吧。
- [算法] 定價(jià):放的這個(gè)廣告該跟廣告商要多少錢。這受很多因素影響:放的位置高低,有多少個(gè)其他廣告一起競價(jià),等等。
所以,個(gè)性化推薦只是整個(gè)廣告流程的一個(gè)小部分。不過,好的個(gè)性化推薦可以提高廣告的點(diǎn)擊率,從而增加產(chǎn)品營收。
2. 個(gè)性化推薦不一定非要是機(jī)器學(xué)習(xí)
很多人把個(gè)性化推薦等同于機(jī)器學(xué)習(xí),甚至deep learning。這在嚴(yán)格意義上其實(shí)是不準(zhǔn)確的。個(gè)性化推薦本質(zhì)上是一組算法。這些算法可以是基于機(jī)器學(xué)習(xí)的,也可以是基于其他信號(hào)或者策略。比如說:
Amazon和Netflix最早的推薦系統(tǒng)就是item-item的算法。本質(zhì)上是基于用戶評(píng)價(jià)計(jì)算任何兩件商品的相似度,生成一個(gè)巨大的二維矩陣。很難說這是機(jī)器學(xué)習(xí)。
Facebook最早的新鮮事排序就是基于一些人工制定的規(guī)則,表現(xiàn)也挺不錯(cuò),以至于基于機(jī)器學(xué)習(xí)的實(shí)現(xiàn)在很久之后才在A/B test中擊敗人工規(guī)則。
Pandora的曲庫是人工打標(biāo)簽,基于此生成個(gè)性化推薦。連機(jī)器都沒怎么用。
不過廣告系統(tǒng)中的個(gè)性化推薦一般都是機(jī)器學(xué)習(xí),Supervise learning對(duì)廣告這方面有極為成熟的方案。