冷啟動系統(tǒng)優(yōu)化與內(nèi)容潛力預(yù)估實踐
背景
每平每屋是阿里巴巴旗下家居家裝平臺,涵蓋淘寶每平每屋家居頻道、每平每屋設(shè)計家、每平每屋App、每平每屋制造業(yè)等家居全鏈路服務(wù),為消費者提供了2D短圖文、長圖文、3D樣板間、3D短視頻、VR全屋漫游等豐富多元的家居內(nèi)容,逐漸成為當(dāng)代年輕人生活靈感與家居裝修的向?qū)е弧?/p>
淘寶內(nèi)的每平每屋頻道是每平每屋業(yè)務(wù)獲取C端流量并進行內(nèi)容分發(fā)從而建立用戶家居、生活方式心智場的主要陣地。在每平每屋頻道中,內(nèi)容主要以場景搭配為主,內(nèi)容內(nèi)掛載了多個商品錨點,點擊商品錨點可以跳轉(zhuǎn)到商品的詳情頁完成進一步收藏、購買等行為。
隨著業(yè)務(wù)的快速發(fā)展,供給的內(nèi)容類型 和 體裁逐漸豐富 , 內(nèi)容量級也全面增加,而現(xiàn)有的個性化分發(fā)策略難以充分滿足內(nèi)容創(chuàng)作者和內(nèi)容消費者的訴求。具體地,對于內(nèi)容消費者而言,希望在平臺上獲取到優(yōu)質(zhì)、實用的內(nèi)容。對于內(nèi)容創(chuàng)作者來說,則希望自己發(fā)布的內(nèi)容被更多的人看到和認可。
以效率至上的個性化分發(fā)算法雖然能夠滿足用戶的短期訴求,但長期來看會導(dǎo)致平臺流量被頭部高熱內(nèi)容占據(jù),長尾內(nèi)容無法得到有效曝光,從而導(dǎo)致部分創(chuàng)作者的內(nèi)容無法及時獲得有效的反饋,生產(chǎn)積極性會大大降低,甚至從平臺流失。綜上,除了從算法分發(fā)的視角來優(yōu)化平臺的流量分配策略外,還需要我們從內(nèi)容生態(tài)的角度來考慮如何激勵創(chuàng)作者生產(chǎn)更多優(yōu)質(zhì)內(nèi)容并保證這些內(nèi)容能夠被消費者看到。
在推薦主鏈路的召回 、排序和機制策略中,我們引入了若干算法策略來提升推薦內(nèi)容的多樣性降低系統(tǒng)的馬太效應(yīng),但這部分優(yōu)化主要是在存量內(nèi)容上生效,對于新發(fā)布的內(nèi)容則依賴于冷啟動系統(tǒng)的加速。每平每屋的冷啟動鏈路先后經(jīng)歷了從 基于湯普森采樣的 定坑展現(xiàn)到基于Visual EE的動態(tài)混排策略迭代。但是,隨著內(nèi)容供給速度的提升,有限的冷啟動流量難以滿足新發(fā)內(nèi)容的快速透出和潛在優(yōu)質(zhì)內(nèi)容的快速成長訴求。本文將介紹我們在冷啟動系統(tǒng)采用兩階段多級流量放大策略和內(nèi)容潛力預(yù)估模型的實踐經(jīng)驗。
冷啟動系統(tǒng)優(yōu)化
我們將新內(nèi)容的冷啟動分為了兩個階段:
- 均勻保量
- 助推放大
均勻保量階段的目標(biāo)為縮短新內(nèi)容首曝時間并確保能夠公平地獲取曝光機會。而助推放大階段的目標(biāo)是幫助內(nèi)容快速成長,符合條件的新內(nèi)容從當(dāng)天分配的固定流量池互相競爭獲取流量,潛在的優(yōu)質(zhì)內(nèi)容將會在這個階段快速獲取到一定的曝光數(shù)量,加快其成長速度。
由于新內(nèi)容缺少線上的反饋數(shù)據(jù),直接復(fù)用主鏈路的召回排序算法會導(dǎo)致對新內(nèi)容的預(yù)估結(jié)果偏差較大,所以我們?yōu)槔鋯渔溌吩O(shè)計了一套獨立的召回排序鏈路。為了在缺少反饋數(shù)據(jù)的條件下盡可能將潛在優(yōu)質(zhì)內(nèi)容排序靠前,我們還設(shè)計了一個內(nèi)容潛力預(yù)估模型,并將該模型的預(yù)測分用在召回和排序算法中。冷啟動鏈路的推薦結(jié)果會結(jié)合主鏈路結(jié)果和調(diào)控分數(shù)進行生成式重排,最終確定冷啟動內(nèi)容是否在當(dāng)次請求中展示以及展示在第幾個坑位。
均勻保量
均勻保量是解決創(chuàng)作者流量確定性的第一個環(huán)節(jié)。在我們的系統(tǒng)中,最近7日內(nèi)新發(fā)布并且曝光pv < x的內(nèi)容會進入到均勻保量投放的階段,當(dāng)內(nèi)容投放達到曝光pv上限后則會退出該階段,該階段會確保每條新內(nèi)容都能獲得一定的初始曝光,收集到的反饋數(shù)據(jù)有助于新內(nèi)容在主鏈路中的透出。
為了防止一些創(chuàng)作者通過批量生產(chǎn)內(nèi)容來獲取系統(tǒng)流量,我們根據(jù)創(chuàng)作者歷史生產(chǎn)內(nèi)容的線上表現(xiàn)計算出了創(chuàng)作流量效率指數(shù),根據(jù)該指數(shù)約束每個創(chuàng)作者每天在均勻保量階段可以獲得的流量上限 m,當(dāng)作者創(chuàng)作的新內(nèi)容在當(dāng)天累計獲得的曝光pv > m時則不再對內(nèi)容進行保量投放。
助推放大
均勻保量策略有效緩解了新內(nèi)容首曝周期長和難以獲得初始流量的問題,但該鏈路沒有充分考慮到給予潛在優(yōu)質(zhì)內(nèi)容更多的流量,加速其成長為熱門內(nèi)容。我們?yōu)樾聝?nèi)容引入助推成長的環(huán)節(jié),根據(jù)內(nèi)容在線上投放的實時表現(xiàn)動態(tài)調(diào)整扶持流量,隨著效果的提高逐步放大流量,給予優(yōu)質(zhì)內(nèi)容獲取更多流量。
助推放大鏈路會對已經(jīng)獲得過一部分曝光并且點擊率大于指定閾值min_ctr的內(nèi)容執(zhí)行分級的流量放大策略,在該策略中內(nèi)容的扶持流量上限會隨著內(nèi)容實時的點擊率動態(tài)的調(diào)整。我們根據(jù)大盤的內(nèi)容效果和可用于扶持的流量比例劃分了k個助推等級,根據(jù)實時計算的后驗點擊率確定內(nèi)容所屬的助推級別,當(dāng)內(nèi)容在助推鏈路中的曝光pv > 上限n后內(nèi)容則會從助推鏈路中退出。
業(yè)務(wù)效果
- 流量新鮮度
- 近N天發(fā)布內(nèi)容pvr:每日曝光內(nèi)容中發(fā)布時間在N天內(nèi)的內(nèi)容獲取總流量占比(該指標(biāo)越高表明新鮮度越高)
- 按pv加權(quán)發(fā)布天數(shù):每日曝光內(nèi)容中按內(nèi)容曝光pv加權(quán)計算得到的內(nèi)容發(fā)布天數(shù)(該指標(biāo)越低表明新鮮度越高)
我們在21年5月底啟動了冷啟系統(tǒng)優(yōu)化的項目,新系統(tǒng)逐步放量,從時間周期來看,自線上運行以來, 近 N天發(fā)布內(nèi)容pvr 呈現(xiàn)逐步提高的趨勢,而 pv加權(quán)發(fā)布天數(shù) 呈現(xiàn)逐漸下降趨勢,表明新系統(tǒng)對于提高整體推薦系統(tǒng)的流量新鮮度具有正向促進作用,近7天發(fā)布內(nèi)容pvr +15.8% ,近14天發(fā)布內(nèi)容pvr +73.3% ,近30天發(fā)布內(nèi)容pvr +17.1% 。
- 流量扶持效率
助推放大階段引入了分級流量放大機制,將用于冷啟扶持的流量更多傾斜到潛在優(yōu)質(zhì)內(nèi)容,加速優(yōu)質(zhì)內(nèi)容成長。我們采用近7天冷啟鏈路曝光的內(nèi)容在最近1天常規(guī)鏈路分發(fā)下的pctr衡量扶持效率。具體公式定義為:
其中 為內(nèi)容在冷啟鏈路獲取的曝光PV,
為內(nèi)容在常規(guī)鏈路中統(tǒng)計得到的CTR??紤]到CTR的計算依賴曝光量,使用
表示僅統(tǒng)計在常規(guī)鏈路下獲得>100次曝光的內(nèi)容,efficiency +30% , efficiency_limit +39.9%。
內(nèi)容潛力預(yù)估模型
模型設(shè)計
我們設(shè)計內(nèi)容潛力預(yù)估模型來預(yù)測新發(fā)布的內(nèi)容在未來成長為熱門內(nèi)容的概率。模型以內(nèi)容是否能成為熱門為目標(biāo),將在發(fā)布7天內(nèi)迅速獲得高曝光高點擊的內(nèi)容為正樣本,其余為負樣本。通過模型訓(xùn)練,捕獲內(nèi)容成長為熱門的特征,從而挖掘出有潛力的內(nèi)容。
- 特征工程
在特征選擇上,主要分為2類:內(nèi)容屬性特征和內(nèi)容封面圖特征。其中,內(nèi)容屬性特征包括:內(nèi)容所屬的風(fēng)格、空間,掛載商品的id、類目、店鋪、組合價格等。通過一個預(yù)訓(xùn)練的模型提取對應(yīng)的封面圖圖像embedding特征。值得注意的是,我們有意識地避開點擊率等基于用戶交互行為的統(tǒng)計特征,以期更專注于內(nèi)容本身進行潛力預(yù)估。
- 樣本構(gòu)造
在樣本構(gòu)造上,我們采取兩種方案:
方案一:設(shè)定曝光PV和點擊率閾值,高于閾值的為正樣本,否則為負樣本;
方案二:首先,根據(jù)內(nèi)容曝光PV對點擊率進行校正。其次,將空間x風(fēng)格維度下,內(nèi)容發(fā)布7天后累計點擊率高于維度內(nèi)平均點擊率的內(nèi)容為正樣本,其余為負樣本。
方案一在正樣本的選擇上更為嚴(yán)格,能夠確保是熱門的內(nèi)容。方案二考慮了不同空間和風(fēng)格內(nèi)容下內(nèi)容點擊率的差異,但是可能會將維度內(nèi)熱門但全局非熱門內(nèi)容的設(shè)置為正樣本。
- 模型結(jié)構(gòu)
在Wide & Deep模型基礎(chǔ)之上設(shè)計潛力預(yù)估模型,具體改動有兩處:
- 內(nèi)容封面圖向量與Sparse feature的embedding進行concat,共同作為deep側(cè)輸入;
- 訓(xùn)練時,根據(jù)曝光PV的大小,給樣本賦值不同的置信度,PV值越大,樣本越置信。
離線評估
下表展示了基于上述兩種方案訓(xùn)練的模型進行潛力預(yù)估,P(is_hot)位于top10%的內(nèi)容在發(fā)布7天后在冷啟結(jié)束后的自然推薦獲得曝光PV的分布。
0 | 1 | 2 | 3 | 4 | 5 | |
方案一 | 17.45% | 12.97% | 11.57% | 11.57% | 23.53% | 28.18% |
方案二 | 19.17% | 13.75% | 13.97% | 24.70% | 20.78% | 24.30% |
第一行的0-5是內(nèi)容曝光PV的范圍劃定:數(shù)值越大,對應(yīng)的曝光PV越高。從占比上看,方案二在潛力內(nèi)容挖掘上準(zhǔn)確性更高。
業(yè)務(wù)效果
潛力預(yù)估分主要被應(yīng)用于干預(yù)線上冷啟鏈路內(nèi)容的召回和排序算法。期望對于P(is_hot)高的內(nèi)容,給予更高的冷啟PV;同時,對于P(is_hot)低的內(nèi)容,減少其冷啟PV,以節(jié)省一部分冷啟流量。在具體實現(xiàn)上,我們分別將潛力預(yù)估分作為冷啟鏈路排序模型的一個特征和召回鏈路的截斷分。
- 作為排序模型特征
我們統(tǒng)計了線上完整7天的AB實驗結(jié)果。
uctr | pctr | avg_expo | avg_click | avg_ipv_click | ipv_uctr | ipv_pctr | uctcvr | pctcvr | |
方案一 | +0.18% | +0.19% | -0.89% | -0.71% | +0.21% | +0.33% | +0.86% | +0.51% | +1.05% |
方案二 | -0.16% | +0.15% | -0.81% | -0.66% | -0.23% | -0.38% | +0.34% | -0.54% | +0.49% |
另外,我們統(tǒng)計了線上冷啟鏈路完整AB7天的效果。
ab_id | pctr | uctr | ipv_pctr | ipv_uctr | pctcvr | uctcvr | expo_ratio |
方案一 | +3.00% | +3.10% | -0.45% | +0.38% | +2.16% | +3.14% | +0.34% |
方案二 | -0.03 | -0.04 | -0.06 | -0.05 | -0.07 | -0.07 | 0.00 |
相比較于冷啟扶持baseline,將基于方案一輸出的內(nèi)容潛力預(yù)估分作為冷啟鏈路粗排模型的特征,整體收益為正,二跳相關(guān)指標(biāo)提升顯著。而方案二整體收益為負,可能是將維度內(nèi)熱門但全局非熱門內(nèi)容的設(shè)置為正樣本帶來了負向影響。
- 作為召回截斷分
進一步地,我們將方案一的潛力預(yù)估分作為冷啟鏈路中葉子類目單鏈路召回的截斷分。下表展示了線上完整7天AB實驗結(jié)果。
uctr | pctr | avg_expo | avg_click | ipv_uctr | ipv_pctr | uctcvr | pctcvr | avg_ipv | |
單鏈路召回分 | +0.25% | +0.03% | -0.02% | +0.01% | +0.37% | +0.26% | +0.62% | +0.29% | +0.26% |
而在冷啟鏈路上完整AB7天的效果如下所示。
pctr | uctr | ipv_pctr | ipv_uctr | pctcvr | uctcvr | expo_ratio | |
單鏈路召回分 | +8.06% | +8.31% | +11.10% | +10.40% | +20.38% | 19.47% | +13.54% |
在冷啟鏈路上提升顯著,并在整體指標(biāo)上也獲得了進一步的提升。
總結(jié)
每平每屋頻道新內(nèi)容冷啟動分發(fā)策略先后經(jīng)歷了從基于湯普森采樣的定坑展現(xiàn)到基于Visual EE的動態(tài)混排策略,在此基礎(chǔ)上我們將整個鏈路進行重新設(shè)計,以均勻保量和助推放大兩階段構(gòu)成的獨立算法鏈路極大的縮減了新發(fā)布內(nèi)容的首曝時間,提升了整體系統(tǒng)的流量新鮮度和冷啟動階段的扶持效率。我們引入的內(nèi)容潛力預(yù)估模型通過預(yù)估新內(nèi)容在未來成長為熱門內(nèi)容的概率來干預(yù)冷啟鏈路的召回與排序,有效地幫助潛在熱門內(nèi)容在冷啟動階段獲得更多的扶持流量,提升冷啟階段流量的利用率。
冷啟動優(yōu)化項目取得了初步的成果,未來我們會進行更細致的優(yōu)化:
- 不同的內(nèi)容體裁在展現(xiàn)形式、內(nèi)容主題和后驗效果上具有差異,設(shè)計更細致的冷啟動策略有助于進一步提升流量公平性和加速潛在優(yōu)質(zhì)內(nèi)容的成長
- 冷啟動鏈路需求快速反饋,引入更多的實時特征并將主鏈路驗證有效的ODL進行遷移能夠提升整體鏈路的實時性,有助于新內(nèi)容更精準(zhǔn)的分發(fā)