偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

冷啟動系統(tǒng)優(yōu)化與內(nèi)容潛力預(yù)估實踐

開發(fā) 系統(tǒng)運維
在召回側(cè)基于GNN和向量解耦表征技術(shù)緩解了零少行為用戶推薦的馬太效應(yīng);排序側(cè)通過模型的在線深度學(xué)習(xí)、生成式重排、下拉深度優(yōu)化等技術(shù)大幅度提升了內(nèi)容分發(fā)效率和推薦列表的整體收益。

背景

每平每屋是阿里巴巴旗下家居家裝平臺,涵蓋淘寶每平每屋家居頻道、每平每屋設(shè)計家、每平每屋App、每平每屋制造業(yè)等家居全鏈路服務(wù),為消費者提供了2D短圖文、長圖文、3D樣板間、3D短視頻、VR全屋漫游等豐富多元的家居內(nèi)容,逐漸成為當(dāng)代年輕人生活靈感與家居裝修的向?qū)е弧?/p>

淘寶內(nèi)的每平每屋頻道是每平每屋業(yè)務(wù)獲取C端流量并進行內(nèi)容分發(fā)從而建立用戶家居、生活方式心智場的主要陣地。在每平每屋頻道中,內(nèi)容主要以場景搭配為主,內(nèi)容內(nèi)掛載了多個商品錨點,點擊商品錨點可以跳轉(zhuǎn)到商品的詳情頁完成進一步收藏、購買等行為。

隨著業(yè)務(wù)的快速發(fā)展,供給的內(nèi)容類型  體裁逐漸豐富 , 內(nèi)容量級也全面增加,而現(xiàn)有的個性化分發(fā)策略難以充分滿足內(nèi)容創(chuàng)作者和內(nèi)容消費者的訴求。具體地,對于內(nèi)容消費者而言,希望在平臺上獲取到優(yōu)質(zhì)、實用的內(nèi)容。對于內(nèi)容創(chuàng)作者來說,則希望自己發(fā)布的內(nèi)容被更多的人看到和認可。

以效率至上的個性化分發(fā)算法雖然能夠滿足用戶的短期訴求,但長期來看會導(dǎo)致平臺流量被頭部高熱內(nèi)容占據(jù),長尾內(nèi)容無法得到有效曝光,從而導(dǎo)致部分創(chuàng)作者的內(nèi)容無法及時獲得有效的反饋,生產(chǎn)積極性會大大降低,甚至從平臺流失。綜上,除了從算法分發(fā)的視角來優(yōu)化平臺的流量分配策略外,還需要我們從內(nèi)容生態(tài)的角度來考慮如何激勵創(chuàng)作者生產(chǎn)更多優(yōu)質(zhì)內(nèi)容并保證這些內(nèi)容能夠被消費者看到。

在推薦主鏈路的召回 、排序和機制策略中,我們引入了若干算法策略來提升推薦內(nèi)容的多樣性降低系統(tǒng)的馬太效應(yīng),但這部分優(yōu)化主要是在存量內(nèi)容上生效,對于新發(fā)布的內(nèi)容則依賴于冷啟動系統(tǒng)的加速。每平每屋的冷啟動鏈路先后經(jīng)歷了從 基于湯普森采樣的 定坑展現(xiàn)到基于Visual EE的動態(tài)混排策略迭代。但是,隨著內(nèi)容供給速度的提升,有限的冷啟動流量難以滿足新發(fā)內(nèi)容的快速透出和潛在優(yōu)質(zhì)內(nèi)容的快速成長訴求。本文將介紹我們在冷啟動系統(tǒng)采用兩階段多級流量放大策略和內(nèi)容潛力預(yù)估模型的實踐經(jīng)驗。

冷啟動系統(tǒng)優(yōu)化

我們將新內(nèi)容的冷啟動分為了兩個階段:

  1. 均勻保量
  2. 助推放大

均勻保量階段的目標(biāo)為縮短新內(nèi)容首曝時間并確保能夠公平地獲取曝光機會。而助推放大階段的目標(biāo)是幫助內(nèi)容快速成長,符合條件的新內(nèi)容從當(dāng)天分配的固定流量池互相競爭獲取流量,潛在的優(yōu)質(zhì)內(nèi)容將會在這個階段快速獲取到一定的曝光數(shù)量,加快其成長速度。

由于新內(nèi)容缺少線上的反饋數(shù)據(jù),直接復(fù)用主鏈路的召回排序算法會導(dǎo)致對新內(nèi)容的預(yù)估結(jié)果偏差較大,所以我們?yōu)槔鋯渔溌吩O(shè)計了一套獨立的召回排序鏈路。為了在缺少反饋數(shù)據(jù)的條件下盡可能將潛在優(yōu)質(zhì)內(nèi)容排序靠前,我們還設(shè)計了一個內(nèi)容潛力預(yù)估模型,并將該模型的預(yù)測分用在召回和排序算法中。冷啟動鏈路的推薦結(jié)果會結(jié)合主鏈路結(jié)果和調(diào)控分數(shù)進行生成式重排,最終確定冷啟動內(nèi)容是否在當(dāng)次請求中展示以及展示在第幾個坑位。

均勻保量

均勻保量是解決創(chuàng)作者流量確定性的第一個環(huán)節(jié)。在我們的系統(tǒng)中,最近7日內(nèi)新發(fā)布并且曝光pv < x的內(nèi)容會進入到均勻保量投放的階段,當(dāng)內(nèi)容投放達到曝光pv上限后則會退出該階段,該階段會確保每條新內(nèi)容都能獲得一定的初始曝光,收集到的反饋數(shù)據(jù)有助于新內(nèi)容在主鏈路中的透出。

為了防止一些創(chuàng)作者通過批量生產(chǎn)內(nèi)容來獲取系統(tǒng)流量,我們根據(jù)創(chuàng)作者歷史生產(chǎn)內(nèi)容的線上表現(xiàn)計算出了創(chuàng)作流量效率指數(shù),根據(jù)該指數(shù)約束每個創(chuàng)作者每天在均勻保量階段可以獲得的流量上限 m,當(dāng)作者創(chuàng)作的新內(nèi)容在當(dāng)天累計獲得的曝光pv > m時則不再對內(nèi)容進行保量投放。

助推放大

均勻保量策略有效緩解了新內(nèi)容首曝周期長和難以獲得初始流量的問題,但該鏈路沒有充分考慮到給予潛在優(yōu)質(zhì)內(nèi)容更多的流量,加速其成長為熱門內(nèi)容。我們?yōu)樾聝?nèi)容引入助推成長的環(huán)節(jié),根據(jù)內(nèi)容在線上投放的實時表現(xiàn)動態(tài)調(diào)整扶持流量,隨著效果的提高逐步放大流量,給予優(yōu)質(zhì)內(nèi)容獲取更多流量。

助推放大鏈路會對已經(jīng)獲得過一部分曝光并且點擊率大于指定閾值min_ctr的內(nèi)容執(zhí)行分級的流量放大策略,在該策略中內(nèi)容的扶持流量上限會隨著內(nèi)容實時的點擊率動態(tài)的調(diào)整。我們根據(jù)大盤的內(nèi)容效果和可用于扶持的流量比例劃分了k個助推等級,根據(jù)實時計算的后驗點擊率確定內(nèi)容所屬的助推級別,當(dāng)內(nèi)容在助推鏈路中的曝光pv > 上限n后內(nèi)容則會從助推鏈路中退出。

業(yè)務(wù)效果

  • 流量新鮮度
  1. 近N天發(fā)布內(nèi)容pvr:每日曝光內(nèi)容中發(fā)布時間在N天內(nèi)的內(nèi)容獲取總流量占比(該指標(biāo)越高表明新鮮度越高)
  2. 按pv加權(quán)發(fā)布天數(shù):每日曝光內(nèi)容中按內(nèi)容曝光pv加權(quán)計算得到的內(nèi)容發(fā)布天數(shù)(該指標(biāo)越低表明新鮮度越高)

我們在21年5月底啟動了冷啟系統(tǒng)優(yōu)化的項目,新系統(tǒng)逐步放量,從時間周期來看,自線上運行以來,  N天發(fā)布內(nèi)容pvr 呈現(xiàn)逐步提高的趨勢,而 pv加權(quán)發(fā)布天數(shù) 呈現(xiàn)逐漸下降趨勢,表明新系統(tǒng)對于提高整體推薦系統(tǒng)的流量新鮮度具有正向促進作用,近7天發(fā)布內(nèi)容pvr +15.8% ,近14天發(fā)布內(nèi)容pvr +73.3% ,近30天發(fā)布內(nèi)容pvr +17.1% 。

  • 流量扶持效率

助推放大階段引入了分級流量放大機制,將用于冷啟扶持的流量更多傾斜到潛在優(yōu)質(zhì)內(nèi)容,加速優(yōu)質(zhì)內(nèi)容成長。我們采用近7天冷啟鏈路曝光的內(nèi)容在最近1天常規(guī)鏈路分發(fā)下的pctr衡量扶持效率。具體公式定義為:

其中  為內(nèi)容在冷啟鏈路獲取的曝光PV, 為內(nèi)容在常規(guī)鏈路中統(tǒng)計得到的CTR??紤]到CTR的計算依賴曝光量,使用表示僅統(tǒng)計在常規(guī)鏈路下獲得>100次曝光的內(nèi)容,efficiency +30% , efficiency_limit +39.9%。

內(nèi)容潛力預(yù)估模型

模型設(shè)計

我們設(shè)計內(nèi)容潛力預(yù)估模型來預(yù)測新發(fā)布的內(nèi)容在未來成長為熱門內(nèi)容的概率。模型以內(nèi)容是否能成為熱門為目標(biāo),將在發(fā)布7天內(nèi)迅速獲得高曝光高點擊的內(nèi)容為正樣本,其余為負樣本。通過模型訓(xùn)練,捕獲內(nèi)容成長為熱門的特征,從而挖掘出有潛力的內(nèi)容。

  • 特征工程

在特征選擇上,主要分為2類:內(nèi)容屬性特征和內(nèi)容封面圖特征。其中,內(nèi)容屬性特征包括:內(nèi)容所屬的風(fēng)格、空間,掛載商品的id、類目、店鋪、組合價格等。通過一個預(yù)訓(xùn)練的模型提取對應(yīng)的封面圖圖像embedding特征。值得注意的是,我們有意識地避開點擊率等基于用戶交互行為的統(tǒng)計特征,以期更專注于內(nèi)容本身進行潛力預(yù)估。

  • 樣本構(gòu)造

在樣本構(gòu)造上,我們采取兩種方案:

方案一:設(shè)定曝光PV和點擊率閾值,高于閾值的為正樣本,否則為負樣本;

方案二:首先,根據(jù)內(nèi)容曝光PV對點擊率進行校正。其次,將空間x風(fēng)格維度下,內(nèi)容發(fā)布7天后累計點擊率高于維度內(nèi)平均點擊率的內(nèi)容為正樣本,其余為負樣本。

方案一在正樣本的選擇上更為嚴(yán)格,能夠確保是熱門的內(nèi)容。方案二考慮了不同空間和風(fēng)格內(nèi)容下內(nèi)容點擊率的差異,但是可能會將維度內(nèi)熱門但全局非熱門內(nèi)容的設(shè)置為正樣本。

  • 模型結(jié)構(gòu)

在Wide & Deep模型基礎(chǔ)之上設(shè)計潛力預(yù)估模型,具體改動有兩處:

  1. 內(nèi)容封面圖向量與Sparse feature的embedding進行concat,共同作為deep側(cè)輸入;
  2. 訓(xùn)練時,根據(jù)曝光PV的大小,給樣本賦值不同的置信度,PV值越大,樣本越置信。

離線評估

下表展示了基于上述兩種方案訓(xùn)練的模型進行潛力預(yù)估,P(is_hot)位于top10%的內(nèi)容在發(fā)布7天后在冷啟結(jié)束后的自然推薦獲得曝光PV的分布。

0

1

2

3

4

5

方案一

17.45%

12.97%

11.57%

11.57%

23.53%

28.18%

方案二

19.17%

13.75%

13.97%

24.70%

20.78%

24.30%

第一行的0-5是內(nèi)容曝光PV的范圍劃定:數(shù)值越大,對應(yīng)的曝光PV越高。從占比上看,方案二在潛力內(nèi)容挖掘上準(zhǔn)確性更高。

業(yè)務(wù)效果

潛力預(yù)估分主要被應(yīng)用于干預(yù)線上冷啟鏈路內(nèi)容的召回和排序算法。期望對于P(is_hot)高的內(nèi)容,給予更高的冷啟PV;同時,對于P(is_hot)低的內(nèi)容,減少其冷啟PV,以節(jié)省一部分冷啟流量。在具體實現(xiàn)上,我們分別將潛力預(yù)估分作為冷啟鏈路排序模型的一個特征和召回鏈路的截斷分。

  • 作為排序模型特征

我們統(tǒng)計了線上完整7天的AB實驗結(jié)果。

uctr

pctr

avg_expo

avg_click

avg_ipv_click

ipv_uctr

ipv_pctr

uctcvr

pctcvr

方案一

+0.18%

+0.19%

-0.89%

-0.71%

+0.21%

+0.33%

+0.86%

+0.51%

+1.05%

方案二

-0.16%

+0.15%

-0.81%

-0.66%

-0.23%

-0.38%

+0.34%

-0.54%

+0.49%

另外,我們統(tǒng)計了線上冷啟鏈路完整AB7天的效果。

ab_id

pctr

uctr

ipv_pctr

ipv_uctr

pctcvr

uctcvr

expo_ratio

方案一

+3.00%

+3.10%

-0.45%

+0.38%

+2.16%

+3.14%

+0.34%

方案二

-0.03

-0.04

-0.06

-0.05

-0.07

-0.07

0.00

相比較于冷啟扶持baseline,將基于方案一輸出的內(nèi)容潛力預(yù)估分作為冷啟鏈路粗排模型的特征,整體收益為正,二跳相關(guān)指標(biāo)提升顯著。而方案二整體收益為負,可能是將維度內(nèi)熱門但全局非熱門內(nèi)容的設(shè)置為正樣本帶來了負向影響。

  • 作為召回截斷分

進一步地,我們將方案一的潛力預(yù)估分作為冷啟鏈路中葉子類目單鏈路召回的截斷分。下表展示了線上完整7天AB實驗結(jié)果。

uctr

pctr

avg_expo

avg_click

ipv_uctr

ipv_pctr

uctcvr

pctcvr

avg_ipv

單鏈路召回分

+0.25%

+0.03%

-0.02%

+0.01%

+0.37%

+0.26%

+0.62%

+0.29%

+0.26%

而在冷啟鏈路上完整AB7天的效果如下所示。

pctr

uctr

ipv_pctr

ipv_uctr

pctcvr

uctcvr

expo_ratio

單鏈路召回分

+8.06%

+8.31%

+11.10%

+10.40%

+20.38%

19.47%

+13.54%

在冷啟鏈路上提升顯著,并在整體指標(biāo)上也獲得了進一步的提升。

總結(jié)

每平每屋頻道新內(nèi)容冷啟動分發(fā)策略先后經(jīng)歷了從基于湯普森采樣的定坑展現(xiàn)到基于Visual EE的動態(tài)混排策略,在此基礎(chǔ)上我們將整個鏈路進行重新設(shè)計,以均勻保量和助推放大兩階段構(gòu)成的獨立算法鏈路極大的縮減了新發(fā)布內(nèi)容的首曝時間,提升了整體系統(tǒng)的流量新鮮度和冷啟動階段的扶持效率。我們引入的內(nèi)容潛力預(yù)估模型通過預(yù)估新內(nèi)容在未來成長為熱門內(nèi)容的概率來干預(yù)冷啟鏈路的召回與排序,有效地幫助潛在熱門內(nèi)容在冷啟動階段獲得更多的扶持流量,提升冷啟階段流量的利用率。

冷啟動優(yōu)化項目取得了初步的成果,未來我們會進行更細致的優(yōu)化:

  1. 不同的內(nèi)容體裁在展現(xiàn)形式、內(nèi)容主題和后驗效果上具有差異,設(shè)計更細致的冷啟動策略有助于進一步提升流量公平性和加速潛在優(yōu)質(zhì)內(nèi)容的成長
  2. 冷啟動鏈路需求快速反饋,引入更多的實時特征并將主鏈路驗證有效的ODL進行遷移能夠提升整體鏈路的實時性,有助于新內(nèi)容更精準(zhǔn)的分發(fā)
責(zé)任編輯:張燕妮 來源: 淘系技術(shù)
相關(guān)推薦

2023-10-12 07:32:27

冷啟動推薦模型

2024-05-20 07:52:06

冷啟動策略推薦算法推薦系統(tǒng)

2019-06-20 17:39:12

Android啟動優(yōu)化

2024-12-03 11:12:47

2023-08-30 18:49:05

2025-06-19 09:53:30

Spring性能優(yōu)化服務(wù)器

2017-01-23 21:05:00

AndroidApp啟動優(yōu)化

2023-11-14 07:16:51

冷啟動技術(shù)推薦系統(tǒng)

2022-03-29 13:27:22

Android優(yōu)化APP

2022-10-28 13:41:51

字節(jié)SDK監(jiān)控

2021-09-02 10:10:59

技術(shù)VS Code實踐

2021-10-13 08:00:00

數(shù)據(jù)算法人工智能

2024-09-21 11:11:29

數(shù)據(jù)治理數(shù)據(jù)中臺

2022-12-12 08:00:00

人工智能網(wǎng)易云音樂算法平臺研發(fā)

2020-02-12 08:50:05

Linux命令啟動時間

2020-08-03 08:04:04

限流算法Sentinel

2024-07-11 07:02:01

2014-02-26 11:01:28

日志優(yōu)化系統(tǒng)日志

2023-10-31 12:50:35

智能優(yōu)化探索

2023-02-22 07:04:05

自動機原理優(yōu)化實踐
點贊
收藏

51CTO技術(shù)棧公眾號