測(cè)試時(shí)擴(kuò)展(TestTimeScaling)極大提升了大語(yǔ)言模型的性能,涌現(xiàn)出了如OpenAIo系列模型和DeepSeekR1等眾多爆款。那么,什么是視覺(jué)領(lǐng)域的testtimescaling?又該如何定義??為了回答這一問(wèn)題,最近香港科技大學(xué)聯(lián)合快手可靈團(tuán)隊(duì)推出EvolutionarySearch(EvoSearch)方法,通過(guò)提高推理時(shí)的計(jì)算量來(lái)大幅提升模型的生成質(zhì)量,支持圖像和視頻生成,支持目前最先進(jìn)的diffusionbased和flowbased模型。?EvoSearch無(wú)需訓(xùn)練,無(wú)需梯度...
1天前 205瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
導(dǎo)讀:快聘業(yè)務(wù)快速發(fā)展情況下,圖文AIGC模板生產(chǎn)人力緊缺,技術(shù)借助碼靈D2C和增長(zhǎng)合圖能力搭建伏羲工作臺(tái),助力實(shí)現(xiàn)業(yè)務(wù)模板快速自動(dòng)化生產(chǎn),推動(dòng)了業(yè)務(wù)形態(tài)發(fā)展。一、背景介紹業(yè)務(wù)背景“快聘”是快手于2022年推出覆蓋藍(lán)領(lǐng)群體的短視頻平臺(tái)藍(lán)領(lǐng)招聘業(yè)務(wù)。通過(guò)構(gòu)建以信任為中心的藍(lán)領(lǐng)招聘關(guān)系和直播帶崗模式,為用工企業(yè)和藍(lán)領(lǐng)用戶搭建就業(yè)平臺(tái)??焓?ldquo;快聘”早期叫“快招工”,進(jìn)行品牌升級(jí)后叫“快聘”,自推出后,已為比亞迪...
7天前 480瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
導(dǎo)讀:近日,快手發(fā)布并開(kāi)源其最新自研的多模態(tài)大語(yǔ)言模型KwaiKeyeVL。KwaiKeyVL采用VisionEncoderProjectorLLM架構(gòu),集成了文本、圖像、視頻信息的混合輸入處理能力,旨在為用戶帶來(lái)更智能、更全面的多模態(tài)交互體驗(yàn)。如果有人突然問(wèn)你:「這張圖片中有幾顆草莓」?你會(huì)如何快速回復(fù)?面對(duì)五彩繽紛的果盤(pán),我們往往需要反復(fù)端詳,放大圖片再逐一清點(diǎn),耗費(fèi)不少時(shí)間才能得到答案。然而,AI大模型正讓這種復(fù)雜視覺(jué)識(shí)別變得簡(jiǎn)單—...
8天前 1071瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
導(dǎo)讀:大模型技術(shù)正深刻重塑商業(yè)風(fēng)控體系,推動(dòng)風(fēng)險(xiǎn)管理向智能化、高效化、精準(zhǔn)化轉(zhuǎn)型。本系列專(zhuān)題首篇聚焦快手商業(yè)化風(fēng)控內(nèi)容審核場(chǎng)景,系統(tǒng)剖析大模型如何破解傳統(tǒng)風(fēng)控痛點(diǎn),構(gòu)建覆蓋全鏈路的風(fēng)險(xiǎn)治理新范式。后續(xù)篇章還將進(jìn)一步揭秘大模型評(píng)估標(biāo)準(zhǔn)Bechmark、智能體Agent、多模態(tài)推理模型等內(nèi)容,敬請(qǐng)期待。一、引言快手商業(yè)化場(chǎng)景下,風(fēng)險(xiǎn)控制不僅關(guān)乎平臺(tái)的信譽(yù)和經(jīng)濟(jì)效益,更直接影響用戶和客戶的體驗(yàn)和利益。理想的風(fēng)控系...
9天前 642瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
近日,快手推薦模型團(tuán)隊(duì)提出了一個(gè)端到端生成式推薦系統(tǒng)OneRec,該系統(tǒng)采用EncoderDecoder架構(gòu),引入了基于獎(jiǎng)勵(lì)機(jī)制的偏好對(duì)齊方法,借助強(qiáng)化學(xué)習(xí)增強(qiáng)模型效果,可在獎(jiǎng)勵(lì)模型引導(dǎo)下直接生成契合用戶偏好的視頻內(nèi)容。通過(guò)極致的性能優(yōu)化,OneRec在推薦模型FLOPs提升10倍的同時(shí),大幅削減了通信和存儲(chǔ)等運(yùn)營(yíng)成本近90%。目前,OneRec已在快手快手極速版雙端承接25%的線上流量,帶動(dòng)APP停留時(shí)長(zhǎng)分別提升0.54%和1.24%。當(dāng)生成式架構(gòu)...
2025-06-20 19:57:58 2484瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
CVPR(IEEEConferenceonComputerVisionandPatternRecognition)是國(guó)際計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議之一。CVPR2025將于6月11日至6月15日在美國(guó)田納西州納什維爾舉辦,本屆共收到了13,008篇有效論文提交,最終有2,878篇被接收,整體錄用率約為22.1%。其中,快手共有12篇論文入選CVPR2025,涵蓋視頻質(zhì)量評(píng)估、多模態(tài)數(shù)據(jù)集構(gòu)建與基準(zhǔn)測(cè)試、動(dòng)態(tài)3D頭像重建、動(dòng)態(tài)4D場(chǎng)景模擬、視頻生成與增強(qiáng)技術(shù)、可控視頻生成與編輯等多...
2025-06-11 11:00:36 831瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
國(guó)際計(jì)算語(yǔ)言學(xué)年會(huì)(AnnualMeetingoftheAssociationforComputationalLinguistics,簡(jiǎn)稱ACL)是由國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì)(AssociationforComputationalLinguistics)主辦的學(xué)術(shù)盛會(huì),每年舉辦一次。作為計(jì)算語(yǔ)言學(xué)和自然語(yǔ)言處理領(lǐng)域最具影響力的會(huì)議之一,第63屆ACL即將于7月27日至8月1日在奧地利首都維也納隆重舉辦。近日,ACL正式公布了論文錄用名單,快手基礎(chǔ)大模型團(tuán)隊(duì)?wèi){借其在人工智能領(lǐng)域的深厚積累,成功入選7篇論文。這些...
2025-06-05 20:34:36 805瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
導(dǎo)讀:本文回顧了關(guān)于快手的核心數(shù)據(jù)對(duì)象“Photo”存儲(chǔ)系統(tǒng)的一次巧妙降本增效的故事。通過(guò)充足細(xì)致的前期調(diào)研分析,以極少的人力投入取得了相當(dāng)可觀的收益。文中對(duì)有巨大UGC歷史數(shù)據(jù)存量的平臺(tái)型公司如何應(yīng)對(duì)挑戰(zhàn)有一些思考和總結(jié)。一、引言Prematureoptimizationistherootofallevil(oratleastmostofit)inprogramming.——DonaldKnuth快手作為國(guó)民級(jí)短視頻平臺(tái),歷史上短視頻的總量已達(dá)千億級(jí),每日新增短視頻作品超過(guò)4000萬(wàn)。...
2025-05-29 17:10:58 540瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
?Sora、可靈等視頻生成模型令人驚艷的性能表現(xiàn)使得創(chuàng)作者僅依靠文本輸入就能夠創(chuàng)作出高質(zhì)量的視頻內(nèi)容。然而,我們常見(jiàn)的電影片段通常是由導(dǎo)演在一個(gè)場(chǎng)景中精心布置多個(gè)目標(biāo)的運(yùn)動(dòng)、攝像機(jī)拍攝角度后再剪輯而成的。例如,在拍攝賽車(chē)追逐的場(chǎng)景時(shí),鏡頭通常跟隨賽車(chē)運(yùn)動(dòng),并通過(guò)扣人心弦的超車(chē)時(shí)刻來(lái)展示賽事的白熱化。而如今的視頻生成模型無(wú)法實(shí)現(xiàn)3D場(chǎng)景中目標(biāo)、相機(jī)聯(lián)合控制的文本到視頻創(chuàng)作,限制了AI影視制作的能力。近期...
2025-05-27 16:16:18 636瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
多模態(tài)獎(jiǎng)勵(lì)模型(MRMs)在提升多模態(tài)大語(yǔ)言模型(MLLMs)的表現(xiàn)中起著至關(guān)重要的作用,在訓(xùn)練階段可以提供穩(wěn)定的reward,評(píng)估階段可以選擇更好的sample結(jié)果,甚至單獨(dú)作為evaluator。盡管近期強(qiáng)化學(xué)習(xí)(RL)在傳統(tǒng)視覺(jué)任務(wù)和多模態(tài)推理任務(wù)中取得了顯著進(jìn)展,但其在獎(jiǎng)勵(lì)建模中的應(yīng)用仍然受到挑戰(zhàn),尤其是如何通過(guò)強(qiáng)化學(xué)習(xí)對(duì)獎(jiǎng)勵(lì)模型引入長(zhǎng)期推理能力??焓?、中科院、清華、南大的研究團(tuán)隊(duì)發(fā)現(xiàn),直接把現(xiàn)有的RL算法(比如Reinfor...
2025-05-14 19:53:43 591瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
在短視頻成為億萬(wàn)用戶日常生活標(biāo)配的當(dāng)下,它不僅是一種娛樂(lè)方式,更是人們獲取信息、表達(dá)觀點(diǎn)、構(gòu)建社交的主要媒介。隨著內(nèi)容量的井噴式增長(zhǎng),平臺(tái)面臨著前所未有的挑戰(zhàn):一方面,需要更高效地識(shí)別和管理內(nèi)容;另一方面,必須精準(zhǔn)地將優(yōu)質(zhì)內(nèi)容推送給真正感興趣的用戶。大模型技術(shù),尤其是多模態(tài)大模型,正迅速成為人工智能領(lǐng)域的新引擎,具備強(qiáng)大的圖文音視頻理解能力。但在短視頻生態(tài)這一復(fù)雜、高速演化的場(chǎng)景中,如何將這些...
2025-05-13 19:04:39 708瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
?OpenAI的o1系列和DeepSeekR1的成功充分證明,大規(guī)模強(qiáng)化學(xué)習(xí)已成為一種極為有效的方法,能夠激發(fā)大型語(yǔ)言模型(LLM)的復(fù)雜推理行為并顯著提升其能力。然而,這些推理模型的核心訓(xùn)練方法在其技術(shù)報(bào)告中仍然鮮有披露。近期社區(qū)的主要工作也僅局限于數(shù)學(xué)推理領(lǐng)域,使得跨領(lǐng)域泛化這一挑戰(zhàn)依然未得到充分探索。此外,GRPO訓(xùn)練過(guò)程中存在多項(xiàng)常見(jiàn)問(wèn)題,如性能瓶頸、樣本利用效率低下,以及在處理混合領(lǐng)域數(shù)據(jù)集時(shí)難以培養(yǎng)專(zhuān)業(yè)推理...
2025-04-24 17:34:27 1119瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
?ICLR(InternationalConferenceonLearningRepresentations)是人工智能領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議之一,主要聚焦于深度學(xué)習(xí)及其在表示學(xué)習(xí)(representationlearning)方面的最新研究進(jìn)展,是學(xué)術(shù)界和工業(yè)界展示最前沿機(jī)器學(xué)習(xí)成果的重要平臺(tái)。ICLR2025將于4月24日至28日在新加坡博覽中心舉行,本屆論文錄用結(jié)果揭曉,本次大會(huì)共收到11672篇有效投稿,最終有3706篇論文中稿,錄取率為31.75%。logo快手憑借其在深度學(xué)習(xí)算法研發(fā)領(lǐng)域的持...
2025-04-24 17:31:47 1782瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
快手靜態(tài)部署托管服務(wù)(KFX)歷經(jīng)四年發(fā)展,經(jīng)歷了三個(gè)階段,一步步從勉強(qiáng)能行車(chē)的“崎嶇土路”到現(xiàn)在多車(chē)道并行的“平坦高速”,這一轉(zhuǎn)變極大地提升了資源利用率和效率,滿足業(yè)務(wù)的實(shí)際需要。本文將帶你了解其背后的演進(jìn)歷程。一、KFX前端通用靜態(tài)托管服務(wù)KFX是什么:KFX是快手前端通用靜態(tài)托管服務(wù)。為什么要有KFX?靜態(tài)托管服務(wù)是前端工程化發(fā)展的必然結(jié)果??焓智岸瞬渴鸬陌l(fā)展大致經(jīng)歷了這三個(gè)階段:1.直接在物理機(jī)上部署ng...
2025-02-26 19:50:52 1861瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
小程序是一種運(yùn)行在快手生態(tài)內(nèi),無(wú)需下載安裝、即用即走的輕量級(jí)應(yīng)用。其中,模擬器是快手開(kāi)發(fā)者所使用的工具中最核心的模塊之一,但因性能問(wèn)題收到開(kāi)發(fā)者反饋。為此,24年Q2快手啟動(dòng)了模擬器性能優(yōu)化專(zhuān)項(xiàng),從線上數(shù)據(jù)看:模擬器秒開(kāi)率從18%提升至64%,F(xiàn)CPP90從4.4s提升至1.9s。本文詳細(xì)介紹優(yōu)化措施和成效。一、問(wèn)題背景小程序是快手開(kāi)放平臺(tái)對(duì)外提供的開(kāi)放能力之一,是一種運(yùn)行在快手生態(tài)內(nèi),無(wú)需下載安裝、即用即走的輕量級(jí)...
2025-02-26 14:58:29 2111瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
引言:本文將全面且深入地解析BlazeRangePartitioning算子的Native實(shí)現(xiàn)過(guò)程。相較于原生Spark,RangePartitioning的Native實(shí)現(xiàn)在執(zhí)行時(shí)間上達(dá)到了30%的顯著下降,同時(shí)在資源開(kāi)銷(xiāo)方面節(jié)省了高達(dá)76%。這一改進(jìn)大幅降低了運(yùn)行成本,展現(xiàn)了Native實(shí)現(xiàn)帶來(lái)的巨大優(yōu)勢(shì)。一、算子描述RangePartitioning是shufflepartitioning的一種分區(qū)類(lèi)型。它通過(guò)根據(jù)數(shù)據(jù)的值范圍將數(shù)據(jù)劃分成多個(gè)分區(qū)。每個(gè)分區(qū)包含特定范圍內(nèi)的值,通常用于處理有...
2025-02-21 16:36:46 2152瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
導(dǎo)讀:快手動(dòng)效Vision平臺(tái)為解決動(dòng)效資源交付問(wèn)題,引入了動(dòng)效資源準(zhǔn)入準(zhǔn)出檢測(cè)機(jī)制。通過(guò)分析現(xiàn)有交付流程的痛點(diǎn),平臺(tái)增加了了靜態(tài)和動(dòng)態(tài)檢測(cè)服務(wù),確保動(dòng)效質(zhì)量與性能。該套系統(tǒng)已成功召回并預(yù)防了多次線上問(wèn)題,提升了使用動(dòng)效資源的穩(wěn)定性和效率。一、引言在系列文章的首篇??《快手前端動(dòng)效大揭秘:告別低效,vision平臺(tái)來(lái)襲!》(點(diǎn)擊回顧)???中,我們探討了Vision平臺(tái)的整體架構(gòu)和演進(jìn)思路,特別是針對(duì)動(dòng)效生產(chǎn)成...
2025-02-21 14:52:13 1802瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
KwaiCoder23BA4v1是快手Kwaipilot團(tuán)隊(duì)最新開(kāi)源的自研代碼續(xù)寫(xiě)大模型,模型的訓(xùn)練依托于Kwaipilot團(tuán)隊(duì)提出的一種高效的模型訓(xùn)練方案。通過(guò)結(jié)合模型剪枝、知識(shí)蒸餾、細(xì)粒度合并等技術(shù),相比傳統(tǒng)方法以130的成本完成了23B寬MoE架構(gòu)代碼續(xù)寫(xiě)模型的訓(xùn)練,并在多個(gè)代碼領(lǐng)域評(píng)測(cè)集上實(shí)現(xiàn)了新的SOTA。開(kāi)源地址:??https:huggingface.coKwaipilotKwaiCoder23BA4Bv1??我們的路徑:高質(zhì)量數(shù)據(jù):我們強(qiáng)調(diào)篩選和整理高質(zhì)量代碼、文本與合...
2025-01-24 15:04:35 2490瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
導(dǎo)讀:在上一篇文章中,我們?cè)敿?xì)介紹了Vision動(dòng)效平臺(tái)的渲染引擎——Crab,并分享在復(fù)雜動(dòng)效渲染場(chǎng)景下積累的實(shí)踐經(jīng)驗(yàn)和精彩案例。今天,我們將揭秘如何將「動(dòng)效描述翻譯為動(dòng)效代碼」——從Lottie導(dǎo)出CSSAnimated代碼。一、項(xiàng)目背景在進(jìn)行前端頁(yè)面開(kāi)發(fā)中,經(jīng)常需要涉及到元素動(dòng)效的開(kāi)發(fā),比如按鈕的呼吸狀態(tài)動(dòng)效,彈窗的出現(xiàn)和消失動(dòng)效等等,這些動(dòng)效為用戶在頁(yè)面交互過(guò)程中獲得良好的體驗(yàn)起到重要的作用。要開(kāi)發(fā)這些動(dòng)效,一般...
2024-12-31 17:02:32 2291瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
導(dǎo)讀:在上一篇文章中,我們?nèi)轿坏亟馕隽丝焓諺ision動(dòng)效平臺(tái)的整體架構(gòu)及其演進(jìn)思路??焓智岸藙?dòng)效大揭秘:告別低效,vision平臺(tái)來(lái)襲!?????今天,我們將進(jìn)一步深入,詳細(xì)介紹Vision動(dòng)效平臺(tái)的渲染引擎——Crab,并分享在復(fù)雜動(dòng)效渲染場(chǎng)景下積累的實(shí)踐經(jīng)驗(yàn)和精彩案例。?一、項(xiàng)目背景?1.1快手大型活動(dòng)中的動(dòng)效動(dòng)效在設(shè)計(jì)和用戶體驗(yàn)領(lǐng)域中有重要的價(jià)值,表現(xiàn)力強(qiáng)的動(dòng)效不僅能夠激發(fā)受眾用戶的興趣,提高參與度,還能提高...
2024-12-31 14:48:54 2708瀏覽 0點(diǎn)贊 0回復(fù) 0收藏