視頻時代的大數(shù)據(jù):問題、挑戰(zhàn)與解決方案
一、介紹
人們所觀察的世界無時無刻不在改變,造就了“視頻”相比于文本等類型的數(shù)據(jù)更具表現(xiàn)力,包含更加豐富的信息。如今,能夠產(chǎn)生視頻的數(shù)據(jù)源及應(yīng)用場景愈發(fā)多樣,視頻數(shù)據(jù)的規(guī)模不斷增長,視頻大數(shù)據(jù)成為支撐諸多行業(yè)技術(shù)發(fā)展的熱點方向。
1. 交通攝錄
城市化的快速發(fā)展導(dǎo)致機動車數(shù)量持續(xù)激增,也因此造成了諸多的交通問題。
一方面,由于時間、天氣、大型事件等多方面的因素,城市道路上的交通流量持續(xù)變化,尤其是繁華地帶的路口,經(jīng)常匯聚著較多的待通行車輛。
如何第一時間獲取交通流量信息、監(jiān)測城市交通狀況,正是交通攝錄系統(tǒng)所需解決的問題。通過攝錄視頻流的實時收集,城市交通控制中樞能夠及時地獲知流量異常情況,做出交通調(diào)度調(diào)整,以改善行車效率。
另一方面,人為駕駛的主觀性導(dǎo)致違規(guī)事件的發(fā)生難以完全避免,而對檢測的疏漏或延遲將不僅可能導(dǎo)致駕駛行為責任人自身規(guī)則意識的下降,升高未來的事故發(fā)生率,更有可能造成交通癱瘓,甚至重大的人身財產(chǎn)損失。
因此,廣泛分布且實時視頻采集的交通攝錄系統(tǒng)具有極高的存在必要性,不斷規(guī)范及約束車輛駕駛者的行為,同時對違規(guī)事件及交通事故在第一時間進行采集、上報,進行后續(xù)的處理。
目前,在部分城市的交通系統(tǒng)中,已經(jīng)嘗試采用更加智能化的交通攝錄體系,例如對疲勞駕駛、違規(guī)通話等駕駛行為實時檢測、智能判斷,而無須人為干預(yù)。
密布于城市各個角落的攝像頭組成的龐大的攝像系統(tǒng)基礎(chǔ)設(shè)施帶來的交通價值不言而喻,但對交通數(shù)據(jù)處理系統(tǒng)提出了嚴峻的挑戰(zhàn)。
一方面,該系統(tǒng)需要具備低延遲的處理性能,保證異常事件發(fā)生時能夠及時地進行分析、處理以及后續(xù)操作。另一方面,基礎(chǔ)設(shè)施中數(shù)量巨大的輸入源是傳統(tǒng)單一視頻處理系統(tǒng)所難以應(yīng)付的。
由于該系統(tǒng)不僅需要采集、存儲視頻,而且在邁向智能化發(fā)展的路上,需要對它進行預(yù)處理、幀解析、事件模式匹配、異常檢測上報等操作,因此對于極多輸入源的同時處理,是當前所面臨的一大難題。
2. 車載攝錄
對于傳統(tǒng)機動車而言,行車記錄儀的出現(xiàn)為廣大駕駛者帶來了多方面的保護。
一方面,共享出行的專車內(nèi)、公共交通的車廂內(nèi),車內(nèi)記錄儀能夠持續(xù)記錄乘客及駕駛者的行為,檢測車內(nèi)狀況。在發(fā)生異常事件時,記錄儀能夠提供準確的現(xiàn)場追溯,不僅為責任認定提供了有效的證據(jù)支撐,更為嚴重性事件的溯源剖析提供了第一手資料。
另一方面,用于私家車的前向記錄儀則更為普遍。在車輛啟動后,行車記錄儀隨之啟動,以視頻的形式持續(xù)地、完整地記錄著行駛的整個過程,有效彌補了交通攝錄系統(tǒng)不及之處,為駕駛者提供了多層面的安全保證。
對于新興的智能車輛而言,包含360°環(huán)繞攝像在內(nèi)的環(huán)境感知系統(tǒng)所發(fā)揮的作用更是舉足輕重。攝像頭之于汽車,就像眼之于人,提供了感知周遭環(huán)境的輸入口?;趯崟r的環(huán)境圖像,自動駕駛控制系統(tǒng)能夠?qū)Σ杉降囊曨l進行處理、分析,并即時進行決策,控制車輛行為,在一定程度上,甚至完全地替代人為控制,極大地提升出行效率。
雖然車載攝錄為傳統(tǒng)及新興機動車帶來了強大的功能,但車輛本身的移動性為視頻的數(shù)據(jù)處理提出了新的問題:
- 一方面,高移動性導(dǎo)致視頻內(nèi)容的變化極快,不同于固定物理位置的城市攝像頭,車載攝錄可能在極短時間內(nèi)采集到完全不同的影像,這不僅包括物體本身的變化,還包含了移動導(dǎo)致的光線、角度等上下文環(huán)境的急劇變化,對于視頻內(nèi)容分析的準確性和靈活性要求更高;
- 另一方面,高移動性直接導(dǎo)致了網(wǎng)絡(luò)通信連接的不穩(wěn)定性,不同于有線光纜傳輸,無線網(wǎng)絡(luò)傳輸?shù)馁|(zhì)量依賴于網(wǎng)絡(luò)信號強度、帶寬、信道實時負載等因素,造成基于無線網(wǎng)絡(luò)的數(shù)據(jù)及任務(wù)的穩(wěn)定上傳過程變得愈發(fā)艱難。
3. 航空攝錄
由于更高的攝入角度,基于航空器材的攝錄系統(tǒng)通常具有更高的專業(yè)型和特殊性,同時帶來了更加強大的功能性:
1)空地追蹤
得益于不被道路交通所限,飛行器能夠靈活、高效地追蹤移動性目標,彌補地面追蹤不便的缺陷,降低目標失蹤率,為關(guān)鍵性任務(wù)提供支撐。
2)智慧農(nóng)耕
傳統(tǒng)農(nóng)耕作業(yè)需要人工地親力親為,經(jīng)歷長周期的運作,包括觀察并分析農(nóng)田情況,調(diào)整作業(yè)策略,根據(jù)種植方案進行播種,以及后期灌溉、除蟲等維護。由于務(wù)農(nóng)者本身能力所限,這一系列的過程將十分耗費時間資源,效率較為低下,且無法準確地按照預(yù)期規(guī)范化操作細節(jié),造成減產(chǎn)等損失。
相比于人力運作,基于航空器的作業(yè)方式能夠帶來極大的改善。通過航空攝錄系統(tǒng),能夠直接以直觀的視頻形式采集農(nóng)田情況,并基于農(nóng)田數(shù)據(jù)處理系統(tǒng)進行視頻分析,獲取種植所需的多元化參數(shù)。隨后,航空器能夠攜帶種子、農(nóng)藥等基礎(chǔ)資源,從空中直接進行均勻播撒,在短時間內(nèi)覆蓋大范圍作業(yè)區(qū)域,實現(xiàn)人工難以達到的效率。
3)遙感
基于航空設(shè)備的自身優(yōu)勢,它能夠在空中無接觸地、遠距離地探測、勘察各種復(fù)雜地形地貌,包括人們難以進入的野生地帶、冰川、火山等。而視頻的形式為人們提供了對于未知環(huán)境最為直觀的感受,同時有利于數(shù)據(jù)處理系統(tǒng)進一步地科學(xué)分析、探索。
如今,由于基礎(chǔ)設(shè)施以及無人控制技術(shù)的不斷發(fā)展,航空攝錄已經(jīng)逐漸轉(zhuǎn)向基于無人機的系統(tǒng)實現(xiàn)。無人機具有更低的制造成本、更小的體積、移動更加靈活等諸多優(yōu)勢,因此對于傳統(tǒng)飛行器難以實現(xiàn)的場景,無人機具有更大的潛能。
同時,由于控制者本身從“機內(nèi)”移動到了“機外”,相隔數(shù)百米甚至數(shù)百千米,因此,一方面,如何高性能地實現(xiàn)從無人機采集的實時視頻到控制者的實時決策,需要解決視頻采集技術(shù)、預(yù)處理技術(shù)、網(wǎng)絡(luò)傳輸技術(shù)等諸多視頻大數(shù)據(jù)系統(tǒng)所面臨的問題;另一方面,由于無人機具備更加多元化的環(huán)境感知能力,例如無死角覆蓋的實時攝錄系統(tǒng),因此無人機自主行為控制也是實現(xiàn)智能化發(fā)展的一個方向。但是,因此帶來更高的視頻處理性能需求,是傳統(tǒng)設(shè)備端運算或者云端兩層架構(gòu)所無法實現(xiàn)的,需要云邊協(xié)同高效架構(gòu)的加入。
4. 智能設(shè)備
包括智能手機、平板計算機在內(nèi)的智能設(shè)備,逐漸成為日常生產(chǎn)生活中與人們打交道最為頻繁的物品。
一方面,智能設(shè)備本身所具備的拍照及錄像能力,為人們的生活帶來了更加豐富的記錄方式。通過智能設(shè)備所拍下的照片、短視頻、影片,能夠方便地分享正在進行的游戲、欣賞的風景、有趣的寵物、令人深思的事件等。
另一方面,它能使得人們的生產(chǎn)、工作更加高效,尤其是在人們出行受限的特殊時期,眾多的團隊、企業(yè)開始使用基于視頻會議的高效辦公方式,繼續(xù)原有的運作。
相比于其他的攝錄系統(tǒng),智能設(shè)備帶來的攝錄能力以及產(chǎn)生的視頻大數(shù)據(jù)更加無處不在,更加貼近人們本身,同時也包含著更大的價值挖掘潛能。
5. 其他
遠不止上述提及的應(yīng)用場景,視頻大數(shù)據(jù)幾乎無處不在,例如:
1)安防監(jiān)控
不同于交通攝錄系統(tǒng),安防監(jiān)控帶來的視頻記錄能力更多地用于環(huán)境采集,以實現(xiàn)生產(chǎn)生活日常運作的安全保障。在安防系統(tǒng)中,數(shù)據(jù)處理的低延遲、高吞吐特性尤為重要。根據(jù)用戶預(yù)設(shè)的智能檢測模型,攝像系統(tǒng)在采集到視頻數(shù)據(jù)后,應(yīng)在極短的時間內(nèi)完成數(shù)據(jù)處理,并實現(xiàn)智能決策。
2)工業(yè)攝錄
通過視頻監(jiān)控等方式,實時監(jiān)測車間生產(chǎn)情況,基于視頻大數(shù)據(jù)的分析,能夠即時發(fā)現(xiàn)異常、調(diào)整設(shè)備等。
視頻數(shù)據(jù)在各行各業(yè)的應(yīng)用場景十分廣泛,同時也帶了極高的潛在分析價值,但由于它文件體積本身龐大,因此對數(shù)據(jù)處理系統(tǒng)的能力提出了更大的挑戰(zhàn)。
二、問題與挑戰(zhàn)
1. 問題
視頻數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),價值密度很低,且具有連續(xù)性、實時性等特點,視頻大數(shù)據(jù)系統(tǒng)對數(shù)據(jù)相比傳統(tǒng)具有更高的性能要求,這主要體現(xiàn)在以下幾方面:
1)計算密集
對于視頻流而言,一般需要進行信號處理、編碼、解碼等基礎(chǔ)過程,轉(zhuǎn)換為計算機內(nèi)相應(yīng)的存儲格式,再對每一幀內(nèi)容進行深入處理。
一方面,對于每一幀內(nèi)容而言,可以將它看作類似于靜態(tài)照片的圖像,可通過一系列相關(guān)技術(shù)進行以下操作:
- 特征檢測及提取:傳統(tǒng)的Canny邊緣檢測算法、Harris角點檢測算法、SURF算法以及SIFT特征、GIST特征等,基于深度學(xué)習的神經(jīng)網(wǎng)絡(luò)模型等,能夠?qū)D像中的邊緣、轉(zhuǎn)角等特征進行識別,支撐后續(xù)更加復(fù)雜的處理。
- 目標檢測:針對特定的或者泛化的目標,例如物品、人體、面部等,通過特定算法進行檢測,獲知其存在性或位置。
- 目標分類:對于圖像中出現(xiàn)的目標進行分類等。
不論是基于傳統(tǒng)算法的圖像處理方法,還是近年來愈發(fā)火熱的深度學(xué)習處理方法,它的性能(例如準確率)通常與運算量直接關(guān)聯(lián),例如,對于深度網(wǎng)絡(luò)模型而言,具備更高精度的模型通常具有更為復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)、更為龐大的訓(xùn)練參數(shù)量,因此需要更高的算力(包括計算能力、存儲能力等)進行推斷。
另一方面,由于視頻是每一幀連續(xù)組合而成的流式數(shù)據(jù),因此對于視頻流的處理將遠高于靜態(tài)圖像處理的復(fù)雜度。
首先,為了捕獲環(huán)境中更多的細節(jié),以及為后續(xù)的算法提供更加精確的原生輸入,視頻采集系統(tǒng)通常追求更高的分辨率。如今,隨著設(shè)備的不斷升級迭代,4K甚至8K分辨率已經(jīng)逐漸成為高質(zhì)量視頻的標準,這將大幅增加每一幀圖像的體積,對運算系統(tǒng)性能提出更高的要求。
其次,為了能夠在時間變化的過程中捕獲更加順暢的運動行為,視頻采集系統(tǒng)通常會將幀率(即每單位時間內(nèi)采集的圖像幀數(shù)量)設(shè)置為設(shè)備能夠接受的盡可能高的水平。因此,在單幀圖像體積一定的情況下,更高的幀率意味著單位時間內(nèi)的視頻體積更大,這對數(shù)據(jù)處理系統(tǒng)會造成更大的壓力。
此外,由于不同于靜態(tài)圖像的特點,視頻流將具有更高的連續(xù)性、動態(tài)性,數(shù)據(jù)處理系統(tǒng)不應(yīng)僅專注于每一幀內(nèi)圖像的信息,還應(yīng)該具備分析幀與幀之間的動態(tài)變化性信息的能力。
在進行目標追蹤時,需要對高幀率的連續(xù)視頻畫面執(zhí)行算法,憑借實時性能檢測目標物體,并定位目標位置。例如,在檢測行人的過程中,人們的移動通常具有群體性,因此基于對行人運動軌跡的預(yù)測進而提升檢測準確率,這是一個優(yōu)化的潛在方向。
因此,計算密集型的視頻流處理使得終端設(shè)備的計算能力、存儲能力難以滿足。
2)帶寬需求高
分辨率、幀率等配置的不斷提升,帶來的不僅是對于計算系統(tǒng)的壓力,同時也帶來了對于網(wǎng)絡(luò)傳輸系統(tǒng)的挑戰(zhàn):
- 每一幀圖像的內(nèi)容不斷豐富,細節(jié)更加完整;
- 單位時間內(nèi)的幀數(shù)不斷增長,視頻動態(tài)變化更加流暢;
- 視頻源不斷增加,針對同一物體的拍攝角度不再限于一個(例如足球比賽中環(huán)繞全場的大量攝錄機位)。
這三點同時帶來了不同維度的體積增長,進而導(dǎo)致了視頻產(chǎn)生源發(fā)送至處理系統(tǒng)所在平臺的網(wǎng)絡(luò)帶寬開銷急劇增加。目前,在體積優(yōu)化的情況下,智能手機以1080P分辨率、60幀/s幀率的配置錄制1min視頻的體積約為100MB;以4K分辨率、60幀/s幀率錄制1min視頻的體積約為440MB。
由此可見,在多采集源同時進行傳輸?shù)那闆r下,網(wǎng)絡(luò)基礎(chǔ)設(shè)施將承受極大壓力,同時,帶寬占用帶來的成本也使得用戶難以承受。
2. 挑戰(zhàn)
針對視頻體積帶來的帶寬成本與通信壓力,需要從多個維度進行分析,根據(jù)實際場景進行優(yōu)化。例如圖1-8給出了一種嘗試方案:邊緣節(jié)點對終端設(shè)備采集的原生高帶寬視頻進行預(yù)處理,通過局部壓縮、裁切、去幀等方法,減小視頻體積,并將加工后的視頻流上傳至云端進一步處理。但這種方法同樣面臨著一些技術(shù)挑戰(zhàn):

▲圖1-8 一種云邊協(xié)同視頻大數(shù)據(jù)處理方案
1)計算任務(wù)卸載
普通計算任務(wù)通常能夠通過劃分獲得低耦合的子任務(wù),但視頻流由于特殊性,為任務(wù)劃分以及基于劃分的卸載提出了更高的要求:
- 一方面,視頻流本身體積龐大,這一特點使得該類型數(shù)據(jù)在不同平臺之間的流動變得較為困難,每一次網(wǎng)絡(luò)傳輸都需要付出較大的時間及服務(wù)成本;
- 另一方面,視頻處理本身具有連續(xù)性,不同子任務(wù)之間可能具有較高的耦合程度,對任務(wù)的切分造成了困難,進而導(dǎo)致處理任務(wù)卸載至邊緣平臺、云平臺時面臨更多問題。
2)邊緣平臺資源
邊緣平臺相比于云平臺,本身不具備海量的計算、存儲等資源,因此對于計算密集型的視頻流應(yīng)用而言,難以提供無限制的處理能力。例如,用于處理視頻圖像的DNN通常具有百萬甚至千萬級的參數(shù),這使得邊緣平臺中單一的計算節(jié)點可能難以負載。
對于用戶而言,需要更加縝密地考慮云邊協(xié)同處理方案,而不能簡單直接地套用現(xiàn)有卸載策略。
3)邊緣服務(wù)范圍
處于網(wǎng)絡(luò)中心的云平臺能夠?qū)W(wǎng)絡(luò)全局的計算請求進行處理,而邊緣節(jié)點受限于服務(wù)范圍,僅能夠為一定區(qū)域內(nèi)的用戶提供服務(wù)。但與此同時,許多視頻流應(yīng)用的計算任務(wù)具有較高的持續(xù)性,需要平臺為它提供不間斷的計算服務(wù),這對于移動性的視頻源而言,將造成節(jié)點切換、任務(wù)遷移、服務(wù)穩(wěn)定性等多方面影響。
此外,減小視頻體積意味著可能造成視頻的細節(jié)完整度降低,進而導(dǎo)致在用于目標檢測、物體追蹤等的深度網(wǎng)絡(luò)模型準確率方面有所妥協(xié),因此需要使用更加細粒度的優(yōu)化方案來彌補畫面細節(jié)減少帶來的損失。
因此,在傳統(tǒng)云平臺的任務(wù)卸載方式儼然無法適應(yīng)體積增長迅速的視頻流處理應(yīng)用的當下,如何利用云邊協(xié)同平臺進一步優(yōu)化視頻大數(shù)據(jù)處理性能,值得人們深入研究。
三、前沿研究
對于計算、存儲以及網(wǎng)絡(luò)傳輸能力的需求使得視頻流處理系統(tǒng)需要采用新的計算服務(wù)模式來實現(xiàn)。目前,云邊協(xié)同平臺為它帶來了希望,同時也面臨著許多問題,不僅包括云邊平臺本身所面臨的問題,也包含針對視頻流處理應(yīng)用的特殊挑戰(zhàn),學(xué)術(shù)界以及工業(yè)界的研究人員對此進行著不斷探索。
1. 邊緣環(huán)境的網(wǎng)絡(luò)不穩(wěn)定性
參考文獻[62]針對邊緣環(huán)境中對視頻流圖像處理任務(wù)影響較大的網(wǎng)絡(luò)因素進行分析,考慮到無線通信信號強弱,提出了3種處理方案:
①本地執(zhí)行;②完全卸載;③本地預(yù)處理(減小體積)后卸載至云邊平臺,并對不同模型的計算時間、計算能耗、通信時間、通信開銷等多方面進行綜合建模分析,權(quán)衡計算時間與能耗、通信時間與能耗,在不同信號強度時選擇不同的最優(yōu)策略完成圖像處理任務(wù)。
2. 邊緣節(jié)點的多租戶特性
同一個邊緣節(jié)點可能同時服務(wù)于不同的用戶,但由于邊緣平臺的地理位置以及服務(wù)范圍,這些用戶可能具有相似或部分相似的視頻流計算任務(wù),尤其是基于深度神經(jīng)網(wǎng)絡(luò)模型的圖像處理,不同的圖像可能應(yīng)用相同的模型或相同的子模型進行推斷。
基于這個理念,Mainstream[63]框架基于遷移學(xué)習,對使用相同預(yù)訓(xùn)練模型的并發(fā)執(zhí)行的視頻處理任務(wù)進行分析,利用相同預(yù)訓(xùn)練層[作者稱為共享莖干(share stem)部分]的一次計算,消除重復(fù)計算。
但由于不同的應(yīng)用可能會對相同的預(yù)訓(xùn)練模型進行細粒度的優(yōu)化訓(xùn)練以提升模型推斷準確率,因此共享莖干的比重會隨之降低,同時減慢了幀處理速率。為了解決這個問題,即動態(tài)權(quán)衡視頻流處理速度與模型準確率,該框架包含3個部分:
1)M-Trainer:模型訓(xùn)練工具包,能夠使得基于預(yù)訓(xùn)練模型進行訓(xùn)練優(yōu)化的過程保留不同粒度級別的副本,同時產(chǎn)生不同級別模型的推斷準確率等元數(shù)據(jù);2)M-Scheduler:使用訓(xùn)練時生成的數(shù)據(jù),計算不同層(包括共享莖干)的運行時間開銷,尋找全局最優(yōu)策略;3)M-Runner:提供應(yīng)用運行時環(huán)境,動態(tài)選擇不同級別的模型提供服務(wù),實現(xiàn)共享莖干帶來的計算量減少與準確率下降之間的權(quán)衡。該框架專注于并發(fā)視頻流任務(wù)處理的場景,提供了從開發(fā)到部署運行的完整框架,但同時也為開發(fā)者的實現(xiàn)帶來了一定難度。
3. 云邊協(xié)同下的智能處理
深度學(xué)習技術(shù)為視頻大數(shù)據(jù)處理帶來了前所未有的性能提升,但包括深度神經(jīng)網(wǎng)絡(luò)在內(nèi)的模型架構(gòu)的復(fù)雜度使得它對于資源具有較高的要求,這表現(xiàn)在模型訓(xùn)練以及推斷兩方面:
1)模型訓(xùn)練
對于視頻大數(shù)據(jù)應(yīng)用的深度神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練而言,數(shù)據(jù)的規(guī)模和體積成為限制性能的一個重要因素。通常,模型訓(xùn)練階段通常放置于擁有較多資源的平臺而非在終端設(shè)備上運行,因此視頻數(shù)據(jù)的傳輸將造成巨大的網(wǎng)絡(luò)帶寬開銷。
CDC[64]框架實現(xiàn)了一個輕量級的自動編碼器(AutoEncoder,AE),以及一個輕量的元素分類器(Elementary Classifier,EC):
首先,CDC框架控制AE對數(shù)據(jù)進行壓縮;隨后,EC使用壓縮后的數(shù)據(jù)以及數(shù)據(jù)標注進行梯度下降計算,調(diào)整自身參數(shù)集合;再者,AE基于自身壓縮造成的損失與相應(yīng)的EC的損失值共同優(yōu)化自身參數(shù),并設(shè)置削弱參數(shù)α,調(diào)整EC的損失對AE訓(xùn)練過程的影響權(quán)重,避免不收斂的問題;如此往復(fù)迭代,實現(xiàn)EC、AE相結(jié)合,EC指導(dǎo)AE的訓(xùn)練。
經(jīng)過訓(xùn)練后的AE將具備內(nèi)容感知的壓縮能力,結(jié)合精度降低策略,實現(xiàn)傳輸?shù)皆贫说妮^低的帶寬開銷。同時,云端能夠評估網(wǎng)絡(luò)狀況,向邊緣端反饋后續(xù)的圖像壓縮率。該框架以智能壓縮的思路,對降低訓(xùn)練數(shù)據(jù)網(wǎng)絡(luò)傳輸開銷的方向進行了有價值的探索。
2)模型推斷
同樣是采用壓縮策略,參考文獻[65]從關(guān)鍵區(qū)域(Region Of Interest,ROI)的角度實現(xiàn)帶寬與準確率之間的權(quán)衡。作者基于SORT、Hungarian等算法,在云端將包含目標物體的ROI坐標反饋至邊緣端,邊緣端基于multi-QF JPEG算法對ROI及非ROI區(qū)域進行不同質(zhì)量程度的壓縮,并將壓縮后的數(shù)據(jù)發(fā)送至云端推斷。
同時,基于Kalman Filter算法,該研究為每個目標物體建立一個行為預(yù)測模型,以抵償邊-云-邊這一反饋傳輸過程的延遲。
4. 其他
參考文獻[66]基于動態(tài)規(guī)劃思想,在云端構(gòu)建了一個動態(tài)數(shù)據(jù)模型,對固定視頻流進行分析,并預(yù)測下一次可能發(fā)生的事件的時空位置,以對特定監(jiān)控傳感器進行帶寬控制。
而參考文獻[67]從多比特率視頻流傳輸?shù)慕嵌瘸霭l(fā),認為傳統(tǒng)邊緣緩存方法通常需要視頻流行度符合特定分布,但實際場景下邊緣節(jié)點覆蓋區(qū)域小、用戶移動性高、用戶請求受移動設(shè)備上下文影響大。因此研究人員將該問題建模為0-1優(yōu)化問題,利用多臂老虎機理論,設(shè)計了CUCB(C-upper置信區(qū)間)算法進行優(yōu)化。
具體而言,該方法能夠進行在線化的學(xué)習,根據(jù)用戶需求實時地制定緩存模式和處理策略,可最大化視頻服務(wù)提供商的利益,滿足用戶的服務(wù)質(zhì)量要求。
此外,對于云邊協(xié)同的視頻處理,還能夠應(yīng)用全局統(tǒng)一的時空ID技術(shù)、視頻編碼與特征編碼聯(lián)合優(yōu)化技術(shù)等,進一步對視頻處理性能加以提高。
關(guān)于作者:韓銳,北京理工大學(xué)特別研究員,博士生導(dǎo)師。2010年畢業(yè)于清華大學(xué)并獲優(yōu)秀碩士畢業(yè)生,2014年博士畢業(yè)于英國帝國理工學(xué)院,2014年3月至2018年6月在中國科學(xué)院計算所工作。專注于研究面向典型負載(機器學(xué)習、深度學(xué)習、互聯(lián)網(wǎng)服務(wù))的云計算系統(tǒng)優(yōu)化,在 TPDS、TC、TKDE、TSC等領(lǐng)域頂級(重要)期刊和INFOCOM、ICDCS、ICPP、RTSS等會議上發(fā)表超過40篇論文,Google學(xué)術(shù)引用1000 余次。
劉馳,北京理工大學(xué)計算機學(xué)院副院長,教授,博士生導(dǎo)師。智能信息技術(shù)北京市重點實驗室主任,國家優(yōu)秀青年科學(xué)基金獲得者,國家重點研發(fā)計劃首席科學(xué)家,中國電子學(xué)會會士,英國工程技術(shù)學(xué)會會士,英國計算機學(xué)會會士。分別于清華大學(xué)和英國帝國理工學(xué)院獲得學(xué)士和博士學(xué)位,后在德國電信研究總院任博士后研究員,在美國IBM T.J.Watson研究中心和IBM中國研究院任研究主管。主要研究方向是智能物聯(lián)網(wǎng)技術(shù)。
本文摘編自《云邊協(xié)同大數(shù)據(jù)技術(shù)與應(yīng)用》(ISBN:978-7-111-70100-2),經(jīng)出版方授權(quán)發(fā)布。
參考文獻[62] Y G KIM, Y S LEE, S W CHUNG. Signal strength-aware adaptive offloading with local image preprocessing for energy efficient mobile devices[J].IEEE Transactions on Computers, 2019, 69(1): 99-111.
[63] A H JIANG, et al. Mainstream: Dynamic stem-sharing for multi-tenant video processing[C].2018 USENIX Annual Technical Conference, 2018: 29-42.
[64] Y DONG, P ZHAO, H YU, et al. CDC: Classification Driven Compression for Bandwidth Efficient Edge-Cloud Collaborative Deep Learning[DB/OL].arXiv preprint arXiv: 2005.02177, 2020.
[65] B A MUDASSAR, J H KO, S MUKHOPADHYAY. Edge-cloud collaborative processing for intelligent internet of things: A case study on smart surveillance[C].2018 55th ACM/ESDA/IEEE Design Automation Conference (DAC), 2018: 1-6.
[66] L TOKA, B LAJTHA, é HOSSZU, et al. A resource-aware and time-critical IoT framework[C].IEEE INFOCOM 2017-IEEE Conference on Computer Communications, 2017: 1-9.
[67] Y HAO, L HU, Y QIAN, et al. Profit maximization for video caching and processing in edge cloud[J].IEEE Journal on Selected Areas in Communications, 2019, 37(7): 1632-1641.




























