小覓雙目攝像頭:加速外賣無人配送新時代
王興曾在采訪中提到:美團***的成本來自于 50 萬名送餐騎手。據(jù)美團的招股說明書顯示,美團餐飲外賣業(yè)務成本由 2016 年的 57 億元增至 2017 年的 193 億元,增幅達 238.8%,騎手成本則由 2016 年的 51 億元增至2017 年的 183 億元,占 94.8%,增長超過了3 倍。不得不說,不斷上漲的人力成本,加速了無人配送餐車的落地。
近期,美團無人配送團隊在上海松江大學城進行了測試,不由讓人聯(lián)想,無人車代替自然人進行配送的那一天還會遠嗎?
首先考慮下室內(nèi)場景:無人配送餐車進入室內(nèi)環(huán)境取餐,就需要自行進入電梯,期間可能會遇到電梯大小不合適的問題。目前金地集團,朝陽大悅城同意為美團免費改造電梯,但其他的寫字樓,小區(qū)呢?如果為了無人配送餐車又增加了成本,豈不是失去了本意?
再來看下室外環(huán)境,無人配送餐車需要考慮人行道、機動車道、紅綠燈以及來來往往的行人、機動車和非機動車等等。在如此復雜的情況下,無人配送餐車需要能夠自主規(guī)劃路線,并在復雜多變的路面環(huán)境中依據(jù)周邊環(huán)境實時做出相應的判斷。這背后需要強大的自主定位與地圖創(chuàng)建技術支持,也就是 SLAM 技術(Simultaneous Localization and Mapping)。
SLAM 實際上是一個典型的軍轉(zhuǎn)民用的技術,探測器登陸未知環(huán)境的星球進行科研研究時,面對復雜的大規(guī)模環(huán)境,而無法對其進行實時遙控時,必須通過實現(xiàn)同步定位與地圖創(chuàng)建才能完成導航任務,例如美國“機遇號”、“勇氣號”以及“好奇號”等火星探測器。如果放在當今社會消費級市場來理解的話,掃地機器人沒有 SLAM 技術,就無法實現(xiàn)自主移動。
SLAM 主要分為激光 SLAM 和 視覺SLAM(vSLAM) 兩大類。其中,激光 SLAM 比 vSLAM 起步早,在理論、技術和產(chǎn)品落地上都相對成熟。從成本上來說,vSLAM 主要通過視覺攝像頭來采集信息,因此造價要比激光雷達低很多。從應用場景上來說,囿于傳統(tǒng)單線激光 SLAM 的固有弊端,目前此類模塊主要被應用在室內(nèi),但對于無人配送行業(yè)來說,不能兼顧室內(nèi)外場景,無人配送只是空談。與傳統(tǒng)單線激光SLAM相比, vSLAM 在室內(nèi)外環(huán)境外均能開展工作,且成本相對較低,對于無人配送行業(yè)來說無疑是一個更優(yōu)的選擇。
目前,實現(xiàn)vSLAM方案主要有兩種路徑,一種是基于 RGBD 的深度攝像機(如Kinect),它***的特點是可以通過紅外結(jié)構(gòu)光或 Time-of-Flight 原理,直接測出圖像中各像素離相機的距離。不過,現(xiàn)在多數(shù) RGBD 相機還存在測量范圍窄、噪聲大、視野小等諸多問題,主要適用于室內(nèi) SLAM,并不適用于需要在室外工作的無人配送餐車。
還有一種就是基于單目或雙目攝像頭的vSLAM。單目相機 SLAM,即只用一只攝像頭就可以完成的SLAM 。這樣做的好處是傳感器簡單、成本特別的低,但相比別的視覺傳感器,單目有個***的問題,就是沒法確切地得到深度。

相比單目攝像頭,雙目攝像頭的功能更加豐富,可獲取依靠單目攝像頭無法準確識別的深度等信息。雙目攝像頭是利用仿生學原理,通過標定后的雙攝像頭得到同步曝光圖像,然后計算獲取的 2 維圖像像素點的第三維深度信息。相對較低的造價以及穩(wěn)定的室內(nèi)外應用效果使許多大廠紛紛將目光聚焦到這一才涌現(xiàn)不久的細分領域。
深耕此領域的小覓智能已與國內(nèi)外200余家企業(yè)客戶開展了服務與合作,其中標配六軸傳感器(IMU)和紅外主動光探測器(IR)的小覓雙目攝像頭標準版,利用攝像頭和運動傳感器的互補性,可為視覺 SLAM 的研究提供精度更高、成本更低、布置簡單、同時可以實現(xiàn)人臉和物體識別的視覺 SLAM 研發(fā)硬件。
就目前而言,“雙目+IMU”的結(jié)合方式,是眼下 SLAM 的相對***方案。小覓雙目攝像頭標準版內(nèi)置的六軸傳感器(IMU)可為視覺定位算法的研究提供數(shù)據(jù)的互補和校正,適用于視覺慣性里程計(VIO)的算法研究,幫助提升定位精度,而紅外主動光探測器(IR)可以幫助解決室內(nèi)白墻和無紋理物體的識別難題,提升圖像源的識別精度。相信有成熟vSLAM技術的加持,無人配送餐車已經(jīng)離我們不遠了。