順豐劉志欣:人工智能助力物流升級
原創(chuàng)【51CTO.com原創(chuàng)稿件】2017年7月21日-22日,由51CTO主辦的以人工智能為主題的WOTI2017全球創(chuàng)新技術(shù)峰會在北京富力萬麗酒店隆重舉行。峰會期間,30+AI明星,數(shù)十場圍繞人工智能主題的精彩演講與圓桌論壇緩緩揭開面紗。除了場內(nèi)的精彩演講,場外還有專門為AI愛好者搭建的動手實驗室和科技體驗區(qū),這一切都讓本次大會亮點十足。
7月21日下午WOTI2017主會場,順豐科技人工智能技術(shù)總監(jiān)劉志欣進(jìn)行了主題為《人工智能助力物流升級》的精彩演講。以下是演講實錄,讓我們先睹為快!
順豐科技人工智能技術(shù)總監(jiān)劉志欣
大家好!非常感謝主辦方提供這么一個機(jī)會,讓我們來分享一些事情,和大家進(jìn)行交流。物流這個詞最早來源是什么呢?物流最早是Logistics,源于希臘文意為計算的科學(xué)。這個詞最早被提出來是拿破侖戰(zhàn)爭失敗以后,法國人總結(jié)經(jīng)驗提出了這個詞,它是軍事術(shù)語,咱們中國古人很早就提出了類似的想法,比如糧草先行,運籌帷幄等等?,F(xiàn)在物流的概念是美國人提出來的。后來傳到日本,日本斷章取義,翻譯成了物的流通,把計算取消了,再傳到中國就是物流,感覺就是搬運貨物,其實后面有非常多的優(yōu)化與計算。接下來跟大家聊一聊,比如順豐這樣的行業(yè)龍頭,怎么把快遞的各種策略、優(yōu)化等等做好,并且能夠保障我們貨物時效、高效有保證,新技術(shù)如何幫助我們做的更好,具體的案例再和大家分享一下。
剛才提到的計算還是需要很多數(shù)據(jù)支撐的,順豐也積累了很多優(yōu)質(zhì)的數(shù)據(jù),其中就包括運單本身,運單本身就會帶出來從哪寄到哪,誰給誰的,還有運單本身,比如托寄物品,物流時間點等等,除此之外,還有很多其他領(lǐng)域的,比如商業(yè)的,比如金融方面的數(shù)據(jù)。同時順豐有二三十萬人的地面部隊,散布在全國各個城市的小區(qū)、寫字樓,他們的所聽所聞所感,最接近我們真實世界的數(shù)據(jù),這些數(shù)據(jù)我們怎么運用好,幫助我們更進(jìn)一步的應(yīng)用,也是我們需要考慮的內(nèi)容。所以我們運用技術(shù),在數(shù)據(jù)和業(yè)務(wù)基礎(chǔ)上做了一些工作,其中包括智能物流,這個主要是支撐這個業(yè)務(wù)鏈條的很多智能硬件,還有智能決策,決策方面很多的策略和規(guī)劃,還有智能管理,公司的管理等等。
今天主要跟大家分享的是智能決策方面的工作,分三個層次。第一個層次,如果我們從普通物流業(yè)務(wù)來說,它是很長的鏈條,最早從下單開始,之后運單,有些手寫運單,到后面送貨員去收,后面一系列的支線運輸、干線運輸,包括中轉(zhuǎn)場,分揀分流,還有整個系統(tǒng)規(guī)范的問題。既有運輸又有分揀等等,綜合在一起考慮更加有效,同時還有場地管理方面的問題。第二個層次,面對客戶,客戶有toC的,也有toB的,比如說運單,我們運單都有理賠風(fēng)險,還有客戶的流失,客戶的異動,還有月結(jié)客戶是否安全,月結(jié)客戶是跟我們合作,有資質(zhì)的大客戶,其實就是短期貸款,貸款就會有一些風(fēng)險問題。同時還有類似于產(chǎn)品推薦等等。最后是排班、任務(wù)分配、計提計算,今天因為時間關(guān)系,我選取其中幾個產(chǎn)品和大家進(jìn)行交流。
第一個案例是線路規(guī)劃的問題。線路規(guī)劃不僅僅是做一個導(dǎo)航,拓?fù)淅锩嬗泻芏嗪芏帱c,怎么高效的把這些點串在一起,我們需要在一個時間窗口內(nèi)既有放又有提,還有整體的優(yōu)化。優(yōu)化這個問題是很難做的,為什么很難做?我如果列一個規(guī)劃的方程出來其實是比較容易的,最大的難點在于求解,因為解空間非常非常巨大。
同時,加上很多約束之后,可求解的區(qū)域有些時候不一定是凸的,這就造成我們做工程上可用的系統(tǒng),能夠比較快的反映出來,就是難度所在。除了列方程求解之外,大家普遍采用求近似,不一定最優(yōu),比如大領(lǐng)域搜索,比如剪枝問題等等,這都是我在一個范圍內(nèi)用一些策略做剪枝,找到比較優(yōu)的解。很多時候它的效果有時候好,有時候不見得特別好。所以說,這個問題歸根到底,把它看成是巨大空間里的剪枝問題,和AlphaGo下圍棋的道理是一樣的。所以除了傳統(tǒng)這些領(lǐng)域之外,也用了(英文)方法來做一個剪枝的策略。我們這套算法系統(tǒng)已經(jīng)在一些實際場景中使用了。
它的特點是同時支持靜態(tài)的規(guī)劃和動態(tài)實時規(guī)劃,實際上很多時候我們既需要動態(tài)又需要靜態(tài),比如大干線,需要有班次的支撐,但是我在一個小范圍,比如城市里動態(tài)規(guī)劃,能夠提供非常高的效率。我們目前也在試點過程中。這樣做,我們就需要把靜態(tài)和動態(tài)靈活的無縫銜接在一起,比如在一個區(qū)域內(nèi)做動態(tài)優(yōu)化,支線大干線在一起,這是我們需要解決的一個問題。實際中,如果做動態(tài)線路規(guī)劃,需要很快的插入到現(xiàn)在的線路,或者新的線路出來,這是實時計算工程上的問題,我們怎么樣讓剪枝策略非??斓耐黄?。
除了線路規(guī)劃之外,它聯(lián)動的是什么,我把線路重新算了之后,不可避免的帶來線路終點在哪里,線路終點就是在中轉(zhuǎn)場,怎么把線路結(jié)合在一起,這也是優(yōu)化的問題。
剛才談到了線路規(guī)劃,其實很類似的很接近的一個問題是網(wǎng)點規(guī)劃,我選擇這些點,比如說城市里各個網(wǎng)點,中轉(zhuǎn)場選址等等,這個選點優(yōu)化的結(jié)果最終會很大程度上影響我們的效率。做這件事情的時候里面的一個問題,比如我們?nèi)绻镁垲惢蛘呤裁捶椒ㄗ?,算起來也是很痛苦的事情,所以需要?xùn)練策略網(wǎng)絡(luò)。
我們怎么才能夠?qū)χ修D(zhuǎn)場做一些規(guī)劃,線路最好的結(jié)合在一起,現(xiàn)在所有的中轉(zhuǎn)場都面臨同樣的問題,也就意味著,中轉(zhuǎn)場放100個、200個、300個人,我的貨物堆在那能不能及時處理,人工的線有沒有塞,如果大家有機(jī)會去中轉(zhuǎn)場看的話就會看到一片忙碌的景象。綜合剛才說的這些問題,目前的現(xiàn)狀就是傳統(tǒng)中轉(zhuǎn)場是靠人來識別,主管經(jīng)理在辦公室看這個裝卸需要多少人,貨物多,需要多開幾個口等等。所以用計算機(jī)視覺方法能夠把這些實時拿出來,包括人的軌跡,這些人是不是在他工作的地方,貨物堆在那是不是長時間沒有處理,包括我們用雙目攝像頭做車廂內(nèi)裝載率的掃描,這也能降低我們的成本。
在此基礎(chǔ)上,把這套數(shù)字化構(gòu)建好之后,后面就可以和我們的線路做聯(lián)合優(yōu)化。舉一個例子,我們之前中轉(zhuǎn)場開了七個班次,但是我們整個支線和干線的線路做了優(yōu)化之后發(fā)現(xiàn)不需要那么多班次,只需要五個班次就可以了,但對中轉(zhuǎn)場就造成一個問題,這些貨物集中在五個班次內(nèi)完成的話,會不會造成堆在那處理不了,造成爆倉。所以數(shù)字化工作做好以后,我們可以用一些仿真把它計算出來,對這種情況我們需要開多少口,需要開多少皮帶機(jī),這都是需要做的。
整個中轉(zhuǎn)場環(huán)節(jié)是非常典型的應(yīng)用場景。
還有,和整個運輸中轉(zhuǎn)密切相關(guān)的是件量預(yù)測,包括每個點收的件預(yù)測,我們對資源進(jìn)行很好的安排,進(jìn)行整體的組合優(yōu)化,但是物流行業(yè)里的預(yù)測是一件非常難做的事情。我列了三個維度,空間維度、時間維度、產(chǎn)品維度。空間維度,我們的空間是一層一層往前的,從城市到地區(qū),城市之間經(jīng)濟(jì)圈再到全國,還要加上一些流向,變成兩個方向。時間維度,也是很復(fù)雜的事情,它不光是一個簡單的時間序列問題,因為時間序列預(yù)測之前整個業(yè)界在做,但時間維度難點在于有三個時間軸,第一個是公歷,第二個是農(nóng)歷,第三個是時令,各種時令產(chǎn)品,比如最近最好吃的櫻桃,再過幾個月就是大閘蟹,每年都是有波動的。所以這也是一個時間軸,前兩個還比較好弄,第三個是很難判斷的。所以這是時間維度上的難點。產(chǎn)品維度,要預(yù)測出各種產(chǎn)品出來,這方面也做了大量工作。針對不同情況用了很多不同的模型,比如傳統(tǒng)意義上的序列模型,再是最近Facebook提出的一個模型。對有一些比較特殊的產(chǎn)品,我們用改進(jìn)的方法來做。我們希望做出選擇和預(yù)測。
最后一個例子是關(guān)于手寫運單識別與糾偏的問題,地址的糾偏。第一個是人力資源的投入,需要很多輸單員操作;第二個是信息的前置,手寫運單很難做到這一點,就算再快的人,每天幾百萬上千萬的單涌入,處理起來還是需要時間的。所以我們做的工作包括手寫單的識別,最重要是地址識別,包括地址糾偏。
下面是幾個例子,做識別的時候,給它進(jìn)行復(fù)原,把有文字的地方識別出來,用一個比較常規(guī)的模型,接下來給大家講一下地址糾偏的問題,很可能這個人自己寫了錯別字,這是很常見的。第二個,可能把很潦草的字識別錯了,或者有的字漏掉了,我們做分詞,再一級一級做糾偏就面臨一個尷尬的情況,比如很多錯別字,關(guān)鍵字漏掉之后,不太容易做。所以我們這邊用了一個蠻超新的想法,它是基于積攢的海量數(shù)據(jù)庫來做的。
這邊是幾個事例,我們看看它到底能做的多好,上面黑色的是識別出來有錯的地址文本行,同時我們?nèi)藶榧右恍┰肼曔M(jìn)去,看看能不能糾錯回來,我們可以看到,這個有很多錯字的地址行連人類自己都很難把正確的地址識別糾正過來,但紅色的字是我們糾過來的結(jié)果,下面一行字是真實的地址,大家可以看到是完全糾正過來了的。第二個例子是漏掉了關(guān)鍵字,同時我們也人為加了很多噪聲,這個地址基本上已經(jīng)糾錯過來了,唯一錯的就是門牌號。
剛才和大家分享了一下我們做的一些工作,我們是很年輕的團(tuán)隊,不到一年,大半年時間,我們在這個行業(yè)里發(fā)現(xiàn),這是一個計算密集的行業(yè),大量的工作需要做優(yōu)化。第二個,不只人工智能技術(shù),包括優(yōu)化問題、網(wǎng)絡(luò)問題等等是比較有意思的。謝謝。
51CTO記者將持續(xù)為您帶來WOTI2017全球創(chuàng)新技術(shù)峰會前方精彩報道,敬請期待!
【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】