AdMaster創(chuàng)始人洪倍:大數(shù)據(jù)深度應用時代,全流程把控數(shù)據(jù)實現(xiàn)價值最大化
在2017年中,對于大數(shù)據(jù)采集、處理、分析、應用全流程都有把控的公司將會越來越受到青睞。數(shù)據(jù)流之所以稱之為數(shù)據(jù)流,正是因為數(shù)據(jù)只有流動起來,才能真正發(fā)揮其價值所在。
作者 | 洪倍
本文長度為2500字,建議閱讀5分鐘
本文為數(shù)據(jù)猿年關策劃活動《大數(shù)據(jù)的2016,我的2016》系列稿件,感謝本文作者 AdMaster創(chuàng)始人 洪倍 先生的投稿。
敬請期待2月16日,由數(shù)據(jù)猿與中歐商學院、騰訊視頻共同舉辦的高端領袖線下演講欄目中歐微論壇之《超聲波》。
2016年對于我來講是十分具有紀念意義的一年,在這一年中,由我和 Vincent(Vincent Yan,閆曌 AdMaster創(chuàng)始人 首席執(zhí)行官) 所創(chuàng)辦的公司 AdMaster 度過了他的第十個生日。在十年前的那個夏天,大數(shù)據(jù)還僅僅存在于概念中,那時的我們就堅信,在未來的十年中,大數(shù)據(jù)必定會引領一段波瀾壯闊的潮流。
如今十年如白駒過隙般匆匆而逝,站在第十年的年末回顧這一年的種種,看著在2016年中大數(shù)據(jù)取得的種種碩果,我也是頗為激動的。
回顧2016,深度應用發(fā)揮數(shù)據(jù)真正價值:
最近有一位朋友在閑聊時提到,在2016年中,大數(shù)據(jù)似乎在概念的熱度上已有所下降,其更偏向于實際的應用(如人工智能,深度學習)。對于這種說法,我實際上也有體會的。大數(shù)據(jù)從概念向應用的轉(zhuǎn)化是一個必要的過程。任何事物在產(chǎn)生初期肯定只有概念,而其最終目的必定是為人類帶來收益。
經(jīng)過十余年的時間,大數(shù)據(jù)已經(jīng)在技術領域積累了一定的經(jīng)驗,有了這些基礎,我們可以利用大數(shù)據(jù)做一些更實際的東西。大數(shù)據(jù)好比是原始的食材,人工智能、深度學習好比是烹飪好的食物,如何做出美味的食物,從洗菜,切菜到炒菜,這其中的任何一個環(huán)節(jié)都需要仔細琢磨。
而這其中有一個十分重要的環(huán)節(jié),就是一定要做好清洗,食材如此,數(shù)據(jù)亦然。如果數(shù)據(jù)源被污染,之后的一系列過程都會被臟數(shù)據(jù)破壞,離我們最近的一個例子就是微軟小冰滿嘴臟話,導致這一問題的直接原因就是小冰在機器學習的過程中未對學習的語言內(nèi)容進行有效過濾。
相比微軟小冰滿嘴臟話的尷尬表現(xiàn),另一位人工智能領域的新星——AlphaGo 在2016年可謂搏足了我們的眼球。相信大家都有關注那條火爆的新聞:AlphaGo化身Master,接連戰(zhàn)勝諸多圍棋名手。
實際上,在2016年3月份4:1戰(zhàn)勝李世石后,AlphaGo就已經(jīng)儼然成為了人工智能的代名詞。在那之后又經(jīng)過如此長時間的深度學習后,他再次戰(zhàn)勝諸多圍棋名手,其實也是在我們意料之外,情理之中的事情。與這些圍棋名手的棋局,實際上也化作大數(shù)據(jù),成為了AlphaGo深度學習的內(nèi)容。相信在這幾番激戰(zhàn)后,AlphaGo又會產(chǎn)生了一些新的微妙變化。
人工智能在未來會是一個十分重要的領域,大數(shù)據(jù)則會是其不可缺少的后盾。目前來看,AlphaGo顯然還不如我們想象的那樣智能,雖然他可以戰(zhàn)勝人類棋手,但更多的是依賴于其強大的計算能力,而非類人的思考方式,有傳言稱AlphaGo下一盤棋消耗的電量就相當于小半個城鎮(zhèn),無論是否屬實,其運算所耗費的資源可見一斑。
未來深度學習的算法能夠做到何種程度的優(yōu)化,如何妥善處理學習數(shù)據(jù),都會對AlphaGo的進化之路產(chǎn)生影響,對于這一切的結果,我們拭目以待。
看到如此多的大數(shù)據(jù)成果,我固然很欣喜,然而凡事都有兩面性,在2016年中,大數(shù)據(jù)帶來的一些負面的影響也讓我陷入了深深的沉思。而這首當其沖的,依舊是大數(shù)據(jù)的隱私與安全問題。大數(shù)據(jù)的隱私與安全問題一直都是一個敏感的話題。一方面,數(shù)據(jù)的量級越大,對于后期數(shù)據(jù)的處理分析的效果越好,能帶來的收益越明顯;另一方面,保護數(shù)據(jù)安全的難度也會越來越大。
據(jù)統(tǒng)計,在2016年,全球范圍內(nèi)被曝光的泄漏事件達到了1818起,而未被曝光的數(shù)量則難以估量。數(shù)據(jù)的泄露對于企業(yè)的品牌會是毀滅性的打擊,也會使大數(shù)據(jù)的意義受到質(zhì)疑。為了防止泄露,我們都在盡可能的增加對數(shù)據(jù)的保護機制與流程,利用身份認證、訪問控制、傳輸加密、文件加密、審計等途徑,多方面多維度的保護數(shù)據(jù)。我始終堅信,技術是中立,而使用技術的人決定著這項技術最終是造福于人類還是遺害于人類。
同樣數(shù)據(jù)安全也不僅僅是個單方面概念,更重要的從架構、流程、機制乃至思維層面,和客戶、合作伙伴一起進行梳理和規(guī)范。截止到2016年,AdMaster通過了ISAE3402 和 ISO27000 數(shù)據(jù)安全審計,安全審計不僅僅是一個認證證書,更讓團隊借助深入訪談、嚴格審計、應急演練,提高綜合的安全意識、多多考慮風險管控,以更加主動的心態(tài)去做好數(shù)據(jù)安全。魔高一尺,道高一丈,正義的大數(shù)據(jù)人應有與數(shù)據(jù)黑客抗爭到底的決心。
另外,在2016年走訪客戶的過程中,我發(fā)現(xiàn)大家仿佛都在說著自己在擁抱大數(shù)據(jù),但實際上沒有多少人弄清楚自己掌握了多少數(shù)據(jù)。既然都不知道擁有多少,就更不用談利用了。如果此時你愿意好好坐下來梳理一下自己手中的數(shù)據(jù)資產(chǎn)和數(shù)據(jù)相關的業(yè)務流程,我相信你的公司在2017年會有質(zhì)的飛躍。
在梳理的過程中,一定要清楚這些數(shù)據(jù)是如何采集的,如何保存的,應該用何種手段去分析發(fā)掘這些數(shù)據(jù),這一部分數(shù)據(jù)之后會和什么樣的場景去結合,以產(chǎn)生化學反應。這一點對于營銷部門尤為重要,如果可以正確的運用大數(shù)據(jù)分析建模帶來的成果,與相應的業(yè)務場景結合,帶來的收益將十分可觀。
展望2017,全流程把控最大化數(shù)據(jù)價值:
說了這么多2016年的回顧,我也不禁對2017年大數(shù)據(jù)的發(fā)展充滿了憧憬。我相信,在2017年中,對于大數(shù)據(jù)采集、處理、分析、應用全流程都有把控的公司將會越來越受到青睞。數(shù)據(jù)流之所以稱之為數(shù)據(jù)流,正是因為數(shù)據(jù)只有流動起來,才能真正發(fā)揮其價值所在。
目前更多的公司還只是注重于大數(shù)據(jù)流程中某一環(huán)的工作。有的公司可能專注于數(shù)據(jù)的采集,有的公司可能專注于分析。這樣子做未免有些管中窺豹的感覺,而且數(shù)據(jù)在交接的過程中,必定存在由于溝通不暢導致的信息缺失,影響最終的洞察、發(fā)現(xiàn)乃至影響收效。
對大數(shù)據(jù)全流程全面把控的公司,對于數(shù)據(jù)流有著從頭到尾的完全掌控,采集,儲存,提煉,分析,各個過程一氣呵成,內(nèi)部部門配合效率也必定更高,整個過程可以大大降低成本,減少數(shù)據(jù)的失配,有問題出現(xiàn)也可以更快的追本溯源解決問題,最終實現(xiàn)收益的提升。
2016年已經(jīng)過去,2017年仍待我們努力。大數(shù)據(jù)之路,你我同行。
— 關于作者 —
洪倍,AdMaster(精碩科技)創(chuàng)始人兼首席技術官,他在 2006 年與閆曌共同創(chuàng)立 AdMaster,帶領公司研發(fā)團隊完善產(chǎn)品架構、鉆研核心技術、挖掘數(shù)據(jù)價值。
洪倍獨創(chuàng)了 AdMaster Dual Cookie 用戶標識技術,專注于高并發(fā)異構數(shù)據(jù)實時流式計算的研究,擁有豐富的分布式數(shù)據(jù)挖掘集群的架構設計經(jīng)驗。他帶領 AdMaster 研發(fā)團隊,架構了中國領先,涵蓋廣告監(jiān)播、社交聆聽、電商渠道及移動應用等多種數(shù)據(jù)源的營銷大數(shù)據(jù)采集和處理集群。