Foursquare的野心:大數(shù)據(jù)時代“活點地圖”
這還不止,F(xiàn)oursquare 還想要根據(jù)過去的“行動歷史”以及朋友的喜好提供未來行動的指引,F(xiàn)oursquare Explore 服務(wù),可以發(fā)現(xiàn)身處的城市周邊都有什么值得一去的地方。他們還有怎樣的“地圖”美夢?處理這些數(shù)據(jù)的工具又是什么?
大野心:精細的“多邊形區(qū)域”框架
Foursquare 正在和多個公司合作,為他們提供地理位置信息以及周邊商家評價反饋。同時,他們也通過這些合作伙伴收集更多的地理位置信息——人們對什么地方感興趣,對什么地方不喜歡。Instagram, Bing, Flickr, Quora, Path, Soundtracking, Evernote……都是他們的合作伙伴,導(dǎo)入數(shù)據(jù)的量級可想而知。
Foursquare 的工程師 David Blackman 日前接受采訪時透露,F(xiàn)oursquare 正在為完善“活點地圖”的框架,讓更多應(yīng)用和公司能夠在此基礎(chǔ)上反戰(zhàn)自己的“殺手級”服務(wù)。而這種框架,就是城市區(qū)域中的“多邊形”(polygon shape)——根據(jù)“簽到”信息的大數(shù)據(jù)和地理信息編碼匯總而成的城市區(qū)域邊界。舉個例子,不是“廣州”或者“北京”的邊界,而是廣州的“上下九”區(qū)域,或者北京的“五道口”區(qū)域,他們不僅僅是一路名,一商圈,一行政區(qū)域,而是大部分用戶所認為的區(qū)域邊界。他用紐約的“布魯克林”作為例子,F(xiàn)oursquare 所呈現(xiàn)的區(qū)域,并不是一般的網(wǎng)格狀,而是,通過收集用戶的簽到信息整合的“多邊形邊界”。
本來,他們需要到世界上的每個城市深入每個區(qū)域來了解這些細節(jié)的邊界。不過通過收集“簽到”(需要輸入地址)信息,或者是用戶查找某地址所用的區(qū)域名字信息,他們可以足不出戶地把這個工作交給世界。只要與現(xiàn)有的商家點評服務(wù)糟糕的區(qū)域識別稍作對比,就能想象到多邊形框架的可怕之處——精準,而且“懂你”。
解密地圖背后的“繪圖工具”
Foursquare 目前有 100 多名員工,而負責地理信息數(shù)據(jù)的團隊只有 3 人。這個小團隊正在使用什么樣的工具來構(gòu)建地圖的框架?
其中之一是 Google S2 ,提供地表地理信息數(shù)據(jù)索引的開源服務(wù)。Foursquare 目前的發(fā)現(xiàn)周邊商家和去處的服務(wù) Explore 就是基于S2 的開源數(shù)據(jù)。而用戶的簽到信息,也是會覆蓋在 S2 的地理信息上,方便 Foursquare 進行整合和地理分類。 而為了建立地理編碼信息的數(shù)據(jù)庫,F(xiàn)oursquare 還在使用 MapReduce 這種大規(guī)模數(shù)據(jù)集的運算模型。David Blackman 稱,他們將 MapReduce 和 S2 結(jié)合起來,將世界分成數(shù)個模塊,將簽到的地理位置信息與 S2 結(jié)合一起,然后分成區(qū)域,這樣就有了之前我們提及的“多邊形區(qū)域”的模型了。
另外,為了獲取豐富地圖數(shù)據(jù)——商家、郵政編碼等,F(xiàn)oursquare 還與 TIGER Project 和 Natural Earth 等美國政府官方的地理編碼項目合作。
盡管如此,F(xiàn)oursquare 還是以來用戶提供的大量地理位置數(shù)據(jù)來完善自己的推薦和地圖內(nèi)容,早前,F(xiàn)oursquare 曾經(jīng)把這些數(shù)據(jù)整合成一個動態(tài)的“簽到”地圖:
【編輯推薦】