大數(shù)據(jù)“顯影”:Ayasdi用拓撲數(shù)據(jù)分析癌癥
大數(shù)據(jù)蘊含的寶藏就在每個人的腳下,而Ayasdi這樣的大數(shù)據(jù)創(chuàng)業(yè)公司能借你一雙慧眼,從現(xiàn)有的數(shù)據(jù)中發(fā)現(xiàn)新的金礦。
最近,硅谷的創(chuàng)業(yè)公司Ayasdi最近剛剛完成了一筆1000萬美元的融資,該公司利用拓撲數(shù)據(jù)分析的算法,來推動癌癥的研究。
Ayasdi所代表的大數(shù)據(jù)垂直應(yīng)用顯然正在成為大數(shù)據(jù)投資的焦點之一,在IT經(jīng)理網(wǎng)之前的文章:大數(shù)據(jù)的下一個熱點在于應(yīng)用軟件中,我們曾指出:
就長期價值而言, 行業(yè)或細分市場的突破性大數(shù)據(jù)軟件應(yīng)用要超過目前火熱的大數(shù)據(jù)基礎(chǔ)設(shè)施平臺。
舊數(shù)據(jù)里的新財富
斯坦福大學(xué)的學(xué)者Gurjeet Singh, Gunnar Carlsson, 和 Harlan Sexton一直在致力于用拓撲學(xué)的方法, 進行數(shù)據(jù)分析。 拓撲學(xué)是一個很古老的數(shù)學(xué)分支, 從歐拉時代就開始研究,不過最近15年左右, 拓撲學(xué)開始和數(shù)據(jù)分析相結(jié)合, 用來發(fā)現(xiàn)大數(shù)據(jù)中的一些隱形的關(guān)系。 Gurjeet Singh, Gunnar Carlsson, 和 Harlan Sexton在2008年, 覺得將這一技術(shù)進行商用。 于是成了了Ayasdi公司。 (Ayasdi來自印第安語, 意思是“尋找“)。 而Ayasdi的目標(biāo), 也是為了幫助用戶從現(xiàn)有數(shù)據(jù)中進行一些新的發(fā)現(xiàn)。
用Ayasdi的創(chuàng)始人 Gunnar Carlsson的話說:
“人們先有數(shù)據(jù), 然后根據(jù)這些數(shù)據(jù)提問, 按照不同的問題軌跡進行尋找答案。 而有的問題軌跡是正確的,有的則不一定正確。而Ayasdi的目標(biāo), 這是幫助用戶回答他們還沒想到的問題。”
Ayasdi成立以后,就獲得了DARPA(美國國防部高級研究項目組)350萬美元的資助。(編者:DARPA的很多項目都非常具有前瞻性, DAPRA的網(wǎng)絡(luò)項目ARPANET就是現(xiàn)在Internet的前身)。 隨后, Ayasdi的綜合了機器學(xué)習(xí)和拓撲數(shù)據(jù)分析的技術(shù)引起了硅谷投資界的關(guān)注。
Ayasdi的技術(shù)的一個重要特點就是,不像別的系統(tǒng)需要類似搜索查詢式語句。 Ayasdi可以自動從數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式。
隨著Khosla Ventures和 Floodgate等基金的投資到位, Ayasdi目前30人的技術(shù)團隊將擴充, 同時將營銷和銷售也將展開。
Ayasdi的投資人Vinod Khosla 有句名言, 說將來80%的醫(yī)生將會被機器代替。 他認為, Ayasdi的“機器智能”技術(shù), 將使我們的探索能力達到過去難以企及的高度。從而幫助解決一些全球性的社會和經(jīng)濟問題。
讓大數(shù)據(jù)“顯影”
Ayasdi的一個應(yīng)用就是在醫(yī)學(xué)研究領(lǐng)域。 Mount Sinai醫(yī)學(xué)院基因與多尺度生物學(xué)系的主任Eric Schadt就帶領(lǐng)了一個團隊,利用Ayasdi的技術(shù)進行一些疾病的遺傳傾向的研究。 這些疾病中包括癌癥。 Eric Schadt希望這種技術(shù)能夠幫助找到一些新的發(fā)現(xiàn), 從而可能帶來一些治療上的突破。
事實上, Ayasdi一直在美國各個頂級醫(yī)院和藥廠合作。 醫(yī)院和制藥公司可以從公開的信息源獲得很多數(shù)據(jù), 和他們自己的數(shù)據(jù)結(jié)合起來,進行一些新的研究。
Ayasdi的CEO Gurjeet Singh說:
“數(shù)據(jù)還是那些數(shù)據(jù), 只是我們用了新的技術(shù), 可以從這些數(shù)據(jù)里自動地得出一些新的發(fā)現(xiàn)。”
通過對一個累計采集15年, 被成千科學(xué)家研究過的數(shù)據(jù)集的分析。 Ayasdi的數(shù)據(jù)分析技術(shù),幫助發(fā)現(xiàn)了乳腺癌的14個變種。 Ayasdi的算法發(fā)現(xiàn)了某一個基因子組的病人乳腺癌的存活率比較高。如果病人的基因是在這樣的子組里, 可以免受化療之苦。
風(fēng)險基金Data Collective 的合伙人Matt Ocko是一個專注于大數(shù)據(jù)領(lǐng)域的投資人,他看到了這個醫(yī)學(xué)上的突破的新聞后, 決定給Ayasdi投資。 他說:
目前,政府和企業(yè)的問題,不在于數(shù)據(jù)量的缺乏,而是對數(shù)據(jù)進行發(fā)現(xiàn)和直覺能力不足。 Ayasdi的技術(shù), 能夠在短時間內(nèi), 提高分析人員面對海量數(shù)據(jù)的直覺能力,這一點是個突破。
對于醫(yī)療行業(yè)而言,大數(shù)據(jù)財富其實就在腳下,甚至在那些被遺棄的數(shù)據(jù)中,(在本站“Rich Smolan:大數(shù)據(jù)的人類面孔”一文中提到一個例子,麻省理工學(xué)院的計算機科學(xué)家和密歇根大學(xué)計算機科學(xué)家創(chuàng)建了一個全新的計算機模型,可以分析那些被丟棄的心電圖數(shù)據(jù),發(fā)現(xiàn)被忽視的心臟疾病復(fù)發(fā)信號,并能大大改進今天的心臟病風(fēng)險篩查技術(shù)。)
Ayasdi獲得風(fēng)險投資的青睞,從一個側(cè)面表明,數(shù)據(jù)直覺化和數(shù)據(jù)分析創(chuàng)新才是醫(yī)療大數(shù)據(jù)的發(fā)展重點。
原文鏈接:http://www.ctocio.com/ccnews/11043.html