人工智能和機器學(xué)習(xí)領(lǐng)域中有趣的開源項目
本文簡要介紹了10款 Quora上網(wǎng)友推薦的人工智能和機器學(xué)習(xí)領(lǐng)域方面的開源項目。
GraphLab
GraphLab是一種新的面向機器學(xué)習(xí)的并行框架。GraphLab提供了一個完整的平臺,讓機構(gòu)可以使用可擴展的機器學(xué)習(xí)系統(tǒng)建立大數(shù)據(jù)以 分析產(chǎn)品,該公司客戶包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它們從別的應(yīng)用程序或者服務(wù)中抓 取數(shù)據(jù),通過推薦系統(tǒng)、欺詐監(jiān)測系統(tǒng)、情感及社交網(wǎng)絡(luò)分析系統(tǒng)等系統(tǒng)模式將大數(shù)據(jù)理念轉(zhuǎn)換為生產(chǎn)環(huán)境下可以使用的預(yù)測應(yīng)用程序。( 詳情 )
項目主頁: http://graphlab.org/
Vowpal Wabbit
Vowpal Wabbit (Fast Online Learning)最初是由雅虎研究院建設(shè)的一個機器學(xué)習(xí)平臺,目前該項目在微軟研究院。它是由John Langford啟動并主導(dǎo)的項目。
項目地址: http://hunch.net/~vw/
scikits.learn
scikit-learn是一個開源的、構(gòu)建在SciPy之上用于機器學(xué)習(xí)的 Python 模塊。它包括簡單而高效的工具,可用于數(shù)據(jù)挖掘和數(shù)據(jù)分析,適合于任何人,可在各種情況下重復(fù)使用、構(gòu)建在 NumPy、SciPy和 matplotlib 之上,遵循BSD 協(xié)議。( 詳情 )
項目地址: http://scikit-learn.org/stable
Theano
Theano是一個python庫,用來定義、優(yōu)化和模擬數(shù)學(xué)表達式計算,用于高效的解決多維數(shù)組的計算問題。它使得寫深度學(xué)習(xí)模型更加容易,同時也給出了一些關(guān)于在GPU上訓(xùn)練它們的選項。( 詳情 )
項目地址: http://deeplearning.net/software/theano/
Mahout
Mahout 是 Apache Software Foundation(ASF) 旗下的一個開源項目,提供一些可擴展的機器學(xué)習(xí)領(lǐng)域經(jīng)典算法的實現(xiàn),旨在幫助開發(fā)人員更加方便快捷地創(chuàng)建智能應(yīng)用程序。Mahout包含許多實現(xiàn),包括聚 類、分類、推薦過濾、頻繁子項挖掘。此外,通過使用 Apache Hadoop 庫,Mahout 可以有效地擴展到云中。
項目主頁: http://mahout.apache.org/
pybrain
pybrain是Python的一個機器學(xué)習(xí)模塊,它的目標(biāo)是為機器學(xué)習(xí)任務(wù)提供靈活、易應(yīng)、強大的機器學(xué)習(xí)算法。pybrain包括神經(jīng)網(wǎng)絡(luò)、強化學(xué)習(xí)(及二者結(jié)合)、無監(jiān)督學(xué)習(xí)、進化算法。以神經(jīng)網(wǎng)絡(luò)為核心,所有的訓(xùn)練方法都以神經(jīng)網(wǎng)絡(luò)為一個實例。
項目主頁: http://pybrain.org/
OpenCV
OpenCV是一個基于(開源)發(fā)行的跨平臺計算機視覺庫,可以運行在Linux、Windows和Mac OS操作系統(tǒng)上。它輕量級而且高效——由一系列 C 函數(shù)和少量 C++ 類構(gòu)成,同時提供了Python、Ruby、MATLAB等語言的接口,實現(xiàn)了圖像處理和計算機視覺方面的很多通用算法。( 詳情 )
項目主頁: http://opencv.org/
Orange
Orange 是一個基于組件的數(shù)據(jù)挖掘和機器學(xué)習(xí)軟件套裝,它的功能即友好,又很強大,快速而又多功能的可視化編程前端,以便瀏覽數(shù)據(jù)分析和可視化,基綁定了 Python以進行腳本開發(fā)。它包含了完整的一系列的組件以進行數(shù)據(jù)預(yù)處理,并提供了數(shù)據(jù)帳目,過渡,建模,模式評估和勘探的功能。
項目主頁: http://orange.biolab.si/
NLTK
NLTK(natural language toolkit)是python的自然語言處理工具包。2001年推出,至今發(fā)展非常活躍。它的主要作用是為了教學(xué),至今已經(jīng)在20多個國家60多所高校 使用,里面包括了大量的詞料庫,以及自然語言處理方面的算法實現(xiàn):分詞, 詞根計算, 分類, 語義分析等。
項目主頁: http://nltk.org/
Nupic
Nupic是一個開源的人工智能平臺。該項目由Grok(原名 Numenta)公司開發(fā),其中包括了公司的算法和軟件架構(gòu)。 NuPIC 的運作接近于人腦,“當(dāng)模式變化的時候,它會忘掉舊模式,記憶新模式”。如人腦一樣,CLA 算法能夠適應(yīng)新的變化。( 詳情 )
項目主頁: http://numenta.org/nupic.html
以上是小編整理的10款人工智能和機器學(xué)習(xí)領(lǐng)域的開源項目。更多項目可參看這個列表: http://deeplearning.net/software_links/