近200篇機(jī)器學(xué)習(xí)&深度學(xué)習(xí)資料分享(含各種文檔,視頻,源碼等)
編者按:本文收集了百來(lái)篇關(guān)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的資料,含各種文檔,視頻,源碼等。而且原文也會(huì)不定期的更新,望看到文章的朋友能夠?qū)W到更多。
《Brief History of Machine Learning》
介紹:這是一篇介紹機(jī)器學(xué)習(xí)歷史的文章,介紹很全面,從感知機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、SVM、Adaboost 到隨機(jī)森林、Deep Learning.
《Deep Learning in Neural Networks: An Overview》
介紹:這是瑞士人工智能實(shí)驗(yàn)室 Jurgen Schmidhuber 寫(xiě)的最新版本《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)綜述》本綜述的特點(diǎn)是以時(shí)間排序,從 1940 年開(kāi)始講起,到 60-80 年代,80-90 年代,一直講到 2000 年后及最近幾年的進(jìn)展。涵蓋了 deep learning 里各種 tricks,引用非常全面.
《A Gentle Introduction to Scikit-Learn: A Python Machine Learning Library》
介紹:這是一份 python 機(jī)器學(xué)習(xí)庫(kù),如果您是一位 python 工程師而且想深入的學(xué)習(xí)機(jī)器學(xué)習(xí).那么這篇文章或許能夠幫助到你.
《How to Layout and Manage Your Machine Learning Project》
介紹:這一篇介紹如果設(shè)計(jì)和管理屬于你自己的機(jī)器學(xué)習(xí)項(xiàng)目的文章,里面提供了管理模版、數(shù)據(jù)管理與實(shí)踐方法.
介紹:如果你還不知道什么是機(jī)器學(xué)習(xí),或則是剛剛學(xué)習(xí)感覺(jué)到很枯燥乏味。那么推薦一讀。這篇文章已經(jīng)被翻譯成中文,如果有興趣可以移步 http://blog.jobbole.com/67616/
介紹:R語(yǔ)言是機(jī)器學(xué)習(xí)的主要語(yǔ)言,有很多的朋友想學(xué)習(xí)R語(yǔ)言,但是總是忘記一些函數(shù)與關(guān)鍵字的含義。那么這篇文章或許能夠幫助到你
《Choosing a Machine Learning Classifier》
介紹:我該如何選擇機(jī)器學(xué)習(xí)算法,這篇文章比較直觀的比較了 Naive Bayes,Logistic Regression,SVM,決策樹(shù)等方法的優(yōu)劣,另外討論了樣本大小、Feature 與 Model 權(quán)衡等問(wèn)題。此外還有已經(jīng)翻譯了的版本:http://www.52ml.net/15063.html
《An Introduction to Deep Learning: From Perceptrons to Deep Networks》
介紹:深度學(xué)習(xí)概述:從感知機(jī)到深度網(wǎng)絡(luò),作者對(duì)于例子的選擇、理論的介紹都很到位,由淺入深。翻譯版本:http://www.cnblogs.com/xiaowanyer/p/3701944.html
《The LION Way: Machine Learning plus Intelligent Optimization》
介紹:<機(jī)器學(xué)習(xí)與優(yōu)化>這是一本機(jī)器學(xué)習(xí)的小冊(cè)子, 短短 300 多頁(yè)道盡機(jī)器學(xué)習(xí)的方方面面. 圖文并茂, 生動(dòng)易懂, 沒(méi)有一坨坨公式的煩惱. 適合新手入門(mén)打基礎(chǔ), 也適合老手溫故而知新. 比起 MLAPP/PRML 等大部頭, 也許這本你更需要!具體內(nèi)容推薦閱讀:http://intelligent-optimization.org/LIONbook/
《深度學(xué)習(xí)與統(tǒng)計(jì)學(xué)習(xí)理論》
介紹:作者是來(lái)自百度,不過(guò)他本人已經(jīng)在 2014 年 4 月份申請(qǐng)離職了。但是這篇文章很不錯(cuò)如果你不知道深度學(xué)習(xí)與支持向量機(jī)/統(tǒng)計(jì)學(xué)習(xí)理論有什么聯(lián)系?那么應(yīng)該立即看看這篇文章.
《計(jì)算機(jī)科學(xué)中的數(shù)學(xué)》
介紹:這本書(shū)是由谷歌公司和 MIT 共同出品的計(jì)算機(jī)科學(xué)中的數(shù)學(xué):Mathematics for Computer Science,Eric Lehman et al 2013 。分為 5 大部分:1)證明,歸納。2)結(jié)構(gòu),數(shù)論,圖。3)計(jì)數(shù),求和,生成函數(shù)。4)概率,隨機(jī)行走。5)遞歸。等等
《信息時(shí)代的計(jì)算機(jī)科學(xué)理論(Foundations of Data Science)》
介紹:信息時(shí)代的計(jì)算機(jī)科學(xué)理論,目前國(guó)內(nèi)有紙質(zhì)書(shū)購(gòu)買(mǎi),iTunes 購(gòu)買(mǎi)
介紹:這是一本由雪城大學(xué)新編的第二版《數(shù)據(jù)科學(xué)入門(mén)》教材:偏實(shí)用型,淺顯易懂,適合想學(xué)習(xí)R語(yǔ)言的同學(xué)選讀。
《Twenty Questions for Donald Knuth》
介紹:這并不是一篇文檔或書(shū)籍。這是篇向圖靈獎(jiǎng)得主 Donald Knuth 提問(wèn)記錄稿: 近日, Charles Leiserson, Al Aho, Jon Bentley 等大神向 Knuth 提出了 20 個(gè)問(wèn)題,內(nèi)容包括 TAOCP,P/NP 問(wèn)題,圖靈機(jī),邏輯,以及為什么大神不用電郵等等。
《Automatic Construction and Natural-Language Description of Nonparametric Regression Models》
介紹:不會(huì)統(tǒng)計(jì)怎么辦?不知道如何選擇合適的統(tǒng)計(jì)模型怎么辦?那這篇文章你的好好讀一讀了麻省理工 Joshua B. Tenenbaum 和劍橋 Zoubin Ghahramani 合作,寫(xiě)了一篇關(guān)于 automatic statistician 的文章??梢宰詣?dòng)選擇回歸模型類(lèi)別,還能自動(dòng)寫(xiě)報(bào)告...
介紹:對(duì)深度學(xué)習(xí)和 representation learning 最新進(jìn)展有興趣的同學(xué)可以了解一下
《Introduction to Information Retrieval》
介紹:這是一本信息檢索相關(guān)的書(shū)籍,是由斯坦福 Manning 與谷歌副總裁 Raghavan 等合著的 Introduction to Information Retrieval 一直是北美最受歡迎的信息檢索教材之一。最近作者增加了該課程的幻燈片和作業(yè)。IR 相關(guān)資源:http://www-nlp.stanford.edu/IR-book/information-retrieval.html
《Machine learning in 10 pictures》
介紹:Deniz Yuret 用 10 張漂亮的圖來(lái)解釋機(jī)器學(xué)習(xí)重要概念:1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam's razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity. 很清晰
介紹:雅虎研究院的數(shù)據(jù)集匯總: 包括語(yǔ)言類(lèi)數(shù)據(jù),圖與社交類(lèi)數(shù)據(jù),評(píng)分與分類(lèi)數(shù)據(jù),計(jì)算廣告學(xué)數(shù)據(jù),圖像數(shù)據(jù),競(jìng)賽數(shù)據(jù),以及系統(tǒng)類(lèi)的數(shù)據(jù)。
《An Introduction to Statistical Learning with Applications in R》
介紹:這是一本斯坦福統(tǒng)計(jì)學(xué)著名教授 Trevor Hastie 和 Robert Tibshirani 的新書(shū),并且在 2014 年一月已經(jīng)開(kāi)課:https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about
Best Machine Learning Resources for Getting Started
介紹:機(jī)器學(xué)習(xí)最佳入門(mén)學(xué)習(xí)資料匯總是專(zhuān)為機(jī)器學(xué)習(xí)初學(xué)者推薦的優(yōu)質(zhì)學(xué)習(xí)資源,幫助初學(xué)者快速入門(mén)。而且這篇文章的介紹已經(jīng)被翻譯成中文版。如果你不怎么熟悉,那么我建議你先看一看中文的介紹。
介紹:主要是順著 Bengio 的 PAMI review 的文章找出來(lái)的。包括幾本綜述文章,將近 100 篇論文,各位山頭們的 Presentation。全部都可以在 google 上找到。
Cross-Language Information Retrieval
介紹:這是一本書(shū)籍,主要介紹的是跨語(yǔ)言信息檢索方面的知識(shí)。理論很多
探索推薦引擎內(nèi)部的秘密,第 1 部分: 推薦引擎初探
介紹:本文共有三個(gè)系列,作者是來(lái)自 IBM 的工程師。它主要介紹了推薦引擎相關(guān)算法,并幫助讀者高效的實(shí)現(xiàn)這些算法。探索推薦引擎內(nèi)部的秘密,第 2 部分: 深度推薦引擎相關(guān)算法 - 協(xié)同過(guò)濾,探索推薦引擎內(nèi)部的秘密,第 3 部分: 深度推薦引擎相關(guān)算法 - 聚類(lèi)
《Advice for students of machine learning》
介紹:康奈爾大學(xué)信息科學(xué)系助理教授 David Mimno 寫(xiě)的《對(duì)機(jī)器學(xué)習(xí)初學(xué)者的一點(diǎn)建議》, 寫(xiě)的挺實(shí)際,強(qiáng)調(diào)實(shí)踐與理論結(jié)合,最后還引用了馮 · 諾依曼的名言: "Young man, in mathematics you don't understand things. You just get used to them."
介紹:這是一本關(guān)于分布式并行處理的數(shù)據(jù)《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,作者是斯坦福的 James L. McClelland。著重介紹了各種神級(jí)網(wǎng)絡(luò)算法的分布式實(shí)現(xiàn),做 Distributed Deep Learning 的童鞋可以參考下
介紹:【“機(jī)器學(xué)習(xí)”是什么?】John Platt 是微軟研究院杰出科學(xué)家,17 年來(lái)他一直在機(jī)器學(xué)習(xí)領(lǐng)域耕耘。近年來(lái)機(jī)器學(xué)習(xí)變得炙手可熱,Platt 和同事們遂決定開(kāi)設(shè)博客,向公眾介紹機(jī)器學(xué)習(xí)的研究進(jìn)展。機(jī)器學(xué)習(xí)是什么,被應(yīng)用在哪里?來(lái)看 Platt 的這篇博文
《2014 年國(guó)際機(jī)器學(xué)習(xí)大會(huì) ICML 2014 論文》
介紹:2014 年國(guó)際機(jī)器學(xué)習(xí)大會(huì)(ICML)已經(jīng)于 6 月 21-26 日在國(guó)家會(huì)議中心隆重舉辦。本次大會(huì)由微軟亞洲研究院和清華大學(xué)聯(lián)手主辦,是這個(gè)有著 30 多年歷史并享譽(yù)世界的機(jī)器學(xué)習(xí)領(lǐng)域的盛會(huì)首次來(lái)到中國(guó),已成功吸引海內(nèi)外 1200 多位學(xué)者的報(bào)名參與。干貨很多,值得深入學(xué)習(xí)下
《Machine Learning for Industry: A Case Study》
介紹:這篇文章主要是以 Learning to Rank 為例說(shuō)明企業(yè)界機(jī)器學(xué)習(xí)的具體應(yīng)用,RankNet 對(duì) NDCG 之類(lèi)不敏感,加入 NDCG 因素后變成了 LambdaRank,同樣的思想從神經(jīng)網(wǎng)絡(luò)改為應(yīng)用到 Boosted Tree 模型就成就了 LambdaMART。Chirs Burges,微軟的機(jī)器學(xué)習(xí)大神,Yahoo 2010 Learning to Rank Challenge 第一名得主,排序模型方面有 RankNet,LambdaRank,LambdaMART,尤其以 LambdaMART 最為突出,代表論文為: From RankNet to LambdaRank to LambdaMART: An Overview 此外,Burges 還有很多有名的代表作,比如:A Tutorial on Support Vector Machines for Pattern Recognition
Some Notes on Applied Mathematics for Machine Learning
100 Best GitHub: Deep Learning
介紹:100 Best GitHub: Deep Learning
《UFLDL-斯坦福大學(xué) Andrew Ng 教授“Deep Learning”教程》
介紹:本教程將闡述無(wú)監(jiān)督特征學(xué)習(xí)和深度學(xué)習(xí)的主要觀點(diǎn)。通過(guò)學(xué)習(xí),你也將實(shí)現(xiàn)多個(gè)功能學(xué)習(xí)/深度學(xué)習(xí)算法,能看到它們?yōu)槟愎ぷ?,并學(xué)習(xí)如何應(yīng)用/適應(yīng)這些想法到新問(wèn)題上。本教程假定機(jī)器學(xué)習(xí)的基本知識(shí)(特別是熟悉的監(jiān)督學(xué)習(xí),邏輯回歸,梯度下降的想法),如果你不熟悉這些想法,我們建議你去這里機(jī)器學(xué)習(xí)課程,并先完成第 II,III,IV 章(到邏輯回歸)。此外這關(guān)于這套教程的源代碼在 github 上面已經(jīng)有 python 版本了 UFLDL Tutorial Code
*《Deep Learning for Natural Language Processing and Related Applications》
介紹:這份文檔來(lái)自微軟研究院,精髓很多。如果需要完全理解,需要一定的機(jī)器學(xué)習(xí)基礎(chǔ)。不過(guò)有些地方會(huì)讓人眼前一亮,毛塞頓開(kāi)。
介紹:這是一篇介紹圖像卷積運(yùn)算的文章,講的已經(jīng)算比較詳細(xì)的了
《Machine Learning Summer School》
介紹:每天請(qǐng)一個(gè)大牛來(lái)講座,主要涉及機(jī)器學(xué)習(xí),大數(shù)據(jù)分析,并行計(jì)算以及人腦研究。https://www.youtube.com/user/smolix (需FQ)
介紹:一個(gè)超級(jí)完整的機(jī)器學(xué)習(xí)開(kāi)源庫(kù)總結(jié),如果你認(rèn)為這個(gè)碉堡了,那后面這個(gè)列表會(huì)更讓你驚訝:【Awesome Awesomeness】,國(guó)內(nèi)已經(jīng)有熱心的朋友進(jìn)行了翻譯中文介紹,機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘免費(fèi)電子書(shū)
介紹:ACL 候任主席、斯坦福大學(xué)計(jì)算機(jī)系 Chris Manning 教授的《自然語(yǔ)言處理》課程所有視頻已經(jīng)可以在斯坦福公開(kāi)課網(wǎng)站上觀看了(如 Chrome 不行,可用 IE 觀看) 作業(yè)與測(cè)驗(yàn)也可以下載。
《Deep Learning and Shallow Learning》
介紹:對(duì)比 Deep Learning 和 Shallow Learning 的好文,來(lái)著浙大畢業(yè)、MIT 讀博的 Chiyuan Zhang 的博客。
《Recommending music on Spotify with deep learning》
介紹:利用卷積神經(jīng)網(wǎng)絡(luò)做音樂(lè)推薦。
《Neural Networks and Deep Learning》
介紹:神經(jīng)網(wǎng)絡(luò)的免費(fèi)在線(xiàn)書(shū),已經(jīng)寫(xiě)了三章了,還有對(duì)應(yīng)的開(kāi)源代碼:https://github.com/mnielsen/neural-networks-and-deep-learning 愛(ài)好者的福音。
介紹:Java 機(jī)器學(xué)習(xí)相關(guān)平臺(tái)和開(kāi)源的機(jī)器學(xué)習(xí)庫(kù),按照大數(shù)據(jù)、NLP、計(jì)算機(jī)視覺(jué)和 Deep Learning 分類(lèi)進(jìn)行了整理。看起來(lái)挺全的,Java 愛(ài)好者值得收藏。
《Machine Learning Theory: An Introductory Primer》
介紹:機(jī)器學(xué)習(xí)最基本的入門(mén)文章,適合零基礎(chǔ)者
《機(jī)器學(xué)習(xí)常見(jiàn)算法分類(lèi)匯總》
介紹:機(jī)器學(xué)習(xí)的算法很多。很多時(shí)候困惑人們都是,很多算法是一類(lèi)算法,而有些算法又是從其他算法中延伸出來(lái)的。這里,我們從兩個(gè)方面來(lái)給大家介紹,第一個(gè)方面是學(xué)習(xí)的方式,第二個(gè)方面是算法的類(lèi)似性。
《機(jī)器學(xué)習(xí)經(jīng)典論文/survey 合集》
介紹:看題目你已經(jīng)知道了是什么內(nèi)容,沒(méi)錯(cuò)。里面有很多經(jīng)典的機(jī)器學(xué)習(xí)論文值得仔細(xì)與反復(fù)的閱讀。
介紹:視頻由加州理工學(xué)院(Caltech)出品。需要英語(yǔ)底子。
《機(jī)器學(xué)習(xí)經(jīng)典書(shū)籍》
介紹:總結(jié)了機(jī)器學(xué)習(xí)的經(jīng)典書(shū)籍,包括數(shù)學(xué)基礎(chǔ)和算法理論的書(shū)籍,可做為入門(mén)參考書(shū)單。
《16 Free eBooks On Machine Learning》
介紹:16 本機(jī)器學(xué)習(xí)的電子書(shū),可以下載下來(lái)在 pad,手機(jī)上面任意時(shí)刻去閱讀。不多我建議你看完一本再下載一本。
《A Large set of Machine Learning Resources for Beginners to Mavens》
介紹:標(biāo)題很大,從新手到專(zhuān)家。不過(guò)看完上面所有資料??隙ㄊ菍?zhuān)家了
《機(jī)器學(xué)習(xí)最佳入門(mén)學(xué)習(xí)資料匯總》
介紹:入門(mén)的書(shū)真的很多,而且我已經(jīng)幫你找齊了。
介紹:Sibyl 是一個(gè)監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來(lái)解決預(yù)測(cè)方面的問(wèn)題,比如 YouTube 的視頻推薦。
介紹:Yoshua Bengio, Ian Goodfellow, Aaron Courville 著
《Neural Network & Text Mining》
介紹:關(guān)于(Deep) Neural Networks 在 NLP 和 Text Mining 方面一些 paper 的總結(jié)
介紹:計(jì)算機(jī)視覺(jué)入門(mén)之前景目標(biāo)檢測(cè)1(總結(jié))
介紹:計(jì)算機(jī)視覺(jué)入門(mén)之行人檢測(cè)
《Deep Learning – important resources for learning and understanding》
介紹:Important resources for learning and understanding . Is awesome
《Machine Learning Theory: An Introductory Primer》
介紹:這又是一篇機(jī)器學(xué)習(xí)初學(xué)者的入門(mén)文章。值得一讀
《Neural Networks and Deep Learning》
介紹:在線(xiàn) Neural Networks and Deep Learning 電子書(shū)
《Python 網(wǎng)頁(yè)爬蟲(chóng) & 文本處理 & 科學(xué)計(jì)算 & 機(jī)器學(xué)習(xí) & 數(shù)據(jù)挖掘兵器譜》
介紹:python 的 17 個(gè)關(guān)于機(jī)器學(xué)習(xí)的工具
#p#
介紹:下集在這里神奇的伽瑪函數(shù)(下)
介紹:作者王益目前是騰訊廣告算法總監(jiān),王益博士畢業(yè)后在 google 任研究。這篇文章王益博士 7 年來(lái)從谷歌到騰訊對(duì)于分布機(jī)器學(xué)習(xí)的所見(jiàn)所聞。值得細(xì)讀
《機(jī)器學(xué)習(xí)提升之道(Level-Up Your Machine Learning)》
介紹:把機(jī)器學(xué)習(xí)提升的級(jí)別分為0~4 級(jí),每級(jí)需要學(xué)習(xí)的教材和掌握的知識(shí)。這樣,給機(jī)器學(xué)習(xí)者提供一個(gè)上進(jìn)的路線(xiàn)圖,以免走彎路。另外,整個(gè)網(wǎng)站都是關(guān)于機(jī)器學(xué)習(xí)的,資源很豐富。
介紹:機(jī)器學(xué)習(xí)各個(gè)方向綜述的網(wǎng)站
介紹:深度學(xué)習(xí)閱資源列表
《Deep Learning: Methods and Applications》
介紹:這是一本來(lái)自微的研究員 li Peng 和 Dong Yu 所著的關(guān)于深度學(xué)習(xí)的方法和應(yīng)用的電子書(shū)
《Machine Learning Summer School 2014》
介紹:2014 年七月 CMU 舉辦的機(jī)器學(xué)習(xí)夏季課剛剛結(jié)束有近 50 小時(shí)的視頻、十多個(gè) PDF 版幻燈片,覆蓋深度學(xué)習(xí),貝葉斯,分布式機(jī)器學(xué)習(xí),伸縮性等熱點(diǎn)話(huà)題。所有 13 名講師都是牛人:包括大牛 Tom Mitchell (他的[機(jī)器學(xué)習(xí)]是名校的常用教材),還有 CMU 李沐 .(1080P 高清喲)
《Sibyl: 來(lái)自 Google 的大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)》
介紹:在今年的 IEEE/IFIP 可靠系統(tǒng)和網(wǎng)絡(luò)(DSN)國(guó)際會(huì)議上,Google 軟件工程師 Tushar Chandra 做了一個(gè)關(guān)于 Sibyl 系統(tǒng)的主題演講。 Sibyl 是一個(gè)監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來(lái)解決預(yù)測(cè)方面的問(wèn)題,比如 YouTube 的視頻推薦。詳情請(qǐng)閱讀 google sibyl
《Building a deeper understanding of images》
介紹:谷歌研究院的 Christian Szegedy 在谷歌研究院的博客上簡(jiǎn)要地介紹了他們今年參加 ImageNet 取得好成績(jī)的 GoogLeNet 系統(tǒng).是關(guān)于圖像處理的。
《Bayesian network 與 python 概率編程實(shí)戰(zhàn)入門(mén)》
介紹:貝葉斯學(xué)習(xí)。如果不是很清可看看概率編程語(yǔ)言與貝葉斯方法實(shí)踐
介紹:網(wǎng)友問(wèn)伯克利機(jī)器學(xué)習(xí)大牛、美國(guó)雙料院士 Michael I. Jordan:"如果你有 10 億美金,你怎么花?Jordan: "我會(huì)用這 10 億美金建造一個(gè) NASA 級(jí)別的自然語(yǔ)言處理研究項(xiàng)目。"
《機(jī)器學(xué)習(xí)&數(shù)據(jù)挖掘筆記_16(常見(jiàn)面試之機(jī)器學(xué)習(xí)算法思想簡(jiǎn)單梳理)》
介紹:常見(jiàn)面試之機(jī)器學(xué)習(xí)算法思想簡(jiǎn)單梳理
介紹:Videolectures 上最受歡迎的 25 個(gè)文本與數(shù)據(jù)挖掘視頻匯總
介紹:在 Kaggle 上經(jīng)常取得不錯(cuò)成績(jī)的 Tim Dettmers 介紹了他自己是怎么選擇深度學(xué)習(xí)的 GPUs, 以及個(gè)人如何構(gòu)建深度學(xué)習(xí)的 GPU 集群: http://t.cn/RhpuD1G
《對(duì)話(huà)機(jī)器學(xué)習(xí)大神 Michael Jordan:深度模型》
介紹:對(duì)話(huà)機(jī)器學(xué)習(xí)大神 Michael Jordan
《Deep Learning 和 Knowledge Graph 引爆大數(shù)據(jù)革命》
介紹:還有2,3 部分。http://blog.sina.com.cn/s/blog_46d0a3930101gs5h.html
介紹:是 Stanford 教授 Andrew Ng 的 Deep Learning 教程,國(guó)內(nèi)的機(jī)器學(xué)習(xí)愛(ài)好者很熱心的把這個(gè)教程翻譯成了中文。如果你英語(yǔ)不好,可以看看這個(gè)
介紹:因?yàn)榻鼉赡陙?lái),深度學(xué)習(xí)在媒體界被炒作很厲害(就像大數(shù)據(jù))。其實(shí)很多人都還不知道什么是深度學(xué)習(xí)。這篇文章由淺入深。告訴你深度學(xué)究竟是什么!
介紹:這是斯坦福大學(xué)做的一免費(fèi)課程(很勉強(qiáng)),這個(gè)可以給你在深度學(xué)習(xí)的路上給你一個(gè)學(xué)習(xí)的思路。里面提到了一些基本的算法。而且告訴你如何去應(yīng)用到實(shí)際環(huán)境中。中文版
介紹:這是多倫多大學(xué)做的一個(gè)深度學(xué)習(xí)用來(lái)識(shí)別圖片標(biāo)簽/圖轉(zhuǎn)文字的 demo。是一個(gè)實(shí)際應(yīng)用案例。有源碼
《Deep learning from the bottom up》
介紹:機(jī)器學(xué)習(xí)模型,閱讀這個(gè)內(nèi)容需要有一定的基礎(chǔ)。
介紹: (CRAN Task Views, 34 種常見(jiàn)任務(wù),每個(gè)任務(wù)又各自分類(lèi)列舉若干常用相關(guān)工具包) 例如: 機(jī)器學(xué)習(xí),自然語(yǔ)言處理,時(shí)間序列分析,空間信息分析,多重變量分析,計(jì)量經(jīng)濟(jì)學(xué),心理統(tǒng)計(jì)學(xué),社會(huì)學(xué)統(tǒng)計(jì),化學(xué)計(jì)量學(xué),環(huán)境科學(xué),藥物代謝動(dòng)力學(xué)等
《機(jī)器學(xué)習(xí)常見(jiàn)算法分類(lèi)匯總》
介紹: 機(jī)器學(xué)習(xí)無(wú)疑是當(dāng)前數(shù)據(jù)分析領(lǐng)域的一個(gè)熱點(diǎn)內(nèi)容。很多人在平時(shí)的工作中都或多或少會(huì)用到機(jī)器學(xué)習(xí)的算法。本文為您總結(jié)一下常見(jiàn)的機(jī)器學(xué)習(xí)算法,以供您在工作和學(xué)習(xí)中參考.
《Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列》
介紹: 很多干貨,而且作者還總結(jié)了好幾個(gè)系列。另外還作者還了一個(gè)文章導(dǎo)航.非常的感謝作者總結(jié)。
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(二)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(三)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(四)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(五)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(六)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(七)
DeepLearning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(八)
《Tutorials Session A - Deep Learning for Computer Vision》
介紹:傳送理由:Rob Fergus 的用深度學(xué)習(xí)做計(jì)算機(jī)是覺(jué)的 NIPS 2013 教程。有 mp4, mp3, pdf 各種下載 他是紐約大學(xué)教授,目前也在 Facebook 工作,他 2014 年的 8 篇論文
介紹:FudanNLP,這是一個(gè)復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院開(kāi)發(fā)的開(kāi)源中文自然語(yǔ)言處理(NLP)工具包 Fudan NLP 里包含中文分詞、關(guān)鍵詞抽取、命名實(shí)體識(shí)別、詞性標(biāo)注、時(shí)間詞抽取、語(yǔ)法分析等功能,對(duì)搜索引擎文本分析等極為有價(jià)值。
介紹:LinkedIn 開(kāi)源的機(jī)器學(xué)習(xí)工具包,支持單機(jī), Hadoop cluster,和 Spark cluster 重點(diǎn)是 logistic regression 算法
介紹:對(duì)于英語(yǔ)不好,但又很想學(xué)習(xí)機(jī)器學(xué)習(xí)的朋友。是一個(gè)大的福利。機(jī)器學(xué)習(xí)周刊目前主要提供中文版,還是面向廣大國(guó)內(nèi)愛(ài)好者,內(nèi)容涉及機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、并行系統(tǒng)、圖像識(shí)別、人工智能、機(jī)器人等等。謝謝作者
《線(xiàn)性代數(shù)》
介紹:《線(xiàn)性代數(shù)》是《機(jī)器學(xué)習(xí)》的重要數(shù)學(xué)先導(dǎo)課程。其實(shí)《線(xiàn)代》這門(mén)課講得淺顯易懂特別不容易,如果一上來(lái)就講逆序數(shù)及羅列行列式性質(zhì),很容易讓學(xué)生失去學(xué)習(xí)的興趣。我個(gè)人推薦的最佳《線(xiàn)性代數(shù)》課程是麻省理工 Gilbert Strang 教授的課程。 課程主頁(yè)
介紹:大數(shù)據(jù)數(shù)據(jù)處理資源、工具不完備列表,從框架、分布式編程、分布式文件系統(tǒng)、鍵值數(shù)據(jù)模型、圖數(shù)據(jù)模型、數(shù)據(jù)可視化、列存儲(chǔ)、機(jī)器學(xué)習(xí)等。很贊的資源匯總。
《machine learning for smart dummies》
介紹:雅虎邀請(qǐng)了一名來(lái)自本古里安大學(xué)的訪(fǎng)問(wèn)學(xué)者,制作了一套關(guān)于機(jī)器學(xué)習(xí)的系列視頻課程。本課程共分為 7 期,詳細(xì)講解了有關(guān) SVM, boosting, nearest neighbors, decision trees 等常規(guī)機(jī)器學(xué)習(xí)算法的理論基礎(chǔ)知識(shí)。
《Entanglement-Based Quantum Machine Learning》
介紹:應(yīng)對(duì)大數(shù)據(jù)時(shí)代,量子機(jī)器學(xué)習(xí)的第一個(gè)實(shí)驗(yàn) paper 下載
《How a Math Genius Hacked OkCupid to Find True Love》
介紹:Wired 雜志報(bào)道了 UCLA 數(shù)學(xué)博士 Chris McKinlay (圖1)通過(guò)大數(shù)據(jù)手段+機(jī)器學(xué)習(xí)方法破解婚戀網(wǎng)站配對(duì)算法找到真愛(ài)的故事,通過(guò) Python 腳本控制著 12 個(gè)賬號(hào),下載了婚戀網(wǎng)站 2 萬(wàn)女用戶(hù)的 600 萬(wàn)問(wèn)題答案,對(duì)他們進(jìn)行了統(tǒng)計(jì)抽樣及聚類(lèi)分析(圖2,3),最后終于收獲了真愛(ài)??萍几淖兠\(yùn)!
介紹:MIT 的 Underactuated Robotics 于 2014 年 10 月 1 日開(kāi)課,該課屬于 MIT 研究生級(jí)別的課程,對(duì)機(jī)器人和非線(xiàn)性動(dòng)力系統(tǒng)感興趣的朋友不妨可以挑戰(zhàn)一下這門(mén)課程!
《mllib 實(shí)踐經(jīng)驗(yàn)(1)》
介紹:mllib 實(shí)踐經(jīng)驗(yàn)分享
《Google Turns To Deep Learning Classification To Fight Web Spam》
介紹:Google 用 Deep Learning 做的 antispam (反垃圾郵件)
介紹:NLP 常用信息資源* 《NLP 常用信息資源》
介紹:機(jī)器學(xué)習(xí)速查表
《Best Papers vs. Top Cited Papers in Computer Science》
介紹:從 1996 年開(kāi)始在計(jì)算機(jī)科學(xué)的論文中被引用次數(shù)最多的論文
《InfiniTAM: 基于深度圖像的體數(shù)據(jù)集成框架》
介紹:把今年的一個(gè) ACM Trans. on Graphics (TOG)論文中的代碼整理為一個(gè)開(kāi)源的算法框架,共享出來(lái)了。歡迎大家使用??梢詫?shí)時(shí)的采集 3D 數(shù)據(jù)、重建出三維模型。Online learning,GPU Random forest,GPU CRF 也會(huì)后續(xù)公開(kāi)。
介紹:【神經(jīng)網(wǎng)絡(luò)黑客指南】現(xiàn)在,最火莫過(guò)于深度學(xué)習(xí)(Deep Learning),怎樣更好學(xué)習(xí)它?可以讓你在瀏覽器中,跑起深度學(xué)習(xí)效果的超酷開(kāi)源項(xiàng)目 convnetjs 作者 karpathy 告訴你,最佳技巧是,當(dāng)你開(kāi)始寫(xiě)代碼,一切將變得清晰。他剛發(fā)布了一本圖書(shū),不斷在線(xiàn)更新
《Building a Production Machine Learning Infrastructure》
介紹:前 Google 廣告系統(tǒng)工程師 Josh Wills 講述工業(yè)界和學(xué)術(shù)界機(jī)器學(xué)習(xí)的異同,大實(shí)話(huà)
《Deep Learning Sentiment Analysis for Movie Reviews using Neo4j》
介紹:使用 Neo4j 做電影評(píng)論的情感分析。
《DeepLearning.University – An Annotated Deep Learning Bibliography》
介紹:不僅是資料,而且還對(duì)有些資料做了注釋。
《A primer on deeping learning》
介紹:深度學(xué)習(xí)入門(mén)的初級(jí)讀本
《Machine learning is teaching us the secret to teaching 》
介紹:機(jī)器學(xué)習(xí)教會(huì)了我們什么?
《scikit-learn:用于機(jī)器學(xué)習(xí)的 Python 模塊》
介紹:scikit-learn 是在 SciPy 基礎(chǔ)上構(gòu)建的用于機(jī)器學(xué)習(xí)的 Python 模塊。
《對(duì)話(huà)機(jī)器學(xué)習(xí)大神 Michael Jordan:解析領(lǐng)域中各類(lèi)模型》
介紹:?jiǎn)痰そ淌冢∕ichael I. Jordan)教授是機(jī)器學(xué)習(xí)領(lǐng)域神經(jīng)網(wǎng)絡(luò)的大牛,他對(duì)深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)有著很濃厚的興趣。因此,很多提問(wèn)的問(wèn)題中包含了機(jī)器學(xué)習(xí)領(lǐng)域的各類(lèi)模型,喬丹教授對(duì)此一一做了解釋和展望。
介紹:A*搜索是人工智能基本算法,用于高效地搜索圖中兩點(diǎn)的最佳路徑, 核心是 g (n) +h(n): g (n)是從起點(diǎn)到頂點(diǎn)n的實(shí)際代價(jià),h(n)是頂點(diǎn)n到目標(biāo)頂點(diǎn)的估算代價(jià)。合集
《基于云的自然語(yǔ)言處理開(kāi)源項(xiàng)目 FudanNLP》
介紹:本項(xiàng)目利用了 Microsoft Azure,可以在幾分種內(nèi)完成 NLP on Azure Website 的部署,立即開(kāi)始對(duì) FNLP 各種特性的試用,或者以 REST API 的形式調(diào)用 FNLP 的語(yǔ)言分析功能
《吳立德《概率主題模型&數(shù)據(jù)科學(xué)基礎(chǔ)》》
介紹:現(xiàn)任復(fù)旦大學(xué)首席教授、計(jì)算機(jī)軟件博士生導(dǎo)師。計(jì)算機(jī)科學(xué)研究所副所長(zhǎng).內(nèi)部課程
《機(jī)器學(xué)習(xí)入門(mén)資源不完全匯總》》
介紹:好東西的干貨真的很多
《收集從 2014 年開(kāi)始深度學(xué)習(xí)文獻(xiàn)》
介紹:從硬件、圖像到健康、生物、大數(shù)據(jù)、生物信息再到量子計(jì)算等,Amund Tveit 等維護(hù)了一個(gè) DeepLearning.University 小項(xiàng)目:收集從 2014 年開(kāi)始深度學(xué)習(xí)文獻(xiàn),相信可以作為深度學(xué)習(xí)的起點(diǎn),github
《EMNLP 上兩篇關(guān)于股票趨勢(shì)的應(yīng)用論文 》
介紹:EMNLP 上兩篇關(guān)于 stock trend 用到了 deep model 組織特征; Exploiting Social Relations and Sentiment for Stock Prediction 用到了 stock network。
《Bengio 組(蒙特利爾大學(xué) LISA 組)深度學(xué)習(xí)教程 》
介紹:作者是深度學(xué)習(xí)一線(xiàn)大牛 Bengio 組寫(xiě)的教程,算法深入顯出,還有實(shí)現(xiàn)代碼,一步步展開(kāi)。
《學(xué)習(xí)算法的 Neural Turing Machine 》
介紹:許多傳統(tǒng)的機(jī)器學(xué)習(xí)任務(wù)都是在學(xué)習(xí) function,不過(guò)谷歌目前有開(kāi)始學(xué)習(xí)算法的趨勢(shì)。谷歌另外的這篇學(xué)習(xí) Python 程序的 Learning to Execute 也有相似之處
《Learning to Rank for Information Retrieval and Natural Language Processing》
介紹:作者是華為技術(shù)有限公司,諾亞方舟實(shí)驗(yàn)室,首席科學(xué)家的李航博士寫(xiě)的關(guān)于信息檢索與自然語(yǔ)言處理的文章
《Rumor has it: Identifying Misinformation in Microblogs》
介紹:利用機(jī)用器學(xué)習(xí)在謠言的判別上的應(yīng)用,此外還有兩個(gè)。一個(gè)是識(shí)別垃圾與虛假信息的 paper.還有一個(gè)是網(wǎng)絡(luò)輿情及其分析技術(shù)
《R機(jī)器學(xué)習(xí)實(shí)踐》
介紹:該課程是網(wǎng)易公開(kāi)課的收費(fèi)課程,不貴,超級(jí)便宜。主要適合于對(duì)利用R語(yǔ)言進(jìn)行機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘感興趣的人。
#p#
《大數(shù)據(jù)分析:機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的演化》
介紹:本章中作者總結(jié)了三代機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的演化:第一代非分布式的, 第二代工具如 Mahout 和 Rapidminer 實(shí)現(xiàn)基于 Hadoop 的擴(kuò)展,第三代如 Spark 和 Storm 實(shí)現(xiàn)了實(shí)時(shí)和迭代數(shù)據(jù)處理。BIG DATA ANALYTICS BEYOND HADOOP
介紹:講計(jì)算機(jī)視覺(jué)的四部奇書(shū)(應(yīng)該叫經(jīng)典吧)之一,另外三本是 Hartley 的《多圖幾何》、Gonzalez 的《數(shù)字圖像處理》、Rafael C.Gonzalez / Richard E.Woods 的《數(shù)字圖像處理》
《LinkedIn 最新的推薦系統(tǒng)文章 Browsemaps》
介紹:里面基本沒(méi)涉及到具體算法,但作者介紹了 CF 在 LinkedIn 的很多應(yīng)用,以及他們?cè)谧鐾扑]過(guò)程中獲得的一些經(jīng)驗(yàn)。最后一條經(jīng)驗(yàn)是應(yīng)該監(jiān)控 log 數(shù)據(jù)的質(zhì)量,因?yàn)橥扑]的質(zhì)量很依賴(lài)數(shù)據(jù)的質(zhì)量!
《初學(xué)者如何查閱自然語(yǔ)言處理(NLP)領(lǐng)域?qū)W術(shù)資料》
介紹:初學(xué)者如何查閱自然語(yǔ)言處理(NLP)領(lǐng)域?qū)W術(shù)資料
介紹:用樹(shù)莓派和相機(jī)模塊進(jìn)行人臉識(shí)別
《利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對(duì)話(huà)系統(tǒng) 》
介紹:如何利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對(duì)話(huà)系統(tǒng)
《經(jīng)典論文 Leo Breiman:Statistical Modeling: The Two Cultures 》
介紹:Francis Bach 合作的有關(guān)稀疏建模的新綜述(書(shū)):Sparse Modeling for Image and Vision Processing,內(nèi)容涉及 Sparsity, Dictionary Learning, PCA, Matrix Factorization 等理論,以及在圖像和視覺(jué)上的應(yīng)用,而且第一部分關(guān)于 Why does the l1-norm induce sparsity 的解釋也很不錯(cuò)。
《Reproducing Kernel Hilbert Space》
介紹:RKHS 是機(jī)器學(xué)習(xí)中重要的概念,其在 large margin 分類(lèi)器上的應(yīng)用也是廣為熟知的。如果沒(méi)有較好的數(shù)學(xué)基礎(chǔ),直接理解 RKHS 可能會(huì)不易。本文從基本運(yùn)算空間講到 Banach 和 Hilbert 空間,深入淺出,一共才 12 頁(yè)。
介紹:許多同學(xué)對(duì)于機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的困惑在于,數(shù)學(xué)方面已經(jīng)大致理解了,但是動(dòng)起手來(lái)卻不知道如何下手寫(xiě)代碼。斯坦福深度學(xué)習(xí)博士 Andrej Karpathy 寫(xiě)了一篇實(shí)戰(zhàn)版本的深度學(xué)習(xí)及機(jī)器學(xué)習(xí)教程,手把手教你用 Javascript 寫(xiě)神經(jīng)網(wǎng)絡(luò)和 SVM.
《【語(yǔ)料庫(kù)】語(yǔ)料庫(kù)資源匯總》
介紹:【語(yǔ)料庫(kù)】語(yǔ)料庫(kù)資源匯總
介紹:本文會(huì)過(guò)一遍最流行的機(jī)器學(xué)習(xí)算法,大致了解哪些方法可用,很有幫助。
《Reproducible Research in Computational Science》
介紹:這個(gè)里面有很多關(guān)于機(jī)器學(xué)習(xí)、信號(hào)處理、計(jì)算機(jī)視覺(jué)、深入學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的大量源代碼(或可執(zhí)行代碼)及相關(guān)論文??蒲袑?xiě)論文的好資源
《NYU 2014 年的深度學(xué)習(xí)課程資料》
介紹:NYU 2014 年的深度學(xué)習(xí)課程資料,有視頻
《計(jì)算機(jī)視覺(jué)數(shù)據(jù)集不完全匯總》
介紹:計(jì)算機(jī)視覺(jué)數(shù)據(jù)集不完全匯總
《Machine Learning Open Source Software》
介紹:機(jī)器學(xué)習(xí)開(kāi)源軟件
介紹:A Library for Support Vector Machines
介紹:數(shù)據(jù)挖掘十大經(jīng)典算法之一
《100 Best GitHub: Deep Learning》
介紹:github 上面 100 個(gè)非常棒的項(xiàng)目
《加州大學(xué)歐文分校(UCI)機(jī)器學(xué)習(xí)數(shù)據(jù)集倉(cāng)庫(kù)》
介紹:當(dāng)前加州大學(xué)歐文分校為機(jī)器學(xué)習(xí)社區(qū)維護(hù)著 306 個(gè)數(shù)據(jù)集。查詢(xún)數(shù)據(jù)集
《Andrej Karpathy 個(gè)人主頁(yè)》
介紹:Andrej Karpathy 是斯坦福大學(xué) Li Fei-Fei 的博士生,使用機(jī)器學(xué)習(xí)在圖像、視頻語(yǔ)義分析領(lǐng)域取得了科研和工程上的突破,發(fā)的文章不多,但每個(gè)都很扎實(shí),在每一個(gè)問(wèn)題上都做到了 state-of-art.
《Andrej Karpathy 的深度強(qiáng)化學(xué)習(xí)演示》
介紹:Andrej Karpathy 的深度強(qiáng)化學(xué)習(xí)演示,論文在這里
《CIKM 數(shù)據(jù)挖掘競(jìng)賽奪冠算法-陳運(yùn)文》
介紹:CIKM Cup (或者稱(chēng)為 CIKM Competition)是 ACM CIKM 舉辦的國(guó)際數(shù)據(jù)挖掘競(jìng)賽的名稱(chēng)。
介紹:杰弗里·埃弗里斯特·辛頓 FRS 是一位英國(guó)出生的計(jì)算機(jī)學(xué)家和心理學(xué)家,以其在神經(jīng)網(wǎng)絡(luò)方面的貢獻(xiàn)聞名。辛頓是反向傳播算法和對(duì)比散度算法的發(fā)明人之一,也是深度學(xué)習(xí)的積極推動(dòng)者.
《自然語(yǔ)言處理的深度學(xué)習(xí)理論與實(shí)際》
介紹:微軟研究院深度學(xué)習(xí)技術(shù)中心在 CIKM2014 上關(guān)于《自然語(yǔ)言處理的深度學(xué)習(xí)理論與實(shí)際》教學(xué)講座的幻燈片
《用大數(shù)據(jù)和機(jī)器學(xué)習(xí)做股票價(jià)格預(yù)測(cè)》
介紹: 本文基于<支持向量機(jī)的高頻限價(jià)訂單的動(dòng)態(tài)建模>采用了 Apache Spark 和 Spark MLLib 從紐約股票交易所的訂單日志數(shù)據(jù)構(gòu)建價(jià)格運(yùn)動(dòng)預(yù)測(cè)模型。(股票有風(fēng)險(xiǎn),投資謹(jǐn)慎) GitHub 源代碼托管地址.
《關(guān)于機(jī)器學(xué)習(xí)的若干理論問(wèn)題》
介紹:徐宗本院士將于熱愛(ài)機(jī)器學(xué)習(xí)的小伙伴一起探討有關(guān)于機(jī)器學(xué)習(xí)的幾個(gè)理論性問(wèn)題,并給出一些有意義的結(jié)論。最后通過(guò)一些實(shí)例來(lái)說(shuō)明這些理論問(wèn)題的物理意義和實(shí)際應(yīng)用價(jià)值。
《深度學(xué)習(xí)在自然語(yǔ)言處理的應(yīng)用》
介紹:作者還著有《這就是搜索引擎:核心技術(shù)詳解》一書(shū),主要是介紹應(yīng)用層的東西
《Undergraduate machine learning at UBC》
介紹:機(jī)器學(xué)習(xí)課程
介紹:人臉識(shí)別必讀文章推薦
《推薦系統(tǒng)經(jīng)典論文文獻(xiàn)及業(yè)界應(yīng)用》
介紹:推薦系統(tǒng)經(jīng)典論文文獻(xiàn)
介紹:人臉識(shí)別必讀文章推薦
《第十二屆中國(guó)"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會(huì) PPT》
介紹:第十二屆中國(guó)"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會(huì) PPT
《統(tǒng)計(jì)機(jī)器學(xué)習(xí)》
介紹:統(tǒng)計(jì)學(xué)習(xí)是關(guān)于計(jì)算機(jī)基于數(shù)據(jù)構(gòu)建的概率統(tǒng)計(jì)模型并運(yùn)用模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)和分析的一門(mén)科學(xué),統(tǒng)計(jì)學(xué)習(xí)也成為統(tǒng)計(jì)機(jī)器學(xué)習(xí)。課程來(lái)自上海交通大學(xué)
介紹:機(jī)器學(xué)習(xí)的目標(biāo)是對(duì)計(jì)算機(jī)編程,以便使用樣本數(shù)據(jù)或以往的經(jīng)驗(yàn)來(lái)解決給定的問(wèn)題.
介紹:CIKM 2014 Jeff Dean、Qi Lu、Gerhard Weikum 的主題報(bào)告的幻燈片, Alex Smola、Limsoon Wong、Tong Zhang、Chih-Jen Lin 的 Industry Track 報(bào)告的幻燈片
《人工智能和機(jī)器學(xué)習(xí)領(lǐng)域有趣的開(kāi)源項(xiàng)目》
介紹:部分中文列表
《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及 Python 實(shí)現(xiàn)--基于 SMO 的 SVM 分類(lèi)器》
介紹:此外作者還有一篇元算法、AdaBoost python 實(shí)現(xiàn)文章
《Numerical Optimization: Understanding L-BFGS》
介紹:加州伯克利大學(xué)博士 Aria Haghighi 寫(xiě)了一篇超贊的數(shù)值優(yōu)化博文,從牛頓法講到擬牛頓法,再講到 BFGS 以及L-BFGS, 圖文并茂,還有偽代碼。強(qiáng)烈推薦。
《簡(jiǎn)明深度學(xué)習(xí)方法概述(一)》
介紹:還有續(xù)集簡(jiǎn)明深度學(xué)習(xí)方法概述(二)
介紹:R語(yǔ)言程序員私人定制版
《谷歌地圖解密:大數(shù)據(jù)與機(jī)器學(xué)習(xí)的結(jié)合》
介紹:谷歌地圖解密
介紹:空間數(shù)據(jù)挖掘常用方法
《Use Google's Word2Vec for movie reviews》
介紹:Kaggle 新比賽 ”When bag of words meets bags of popcorn“ aka ”邊學(xué)邊用 word2vec 和 deep learning 做 NLP“ 里面全套教程教一步一步用 python 和 gensim 包的 word2vec 模型,并在實(shí)際比賽里面比調(diào)參數(shù)和清數(shù)據(jù)。 如果已裝過(guò) gensim 不要忘升級(jí)
介紹:PyNLPIR 提供了 NLPIR/ICTCLAS 漢語(yǔ)分詞的 Python 接口,此外 Zhon 提供了常用漢字常量,如 CJK 字符和偏旁,中文標(biāo)點(diǎn),拼音,和漢字正則表達(dá)式(如找到文本中的繁體字)
《深度卷積神經(jīng)網(wǎng)絡(luò)下圍棋》
介紹:這文章說(shuō)把最近模型識(shí)別上的突破應(yīng)用到圍棋軟件上,打 16 萬(wàn)張職業(yè)棋譜訓(xùn)練模型識(shí)別功能。想法不錯(cuò)。訓(xùn)練后目前能做到不用計(jì)算,只看棋盤(pán)就給出下一步,大約 10 級(jí)棋力。但這篇文章太過(guò)樂(lè)觀,說(shuō)什么人類(lèi)的最后一塊堡壘馬上就要跨掉了。話(huà)說(shuō)得太早。不過(guò),如果與別的軟件結(jié)合應(yīng)該還有潛力可挖。@萬(wàn)精油墨綠
介紹:UT Austin 教授 Eric Price 關(guān)于今年 NIPS 審稿實(shí)驗(yàn)的詳細(xì)分析,他表示,根據(jù)這次實(shí)驗(yàn)的結(jié)果,如果今年 NIPS 重新審稿的話(huà),會(huì)有一半的論文被拒。
《2014 年最佳的大數(shù)據(jù),數(shù)據(jù)科學(xué)文章》
介紹:KDNuggets 分別總結(jié)了 2014 年 14 個(gè)閱讀最多以及分享最多的文章。我們從中可以看到多個(gè)主題——深度學(xué)習(xí),數(shù)據(jù)科學(xué)家職業(yè),教育和薪酬,學(xué)習(xí)數(shù)據(jù)科學(xué)的工具比如R和 Python 以及大眾投票的最受歡迎的數(shù)據(jù)科學(xué)和數(shù)據(jù)挖掘語(yǔ)言
《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及 Python 實(shí)現(xiàn)--線(xiàn)性回歸(Linear Regression)算法》
介紹:Python 實(shí)現(xiàn)線(xiàn)性回歸,作者還有其他很棒的文章推薦可以看看
《2014 中國(guó)大數(shù)據(jù)技術(shù)大會(huì) 33 位核心專(zhuān)家演講 PDF》
介紹:2014 中國(guó)大數(shù)據(jù)技術(shù)大會(huì) 33 位核心專(zhuān)家演講 PDF 下載
《使用 RNN 和 Paragraph Vector 做情感分析》
介紹:這是T. Mikolov & Y. Bengio 最新論文 Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ,使用 RNN 和 PV 在情感分析效果不錯(cuò),[項(xiàng)目代碼](https://github.com/mesnilgr/iclr15) 公布在 github (目前是空的)。這意味著 Paragraph Vector 終于揭開(kāi)面紗了嘛。
《NLPIR/ICTCLAS2015 分詞系統(tǒng)大會(huì)上的技術(shù)演講 》
介紹:NLPIR/ICTCLAS2015 分詞系統(tǒng)發(fā)布與用戶(hù)交流大會(huì)上的演講,請(qǐng)更多朋友檢閱新版分詞吧。 我們實(shí)驗(yàn)室同學(xué)的演講包括:孫夢(mèng)姝-基于評(píng)論觀點(diǎn)挖掘的商品搜索技術(shù)研究 李然-主題模型
介紹:Convex Neural Networks 解決維數(shù)災(zāi)難
介紹:介紹 CNN 參數(shù)在使用 bp 算法時(shí)該怎么訓(xùn)練,畢竟 CNN 中有卷積層和下采樣層,雖然和 MLP 的 bp 算法本質(zhì)上相同,但形式上還是有些區(qū)別的,很顯然在完成 CNN 反向傳播前了解 bp 算法是必須的。此外作者也做了一個(gè)資源集:機(jī)器學(xué)習(xí),深度學(xué)習(xí),視覺(jué),數(shù)學(xué)等
《正則表達(dá)式優(yōu)化成 Trie 樹(shù) 》
介紹:如果要在一篇文章中匹配十萬(wàn)個(gè)關(guān)鍵詞怎么辦?Aho-Corasick 算法利用添加了返回邊的 Trie 樹(shù),能夠在線(xiàn)性時(shí)間內(nèi)完成匹配。 但如果匹配十萬(wàn)個(gè)正則表達(dá)式呢 ? 這時(shí)候可以用到把多個(gè)正則優(yōu)化成 Trie 樹(shù)的方法,如日本人寫(xiě)的 Regexp::Trie
介紹:深度學(xué)習(xí)閱讀清單
介紹:Caffe 是一個(gè)開(kāi)源的深度學(xué)習(xí)框架,作者目前在 google 工作,作者主頁(yè) Yangqing Jia (賈揚(yáng)清)
#p#
《GoogLeNet 深度學(xué)習(xí)模型的 Caffe 復(fù)現(xiàn) 》
介紹:2014 ImageNet 冠軍 GoogLeNet 深度學(xué)習(xí)模型的 Caffe 復(fù)現(xiàn)模型,GoogleNet 論文.
《LambdaNet,Haskell 實(shí)現(xiàn)的開(kāi)源人工神經(jīng)網(wǎng)絡(luò)庫(kù) 》
介紹:LambdaNetLambdaNet 是由 Haskell 實(shí)現(xiàn)的一個(gè)開(kāi)源的人工神經(jīng)網(wǎng)絡(luò)庫(kù),它抽象了網(wǎng)絡(luò)創(chuàng)建、訓(xùn)練并使用了高階函數(shù)。該庫(kù)還提供了一組預(yù)定義函數(shù),用戶(hù)可以采取多種方式組合這些函數(shù)來(lái)操作現(xiàn)實(shí)世界數(shù)據(jù)。
介紹:如果你從事互聯(lián)網(wǎng)搜索,在線(xiàn)廣告,用戶(hù)行為分析,圖像識(shí)別,自然語(yǔ)言理解,或者生物信息學(xué),智能機(jī)器人,金融預(yù)測(cè),那么這門(mén)核心課程你必須深入了解。
《楊強(qiáng)在 TEDxNanjing 談智能的起源》
介紹:"人工智能研究分許多流派。其中之一以 IBM 為代表,認(rèn)為只要有高性能計(jì)算就可得到智能,他們的‘深藍(lán)’擊敗了世界象棋冠軍;另一流派認(rèn)為智能來(lái)自動(dòng)物本能;還有個(gè)很強(qiáng)的流派認(rèn)為只要找來(lái)專(zhuān)家,把他們的思維用邏輯一條條寫(xiě)下,放到計(jì)算機(jī)里就行……" 楊強(qiáng)在 TEDxNanjing 談智能的起源
《深度 RNN/LSTM 用于結(jié)構(gòu)化學(xué)習(xí) 0) 序列標(biāo)注 Connectionist Temporal ClassificationICML06》
介紹:1) 機(jī)器翻譯 Sequence to Sequence NIPS14 2) 成分句法 GRAMMAR AS FOREIGN LANGUAGE
《Deep Learning 實(shí)戰(zhàn)之 word2vec》
介紹:網(wǎng)易有道的三位工程師寫(xiě)的 word2vec 的解析文檔,從基本的詞向量/統(tǒng)計(jì)語(yǔ)言模型->NNLM->Log-Linear/Log-Bilinear->層次化 Log-Bilinear,到 CBOW 和 Skip-gram 模型,再到 word2vec 的各種 tricks,公式推導(dǎo)與代碼,基本上是網(wǎng)上關(guān)于 word2vec 資料的大合集,對(duì) word2vec 感興趣的朋友可以看看
《Machine learning open source software》
介紹:機(jī)器學(xué)習(xí)開(kāi)源軟件,收錄了各種機(jī)器學(xué)習(xí)的各種編程語(yǔ)言學(xué)術(shù)與商業(yè)的開(kāi)源軟件.與此類(lèi)似的還有很多例如:DMOZ - Computers: Artificial Intelligence: Machine Learning: Software, LIBSVM -- A Library for Support Vector Machines, Weka 3: Data Mining Software in Java, scikit-learn:Machine Learning in Python, Natural Language Toolkit:NLTK, MAchine Learning for LanguagE Toolkit, Data Mining - Fruitful and Fun, Open Source Computer Vision Library
《機(jī)器學(xué)習(xí)入門(mén)者學(xué)習(xí)指南》
介紹:作者是計(jì)算機(jī)研二(寫(xiě)文章的時(shí)候,現(xiàn)在是 2015 年了應(yīng)該快要畢業(yè)了),專(zhuān)業(yè)方向自然語(yǔ)言處理.這是一點(diǎn)他的經(jīng)驗(yàn)之談.對(duì)于入門(mén)的朋友或許會(huì)有幫助
《A Tour of Machine Learning Algorithms》
介紹:這是一篇關(guān)于機(jī)器學(xué)習(xí)算法分類(lèi)的文章,非常好
《2014 年的《機(jī)器學(xué)習(xí)日?qǐng)?bào)》大合集》
介紹:機(jī)器學(xué)習(xí)日?qǐng)?bào)里面推薦很多內(nèi)容,在這里有一部分的優(yōu)秀內(nèi)容就是來(lái)自機(jī)器學(xué)習(xí)日?qǐng)?bào).
《 Image classification with deep learning 常用模型》
介紹:這是一篇關(guān)于圖像分類(lèi)在深度學(xué)習(xí)中的文章
《自動(dòng)語(yǔ)音識(shí)別:深度學(xué)習(xí)方法》
介紹:作者與 Bengio 的兄弟 Samy 09 年合編《自動(dòng)語(yǔ)音識(shí)別:核方法》 3)李開(kāi)復(fù) 1989 年《自動(dòng)語(yǔ)音識(shí)別》專(zhuān)著,其博導(dǎo)、94 年圖靈獎(jiǎng)得主 Raj Reddy 作序
介紹: 作者是 360 電商技術(shù)組成員,這是一篇 NLP 在中文分詞中的應(yīng)用
《Using convolutional neural nets to detect facial keypoints tutorial》
介紹: 使用 deep learning 的人臉關(guān)鍵點(diǎn)檢測(cè),此外還有一篇 AWS 部署教程
《書(shū)籍推薦:Advanced Structured Prediction》
介紹: 由 Sebastian Nowozin 等人編纂 MIT 出版的新書(shū)《Advanced Structured Prediction》http://t.cn/RZxipKG ,匯集了結(jié)構(gòu)化預(yù)測(cè)領(lǐng)域諸多牛文,涉及 CV、NLP 等領(lǐng)域,值得一讀。網(wǎng)上公開(kāi)的幾章草稿:一,二,三,四,五
《An Introduction to Matrix Concentration Inequalities》
介紹: Tropp 把數(shù)學(xué)家用高深裝逼的數(shù)學(xué)語(yǔ)言寫(xiě)的矩陣概率不等式用初等的方法寫(xiě)出來(lái),是非常好的手冊(cè),領(lǐng)域內(nèi)的 paper 各種證明都在用里面的結(jié)果。雖說(shuō)是初等的,但還是非常的難
《The free big data sources you should know》
介紹: 不容錯(cuò)過(guò)的免費(fèi)大數(shù)據(jù)集,有些已經(jīng)是耳熟能詳,有些可能還是第一次聽(tīng)說(shuō),內(nèi)容跨越文本、數(shù)據(jù)、多媒體等,讓他們伴你開(kāi)始數(shù)據(jù)科學(xué)之旅吧,具體包括:Data.gov、US Census Bureau、European Union Open Data Portal、Data.gov.uk 等
《A Brief Overview of Deep Learning》
介紹: 谷歌科學(xué)家、Hinton 親傳弟子 Ilya Sutskever 的深度學(xué)習(xí)綜述及實(shí)際建議
《A Deep Dive into Recurrent Neural Nets》
介紹: 非常好的討論遞歸神經(jīng)網(wǎng)絡(luò)的文章,覆蓋了 RNN 的概念、原理、訓(xùn)練及優(yōu)化等各個(gè)方面內(nèi)容,強(qiáng)烈推薦!本文作者 Nikhil Buduma 還有一篇 Deep Learning in a Nutshell 值得推薦
《機(jī)器學(xué)習(xí):學(xué)習(xí)資源》
介紹:里面融合了很多的資源,例如競(jìng)賽,在線(xiàn)課程,demo,數(shù)據(jù)整合等。有分類(lèi)
《Statistical foundations of machine learning》
介紹:《機(jī)器學(xué)習(xí)的統(tǒng)計(jì)基礎(chǔ)》在線(xiàn)版,該手冊(cè)希望在理論與實(shí)踐之間找到平衡點(diǎn),各主要內(nèi)容都伴有實(shí)際例子及數(shù)據(jù),書(shū)中的例子程序都是用R語(yǔ)言編寫(xiě)的。
《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
介紹:IVAN VASILEV 寫(xiě)的深度學(xué)習(xí)導(dǎo)引:從淺層感知機(jī)到深度網(wǎng)絡(luò)。高可讀
《Research priorities for robust and beneficial artificial intelligence》
介紹:魯棒及有益的人工智能優(yōu)先研究計(jì)劃:一封公開(kāi)信,目前已經(jīng)有 Stuart Russell, Tom Dietterich, Eric Horvitz, Yann LeCun, Peter Norvig, Tom Mitchell, Geoffrey Hinton, Elon Musk 等人簽署 The Future of Life Institute (FLI).這封信的背景是最近霍金和 Elon Musk 提醒人們注意 AI 的潛在威脅。公開(kāi)信的內(nèi)容是 AI 科學(xué)家們站在造福社會(huì)的角度,展望人工智能的未來(lái)發(fā)展方向,提出開(kāi)發(fā) AI 系統(tǒng)的 Verification,Validity, Security, Control 四點(diǎn)要求,以及需要注意的社會(huì)問(wèn)題。畢竟當(dāng)前 AI 在經(jīng)濟(jì)領(lǐng)域,法律,以及道德領(lǐng)域相關(guān)研究較少。其實(shí)還有一部美劇《疑犯追蹤》,介紹了 AI 的演進(jìn)從一開(kāi)始的自我學(xué)習(xí),過(guò)濾,圖像識(shí)別,語(yǔ)音識(shí)別等判斷危險(xiǎn),到第四季的時(shí)候出現(xiàn)了機(jī)器通過(guò)學(xué)習(xí)成長(zhǎng)之后想控制世界的狀態(tài)。說(shuō)到這里推薦收看。
介紹:里面根據(jù)詞條提供了許多資源,還有相關(guān)知識(shí)結(jié)構(gòu),路線(xiàn)圖,用時(shí)長(zhǎng)短等。號(hào)稱(chēng)是”機(jī)器學(xué)習(xí)“搜索引擎
《FAIR open sources deep-learning modules for Torch》
介紹:Facebook 人工智能研究院(FAIR)開(kāi)源了一系列軟件庫(kù),以幫助開(kāi)發(fā)者建立更大、更快的深度學(xué)習(xí)模型。開(kāi)放的軟件庫(kù)在 Facebook 被稱(chēng)作模塊。用它們替代機(jī)器學(xué)習(xí)領(lǐng)域常用的開(kāi)發(fā)環(huán)境 Torch 中的默認(rèn)模塊,可以在更短的時(shí)間內(nèi)訓(xùn)練更大規(guī)模的神經(jīng)網(wǎng)絡(luò)模型。
介紹:本文雖然是寫(xiě)于 2012 年,但是這篇文章完全是作者的經(jīng)驗(yàn)之作。
介紹:本文是對(duì)《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》作者 Peter Harrington 做的一個(gè)訪(fǎng)談。包含了書(shū)中部分的疑問(wèn)解答和一點(diǎn)個(gè)人學(xué)習(xí)建議
《Deep learning from the bottom up》
介紹:非常好的深度學(xué)習(xí)概述,對(duì)幾種流行的深度學(xué)習(xí)模型都進(jìn)行了介紹和討論
《Hands-On Data Science with R Text Mining》
介紹:主要是講述了利用R語(yǔ)言進(jìn)行數(shù)據(jù)挖掘
介紹:幫你理解卷積神經(jīng)網(wǎng)絡(luò),講解很清晰,此外還有兩篇 Conv Nets: A Modular Perspective,Groups & Group Convolutions. 作者的其他的關(guān)于神經(jīng)網(wǎng)絡(luò)文章也很棒
《Introduction to Deep Learning Algorithms》
介紹:Deep Learning 算法介紹,里面介紹了 06 年 3 篇讓 deep learning 崛起的論文
《Learning Deep Architectures for AI》
介紹:一本學(xué)習(xí)人工智能的書(shū)籍,作者是 Yoshua Bengio,相關(guān)國(guó)內(nèi)報(bào)道
《Geoffrey E. Hinton 個(gè)人主頁(yè)》
介紹:Geoffrey Hinton 是 Deep Learning 的大牛,他的主頁(yè)放了一些介紹性文章和課件值得學(xué)習(xí)
《PROBABILITY THEORY: THE LOGIC OF SCIENCE》
介紹:概率論:數(shù)理邏輯書(shū)籍
介紹:一個(gè)用來(lái)快速的統(tǒng)計(jì),機(jī)器學(xué)習(xí)并且對(duì)于數(shù)據(jù)量大的數(shù)學(xué)庫(kù)
《ICLR 2015 會(huì)議的 arXiv 稿件合集》
介紹:在這里你可以看到最近深度學(xué)習(xí)有什么新動(dòng)向。
《Introduction to Information Retrieval》
介紹:此書(shū)在信息檢索領(lǐng)域家喻戶(hù)曉, 除提供該書(shū)的免費(fèi)電子版外,還提供一個(gè) IR 資源列表 ,收錄了信息檢索、網(wǎng)絡(luò)信息檢索、搜索引擎實(shí)現(xiàn)等方面相關(guān)的圖書(shū)、研究中心、相關(guān)課程、子領(lǐng)域、會(huì)議、期刊等等,堪稱(chēng)全集,值得收藏
【責(zé)任編輯:林師授 TEL:(010)68476606】



























