偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

機(jī)器學(xué)習(xí)需要哪些數(shù)學(xué)基礎(chǔ)?

開發(fā) 開發(fā)工具 機(jī)器學(xué)習(xí)
盡管機(jī)器學(xué)習(xí)和深度學(xué)習(xí)有著無限可能,然而為了更好地掌握算法的內(nèi)部工作機(jī)理和得到較好的結(jié)果,對大多數(shù)這些技術(shù)有一個透徹的數(shù)學(xué)理解是必要的。

[[184240]]

過去的幾個月中,有幾人聯(lián)系我,訴說他們對嘗試進(jìn)入數(shù)據(jù)科學(xué)的世界,以及用機(jī)器學(xué)習(xí)的技術(shù)去探索統(tǒng)計規(guī)律并構(gòu)建無可挑剔的數(shù)據(jù)驅(qū)動型產(chǎn)品的熱忱。然而,我發(fā)現(xiàn)一些人實際上缺乏必要的數(shù)學(xué)直覺和知識框架去得到有用的結(jié)果。這便是我決定寫這篇博文的主要原因。最近涌現(xiàn)出了很多易于使用的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的軟件包,例如 scikit-learn, Weka, Tensorflow 等等。機(jī)器學(xué)習(xí)理論是統(tǒng)計學(xué)、概率學(xué)、計算機(jī)科學(xué)以及算法的交叉領(lǐng)域,是通過從數(shù)據(jù)中的迭代學(xué)習(xí)去發(fā)現(xiàn)能夠被用來構(gòu)建智能應(yīng)用的隱藏知識。盡管機(jī)器學(xué)習(xí)和深度學(xué)習(xí)有著無限可能,然而為了更好地掌握算法的內(nèi)部工作機(jī)理和得到較好的結(jié)果,對大多數(shù)這些技術(shù)有一個透徹的數(shù)學(xué)理解是必要的。

邏輯回歸和神經(jīng)網(wǎng)絡(luò)的代價函數(shù)的計算方法

邏輯回歸和神經(jīng)網(wǎng)絡(luò)的代價函數(shù)的計算方法

為什么要重視數(shù)學(xué)?

機(jī)器學(xué)習(xí)中的數(shù)學(xué)是重要的,有很多原因,下面我將強調(diào)其中的一些:

1. 選擇正確的算法,包括考慮到精度、訓(xùn)練時間、模型復(fù)雜度、參數(shù)的數(shù)量和特征數(shù)量。

2. 選擇參數(shù)的設(shè)置和驗證策略。

3. 通過理解偏差和方差之間的 tradeoff 來識別欠擬合與過擬合。

4. 估計正確的置信區(qū)間和不確定度。

你需要什么水平的數(shù)學(xué)?

當(dāng)你嘗試著去理解一個像機(jī)器學(xué)習(xí)(ML)一樣的交叉學(xué)科的時候,主要問題是理解這些技術(shù)所需要的數(shù)學(xué)知識的量以及必要的水平。這個問題的答案是多維的,也會因個人的水平和興趣而不同。關(guān)于機(jī)器學(xué)習(xí)的數(shù)學(xué)公式和理論進(jìn)步正在研究之中,而且一些研究者正在研究更加先進(jìn)的技術(shù)。下面我會說明我所認(rèn)為的要成為一個機(jī)器學(xué)習(xí)科學(xué)家/工程師所需要的最低的數(shù)學(xué)水平以及每個數(shù)學(xué)概念的重要性。

1. 線性代數(shù):我的一個同事 Skyler Speakman 最近說過,「線性代數(shù)是 21 世紀(jì)的數(shù)學(xué)」,我完全贊同他的說法。在機(jī)器學(xué)習(xí)領(lǐng)域,線性代數(shù)無處不在。主成分分析(PCA)、奇異值分解(SVD)、矩陣的特征分解、LU 分解、QR 分解、對稱矩陣、正交化和正交歸一化、矩陣運算、投影、特征值和特征向量、向量空間和范數(shù)(Norms),這些都是理解機(jī)器學(xué)習(xí)中所使用的優(yōu)化方法所需要的。令人驚奇的是現(xiàn)在有很多關(guān)于線性代數(shù)的在線資源。我一直說,由于大量的資源在互聯(lián)網(wǎng)是可以獲取的,因而傳統(tǒng)的教室正在消失。我最喜歡的線性代數(shù)課程是由 MIT Courseware 提供的(Gilbert Strang 教授的講授的課程):http://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/

2. 概率論和統(tǒng)計學(xué):機(jī)器學(xué)習(xí)和統(tǒng)計學(xué)并不是迥然不同的領(lǐng)域。事實上,最近就有人將機(jī)器學(xué)習(xí)定義為「在機(jī)器上做統(tǒng)計」。機(jī)器學(xué)習(xí)需要的一些概率和統(tǒng)計理論分別是:組合、概率規(guī)則和公理、貝葉斯定理、隨機(jī)變量、方差和期望、條件和聯(lián)合分布、標(biāo)準(zhǔn)分布(伯努利、二項式、多項式、均勻和高斯)、時刻生成函數(shù)(Moment Generating Functions)、最大似然估計(MLE)、先驗和后驗、最大后驗估計(MAP)和抽樣方法。

3. 多元微積分:一些必要的主題包括微分和積分、偏微分、向量值函數(shù)、方向梯度、海森、雅可比、拉普拉斯、拉格朗日分布。

4. 算法和復(fù)雜優(yōu)化:這對理解我們的機(jī)器學(xué)習(xí)算法的計算效率和可擴(kuò)展性以及利用我們的數(shù)據(jù)集中稀疏性很重要。需要的知識有數(shù)據(jù)結(jié)構(gòu)(二叉樹、散列、堆、棧等)、動態(tài)規(guī)劃、隨機(jī)和子線性算法、圖論、梯度/隨機(jī)下降和原始對偶方法。

5. 其他:這包括以上四個主要領(lǐng)域沒有涵蓋的數(shù)學(xué)主題。它們是實數(shù)和復(fù)數(shù)分析(集合和序列、拓?fù)鋵W(xué)、度量空間、單值連續(xù)函數(shù)、極限)、信息論(熵和信息增益)、函數(shù)空間和流形學(xué)習(xí)。

一些用于學(xué)習(xí)機(jī)器學(xué)習(xí)所需的數(shù)學(xué)主題的 MOOC 和材料是(鏈接經(jīng)過壓縮):

  • 可汗學(xué)院的線性代數(shù)(http://suo.im/fgMNX)、概率與統(tǒng)計(http://suo.im/CqwY9)、多元微積分(http://suo.im/xh6Zn)和優(yōu)化(http://suo.im/1o2Axs)
  • 布朗大學(xué) Philip Klein 的「編程矩陣:計算機(jī)科學(xué)應(yīng)用中的線性代數(shù)(Coding the Matrix: Linear Algebra through Computer Science Applications)」:http://codingthematrix.com
  • 得克薩斯大學(xué)的 Robert van de Geijn 在 edX 上的 Linear Algebra – Foundations to Frontiers:http://suo.im/hKRnW
  • 戴維森學(xué)院 Tim Chartier 的新課程 Applications of Linear Algebra;第一部分:http://suo.im/48Vary,第二部分:http://suo.im/3Xm3Lh
  • Joseph Blitzstein 的 Harvard Stat 110 lectures:http://suo.im/2vhVmb
  • Larry Wasserman 的書《All of statistics: A Concise Course in Statistical Inference》,下載:http://suo.im/v9u7k
  • 斯坦福大學(xué)的 Boyd 和 Vandenberghe 的關(guān)于凸優(yōu)化的課程:http://suo.im/2wdQnf
  • Udacity 的 Introduction to Statistics 課程:http://suo.im/1enl1c
  • 吳恩達(dá)授課的 Coursera/斯坦福大學(xué)的機(jī)器學(xué)習(xí)課程:http://suo.im/1eCvp9

這篇博文的主要目的是給出一些善意的關(guān)于數(shù)學(xué)在機(jī)器學(xué)中的重要性的建議,一些一些必需的數(shù)學(xué)主題以及掌握這些主題的一些有用的資源。然而,一些機(jī)器學(xué)習(xí)的癡迷者是數(shù)學(xué)新手,可能會發(fā)現(xiàn)這篇博客令人傷心(認(rèn)真地說,我不是故意的)。對于初學(xué)者而言,你并不需要很多的數(shù)學(xué)知識就能夠開始機(jī)器學(xué)習(xí)的研究。基本的吸納覺條件是這篇博文所描述的數(shù)據(jù)分析,你可以在掌握更多的技術(shù)和算法的過程中學(xué)習(xí)數(shù)學(xué)。

【本文是51CTO專欄機(jī)構(gòu)機(jī)器之心的原創(chuàng)譯文,微信公眾號“機(jī)器之心( id: almosthuman2014)”】

戳這里,看該作者更多好文

責(zé)任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2024-06-05 11:36:28

2021-04-22 22:26:13

Java語言IT

2020-10-13 14:38:50

機(jī)器學(xué)習(xí)數(shù)據(jù)

2021-02-06 23:00:39

機(jī)器學(xué)習(xí)工程人工智能

2018-08-05 06:48:34

2017-04-11 12:05:07

機(jī)器學(xué)習(xí)python矩陣運算

2014-07-01 09:30:54

機(jī)器學(xué)習(xí)

2014-06-17 09:55:24

機(jī)器學(xué)習(xí)

2020-09-29 16:48:13

大數(shù)據(jù)IT技術(shù)

2011-05-31 11:24:11

SEO

2021-12-06 20:23:40

機(jī)器學(xué)習(xí)數(shù)學(xué)

2021-01-21 17:17:47

前端開發(fā)語言

2018-09-18 14:03:57

OpenStack知識難點

2022-05-17 11:05:16

機(jī)器學(xué)習(xí)人工智能

2020-10-16 16:09:15

Java技術(shù)開發(fā)

2014-06-19 14:14:35

機(jī)器學(xué)習(xí)

2020-05-08 10:11:08

人工智能

2019-10-31 08:00:00

機(jī)器學(xué)習(xí)人工智能AI

2018-04-16 11:00:48

云計算互聯(lián)網(wǎng)基礎(chǔ)設(shè)施

2018-08-17 04:27:16

機(jī)器學(xué)習(xí)數(shù)學(xué)理論工程領(lǐng)域
點贊
收藏

51CTO技術(shù)棧公眾號