人工智能基礎(chǔ):機(jī)器學(xué)習(xí)常見的算法介紹
今天給大家聊聊機(jī)器學(xué)習(xí)算法相關(guān)的知識(shí),一起來看看吧!
機(jī)器學(xué)習(xí)的算法主要包括監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)。
1、監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)當(dāng)中非常常見的一種機(jī)器學(xué)習(xí)類型,就是在已知輸入輸出的情況下訓(xùn)練出一個(gè)模型,并且將輸入映射輸出。
特點(diǎn):給出了學(xué)習(xí)目標(biāo)(比如實(shí)際值、標(biāo)注等等)。
監(jiān)督學(xué)習(xí)根據(jù)目標(biāo)結(jié)果是離散還是連續(xù),又可以把監(jiān)督學(xué)習(xí)劃分為分類和回歸。
1.1 分類
該類型的預(yù)測(cè)目標(biāo)值是離散的,比如預(yù)測(cè)是否會(huì)下雨,最終的結(jié)果只有兩種,下雨或者不下雨兩種類別情況。
目的:根據(jù)歷史的結(jié)果來預(yù)測(cè)新樣本的分類結(jié)果,針對(duì)兩個(gè)分類結(jié)果的任務(wù)稱為二分任務(wù);兩種以上稱為多分類任務(wù)。
常見算法:決策樹、隨機(jī)森林、K-最近鄰算法、邏輯回歸、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)。
1.2 回歸
該類型的預(yù)測(cè)目標(biāo)值是連續(xù)的,典型的例子預(yù)測(cè)某個(gè)樓盤的價(jià)格趨勢(shì)。
算法:線性回歸、AdaBoosting等。
2、無監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)的特點(diǎn)是不需要認(rèn)為進(jìn)行數(shù)據(jù)標(biāo)注,而是根據(jù)模型不斷的進(jìn)行自我學(xué)習(xí)、鞏固,最后通過自我總結(jié)歸納來學(xué)習(xí)。學(xué)習(xí)模型主要包含聚類、降維。
2.1 聚類
主要是指將物理或抽象對(duì)象的集合由相似對(duì)象組成多個(gè)類別過程,可以理解為按照相近的原則進(jìn)行分組。
算法:常見的有K-means 算法、BIRCH算法、DBSCAN算法。
2.2 降維
針對(duì)高維度數(shù)據(jù)對(duì)系統(tǒng)資源和算法性能依賴非常大,降維就是把高維度數(shù)據(jù)中不重要的信息處理掉同時(shí)又保留大部分的重要信息。簡(jiǎn)單來說就是由繁到簡(jiǎn)的過程,把復(fù)雜的問題盡可能簡(jiǎn)單話,這樣處理起來難度會(huì)小很多。
優(yōu)點(diǎn):節(jié)省空間、節(jié)省算法消耗的時(shí)間、減少系統(tǒng)資源的消耗。
算法:主成分分析算法(PCA)
3、半監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)相結(jié)合的一種學(xué)習(xí)方法。半監(jiān)督學(xué)習(xí)使用大量的未標(biāo)記數(shù)據(jù),以及同時(shí)使用標(biāo)記數(shù)據(jù),來進(jìn)行模式識(shí)別工作。
半監(jiān)督學(xué)習(xí)適合由少量標(biāo)簽的樣本和大量無標(biāo)簽的樣本,可以實(shí)現(xiàn)較高的準(zhǔn)確性預(yù)測(cè)。
4、遷移學(xué)習(xí)
遷移學(xué)習(xí)指的是一個(gè)預(yù)訓(xùn)練的模型被重新用在另一個(gè)學(xué)習(xí)任務(wù)中的學(xué)習(xí)方法。
源域:已有的知識(shí);目標(biāo)域:待學(xué)習(xí)的新知識(shí)。
5、強(qiáng)化學(xué)習(xí)(ReinforcementLearning, RL)
RL也稱為再勵(lì)學(xué)習(xí)、評(píng)價(jià)學(xué)習(xí)、增強(qiáng)學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的范式和方法論之一。
強(qiáng)化學(xué)習(xí)的任務(wù)就是讓智能設(shè)備可以像人類一樣,不斷學(xué)習(xí)、嘗試,然后可以在不同的環(huán)境下做出最理想的處理方案,強(qiáng)化屬于連續(xù)決策的過程,通過不斷嘗試來發(fā)現(xiàn)哪一種是最佳的方式。
案例:AlphaGo利用強(qiáng)化學(xué)習(xí)算法擊敗了世界冠軍李世石、谷歌YouTube視頻推薦算法等等。