偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<center id="a0xih"></center>

<ruby id="a0xih"><li id="a0xih"></li></ruby>

<form id="a0xih"></form>

<tt id="a0xih"><sup id="a0xih"></sup></tt>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

梯度提升算法決策過程的逐步可視化

作者：Tanguy Renaudie 2023-03-06 16:07:19

人工智能機(jī)器學(xué)習(xí)

梯度提升算法是最常用的集成機(jī)器學(xué)習(xí)技術(shù)之一，該模型使用弱決策樹序列來構(gòu)建強(qiáng)學(xué)習(xí)器。這也是XGBoost和LightGBM模型的理論基礎(chǔ)，所以在這篇文章中，我們將從頭開始構(gòu)建一個(gè)梯度增強(qiáng)模型并將其可視化。

梯度提升算法是最常用的集成機(jī)器學(xué)習(xí)技術(shù)之一，該模型使用弱決策樹序列來構(gòu)建強(qiáng)學(xué)習(xí)器。這也是XGBoost和LightGBM模型的理論基礎(chǔ)，所以在這篇文章中，我們將從頭開始構(gòu)建一個(gè)梯度增強(qiáng)模型并將其可視化。

梯度提升算法介紹

梯度提升算法（Gradient Boosting）是一種集成學(xué)習(xí)算法，它通過構(gòu)建多個(gè)弱分類器，然后將它們組合成一個(gè)強(qiáng)分類器來提高模型的預(yù)測(cè)準(zhǔn)確率。

梯度提升算法的原理可以分為以下幾個(gè)步驟：

初始化模型：一般來說，我們可以使用一個(gè)簡單的模型（比如說決策樹）作為初始的分類器。
計(jì)算損失函數(shù)的負(fù)梯度：計(jì)算出每個(gè)樣本點(diǎn)在當(dāng)前模型下的損失函數(shù)的負(fù)梯度。這相當(dāng)于是讓新的分類器去擬合當(dāng)前模型下的誤差。
訓(xùn)練新的分類器：用這些負(fù)梯度作為目標(biāo)變量，訓(xùn)練一個(gè)新的弱分類器。這個(gè)弱分類器可以是任意的分類器，比如說決策樹、線性模型等。
更新模型：將新的分類器加入到原來的模型中，可以用加權(quán)平均或者其他方法將它們組合起來。
重復(fù)迭代：重復(fù)上述步驟，直到達(dá)到預(yù)設(shè)的迭代次數(shù)或者達(dá)到預(yù)設(shè)的準(zhǔn)確率。

由于梯度提升算法是一種串行算法，所以它的訓(xùn)練速度可能會(huì)比較慢，我們以一個(gè)實(shí)際的例子來介紹：

假設(shè)我們有一個(gè)特征集Xi和值Yi，要計(jì)算y的最佳估計(jì)

我們從y的平均值開始

每一步我們都想讓F_m(x)更接近y|x。

在每一步中，我們都想要F_m(x)一個(gè)更好的y給定x的近似。

首先，我們定義一個(gè)損失函數(shù)

然后，我們向損失函數(shù)相對(duì)于學(xué)習(xí)者Fm下降最快的方向前進(jìn):

因?yàn)槲覀儾荒転槊總€(gè)x計(jì)算y，所以不知道這個(gè)梯度的確切值，但是對(duì)于訓(xùn)練數(shù)據(jù)中的每一個(gè)x_i，梯度完全等于步驟m的殘差:r_i!

所以我們可以用弱回歸樹h_m來近似梯度函數(shù)g_m，對(duì)殘差進(jìn)行訓(xùn)練:

然后，我們更新學(xué)習(xí)器

這就是梯度提升，我們不是使用損失函數(shù)相對(duì)于當(dāng)前學(xué)習(xí)器的真實(shí)梯度g_m來更新當(dāng)前學(xué)習(xí)器F_{m}，而是使用弱回歸樹h_m來更新它。

也就是重復(fù)下面的步驟

1、計(jì)算殘差:

2、將回歸樹h_m擬合到訓(xùn)練樣本及其殘差(x_i, r_i)上

3、用步長\alpha更新模型

看著很復(fù)雜對(duì)吧，下面我們可視化一下這個(gè)過程就會(huì)變得非常清晰了

決策過程可視化

這里我們使用sklearn的moons 數(shù)據(jù)集，因?yàn)檫@是一個(gè)經(jīng)典的非線性分類數(shù)據(jù)

import numpy as np
 import sklearn.datasets as ds
 import pandas as pd
 import matplotlib.pyplot as plt
 import matplotlib as mpl
 
 from sklearn import tree
 from itertools import product,islice
 import seaborn as snsmoonDS = ds.make_moons(200, noise = 0.15, random_state=16)
 moon = moonDS[0]
 color = -1*(moonDS[1]*2-1)
 
 df =pd.DataFrame(moon, columns = ['x','y'])
 df['z'] = color
 df['f0'] =df.y.mean()
 df['r0'] = df['z'] - df['f0']
 df.head(10)

讓我們可視化數(shù)據(jù)：

下圖可以看到，該數(shù)據(jù)集是可以明顯的區(qū)分出分類的邊界的，但是因?yàn)樗欠蔷€性的，所以使用線性算法進(jìn)行分類時(shí)會(huì)遇到很大的困難。

那么我們先編寫一個(gè)簡單的梯度增強(qiáng)模型:

def makeiteration(i:int):
    """Takes the dataframe ith f_i and r_i and approximated r_i from the features, then computes f_i+1 and r_i+1"""
    clf = tree.DecisionTreeRegressor(max_depth=1)
    clf.fit(X=df[['x','y']].values, y = df[f'r{i-1}'])
    df[f'r{i-1}hat'] = clf.predict(df[['x','y']].values)
     
    eta = 0.9
    df[f'f{i}'] = df[f'f{i-1}'] + eta*df[f'r{i-1}hat']
    df[f'r{i}'] = df['z'] - df[f'f{i}']
    rmse = (df[f'r{i}']**2).sum()
    clfs.append(clf)
    rmses.append(rmse)

上面代碼執(zhí)行3個(gè)簡單步驟:

將決策樹與殘差進(jìn)行擬合:

clf.fit(X=df[['x','y']].values, y = df[f'r{i-1}'])
 df[f'r{i-1}hat'] = clf.predict(df[['x','y']].values)

然后，我們將這個(gè)近似的梯度與之前的學(xué)習(xí)器相加:

df[f'f{i}'] = df[f'f{i-1}'] + eta*df[f'r{i-1}hat']

最后重新計(jì)算殘差:

df[f'r{i}'] = df['z'] - df[f'f{i}']

步驟就是這樣簡單，下面我們來一步一步執(zhí)行這個(gè)過程。

第1次決策

Tree Split for 0 and level 1.563690960407257

第2次決策

Tree Split for 1 and level 0.5143677890300751

第3次決策

Tree Split for 0 and level -0.6523728966712952

第4次決策

Tree Split for 0 and level 0.3370491564273834

第5次決策

Tree Split for 0 and level 0.3370491564273834

第6次決策

Tree Split for 1 and level 0.022058885544538498

第7次決策

Tree Split for 0 and level -0.3030575215816498

第8次決策

Tree Split for 0 and level 0.6119407713413239

第9次決策

可以看到通過9次的計(jì)算，基本上已經(jīng)把上面的分類進(jìn)行了區(qū)分

我們這里的學(xué)習(xí)器都是非常簡單的決策樹，只沿著一個(gè)特征分裂!但整體模型在每次決策后邊的越來越復(fù)雜，并且整體誤差逐漸減小。

plt.plot(rmses)

這也就是上圖中我們看到的能夠正確區(qū)分出了大部分的分類

如果你感興趣可以使用下面代碼自行實(shí)驗(yàn)：

??https://github.com/trenaudie/GradientBoostingVisualized/blob/main/fromScratch.ipynb??

責(zé)任編輯：華軒來源： DeepHub IMBA

梯度提升算法機(jī)器學(xué)習(xí)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<table id="epigq"><strong id="epigq"></strong></table>