偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

決策樹分類預測過程可視化

作者：王彥平 2017-09-11 13:33:44

大數(shù)據(jù) 數(shù)據(jù)可視化

首先導入所需庫文件，numpy，pandas用于數(shù)值處理，DictVectorizer用于特征處理，graphviz用于模型可視化。導入所需的數(shù)據(jù)文件，用于訓練和評估模型表現(xiàn)。

開始前的準備工作

首先導入所需庫文件，numpy，pandas用于數(shù)值處理，DictVectorizer用于特征處理，graphviz用于模型可視化。

#導入所需庫文件 
 
import numpy as np 
 
import pandas as pd 
 
from sklearn.feature_extraction import DictVectorizer 
 
from sklearn import cross_validation 
 
from sklearn import tree 
 
import graphviz

導入所需的數(shù)據(jù)文件，用于訓練和評估模型表現(xiàn)。

#導入數(shù)據(jù)表 
 
test=pd.DataFrame(pd.read_csv('TEST_ML_v2.csv',header=0,encoding='GBK'))

特征處理

第二步，對特征進行處理。

#特征處理 
 
X_df=test[['City', 'Item category', 'Period', 'Gender', 'Age', 'Market channels', 'Self-agent', 'Category', 'Loan channels']] 
 
X_list=X_df.to_dict(orient="records") 
 
vec = DictVectorizer() 
 
X=vec.fit_transform(X_list) 
 
Y=np.array(test['Status'])劃分訓練集和測試集數(shù)據(jù)。

劃分訓練集和測試集數(shù)據(jù)

X_train,X_test,y_train,y_test=cross_validation.train_test_split(X.toarray(),Y,test_size=0.4,random_state=0)

訓練模型并進行預測

使用訓練集數(shù)據(jù)對決策樹模型進行訓練，使用測試集數(shù)據(jù)評估模型表現(xiàn)。

#訓練模型 
 
clf = tree.DecisionTreeClassifier(max_depth=5) 
 
clf=clf.fit(X_train,y_train) 
 
clf.score(X_test,y_test) 
 
0.85444078947368418

簡單對測試集的***組特征進行預測，結果與實際值相符。

#對測試集數(shù)據(jù)進行預測 
 
clf.predict(X_test[0]),y_test[0] 
 
(array(['Charged Off'], dtype=object), 'Charged Off')

查看具體的分類概率值。

#查看分類概率 
 
clf.predict_proba(X_test[0]) 
 
array([[ 1., 0.]])

決策樹分類預測可視化

第三步，對決策樹的分類預測過程進行可視化，首先查看分類結果及特征的名稱。

#獲取分類名稱 
 
clf.classes_ 
 
array(['Charged Off', 'Fully Paid'], dtype=object)

對決策樹進行可視化，feature_names為特征名稱，class_names為分類結果名稱。

#決策樹可視化 
 
dot_data = tree.export_graphviz(clf, out_file=None, 
 
feature_names=vec.get_feature_names(), 
 
class_names=clf.classes_, 
 
filled=True, rounded=True, 
 
special_characters=True) 
 
graph = graphviz.Source(dot_data) 
 
graph

將分類結果保存為PDF格式文檔。

#導出PDF文檔  
graph.render("test_e1")

責任編輯：龐桂玉來源： 36大數(shù)據(jù)

大數(shù)據(jù)數(shù)據(jù)可視化決策樹

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<style id="st3kq"></style>

<p id="st3kq"><menu id="st3kq"></menu></p>

<table id="st3kq"></table>

<pre id="st3kq"></pre>