偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

用KNIME建立客戶流失模型

大數(shù)據(jù)
PMML是一種可以呈現(xiàn)預測分析模型的事實標準語言,用于呈現(xiàn)數(shù)據(jù)挖掘模型。預測分析模型采用定型過程中獲取的知識來預測新數(shù)據(jù)中是否有已知模式。

[[179511]]

PMML是一種可以呈現(xiàn)預測分析模型的事實標準語言,用于呈現(xiàn)數(shù)據(jù)挖掘模型。預測分析模型采用定型過程中獲取的知識來預測新數(shù)據(jù)中是否有已知模式。PMML允許您在不同的應用程序之間輕松共享預測分析模型。因此,您可以在一個系統(tǒng)中定型一個模型,PMML中對其進行表達,然后將其移動到另一個系統(tǒng)中,并在該系統(tǒng)中使用上述模型預測機器失效的可能性等。

今天我們運用決策樹算法訓練一個客戶流失模型,進行“客戶流失”的預測分析。

結(jié)點概覽

讀取數(shù)據(jù)。這里讀取兩個數(shù)據(jù)文件,一個是通話數(shù)據(jù)和合約數(shù)據(jù)。接著講兩個數(shù)據(jù)以“電話號(PHONE NUMBER)”為關(guān)鍵字連接。

文件中有兩列數(shù)據(jù),分別是“地區(qū)編號(AREA CODE)”和“流失情況(CHURN)”,我們不想將這兩列作為數(shù)值型數(shù)據(jù)處理,這里我們將其更改為字符型數(shù)據(jù)。

將流失與否(這里為布爾值)用顏色標注出來,設置數(shù)據(jù)為0時標藍色,數(shù)據(jù)為1時標紅色。

接著把數(shù)據(jù)分成80%的訓練集和20%的測試集。

至此完成數(shù)據(jù)預處理工作。

使用決策樹,依照不同的指標,對流失和存活客戶數(shù)進行分類。

首先使用日租費day charge將所有數(shù)據(jù)分為兩組,對于day charge =< 44.96的值再依據(jù)撥打客服電話數(shù),劃分成兩組。以此類推,直至葉節(jié)點擁有最小不純度值。

然后將決策樹所得模型記錄為PMML語句,方便下次調(diào)用。

 

刪除屬于多數(shù)類的隨機行(如在這里流失客戶為少數(shù)項,存活客戶為多數(shù)),則我們隨機刪除一些多數(shù)項,使流失客戶和存活客戶數(shù)據(jù)量相同。接著輸入測試集和已得決策樹模型,應用決策樹算法對之前分出的80%測試數(shù)據(jù)進行預測。

通過ROC曲線可以看出,這個模型的預測準確度高達89.89%,是一個比較理想的模型。 

責任編輯:武曉燕 來源: 36大數(shù)據(jù)
相關(guān)推薦

2020-10-15 15:01:54

Python 開發(fā)編程語言

2016-12-07 09:27:11

KNIME大數(shù)據(jù)網(wǎng)絡

2020-09-15 14:05:21

Python代碼預測模型

2016-12-07 14:23:48

KNIME數(shù)據(jù)分析情感分析

2022-08-01 11:50:47

PySpark流失預測模型

2020-10-13 18:27:24

客戶流失客戶

2010-06-17 13:32:39

UML用例模型

2012-12-05 07:50:37

云服務云戰(zhàn)略

2016-01-05 10:14:33

2020-11-30 23:54:07

網(wǎng)絡可見性客戶流失IT團隊

2022-07-04 09:44:14

數(shù)據(jù)泄露網(wǎng)絡安全網(wǎng)絡攻擊

2024-07-31 11:48:07

2024-06-13 08:36:11

2011-03-03 14:04:08

ProftpdFtp server

2016-12-07 14:45:25

KNIME情感分析數(shù)據(jù)分析

2022-07-03 21:00:58

VoIP 系統(tǒng)人工智能

2020-12-23 13:13:17

機器學習客戶流失客戶

2009-12-18 14:37:56

ADO.NET模型

2016-12-07 14:56:51

KNIME數(shù)據(jù)分析

2009-12-08 16:47:06

WCF IP
點贊
收藏

51CTO技術(shù)棧公眾號