偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

LazyPredict:為你選擇最佳ML模型!

譯文 精選
人工智能 機(jī)器學(xué)習(xí) 開(kāi)發(fā)
本文討論使用LazyPredict來(lái)創(chuàng)建簡(jiǎn)單的ML模型。LazyPredict創(chuàng)建機(jī)器學(xué)習(xí)模型的特點(diǎn)是不需要大量的代碼,同時(shí)在不修改參數(shù)的情況下進(jìn)行多模型擬合,從而在眾多模型中選出性能最佳的一個(gè)。

摘要

本文討論使用LazyPredict來(lái)創(chuàng)建簡(jiǎn)單的ML模型LazyPredict創(chuàng)建機(jī)器學(xué)習(xí)模型的特點(diǎn)是不需要大量的代碼,同時(shí)在不修改參數(shù)的情況下進(jìn)行多模型擬合,從而在眾多模型中選出性能最佳的一個(gè)。?

本文包括的內(nèi)容如下:?

  • 簡(jiǎn)介?
  • LazyPredict模塊的安裝?
  • 在分類模型中實(shí)施LazyPredict?
  • 在回歸模型中實(shí)施?
  • 總結(jié)?

簡(jiǎn)介

LazyPredict號(hào)稱最先進(jìn)的Python軟件包,它的誕生正在徹底改變機(jī)器學(xué)習(xí)模型的開(kāi)發(fā)方式。通過(guò)使用LazyPredict,可以快速創(chuàng)建各種基本模型,幾乎不需要任何代碼,從而騰出時(shí)間來(lái)選擇最適合我們數(shù)據(jù)的模型。?

LazyPredict的主要優(yōu)點(diǎn)是可以使模型選擇更加容易,而不需要對(duì)模型進(jìn)行大量的參數(shù)調(diào)整。LazyPredict提供了一種快速有效的方法來(lái)尋找和適配數(shù)據(jù)的最佳模型。?

接下來(lái),讓我們通過(guò)這篇文章探索和學(xué)習(xí)更多關(guān)于LazyPredict的用法。?

LazyPredict模塊的安裝

LazyPredict庫(kù)的安裝是一項(xiàng)非常簡(jiǎn)單的任務(wù)。如同安裝任何其他Python庫(kù)一樣,只需一行代碼輕松搞定。?

!pip install lazypredict

在分類模型中實(shí)施LazyPredict

在這個(gè)例子中,我們將利用Sklearn包中的乳腺癌數(shù)據(jù)集。?

現(xiàn)在,讓我們來(lái)加載數(shù)據(jù)。?

from sklearn.datasets import load_breast_cancer
from lazypredict.Supervised import LazyClassifier

data = load_breast_cancer()
X = data.data
y= data.target

為了選擇最佳分類器模型,現(xiàn)在讓我們部署"LazyClassifier "算法。這些特征和輸入?yún)?shù)適用于該類。

LazyClassifier(
verbose=0,
ignore_warnings=True,
custom_metric=None,
predictions=False,
random_state=42,
classifiers='all',
)

接著把該模型應(yīng)用于加載好的數(shù)據(jù)并進(jìn)行擬合。?

from lazypredict.Supervised import LazyClassifier
from sklearn.model_selection import train_test_split

# split the data
X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0)

# build the lazyclassifier
clf = LazyClassifier(verbose=0,ignore_warnings=True, custom_metric=None)

# fit it
models, predictions = clf.fit(X_train, X_test, y_train, y_test)

# print the best models
print(models)

執(zhí)行上述代碼之后,得到下面結(jié)果:?

然后,我們可以進(jìn)行以下工作,來(lái)看看模型的細(xì)節(jié)。?

model_dictionary = clf.provide_models(X_train,X_test,y_train,y_test)

接下來(lái),設(shè)置模型的名稱來(lái)顯示詳細(xì)的步驟信息。?

model_dictionary['LGBMClassifier']

在這里,我們可以看到SimpleImputer被用于整個(gè)數(shù)據(jù)集,然后是StandardScaler用于數(shù)字特征。在這個(gè)數(shù)據(jù)集中沒(méi)有分類或序數(shù)特征,但如果有,就會(huì)分別使用OneHotEncoder和OrdinalEncoder。LGBMClassifier模型在轉(zhuǎn)換和歸類后接收數(shù)據(jù)。?

LazyClassifier的內(nèi)部機(jī)器學(xué)習(xí)模型使用sci-kit-learn工具箱進(jìn)行評(píng)估和擬合。LazyClassifier函數(shù)在被調(diào)用時(shí),會(huì)在我們的數(shù)據(jù)上自動(dòng)建立和擬合各種模型,包括決策樹(shù)、隨機(jī)森林、支持向量機(jī)等。你提供的一組性能標(biāo)準(zhǔn),如準(zhǔn)確率、召回率或F1得分,被用來(lái)評(píng)估這些模型。訓(xùn)練集用于擬合,而測(cè)試集則用于評(píng)估。?

在對(duì)模型進(jìn)行評(píng)估和擬合后,LazyClassifier會(huì)提供一份評(píng)估結(jié)果總結(jié)(如上表),以及每個(gè)模型的頂級(jí)模型和性能指標(biāo)列表。由于不需要手動(dòng)調(diào)整或選擇模型,你可以快速簡(jiǎn)單地評(píng)估許多模型的性能,并選擇最適合數(shù)據(jù)的模型。

在回歸模型中實(shí)施LazyPredict

使用"LazyRegressor "函數(shù),可以再次為回歸模型完成同樣的工作。讓我們導(dǎo)入一個(gè)適合回歸任務(wù)的數(shù)據(jù)集(使用波士頓數(shù)據(jù)集)。

現(xiàn)在,讓我們使用LazyRegressor來(lái)擬合我們的數(shù)據(jù)。?

from lazypredict.Supervised import LazyRegressor
from sklearn import datasets
from sklearn.utils import shuffle
import numpy as np

# load the data
boston = datasets.load_boston()
X, y = shuffle(boston.data, boston.target, random_state=0)
X = X.astype(np.float32)

# split the data
X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0)

# fit the lazy object
reg = LazyRegressor(verbose=0, ignore_warnings=False, custom_metric=None)
models, predictions = reg.fit(X_train, X_test, y_train, y_test)

# print the results in a table
print(models)

代碼執(zhí)行結(jié)果如下:?

以下是對(duì)最佳回歸模型的詳細(xì)描述:?

model_dictionary = reg.provide_models(X_train,X_test,y_train,y_test)
model_dictionary['ExtraTreesRegressor']

這里可以看到SimpleImputer被用于整個(gè)數(shù)據(jù)集,然后是StandardScaler用于數(shù)字特征。這個(gè)數(shù)據(jù)集中沒(méi)有分類或序數(shù)特征,但如果有的話,會(huì)分別使用OneHotEncoder和OrdinalEncoder。ExtraTreesRegressor模型接收了轉(zhuǎn)換和歸類后的數(shù)據(jù)。?

結(jié)論

LazyPredict庫(kù)對(duì)于任何從事機(jī)器學(xué)習(xí)行業(yè)的人來(lái)說(shuō)都是一種有用的資源。LazyPredict通過(guò)自動(dòng)創(chuàng)建和評(píng)估模型的過(guò)程來(lái)節(jié)省選擇模型的時(shí)間和精力,這大大提高了模型選擇過(guò)程的有效性。LazyPredict提供了一種快速而簡(jiǎn)單的方法來(lái)比較幾個(gè)模型的有效性,并確定哪個(gè)模型系列最適合我們的數(shù)據(jù)和問(wèn)題,因?yàn)樗軌蛲瑫r(shí)擬合和評(píng)估眾多模型。?

閱讀本文之后希望你現(xiàn)在對(duì)LazyPredict庫(kù)有了直觀的了解,這些概念將幫助你建立一些真正有價(jià)值的項(xiàng)目。?

譯者介紹

崔皓,51CTO社區(qū)編輯,資深架構(gòu)師,擁有18年的軟件開(kāi)發(fā)和架構(gòu)經(jīng)驗(yàn),10年分布式架構(gòu)經(jīng)驗(yàn)。

原文標(biāo)題:??LazyPredict: A Utilitarian Python Library to Shortlist the Best ML Models for a Given Use Case??,作者:Sanjay Kumar

責(zé)任編輯:華軒 來(lái)源: 51CTO
相關(guān)推薦

2018-08-03 10:30:16

算法回歸機(jī)器學(xué)習(xí)

2023-07-18 12:58:06

2022-11-29 07:14:56

NLP語(yǔ)言模型

2015-09-01 10:15:16

公有云應(yīng)用遷移

2014-07-22 09:08:40

2024-12-09 08:54:49

2020-06-02 08:22:18

ML機(jī)器學(xué)習(xí)MVP

2009-11-11 15:41:29

ADO數(shù)據(jù)對(duì)象

2015-08-13 15:01:24

Linux發(fā)行版

2023-11-29 09:52:13

2010-01-12 15:59:12

最佳路由路徑

2022-08-09 13:44:37

機(jī)器學(xué)習(xí)PySpark M數(shù)據(jù)分析

2013-04-23 09:49:43

負(fù)載測(cè)試最佳負(fù)載負(fù)載

2022-12-06 17:02:10

機(jī)器學(xué)習(xí)模型設(shè)置

2024-07-17 08:17:20

2016-05-12 15:47:08

IBM大型機(jī) LinuxONE

2016-03-28 10:32:26

Linux桌面發(fā)行版

2022-09-25 23:10:53

Python數(shù)據(jù)集機(jī)器學(xué)習(xí)

2011-09-29 10:56:06

2010-04-01 10:47:51

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)