偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

關(guān)于機器學(xué)習(xí)管道需要了解什么?

譯文
人工智能 機器學(xué)習(xí)
隨著蓬勃發(fā)展的持續(xù)集成 (CI) /持續(xù)交付(CD)推動了機器學(xué)習(xí)的開發(fā),IT專業(yè)人員可以通過多種選項了解機器學(xué)習(xí)管道,并維護數(shù)據(jù)模型的可靠性。

【51CTO.com快譯】隨著蓬勃發(fā)展的持續(xù)集成 (CI) /持續(xù)交付(CD)推動了機器學(xué)習(xí)的開發(fā),IT專業(yè)人員可以通過多種選項了解機器學(xué)習(xí)管道,并維護數(shù)據(jù)模型的可靠性。

[[352477]]

企業(yè)高管經(jīng)常將機器學(xué)習(xí)模型的黑盒性質(zhì)視為一種神秘技術(shù),他們通常認(rèn)為,IT主管能夠有效調(diào)動流程,并使模型表現(xiàn)良好?,F(xiàn)實情況是,了解機器學(xué)習(xí)流程的基礎(chǔ)知識可以使其流程和步驟變得不再神秘,而IT團隊可以更好地管理對當(dāng)今競爭激烈的商業(yè)環(huán)境至關(guān)重要的機器學(xué)習(xí)技術(shù)。

機器學(xué)習(xí)管道實質(zhì)上是構(gòu)建和自動化程序所需輸出的開發(fā)步驟。開發(fā)人員使用“管道”這一術(shù)語描述軟件如何從形成源代碼并進入生產(chǎn)環(huán)境中的過程。實際上,人們可能會看到許多商業(yè)的編程服務(wù)管道,例如將軟件部署到存儲庫中以進行更新。在采用機器學(xué)習(xí)的情況下,管道描述了在部署之前調(diào)整數(shù)據(jù)的過程以及部署過程。

機器學(xué)習(xí)管道包括數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)轉(zhuǎn)換、模型訓(xùn)練。每個階段的活動通過數(shù)據(jù)和代碼的處理方式進行鏈接。數(shù)據(jù)采集是從計劃的數(shù)據(jù)源獲取數(shù)據(jù)。其采集的類型包括從簡單上傳的數(shù)據(jù)文件到從數(shù)據(jù)湖或數(shù)據(jù)庫中查詢所需的數(shù)據(jù)。

數(shù)據(jù)處理是創(chuàng)建按行、列和值準(zhǔn)備數(shù)據(jù)集的編程代碼。準(zhǔn)備應(yīng)用基于已知數(shù)據(jù)質(zhì)量的更改。用數(shù)據(jù)集平均值作為對缺失值進行補充。

數(shù)據(jù)轉(zhuǎn)換是通過應(yīng)用程序轉(zhuǎn)換數(shù)據(jù)格式,以便模型讀取數(shù)據(jù)。它旨在以模型可識別的格式排列數(shù)據(jù)類型,例如應(yīng)用編碼從數(shù)據(jù)集中移動分類文本。

模型訓(xùn)練涉及運行數(shù)據(jù)以建立模型規(guī)范??梢愿鶕?jù)所使用的模型類型解決這些問題。一些機器學(xué)習(xí)框架的擴展旨在簡化模型的部署和調(diào)整。例如,TensorFlow在R編程中有一個名為tfdatasets的庫,該庫可用于輸入管道。

在訓(xùn)練數(shù)據(jù)模型之后,最后一步是測試模型,以查看其產(chǎn)生預(yù)測值的準(zhǔn)確性如何,并相應(yīng)地調(diào)整模型的參數(shù)。

文檔的重要性

機器學(xué)習(xí)管道中的另一個重要細(xì)節(jié)是文檔。文檔用于建立在指定時間段內(nèi)運行功能的說明。YAML是用于此目的的文本編程語言。該文檔使用名稱值對(如JSON文件中的名稱對)進行設(shè)計。

由于需要大量步驟,IT專業(yè)人員可以通過管理機器學(xué)習(xí)管道流程的平臺來學(xué)習(xí)如何管理與管道相關(guān)的問題。最常用的是Microsoft Azure ML、Amazon Sagemaker和Google Cloud AI。其中每一個平臺都為開發(fā)管道提供了集成的環(huán)境,并提供了與其他云計算服務(wù)一起工作的特定功能。例如,Azure Pipelines與Microsoft IDE,Visual Studio Code同步,為開發(fā)人員提供一個專用的工作流來上傳所需的更正數(shù)據(jù)。這對于編輯YAML文件進行配置來說特別方便。

相對于語言、平臺和媒介,每種平臺服務(wù)都有自己獨特的優(yōu)勢。例如,Azure ML支持Python或R,并為AutoML(基本機器學(xué)習(xí)過程的框架)提供了更多選項。這一細(xì)節(jié)將表明企業(yè)團隊需要培訓(xùn)哪些專業(yè)知識。

熟悉加速器的使用

除了學(xué)習(xí)平臺之外,IT團隊還應(yīng)該熟悉加速器的使用。加速器是一種云計算服務(wù),承載著GPU(圖形處理單元)的多個處理器核心。GPU是一種專用處理器,可為圖形和數(shù)學(xué)計算提供專用內(nèi)存。GPU可以處理大量數(shù)據(jù),從而節(jié)省了在筆記本電腦處理器上無法實現(xiàn)的測試和訓(xùn)練時間。

加速器有時需要其他框架來訪問用于連接模型的解決方案。例如,TensorFlow具有一個庫,用于將不同版本的GPU連接到TPU(張量處理單元),以管理在訓(xùn)練和測試運行期間產(chǎn)生的數(shù)百萬個計算參數(shù)。因此,IT團隊?wèi)?yīng)尋求有關(guān)框架的培訓(xùn),以了解可能出現(xiàn)的部署問題。

學(xué)習(xí)和熟悉管道平臺和加速器為在模型環(huán)境中計劃持續(xù)集成 (CI)/持續(xù)交付(CD)奠定了基礎(chǔ)。而可觀測性成為必不可少的主題,可觀測性允許監(jiān)視模型性能以進行效率調(diào)整,這尤其具有價值,因為模型可能需要很長時間進行測試和訓(xùn)練。可觀測性系統(tǒng)可以使IT團隊對控制模型的更改進行版本控制,從而可以準(zhǔn)確調(diào)試因性能問題而導(dǎo)致的編程。這種可重復(fù)性也為模型驗證奠定了基礎(chǔ)。模型驗證檢查了幾種環(huán)境中的模型操作,有助于企業(yè)選擇最佳的機器學(xué)習(xí)模型。

一旦規(guī)劃了驗證和版本控制,應(yīng)該更容易設(shè)想持續(xù)集成 (CI) /持續(xù)交付(CD)的實踐。持續(xù)集成 (CI) /持續(xù)交付(CD)的價值在于交付根據(jù)管道階段和模型條件精心編排的更新。

了解管道可以為使用持續(xù)集成 (CI) /持續(xù)交付(CD)技術(shù)和機器學(xué)習(xí)模型的IT團隊設(shè)置正確的工作流程。它還為IT團隊更好地討論影響業(yè)務(wù)運營的管道流程鋪平了道路。這樣就打造了一支積極主動的IT團隊,可以使機器學(xué)習(xí)保持最新狀態(tài),從而獲得成功。

原文標(biāo)題:What You Need to Know About Machine Learning Pipelines,作者:Pierre DeBois

【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】

 

責(zé)任編輯:華軒 來源: 51CTO
相關(guān)推薦

2022-08-15 06:53:22

網(wǎng)絡(luò)攻擊網(wǎng)絡(luò)安全

2022-01-05 11:02:44

物聯(lián)網(wǎng)開發(fā)物聯(lián)網(wǎng)IOT

2022-12-01 10:08:43

預(yù)測性維護物聯(lián)網(wǎng)

2023-04-24 15:41:27

ChatGPT人工智能

2018-09-10 11:40:26

機器學(xué)習(xí)數(shù)據(jù)準(zhǔn)備算法

2023-12-29 09:50:51

智能機器人人工智能

2020-04-22 14:41:17

JVM參數(shù)函數(shù)

2022-08-21 15:58:18

網(wǎng)絡(luò)安全網(wǎng)絡(luò)攻擊漏洞

2016-11-01 16:41:08

直通網(wǎng)線連接端口傳輸數(shù)據(jù)

2023-06-25 10:14:46

智能機器人人工智能

2018-04-10 09:59:44

GoogleJS代碼規(guī)范

2022-10-27 10:29:15

2021-09-05 08:46:29

CSPM網(wǎng)絡(luò)安全網(wǎng)絡(luò)攻擊

2020-05-12 10:31:54

云遷移云平臺云計算

2022-10-08 12:59:24

物聯(lián)網(wǎng)物聯(lián)網(wǎng)設(shè)備

2021-05-19 09:40:14

Android 12Android

2021-08-09 14:40:02

物聯(lián)網(wǎng)IOT智能家居

2020-08-03 12:47:58

DevOps數(shù)據(jù)科學(xué)家代碼

2022-07-29 09:17:46

JavaScriptReactJS學(xué)習(xí)

2019-11-28 15:37:33

云計算技術(shù)工具
點贊
收藏

51CTO技術(shù)棧公眾號