偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

擴(kuò)展機(jī)器學(xué)習(xí)模型的五大挑戰(zhàn)

譯文
人工智能 機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)模型很難轉(zhuǎn)化為積極的業(yè)務(wù)效益。為了解機(jī)器學(xué)習(xí)模型產(chǎn)品化方面的常見(jiàn)陷阱,不妨了解組織面臨的五大挑戰(zhàn)。

 

【51CTO.com快譯】機(jī)器學(xué)習(xí)模型是為定義的業(yè)務(wù)目標(biāo)設(shè)計(jì)的。機(jī)器學(xué)習(xí)模型產(chǎn)品化是指在相關(guān)數(shù)據(jù)集上托管、擴(kuò)展和運(yùn)行機(jī)器學(xué)習(xí)模型。生產(chǎn)級(jí)機(jī)器學(xué)習(xí)模型還需要有彈性和靈活性,以適應(yīng)將來(lái)的變化和反饋。Forrester最近的一項(xiàng)研究表明,改善客戶體驗(yàn)、提升盈利能力和增加收入是組織使用機(jī)器學(xué)習(xí)項(xiàng)目計(jì)劃實(shí)現(xiàn)的幾個(gè)主要目標(biāo)。

雖然機(jī)器學(xué)習(xí)模型已獲得全世界的贊譽(yù),但很難轉(zhuǎn)化為積極的業(yè)務(wù)效益。處理活躍數(shù)據(jù)并將機(jī)器學(xué)習(xí)模型部署到生產(chǎn)環(huán)境時(shí),工程、數(shù)據(jù)和業(yè)務(wù)方面的一大堆問(wèn)題成為瓶頸。據(jù)調(diào)查,43%的人稱在機(jī)器學(xué)習(xí)模型生成和集成方面遇到障礙。確保機(jī)器學(xué)習(xí)模型實(shí)現(xiàn)企業(yè)預(yù)期的最終目標(biāo)很重要,由于可靠而廉價(jià)的開(kāi)源基礎(chǔ)設(shè)施,機(jī)器學(xué)習(xí)模型在全球組織的采用正以前所未有的速度增長(zhǎng)。Gartner預(yù)測(cè),全球40%的領(lǐng)先組織計(jì)劃在2020年底之前實(shí)際部署AI解決方案。為了解機(jī)器學(xué)習(xí)模型產(chǎn)品化方面的常見(jiàn)陷阱,不妨了解組織面臨的五大挑戰(zhàn)。

1. 數(shù)據(jù)的復(fù)雜性

需要約100萬(wàn)條相關(guān)記錄才能在數(shù)據(jù)上訓(xùn)練機(jī)器學(xué)習(xí)模型,這不能是隨隨便便的數(shù)據(jù)。數(shù)據(jù)可行性和可預(yù)測(cè)性方面的風(fēng)險(xiǎn)浮出水面。評(píng)估我們是否有相關(guān)的數(shù)據(jù)集、是否足夠快地獲取這些數(shù)據(jù)集以便進(jìn)行預(yù)測(cè)并非易事。獲取上下文數(shù)據(jù)也是個(gè)問(wèn)題。在百勝餐飲集團(tuán)(Yum Brands)的一個(gè)機(jī)器學(xué)習(xí)擴(kuò)展項(xiàng)目中,該公司的一些產(chǎn)品(如肯德基,奉行新的特許權(quán)加盟計(jì)劃)沒(méi)有足夠的客戶數(shù)據(jù)。光有數(shù)據(jù)還不夠。大多數(shù)機(jī)器學(xué)習(xí)團(tuán)隊(duì)從非數(shù)據(jù)湖方法入手,在傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)上訓(xùn)練機(jī)器學(xué)習(xí)模型。如果是傳統(tǒng)的數(shù)據(jù)系統(tǒng),數(shù)據(jù)科學(xué)家常常將80%的時(shí)間用于清理和管理數(shù)據(jù),而不是訓(xùn)練模型。還需要強(qiáng)大的治理系統(tǒng)和數(shù)據(jù)分類,以便數(shù)據(jù)透明地共享并分門別類,從而再次利用。由于數(shù)據(jù)復(fù)雜性,維護(hù)和運(yùn)行機(jī)器學(xué)習(xí)模型的成本相對(duì)回報(bào)會(huì)隨著時(shí)間的推移而降低。

2. 設(shè)計(jì)和部署

一旦數(shù)據(jù)可用,就必須根據(jù)使用場(chǎng)景和未來(lái)彈性敲定基礎(chǔ)設(shè)施和技術(shù)堆棧。機(jī)器學(xué)習(xí)系統(tǒng)可能很難設(shè)計(jì)。機(jī)器學(xué)習(xí)領(lǐng)域有眾多技術(shù)可用。模型要取得成功,關(guān)鍵在于選擇每種技術(shù)堆棧時(shí)將不同領(lǐng)域的技術(shù)堆棧分別標(biāo)準(zhǔn)化,以便不會(huì)加大產(chǎn)品化的難度。比如說(shuō),數(shù)據(jù)科學(xué)家可能使用Pandas之類的工具,用Python編代碼。但是這些未必很好地適用于Spark或Pyspark更合適的生產(chǎn)環(huán)境。設(shè)計(jì)不當(dāng)?shù)募夹g(shù)解決方案很費(fèi)錢。然后,生命周期挑戰(zhàn)以及管理和穩(wěn)定生產(chǎn)環(huán)境中的多個(gè)模型也變得難以處理。

3. 整合風(fēng)險(xiǎn)

機(jī)器學(xué)習(xí)模型要取得成功,與不同的數(shù)據(jù)集和建模技術(shù)很好地集成在一起的可擴(kuò)展生產(chǎn)環(huán)境至關(guān)重要。整合不同的團(tuán)隊(duì)和運(yùn)營(yíng)系統(tǒng)總是具有挑戰(zhàn)性。復(fù)雜的代碼庫(kù)必須融入到準(zhǔn)備部署到生產(chǎn)環(huán)境的結(jié)構(gòu)清晰的系統(tǒng)中。如果沒(méi)有將模型部署到生產(chǎn)環(huán)境的標(biāo)準(zhǔn)化流程,團(tuán)隊(duì)會(huì)在任何階段停滯不前。不同的團(tuán)隊(duì)需要將工作流程自動(dòng)化集成到工作流程系統(tǒng)中,并進(jìn)行測(cè)試。如果未在合適的階段測(cè)試模型,最后就要修復(fù)整個(gè)生態(tài)系統(tǒng)。技術(shù)堆棧必須實(shí)現(xiàn)標(biāo)準(zhǔn)化,否則集成可能是場(chǎng)噩夢(mèng)。集成還是確保機(jī)器學(xué)習(xí)實(shí)驗(yàn)框架不是一次性奇跡的關(guān)鍵時(shí)刻。否則如果業(yè)務(wù)環(huán)境發(fā)生變化或遭遇災(zāi)難性事件,模型無(wú)法提供價(jià)值。

4. 測(cè)試和模型支持

測(cè)試機(jī)器學(xué)習(xí)模型很困難,但與生產(chǎn)過(guò)程的其他步驟一樣重要,甚至更重要。了解結(jié)果、運(yùn)行狀況檢查、監(jiān)測(cè)模型性能、留意數(shù)據(jù)異常以及重新訓(xùn)練模型一起組成整個(gè)產(chǎn)品化周期。即使在運(yùn)行測(cè)試之后,可能仍需要適當(dāng)?shù)臋C(jī)器學(xué)習(xí)生命周期管理工具來(lái)查找測(cè)試中未出現(xiàn)的問(wèn)題。

5. 分配角色和積極溝通

數(shù)據(jù)科學(xué)、數(shù)據(jù)工程、DevOps及其他相關(guān)團(tuán)隊(duì)之間保持透明的溝通對(duì)于機(jī)器學(xué)習(xí)模型的成功至關(guān)重要。但分配角色、提供詳細(xì)的訪問(wèn)權(quán)限以及為每個(gè)團(tuán)隊(duì)密切關(guān)注很復(fù)雜。緊密的協(xié)作和溝通對(duì)于在早期階段識(shí)別不同方面的風(fēng)險(xiǎn)至關(guān)重要。讓數(shù)據(jù)科學(xué)家深入?yún)⑴c也事關(guān)機(jī)器學(xué)習(xí)模型的未來(lái)。

除了上述挑戰(zhàn)外,還要留意不可預(yù)見(jiàn)的事件,比如新冠疫情??蛻舻馁?gòu)買行為突然變化時(shí),過(guò)去的解決方案不再適用,缺少充分訓(xùn)練模型的新數(shù)據(jù)就成了障礙。總之,擴(kuò)展機(jī)器學(xué)習(xí)模型并不容易。

原文標(biāo)題:5 Challenges to Scaling Machine Learning Models,作者:Sigmoid Analyitcs

【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】

 

責(zé)任編輯:龐桂玉 來(lái)源: 51CTO
相關(guān)推薦

2013-05-07 09:24:53

BYOD

2022-03-15 14:55:34

Kubernetes

2023-03-30 14:14:45

Kubernetes

2021-05-20 14:17:05

云計(jì)算混合云架構(gòu)

2024-03-18 15:46:40

2024-04-30 07:02:00

OT網(wǎng)絡(luò)安全DDoS攻擊OT系統(tǒng)

2012-08-20 08:58:00

云網(wǎng)絡(luò)私有云

2022-06-14 08:46:25

安全網(wǎng)絡(luò)漏洞

2022-07-08 10:22:52

IT招聘新興技術(shù)

2012-08-22 09:46:03

私有云網(wǎng)絡(luò)私有云云網(wǎng)絡(luò)

2018-12-28 09:00:00

人工智能機(jī)器學(xué)習(xí)開(kāi)源框架

2022-08-30 18:13:38

機(jī)器學(xué)習(xí)

2025-06-30 08:21:58

2022-02-18 14:27:17

區(qū)塊鏈安全技術(shù)

2024-03-12 12:05:57

2015-08-26 10:46:16

大數(shù)據(jù)

2022-02-09 11:25:58

混合云云計(jì)算云安全

2022-08-08 10:20:19

數(shù)據(jù)安全首席信息安全官

2020-10-15 08:00:00

機(jī)器學(xué)習(xí)開(kāi)源

2011-04-07 10:29:54

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)