偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

運行機器學(xué)習(xí)項目,你需要避開這四個常見錯誤

開發(fā) 開發(fā)工具
本文主要介紹機器學(xué)習(xí)過程中,公司容易犯下的四個典型錯誤。

作為機器學(xué)習(xí)和數(shù)據(jù)分析的專家,在與不同領(lǐng)域企業(yè)合作開發(fā)和實現(xiàn)機器學(xué)習(xí)項目方面,我們有著豐富經(jīng)驗,這些領(lǐng)域包括制造,電信,金融服務(wù)以及零售業(yè)。對機器學(xué)習(xí)項目中常犯的錯誤,我們了如指掌,這些錯誤不是只有初學(xué)者才會犯。

[[188356]]

對于企業(yè)來說,為了專注真正問題以及可以帶來投資回報率的解決方案,學(xué)會不做什么事關(guān)重要。利用我們自己以及其他人的樣例,就會看到讓我們付出慘痛代價但本可加以避免的錯誤。

以下就是機器學(xué)習(xí)過程中,公司容易犯下的四個典型錯誤。

測試錯誤

如何證明機器學(xué)習(xí)真有商業(yè)價值?或許唯一真實的辦法就是用 A/B 測試來驗證一個機器學(xué)習(xí)模型的效果。但是,很多公司犯了一個根本錯誤:在測試時,變量比模型還多。

A/B 測試中,『A』與『B』唯一的區(qū)別就是生成結(jié)果的模型。所有其他變量應(yīng)該是一樣的。

例如,測試通過短信進行產(chǎn)品推薦時,所有短信應(yīng)該在同一天、同一時間里發(fā)出。這也是搞清楚不同模型效果的唯一辦法。一個變量發(fā)生改變了,就沒辦法充分比較測試結(jié)果。比如,周六上午發(fā)出的推薦消息產(chǎn)生的效果會和周五晚上發(fā)出的效果不一樣。

測量標準的重要性

任何機器學(xué)習(xí)項目期間,能對項目成功產(chǎn)生最重要影響的因子之一就是確定測量標準。畢竟,沒有要求就沒有結(jié)果。設(shè)定測量標準就是設(shè)定能夠獲得優(yōu)化效果的標準,因此,其他任何因素都可以忽略。選擇錯誤的成功標準,項目就會偏離優(yōu)化軌道,***只會讓項目更糟糕。

對于公司來說,成功是用以業(yè)務(wù)中心的標準來衡量的。許多項目都有這個問題:找到一個正確的技術(shù)標準,這個標準能夠?qū)⑺械臉I(yè)務(wù)面向都考慮進去。標準意味著什么內(nèi)容需要加以優(yōu)化,因此,如果一些業(yè)務(wù)內(nèi)容并沒有被納入標準的設(shè)定中去,那么,優(yōu)化過程中,這些因素就會被忽略掉,公司就無法實現(xiàn)他們想要的目標。

比如,絕對百分誤差(sMAPE)這個標準,一個以百分比(或相對)錯誤為基礎(chǔ),測量精度的度量標準。零售業(yè)務(wù)中,存貨出貨很慢時,用算法來預(yù)測所有出貨很慢產(chǎn)品的零值,就十分關(guān)鍵了,如果我們想要優(yōu)化 SMAPE 的話。不過,零售商又不能將一周僅交易 1 到 2 次的產(chǎn)品從所有存貨清單中刪除,因為這些產(chǎn)品常常影響著門市中其他產(chǎn)品的銷售,需要保留下來。

據(jù)此,對于公司來說,很重要的一點就是控制住測量標準:設(shè)定目標以及實現(xiàn)這一目標的算法,無論目標具體為何。不問目標。

目標沒問題,方法有錯誤

你是否走在通往目標的正確道路上呢?提出的模型問題是不是正確?比如,所有利益方都認為這個問題值得解決,你甚至還有用機器學(xué)習(xí)解決該問題的豐富知識。那么,現(xiàn)在正是進行交叉檢查的好時機,如果項目目標確實是你們想要實現(xiàn)的。即使決策解決問題方式看似沒啥變化,但最終你還是會發(fā)現(xiàn),在解決這個問題上,機器學(xué)習(xí)并不比不那么先進的模型要好。

比如,你開的公司從事服務(wù)行業(yè),也偶爾會有參觀高峰時期,那時公司人手就會不夠。這不過是一項業(yè)務(wù),你也不會想要員工全年都干這個,畢竟淡季時,這么做并不劃算。相反,你想要預(yù)測參觀人流量***的那五天。不過,這么問的結(jié)果可能會很多噪音,因為有時你會發(fā)現(xiàn) 1 個月里會有十天的高峰,而且你真的搞不清楚這十天的區(qū)別。因此,你想要問的應(yīng)該是:「哪些天,我需要額外幫助?」,你回答問題的方式也要做相應(yīng)調(diào)整。

都有意義嗎?

度量、算法以及測試或許預(yù)示著成功,但是,如果實施方式有誤,模型就有可能出現(xiàn)偏差。因此,你必須確定所有的努力都朝著這一方向:改善機器學(xué)習(xí)項目的流程質(zhì)量是有意義的,否則冒著花時間確保技術(shù)細節(jié)***的風險,***還無功而返。

就拿產(chǎn)品推薦說吧。你必須保持傳遞那些推薦內(nèi)容的渠道(比如電子郵件、短信以及推送通知等)暢通。這個建議貌似很簡單,但常常被忽略。如果渠道不能愉快地運作,那么,你在共享推薦系統(tǒng)上所做的提升就無法實現(xiàn)增值,原因很簡單,從渠道開始是徒勞的。比如,有的消費者幾乎不會讀公司發(fā)來的電子郵件,但接受電子郵件里的產(chǎn)品推薦,那么,這里出問題的是渠道而不是推薦。

機器學(xué)習(xí)項目很復(fù)雜,實施過程中出現(xiàn)的典型錯誤可能會耗費你很多精力,還無功而返。盡管錯誤會讓你停滯不前,但是,只要從中學(xué)習(xí),幾個月的時間就能成功實現(xiàn)業(yè)務(wù)、成本的優(yōu)化,而其他技術(shù)卻要花費數(shù)年才能達到這個效果。就機器學(xué)習(xí)而言,***的錯誤就是不吸取其他人的教訓(xùn)。

 

原文:https://www.datanami.com/2017/04/11/four-common-mistakes-machine-learning-projects/

【本文是51CTO專欄機構(gòu)機器之心的原創(chuàng)譯文,微信公眾號“機器之心( id: almosthuman2014)”】

 

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2015-08-13 10:49:33

WLAN無線局域網(wǎng)

2018-06-29 15:07:13

代碼工程師軟件開發(fā)

2019-10-29 14:54:20

Kafka消息系統(tǒng)分布式

2015-04-15 11:31:14

智能硬件智能家居

2024-10-10 11:49:27

2017-05-16 11:09:56

2018-11-12 13:01:45

機器學(xué)習(xí)模型元學(xué)習(xí)

2021-08-23 10:37:14

Javascript 機器學(xué)習(xí)阿里云

2020-03-24 17:49:27

大數(shù)據(jù)IT技術(shù)

2021-04-25 11:56:45

開源開源項目開源現(xiàn)狀

2017-11-24 14:17:44

身份管理遷移云端

2021-10-13 06:03:12

網(wǎng)絡(luò)帶寬卡頓

2022-10-26 14:55:53

AIoT物聯(lián)網(wǎng)人工智能

2025-03-05 09:20:00

Shell腳本Linux

2022-04-13 15:35:56

交互方案設(shè)計師用戶

2022-05-05 11:13:59

技術(shù)管理

2022-01-27 15:48:05

區(qū)塊鏈金融技術(shù)

2016-12-09 13:08:25

2015-10-30 10:23:27

創(chuàng)業(yè)選擇思考問題

2021-08-06 10:09:54

域名解析網(wǎng)絡(luò)故障網(wǎng)站
點贊
收藏

51CTO技術(shù)棧公眾號