偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

知道為啥失敗么?87%的機器學習項目都是這么栽了的……

人工智能 機器學習
機器學習領域的發(fā)展?jié)摿薮螅覀儗λ私獾眠€不夠。根據(jù)Garner的預測:“2020年,有80%的人工智能項目還很神秘”,Transform 2019 of Venture Beat預測有87%的AI項目將永遠不會投入生產。

本文轉載自公眾號“讀芯術”(ID:AI_Discovery)

 機器學習領域的發(fā)展?jié)摿薮螅覀儗λ私獾眠€不夠。根據(jù)Garner的預測:“2020年,有80%的人工智能項目還很神秘”,Transform 2019 of Venture Beat預測有87%的AI項目將永遠不會投入生產。

為什么會這樣呢?為什么這么多項目失敗呢?

· 缺乏專業(yè)知識

首先是因為大多數(shù)人對此技術依然很陌生,大多數(shù)公司組織仍不熟悉軟件工具和所需的硬件。

如今,似乎只要從事過數(shù)據(jù)分析或軟件開發(fā)工作,完成了一些示例數(shù)據(jù)科學項目的人,在上過在線短期課程后都自詡數(shù)據(jù)科學家。事實上,大多數(shù)的機器學習和人工智能項目,尤其在定義成功標準以及最終部署和持續(xù)監(jiān)控模型時,都需要經驗更豐富的數(shù)據(jù)科學家。

· 數(shù)據(jù)科學與傳統(tǒng)軟件開發(fā)之間的脫節(jié)

數(shù)據(jù)科學與傳統(tǒng)軟件開發(fā)之間的脫節(jié)是另一個主要因素,傳統(tǒng)的軟件開發(fā)往往更便于預測和測量。

· 數(shù)據(jù)科學依然是科研與工程的結合體

數(shù)據(jù)科學研究通過多次迭代和試驗向前發(fā)展。有時,由于選擇的度量標準無法帶動用戶行為,因此整個項目將不得不從部署階段重返計劃階段。

傳統(tǒng)項目或許不能和數(shù)據(jù)科學項目傳達一樣的結果。對于那些在傳統(tǒng)軟件開發(fā)項目的每個任務周期結尾時能得到清晰交付結果的領導者而言,這可能令他們感到疑惑。

· 數(shù)據(jù)的質量與規(guī)模

眾所周知,人工智能系統(tǒng)的數(shù)據(jù)基礎越廣,產生的預測就越好。除了數(shù)據(jù)量增多的直接影響外,隨著數(shù)據(jù)規(guī)模的增加,還會面臨許多新的挑戰(zhàn)。

在許多情況下必須合并來自多方的數(shù)據(jù)。這時,我們就會意識到它們并不是多次同步的。問題也隨之而來,有時會合并不應該被合并的數(shù)據(jù),這將導致有相同名稱的數(shù)據(jù)點卻有不同的含義。錯誤的數(shù)據(jù)產生的結果不僅沒有參考意義,還會產生誤導性。

 

知道為啥失敗么?87%的機器學習項目都是這么栽了的……

 

· 數(shù)據(jù)標注

據(jù)《麻省理工學院斯隆管理評論》稱,另一個使許多機器學習項目停滯的原因是數(shù)據(jù)標注的不可用。

76%的人通過對訓練數(shù)據(jù)進行標注和注釋來解決這一問題,而63%的人甚至嘗試構建自己的數(shù)據(jù)標注和自動化注釋技術。這意味著大量數(shù)據(jù)科學家會在數(shù)據(jù)標記過程中無法運用自己的專業(yè)知識,這是有效執(zhí)行人工智能項目所面臨的主要挑戰(zhàn)。

這就是許多公司將標注任務外包給其他公司的原因。但是,如果標注任務需要全面的專業(yè)領域知識,任務外包不會是好的解決方法。如果公司想保持數(shù)據(jù)集的質量和一致性,必須對數(shù)據(jù)標注員進行正式和標準化培訓。

如果要標注的數(shù)據(jù)很復雜,另一個選擇是開發(fā)自己的數(shù)據(jù)標注工具。但是這通常比機器學習任務本身需要更多的工程開銷。

· 封閉化組織

數(shù)據(jù)是機器學習項目中最重要的部分。在大多數(shù)組織中,這些數(shù)據(jù)將有不同的安全性約束,并以結構化、非結構化、視頻文件、音頻文件、文本和圖像等多種形式儲存在不同位置。

將這些數(shù)據(jù)以不同的格式放在不同的位置本身是一個挑戰(zhàn)。但是,在組織處于封閉狀態(tài)、負責人不相互合作時,團隊就會面臨加倍挑戰(zhàn)。

· 缺乏合作交流

另一個主要挑戰(zhàn)是數(shù)據(jù)科學家、數(shù)據(jù)工程師、數(shù)據(jù)管理員、商務智能專家、開發(fā)運營(DevOps)和工程等不同團隊之間缺乏協(xié)作。這對于從事數(shù)據(jù)科學工程方案的團隊尤其重要,他們的工作方式和使用的技術之間存在很多差異。

工程團隊將完成機器學習模型并將其投入生產。因此,他們之間需要有恰當?shù)睦斫夂透咝У膮f(xié)作。

· 技術上不可行的項目

由于機器學習項目往往成本高昂,因此大多數(shù)企業(yè)傾向于以遠大的“登月計劃”為目標,試圖以此完全改變公司或產品并為企業(yè)帶來超額回報或投資。這樣的項目會使數(shù)據(jù)科學團隊無法突破極限,并且永遠無法完成這樣的項目。最終,企業(yè)領導者將對項目失去信心并停止投資。

企業(yè)最好將精力集中在單個可實現(xiàn)項目上,在力所能及的范圍內針對分散的業(yè)務制定階段性的小目標。

· 技術和業(yè)務團隊之間的協(xié)調問題

在機器學習項目啟動時,業(yè)務團隊和數(shù)據(jù)科學團隊之間沒有明確期望、目標和成功標準。這樣的項目將永遠停留在研究階段,因為他們不清楚自己的目標,便永遠不知道自己是否正在取得進展。

數(shù)據(jù)科學團隊將主要專注于準確性,而業(yè)務團隊卻對財務收益或業(yè)務洞察力等指標更感興趣。最終業(yè)務團隊不會接受數(shù)據(jù)科學團隊的成果。

 

知道為啥失敗么?87%的機器學習項目都是這么栽了的……

 

· 缺乏數(shù)據(jù)策略

根據(jù)麻省理工學院斯隆管理評論,只有50%的員工人數(shù)超過10萬的大型企業(yè)最有可能采用數(shù)據(jù)策略。在開始機器學習項目之前制定可靠的數(shù)據(jù)策略至關重要。

你需要對以下內容有清晰的了解,這是數(shù)據(jù)策略的一部分:

  • 公司中的總數(shù)據(jù)
  • 項目真正需要多少數(shù)據(jù)
  • 項目涉及到的員工是否有權查看這些數(shù)據(jù)
  • 如何將來源不同的數(shù)據(jù)匯總在一起的具體策略
  • 如何清理和轉換這些數(shù)據(jù)

大多數(shù)公司開始時都沒有計劃,或者根本沒有想到自己沒有數(shù)據(jù)。

· 缺乏領導支持

只要投入金錢和技術,問題就能迎刃而解。這是大眾常見的誤解。領導者可能沒有提供正確的支持來確保已經達到成功所需的條件。有時業(yè)務主管并不看好數(shù)據(jù)科學家開發(fā)的模型。

這或許是由于業(yè)務負責人缺乏對人工智能的理解以及數(shù)據(jù)科學家無法將模型的商業(yè)價值準確傳達給領導者。領導者需要了解機器學習的工作原理以及人工智能對企業(yè)的真正意義。

以上就是機器學習項目“九死一生”的原因所在。

 

責任編輯:華軒 來源: 讀芯術
相關推薦

2020-11-05 11:08:11

人工智能

2017-12-11 15:04:58

404錯誤HTTP代碼

2018-10-28 15:40:23

Python編程語言

2022-09-15 18:21:03

JVMKafka

2017-07-15 16:06:09

外賣深度學習O2O

2023-09-08 08:35:42

層疊樣式表CSS

2023-06-26 08:20:02

openapi格式注解

2024-09-04 15:35:59

2015-11-11 10:41:49

1600億AWS云計算

2018-08-14 11:02:55

機器學習項目失敗

2020-06-03 08:15:50

IO軟件

2014-01-22 14:27:25

科技創(chuàng)業(yè)者人品

2024-03-27 12:35:12

2024-04-26 11:12:44

Rust機器學習

2024-04-08 13:08:16

Python去除水印

2021-06-09 10:10:20

代碼內存編程語言

2014-12-23 14:57:42

開源項目機器學習

2021-03-24 08:44:11

代碼內存消耗語言

2023-11-02 08:32:11

機器學習人工智能

2014-08-26 11:03:54

點贊
收藏

51CTO技術棧公眾號