AI/ML項目中四大常見障礙
?但不幸的現(xiàn)實是,85%的AI和ML項目都無法完整交付,只有53%的項目能從原型到生產(chǎn)。盡管如此,根據(jù)最近的IDC支出指南,到2025年,美國在人工智能方面的支出將增長到1200億美元,增幅將達到20%甚至更多。
因此,避免五個經(jīng)常導(dǎo)致AI和ML項目失敗的常見錯誤是很重要的。
1. 了解訓(xùn)練ML算法所需的資源,特別是數(shù)據(jù)資源
雖然說正在利用AI和ML革新公司的流程聽起來很不錯,但事實是80%的公司發(fā)現(xiàn)這些項目比預(yù)期的更難。
為了使這些項目獲得成功,需要清楚地了解在資源和人員方面需要什么。最常見的錯誤之一是不了解如何獲得正確的訓(xùn)練數(shù)據(jù)——這不僅對此類計劃的成功至關(guān)重要,而且還需要大量的努力和專業(yè)知識才能成功完成。大多數(shù)希望采用AI/ML項目的公司無法獲得確保高質(zhì)量、公正結(jié)果所需的數(shù)據(jù)數(shù)量或數(shù)據(jù)多樣性。
然而,如果做不到這一點,往往會給成功帶來巨大的障礙,導(dǎo)致項目成本飆升,項目信心暴跌。
可供公司購買的訓(xùn)練數(shù)據(jù)并不匱乏,許多第三方數(shù)據(jù)公司能夠提供服務(wù)。問題在于,一家公司可以輕松地以低廉的價格購買大量數(shù)據(jù)并不意味著它就是高質(zhì)量的訓(xùn)練數(shù)據(jù),而這正是成功的AI和ML項目所需要的。公司需要的不是簡單地購買一刀切的數(shù)據(jù),而是特定于項目的數(shù)據(jù)。
因此,為了減少偏見,確保數(shù)據(jù)能夠代表廣泛而多樣的受眾是很重要的。數(shù)據(jù)還需要針對你的算法進行準(zhǔn)確的標(biāo)注,并且應(yīng)該始終檢查數(shù)據(jù)是否符合數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)隱私法和安全措施的要求。
2.不要奢望人工智能發(fā)展會一帆風(fēng)順
ML算法的訓(xùn)練不是一個奇異的過程。一旦訓(xùn)練開始并且更好地理解了數(shù)據(jù)模型,就必須不斷地對所收集的數(shù)據(jù)進行更改。在算法訓(xùn)練過程開始之前,要知道您實際需要什么數(shù)據(jù)并不容易。例如,您可能會意識到訓(xùn)練集或數(shù)據(jù)收集方式存在問題。
如同傳統(tǒng)的軟件開發(fā)一樣,人工智能本質(zhì)上也是軟件構(gòu)成的,需要通過持續(xù)、穩(wěn)定的投入并逐漸產(chǎn)生效益。而在這一過程中,永遠不要掉以輕心。
3. 始終集成質(zhì)量保證(QA)測試
通常,QA測試被認為是確保產(chǎn)品正確工作的附加項或形式,而不是被視為在所有迭代中優(yōu)化產(chǎn)品的必備工具。事實上,QA測試是成功AI開發(fā)的重要組成部分。結(jié)果驗證應(yīng)該整合到人工智能開發(fā)過程的每個階段,以降低成本,加快開發(fā)時間表,并確保資源的有效分配。
4. 安排頻繁的應(yīng)用反饋
盡管想象起來可能令人氣餒,但現(xiàn)實是,人工智能項目永遠不會真正完成。即使項目超出了準(zhǔn)確性和性能預(yù)期,你仍然有上升和完善的空間。此外,算法會根據(jù)不斷變化的事物(觀點、對話、圖像等)做出決策。為了讓人工智能體驗在現(xiàn)在和未來都獲得成功,它必須在滾動的基礎(chǔ)上進行再訓(xùn)練,以適應(yīng)新的社會環(huán)境、技術(shù)發(fā)展和其他影響數(shù)據(jù)的變化。
事實上,從AI的采用中看到最積極影響的公司遵循核心和AI最佳實踐,在AI上的投入比同行更高效和有效。這包括在部署前測試AI模型的性能、跟蹤性能以查看結(jié)果是否隨著時間的推移而改善,以及制定良好的協(xié)議以確保數(shù)據(jù)質(zhì)量。
通過開發(fā)一個強大的開發(fā)AI程序的方法,公司可以避免這些常見的錯誤,并確保他們的AI和ML計劃的長期成功。?