偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

2020年有用的機器學習工具2020

人工智能 機器學習
在本文中,我重點介紹了我發(fā)現(xiàn)的工具,這些工具可用于交付專業(yè)項目,分享一些想法和替代方案,并進行快速的實時調(diào)查(您可以在參與后看到社區(qū)的想法)。

TL; DR —構建良好的機器學習應用程序就像制作米其林式菜肴。 擁有一個井井有條的廚房是至關重要的,但是選擇太多了。 在本文中,我重點介紹了我發(fā)現(xiàn)的工具,這些工具可用于交付專業(yè)項目,分享一些想法和替代方案,并進行快速的實時調(diào)查(您可以在參與后看到社區(qū)的想法)。

[[345555]]

像任何工具討論一樣,該列表并不詳盡。 我嘗試著眼于最有用和最簡單的工具。 歡迎在評論部分中提出任何反饋意見,或者讓我知道是否有更好的選擇。

免責聲明:本帖子不被認可或贊助。 我將數(shù)據(jù)科學和ML互換使用。

"如何構建良好的機器學習應用程序?"

在與學校中有抱負的數(shù)據(jù)科學家,希望轉換的專業(yè)人士以及團隊經(jīng)理進行的聊天中,這個問題以各種形式多次出現(xiàn)。

交付專業(yè)數(shù)據(jù)科學項目有很多方面。 像許多其他人一樣,我喜歡使用在廚房做飯的類比:有成分(數(shù)據(jù)),食譜(設計),烹飪過程(以及您獨特的方法),最后是實際的廚房(工具)。 )。

因此,本文遍歷了我的廚房。 它重點介紹了設計,開發(fā)和部署全棧機器學習應用程序的最有用工具,這些應用程序是與系統(tǒng)集成或在生產(chǎn)環(huán)境中為人類用戶服務的解決方案。

如果您想進一步了解交付ML的其他方面,請在此處查看我的文章。

壓倒性的可能性

我們生活在黃金時代。 如果您在Google中搜索"機器學習工具"或咨詢顧問,您可能會得到以下信息:

2020年最有用的機器學習工具2020

> Data & AI Landscape 2019, Image Source

那里有太多工具。 可能的組合是無限的。 這可能會令人困惑和壓倒性。 所以,讓我?guī)椭s小范圍。 也就是說,沒有完美的設置。 這完全取決于您的需求和約束。 因此,進行相應的選擇,選擇和修改。

我的列表按以下順序排列優(yōu)先級(不按順序排列):

  • 免費
  • 易于學習和設置
  • 未來證明(采用和工具成熟度)♻️
  • 研究工程
  • 在初創(chuàng)企業(yè)或大型企業(yè)中為大型或小型項目工作
  • 只要完成工作

警告:我有99%的時間使用Python。 因此,這些工具可以與本機Python一起很好地使用或構建。 我尚未使用其他編程語言(例如R或Java)對其進行測試。

1. 冰箱:數(shù)據(jù)庫

PostgreSQL

一個免費的開源關系數(shù)據(jù)庫管理系統(tǒng)(RDBMS),強調(diào)可擴展性和技術標準合規(guī)性。 它旨在處理各種工作負載,從單臺機器到具有多個并發(fā)用戶的數(shù)據(jù)倉庫或Web服務。

2020年最有用的機器學習工具2020

> Image Source

備選方案:MySQL,SAS,IBM DB2,Oracle,MongoDB,Cloudera,GCP,AWS,Azure,PaperSpace

2. 工作臺:部署管道工具

管道工具對于開發(fā)的速度和質量至關重要。 我們應該能夠以最少的人工處理快速進行迭代。 這是一個運行良好的設置,有關更多詳細信息,請參閱我的12小時ML挑戰(zhàn)文章。 每個懶惰的數(shù)據(jù)科學家都應該在項目的早期階段對此進行嘗試。

2020年最有用的機器學習工具2020

> Author's work, 12-Hour ML Challenge

(1) Github

它提供了Git的分布式版本控制和源代碼管理(SCM)功能,以及其自己的功能。 它為每個項目提供訪問控制和多種協(xié)作功能,例如錯誤跟蹤,功能請求,任務管理和Wiki。

備選:DVC,BitBucket,GitLab

(2) PyCharm社區(qū)版

計算機編程中使用的集成開發(fā)環(huán)境(IDE),專門用于Python語言。 它是由捷克JetBrains公司開發(fā)的。 它提供代碼分析,圖形調(diào)試器,集成的單元測試器,與版本控制系統(tǒng)(VCSes)集成,并支持使用Django進行Web開發(fā)以及使用Anaconda進行數(shù)據(jù)科學開發(fā)。

替代方案:Atom,Sublime

(3) pytest

框架使編寫小型測試變得容易,但可以擴展以支持針對應用程序和庫的復雜功能測試。 它節(jié)省了手動測試的大量時間。 如果您每次更改代碼都需要測試某些東西,請使用Pytest將其自動化。

備選:單元測試

(4) CircleCi

CircleCI是一個持續(xù)集成和部署工具。 當您提交到Github時,它將使用遠程docker創(chuàng)建一個自動化的測試工作流。 Circle CI拒絕任何未通過PyTest設置的測試用例的提交。 這樣可以確保代碼質量,尤其是在與較大的團隊合作時。

備選方案:詹金斯,特拉維斯CI,Github Action

(5) Heroku(僅當您需要網(wǎng)絡托管時)

平臺即服務(PaaS),使開發(fā)人員可以完全在云中構建,運行和操作應用程序。 您可以與CircleCI和Github集成以啟用自動部署。

替代方案:Google App Engine,AWS Elastic Compute Cloud,其他

(6) Streamlit(僅在需要交互式UI時)

Streamlit是面向機器學習和數(shù)據(jù)科學團隊的開源應用程序框架。 近年來,它已成為我最喜歡的工具之一。 查看我如何使用它以及本節(jié)中的其他工具來創(chuàng)建電影和模擬應用程序。

替代方案:Flask,Django,Tableau

3. iPad:探索工具

Streamlit重新點亮

忘了Jupyter Notebook。 是的,這是對的。

Jupyter是我探索數(shù)據(jù),進行分析以及嘗試不同數(shù)據(jù)和建模過程的入門工具。 但我不記得有多少次:

  • 我花了很多時間進行調(diào)試(并抽出頭發(fā)),但最終意識到我忘了從頭開始運行代碼。 Streamlit解決了此問題。
  • 即使稍作更改,我也必須等待一段時間才能重新運行數(shù)據(jù)管道。 Streamlit緩存可解決此問題。
  • 我不得不將代碼從Jupyter重寫或轉換為可執(zhí)行文件,以及花在重新測試上的時間。 Streamlit提供了一個快捷方式。

真令人沮喪。 因此,我使用Streamlit進行早期探索并為最終的前端服務-用一塊石頭殺死兩只鳥。 以下是我的典型屏幕設置。 左側為PyCharm IDE,右側為結果可視化。 試一試。

2020年最有用的機器學習工具2020

> IDE (left) + live update with Streamlit (right), author's work from the Forgotten Algorithm

替代方案:Jupyter Notebook,Anaconda的Spyder,Microsoft Excel(嚴重)

4. 刀具:機器學習框架

就像使用實際的刀一樣,您應該根據(jù)食物和切割方式選擇合適的刀。 有通用刀和特種刀。

要小心。 盡管壽司刀更加亮麗,但使用專用刀將壽司切成骨頭將需要很長時間。 選擇正確的工具來完成工作。

(1) Scikit-Learn(通用ML用例)

在Python中進行常規(guī)機器學習的入門框架。 說夠了。

2020年最有用的機器學習工具2020

> Use Cases for Scikit-Learn, Source

備選方案:無,期限。

(2) PyTorch(深度學習用例)

一個基于Torch庫的開源機器學習庫。 鑒于深度學習的重點,它主要用于計算機視覺和自然語言處理等應用。 它主要由Facebook的AI研究實驗室(FAIR)開發(fā)。 最近,許多著名的AI研究機構,例如Open AI,都使用PyTorch作為其標準工具。

替代方案:Tensorflow,Keras,F(xiàn)ast.ai

(3) 開設AI Gym(強化學習用例)

開發(fā)和比較強化學習算法的工具包。 它提供API和可視環(huán)境。 這是社區(qū)正在為其構建工具的活躍區(qū)域。 打包好的工具還不多。

替代方案:許多小型項目,但維護得不如健身房。

5. 火爐:實驗管理

(1) Atlas

這是一個免費工具,可讓數(shù)據(jù)科學家使用幾個摘要進行實驗并將結果顯示在基于Web的儀表板上。

2020年最有用的機器學習工具2020

> Atlas process, source

免責聲明:我曾在創(chuàng)建Altas的公司Dessa工作。

替代方案:ML Flow,SageMaker,Comet,權重和偏移,數(shù)據(jù)機器人,Domino

(2) 一項調(diào)查

出于好奇,尋找合適工具時最困擾您的是什么? 我很想聽聽您的以下想法。 這是一項實時調(diào)查,因此您可以查看社區(qū)參與后的想法。

(3) 另一種觀點

如前所述,沒有完美的設置。 這完全取決于您的需求和約束。 這是關于哪些工具可用以及它們?nèi)绾螀f(xié)同工作的另一種觀點。

2020年最有用的機器學習工具2020

> Presentation from Sergey Karayev at Full Stack Deep Learning, 2019

(4) 迷你挑戰(zhàn)賽

如果您想了解有關如何使用這些工具的更多信息,最好的方法是找到一個要進行的項目。 您可以將工具合并到當前項目中,也可以進行12小時的ML挑戰(zhàn)。 不確定如何? 看看我如何使用討論的工具和流程創(chuàng)建用戶授權的推薦應用程序。

我期待看到您能創(chuàng)造什么。 請與社區(qū)共享,并在Twitter tag上標記我。

喜歡您閱讀的內(nèi)容嗎? 在Medium,LinkedIn或Twitter上關注我。 另外,您是否想以數(shù)據(jù)科學家的身份學習商業(yè)思維和溝通技巧? 查閱我的《機器學習的影響力》指南。

 

責任編輯:趙寧寧 來源: 今日頭條
相關推薦

2020-02-11 14:10:18

機器學習人工智能設計

2020-03-13 09:00:00

機器學習人工智能AI

2020-03-31 18:47:22

機器學習ML應用程序

2020-05-20 07:00:00

機器學習人工智能AI

2020-06-04 07:00:00

機器學習人工智能Python

2020-11-26 18:10:26

機器學習

2020-03-23 11:56:44

人工智能

2020-02-06 16:15:04

機器學習人工智能計算機

2021-01-17 23:03:15

機器學習開源人工智能

2020-02-07 22:18:32

機器學習人工智能AI

2020-03-06 08:35:45

GitHub設計瀏覽器

2020-06-08 14:19:24

DevOps自動化工具

2020-05-18 10:10:24

開發(fā)工具.NET

2019-12-24 14:05:09

人工智能機器學習技術

2019-10-23 11:00:48

半導體5GAI

2020-08-28 17:54:31

深度學習框架

2021-01-07 07:09:13

深度學習人工智能AI

2020-11-27 15:00:22

Kubernetes程序工具

2020-05-21 15:53:59

遠程調(diào)試工具

2019-11-22 09:00:00

AI人工智能機器學習
點贊
收藏

51CTO技術棧公眾號