偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

可充分利用機(jī)器學(xué)習(xí)的14種開源工具

開發(fā) 開發(fā)工具
自由開源軟件的激增,讓機(jī)器學(xué)習(xí)更容易在單機(jī)上大規(guī)模地通過大多數(shù)流行的編程語言實(shí)現(xiàn)。以下這些開源工具包括了適用于Python,R,C ++,Java,Scala,Clojure,JavaScript和Go之類的庫。

通過一些易于實(shí)現(xiàn)的多樣化庫和框架能夠充分挖掘機(jī)器學(xué)習(xí)的預(yù)測能力。垃圾郵件過濾,面部識別,推薦引擎等等。當(dāng)你要對大型數(shù)據(jù)集執(zhí)行預(yù)測分析或模式識別時(shí),機(jī)器學(xué)習(xí)都是必經(jīng)之路。

自由開源軟件的激增,讓機(jī)器學(xué)習(xí)更容易在單機(jī)上大規(guī)模地通過大多數(shù)流行的編程語言實(shí)現(xiàn)。以下這些開源工具包括了適用于Python,R,C ++,Java,Scala,Clojure,JavaScript和Go之類的庫。

Apache Mahout

Apache Mahout提供了一種構(gòu)建用于托管機(jī)器學(xué)習(xí)應(yīng)用程序環(huán)境的方法,該環(huán)境可以快速有效地?cái)U(kuò)展來滿足需求。

可充分利用機(jī)器學(xué)習(xí)的14種開源工具

Mahout主要與Apache Spark一起工作,最初是為了運(yùn)行分布式應(yīng)用程序而設(shè)計(jì),可以與Hadoop一起使用,但現(xiàn)在已擴(kuò)展為與Flink和H2O等其他分布式后端一起使用。

Mahout在Scala中使用了一種域特定語言。版本0.14是對該項(xiàng)目做了主要內(nèi)部重構(gòu),默認(rèn)基于Apache Spark 2.4.3。

Compose

Compose針對機(jī)器學(xué)習(xí)模型的一個(gè)常見問題,即標(biāo)記原始數(shù)據(jù),這可能是一個(gè)緩慢而乏味的過程,但沒有它,機(jī)器學(xué)習(xí)模型就無法提供有用的結(jié)果。

通過Compose,用戶可以使用Python為數(shù)據(jù)編寫一組標(biāo)記功能,因此可以通過編程方式進(jìn)行標(biāo)記??梢栽跀?shù)據(jù)上設(shè)置各種變換和閾值,以簡化標(biāo)記過程。

Core ML Tools

Apple的Core ML框架能夠讓用戶將機(jī)器學(xué)習(xí)模型集成到應(yīng)用程序中,但使用其自己獨(dú)特的學(xué)習(xí)模型格式。但幸運(yùn)的是,不必以Core ML格式預(yù)先訓(xùn)練模型就能使用它們;可以使用Core ML Tools將幾乎所有常用的機(jī)器學(xué)習(xí)框架中的模型轉(zhuǎn)換為Core ML。

可充分利用機(jī)器學(xué)習(xí)的14種開源工具

Core ML Tools作為Python包運(yùn)行,因此與大量的Python機(jī)器學(xué)習(xí)庫和工具集成在一起。TensorFlow,PyTorch,Keras,Caffe,ONNX,Scikit-learn,LibSVM和XGBoost的模型都可以轉(zhuǎn)換。神經(jīng)網(wǎng)絡(luò)模型還可以通過使用訓(xùn)練后量化來優(yōu)化大小。

Cortex

Cortex提供了一種方便的方法來使用Python和TensorFlow,PyTorch,Scikit-learn和其他模型提供來自機(jī)器學(xué)習(xí)模型的預(yù)測服務(wù)。大多數(shù)Cortex軟件包僅包含幾個(gè)文件,即你的核心Python邏輯,描述要使用的模型,以及要分配的計(jì)算資源類型的cortex.yaml文件,以及用于安裝任何所需Python要求的require.txt文件。

整個(gè)程序包作為Docker容器部署到AWS或另一個(gè)與Docker兼容的托管系統(tǒng)。計(jì)算資源的分配方式與在Kubernetes中使用的定義相呼應(yīng),因此你可以使用GPU或Amazon Inferentia ASIC加快服務(wù)速度。

Featuretools

特征工程或特征創(chuàng)建涉及獲取用于訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù),并通常手動生成數(shù)據(jù)的經(jīng)過轉(zhuǎn)換和聚合的版本,這對于訓(xùn)練模型更為有用。

可充分利用機(jī)器學(xué)習(xí)的14種開源工具

Featuretools為用戶提供了通過綜合數(shù)據(jù)幀中的數(shù)據(jù)而構(gòu)建的高級Python對象來執(zhí)行此操作的功能,并且可以針對從一個(gè)或多個(gè)數(shù)據(jù)幀中提取的數(shù)據(jù)執(zhí)行此操作。Featuretools還為綜合操作提供了通用原語(例如,time_since_previous提供帶時(shí)間戳數(shù)據(jù)實(shí)例之間的時(shí)間間隔),因此用戶不必自己滾動這些原語。

GoLearn

GoLearn是針對Google Go語言的機(jī)器學(xué)習(xí)庫,其創(chuàng)建的目標(biāo)是簡化和可定制性。簡單之處在于在庫中加載和處理數(shù)據(jù)的方式,該方式在SciPy和R之后進(jìn)行了模式化??啥ㄖ菩栽谟谌绾卧趹?yīng)用程序中輕松擴(kuò)展某些數(shù)據(jù)結(jié)構(gòu)。

Gradio

構(gòu)建機(jī)器學(xué)習(xí)應(yīng)用程序時(shí)的一個(gè)常見挑戰(zhàn)是為模型訓(xùn)練和預(yù)測服務(wù)機(jī)制構(gòu)建可靠且易于定制的UI。Gradio提供了用于創(chuàng)建基于Web的UI的工具,這些工具讓用戶可以與模型進(jìn)行實(shí)時(shí)交互。

其中包括幾個(gè)示例項(xiàng)目,例如Inception V3圖像分類器的輸入接口或MNIST手寫識別模型,讓用戶對如何在自己的項(xiàng)目中使用Gradio有所了解。

H2O

H2O目前正在進(jìn)行第三次大修訂,它為內(nèi)存中的機(jī)器學(xué)習(xí)提供了一個(gè)完整的平臺,從訓(xùn)練到服務(wù)預(yù)測。H2O的算法適合于業(yè)務(wù)處理——比如欺詐或趨勢預(yù)測——而不是圖像分析。H2O可以獨(dú)立地與HDFS store交互,在YARN之上,在MapReduce中,或者直接在Amazon EC2實(shí)例中。

可充分利用機(jī)器學(xué)習(xí)的14種開源工具

Hadoop專家可以使用Java與H2O進(jìn)行交互,但是該框架還提供了針對Python,R和Scala的綁定,從而讓用戶也可以與這些平臺上可用的所有庫進(jìn)行交互。還可以使用REST調(diào)用,將H2O集成到大多數(shù)管道中。

Oryx

由Cloudera Hadoop發(fā)行版的創(chuàng)建者提供的Oryx,使用Apache Spark和Apache Kafka在實(shí)時(shí)數(shù)據(jù)上運(yùn)行機(jī)器學(xué)習(xí)模型。Oryx提供了一種構(gòu)建項(xiàng)目的方式,這些項(xiàng)目需要立即做出決定,例如推薦引擎或?qū)崟r(shí)異常檢測,這些都可以通過新數(shù)據(jù)和歷史數(shù)據(jù)獲得通知。

版本2.0對該項(xiàng)目幾乎進(jìn)行了完全重新設(shè)計(jì),其組件以lambda架構(gòu)松散耦合??梢噪S時(shí)添加新算法和這些算法的新抽象(例如,用于超參數(shù)選擇)。

PyTorch Lightning

當(dāng)功能強(qiáng)大的項(xiàng)目流行時(shí),通常會輔以易于使用的第三方項(xiàng)目。PyTorch Lightning為PyTorch提供了組織包裝,因此用戶可以專注于重要的代碼,而不必為每個(gè)項(xiàng)目編寫樣板。

PyTorch Lightning使用基于類的結(jié)構(gòu),因此PyTorch項(xiàng)目的每個(gè)常見步驟都封裝在類方法中。訓(xùn)練和驗(yàn)證循環(huán)是半自動化的,因此你只需要為每個(gè)步驟提供邏輯即可。在多個(gè)GPU或不同的硬件組合中設(shè)置訓(xùn)練結(jié)果也更加容易,因?yàn)檫@樣做的指令和對象引用是集中的。

Scikit-learn

由于Python易于采用且?guī)缀踹m用于所有應(yīng)用程序的庫的廣泛性,它已成為數(shù)學(xué)科學(xué)和統(tǒng)計(jì)學(xué)的首選編程語言。Scikit-learn通過在幾個(gè)現(xiàn)有的Python軟件包(NumPy,SciPy和Matplotlib)之上構(gòu)建數(shù)學(xué)和科學(xué)工作來利用這一廣度。

可充分利用機(jī)器學(xué)習(xí)的14種開源工具

生成的庫可用于交互式“工作臺”應(yīng)用程序或嵌入到其他軟件中并重新使用。該套件可通過BSD許可獲得,因此它是完全開放的,并且可重復(fù)使用。

Shogun

Shogun是這個(gè)工具中時(shí)間最長的項(xiàng)目之一。它創(chuàng)建于1999年,用C ++編寫,但是可以與Java,Python,C#,Ruby,R,Lua,Octave和Matlab一起使用。最新的主要版本6.0.0增加了對微軟Windows和Scala語言的本機(jī)支持。

雖然廣受歡迎,范圍廣泛,但Shogun也有競爭對手。另一個(gè)基于c++的機(jī)器學(xué)習(xí)庫Mlpack是在2011年才出現(xiàn)的,但是它聲稱比其他庫更快、更容易使用(通過一個(gè)更完整的API集)。

Spark MLlib

MLlib是Apache Spark和Apache Hadoop的機(jī)器學(xué)習(xí)庫,擁有許多常用算法和有用的數(shù)據(jù)類型,能夠快速,大規(guī)模地運(yùn)行。盡管Java是在MLlib中工作的主要語言,但是Python用戶可以將MLlib與NumPy庫連接,Scala用戶可以針對MLlib編寫代碼,而R用戶可以從1.5版開始插入Spark。

可充分利用機(jī)器學(xué)習(xí)的14種開源工具

MLlib的版本3專注于使用Spark的DataFrame API(與較早的RDD API相對),并提供了許多新的分類和評估功能。

另一個(gè)項(xiàng)目,MLbase,建立在MLlib的頂部,以使其更容易得出結(jié)果。用戶無需編寫代碼,而是使用SQL的聲明性語言進(jìn)行查詢。

Weka

由Waikato大學(xué)的機(jī)器學(xué)習(xí)小組創(chuàng)建的Weka被稱為“無需編程的機(jī)器學(xué)習(xí)”。這是一個(gè)GUI工作臺,數(shù)據(jù)科學(xué)家無需編寫代碼即可組裝機(jī)器學(xué)習(xí)管道,訓(xùn)練模型和運(yùn)行預(yù)測。

Weka直接與R,Apache Spark和Python合作,后者通過直接包裝或通過通用數(shù)值庫(如NumPy,Pandas,SciPy和Scikit-learn)的接口進(jìn)行工作。Weka的一大優(yōu)勢在于,它為工作的各個(gè)方面提供了可瀏覽的友好界面,包括包裝管理,預(yù)處理,分類和可視化。

 

責(zé)任編輯:趙寧寧 來源: 今日頭條
相關(guān)推薦

2024-10-28 15:14:53

2013-01-18 14:02:46

VDI存儲IOPS

2010-05-06 12:44:13

Unix系統(tǒng)

2022-06-01 14:13:16

人工智能機(jī)器學(xué)習(xí)

2019-08-06 09:52:16

網(wǎng)絡(luò)工具數(shù)據(jù)

2021-05-14 12:19:39

托管服務(wù)IT運(yùn)營CIO

2023-10-23 16:11:14

2017-01-04 15:42:43

運(yùn)營商SDN服務(wù)保障

2019-06-13 19:20:38

云平臺遷移云計(jì)算

2009-05-21 09:08:52

接口C++面向?qū)ο?/a>

2012-05-14 09:11:33

移動CRM企業(yè)

2020-04-27 11:07:13

人工智能存儲設(shè)施數(shù)據(jù)

2015-02-26 09:50:42

vSphereSSD

2018-09-04 08:40:41

數(shù)據(jù)中心網(wǎng)絡(luò)機(jī)柜

2013-03-22 10:30:16

IT主管ITM云計(jì)算

2019-05-05 09:26:01

物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)投資物聯(lián)網(wǎng)

2015-06-04 09:12:05

云安全

2020-08-18 09:03:06

云計(jì)算云存儲數(shù)據(jù)

2013-07-25 09:20:32

Windows 8.1

2024-04-12 14:46:33

人工智能醫(yī)療保健
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號