偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

機(jī)器學(xué)習(xí)的八個步驟

人工智能 機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)帶動了產(chǎn)業(yè)內(nèi)數(shù)十億美元的收入,催生出了空前的資源和海量的就業(yè)機(jī)會。但這也意味著如何入門機(jī)器學(xué)習(xí)讓人有點(diǎn)無所適從。下面是我的入門方法。如果你在本文中的某處卡住了,請搜索 Kaggle(也許某人以前也遇到了同樣問題),并在 Kaggle 論壇上提出問題(如果以前沒人提問過該問題),這是找到方向并解決問題的好方法。

上個月,Kaggle 聯(lián)合創(chuàng)始人兼 CTO Ben Hamner 在 Quora 上回答了有關(guān) Kaggle、機(jī)器學(xué)習(xí)和人工智能的一系列問題。對于 Hamner 給出的《機(jī)器學(xué)習(xí)的八個步驟》的建議,Kaggle Team 重新整理并做了核心摘要。

[[189085]]

現(xiàn)在學(xué)習(xí)機(jī)器學(xué)習(xí)和人工智能比以往任何時候都更好。近年來,這一領(lǐng)域飛速發(fā)展并碩果累累。專家們開源了各種高質(zhì)量的軟件工具和庫,新的線上資源和博文也層出不窮。機(jī)器學(xué)習(xí)帶動了產(chǎn)業(yè)內(nèi)數(shù)十億美元的收入,催生出了空前的資源和海量的就業(yè)機(jī)會。但這也意味著如何入門機(jī)器學(xué)習(xí)讓人有點(diǎn)無所適從。下面是我的入門方法。如果你在本文中的某處卡住了,請搜索 Kaggle(也許某人以前也遇到了同樣問題),并在 Kaggle 論壇上提出問題(如果以前沒人提問過該問題),這是找到方向并解決問題的好方法。

1. 挑一個你感興趣的問題

從一個你想要解決的問題而不是令人生畏的、不系統(tǒng)的主題列表(你可以從谷歌上搜索到很多的機(jī)器需誒心資源列表,這里我就不在提供)出發(fā),你會很容易地專注、主動學(xué)習(xí)。解決問題會促使你更深入更投入,而不是僅僅被動地閱讀一些有關(guān)機(jī)器學(xué)習(xí)的文章。

選擇好的入門問題有幾個標(biāo)準(zhǔn):

  • 問題涵蓋了你個人很感興趣的某一領(lǐng)域
  • 數(shù)據(jù)隨時可用且非常適宜解決問題(否則你的大部分時間將被耗掉)
  • 你可在單臺機(jī)器上舒服地使用數(shù)據(jù)(或者數(shù)據(jù)的一些相關(guān)子集)
  • 沒有發(fā)現(xiàn)問題?被擔(dān)心!我們通過入門競賽系列在 Kaggle 上提供了一些很好的機(jī)器學(xué)習(xí)問題。點(diǎn)擊 Titanic 競賽(https://www.kaggle.com/c/titanic)開始。

2. 為你的問題做一個快速、劣質(zhì)和笨拙的端到端解決方案。

確實(shí)很容易在實(shí)現(xiàn)細(xì)節(jié)中或者錯誤機(jī)器學(xué)習(xí)算法的調(diào)試中陷入僵局,而你想要避免它。

在這里你的目標(biāo)是盡快獲得一些超級基本的內(nèi)容,涵蓋端到端的問題:讀取數(shù)據(jù),并將其處理為適合機(jī)器學(xué)習(xí)的形式,訓(xùn)練基本模型,創(chuàng)造結(jié)果并評估其性能。

3. 進(jìn)行并改進(jìn)你的初步方案

現(xiàn)在你有了一個功能基準(zhǔn),是時候創(chuàng)新了。試著改進(jìn)初步方案的每一個組件,并衡量影響,看看在哪里花費(fèi)時間有意義。很多時候獲取更多數(shù)據(jù)或者改進(jìn)數(shù)據(jù)清理和預(yù)處理步驟比優(yōu)化機(jī)器學(xué)習(xí)模型本身有更高的回報(bào)率(ROI)。

這個步驟的一部分應(yīng)該包括動手使用數(shù)據(jù)——檢查各行和可視化分布,以更好地理解其結(jié)構(gòu)和奇特性。

4. 寫出并分享解決方案

獲得解決方案反饋的最佳方式是寫下來并分享。寫的過程是梳理解決方案的新方式,并帶來更好的理解。這同樣會使其他人理解你在做的事情并提供反饋,幫助你學(xué)習(xí)。這也啟動了你的機(jī)器學(xué)習(xí)代表項(xiàng)目集(portfolio),有助于你展示能力并取得工作。

Kaggle 數(shù)據(jù)集 和 Kaggle 內(nèi)核 是你分享數(shù)據(jù)和解決方案、從其他人獲得反饋并觀察他人如何擴(kuò)展你的問題的有效方式,并開始充實(shí)你的 Kaggle 文件。

機(jī)器學(xué)習(xí)的八個步驟

5. 在一系列不同的問題上重復(fù)步驟 1-4

現(xiàn)在你已經(jīng)解決了感興趣的單一問題,然后在一系列不同的領(lǐng)域中多次執(zhí)行這一操作。

你是從表格數(shù)據(jù)開始的嗎?那就再解決一個涉及更少結(jié)構(gòu)化文本的問題,以及另外一個處理圖像的問題。

機(jī)器學(xué)習(xí)問題最初對你而言是結(jié)構(gòu)化的嗎?很多創(chuàng)新性和有價值的工作解決的正是如何從一開始把一個松散定義的業(yè)務(wù)或者研究目標(biāo)轉(zhuǎn)化為明確定義的機(jī)器學(xué)習(xí)問題。通過這種方式解決一個問題類型。

Kaggle 競賽 和 Kaggle 數(shù)據(jù)集為明確定義的機(jī)器學(xué)習(xí)問題和適用于機(jī)器學(xué)習(xí)的原始數(shù)據(jù)資源提供了一個很好的起點(diǎn)。

6. 認(rèn)真地參與一場 Kaggle 競賽(如果你還沒這樣做)

對于一個數(shù)千人正致力解決的同一問題給出最佳答案是一個巨大的學(xué)習(xí)機(jī)會:它促使你對同一問題不斷迭代,并使你發(fā)現(xiàn)什么可以有效解決問題。

機(jī)器學(xué)習(xí)的八個步驟

個體競賽的論壇有著關(guān)于其他人如何使用你的方法處理和調(diào)試問題的豐富資源,內(nèi)核提供了關(guān)于用簡單方法開始解決問題的數(shù)據(jù)的探索性見解,并且獲獎博文(http://blog.kaggle.com/category/winners-interviews/)在最后展示最佳成果。

Kaggle 競賽也提供了與其他人組隊(duì)的獨(dú)特機(jī)會。社區(qū)人群有著不同的背景和技術(shù),每個人皆可有教和學(xué)兩種角色。你永遠(yuǎn)不會不知道,也許你未來的同事也在 Kaggle 社區(qū)中。

7. 申請機(jī)器學(xué)習(xí)專業(yè)工作

這使你把大部分時間花在機(jī)器學(xué)習(xí)上,并真正提升你的水平。決定你要追求的職位類型并打造與此相關(guān)個人代表項(xiàng)目集是一個強(qiáng)有力的起點(diǎn)。如果你還沒有準(zhǔn)備好面試機(jī)器學(xué)習(xí)職位,那就在目前的職位上接受新項(xiàng)目,尋求咨詢機(jī)會;并且參與公民黑客馬拉松,把握與數(shù)據(jù)相關(guān)的社區(qū)服務(wù)機(jī)會也是獲得立足的額外途徑。專業(yè)工作需要強(qiáng)大的編程能力,并借其極大地提升工作表現(xiàn)——通過重點(diǎn)項(xiàng)目帶來的提升將產(chǎn)生很多下游收益。

專業(yè)機(jī)器學(xué)習(xí)工作的寶貴機(jī)會包括:

  • 機(jī)器學(xué)習(xí)在生產(chǎn)系統(tǒng)中的應(yīng)用
  • 聚焦機(jī)器學(xué)習(xí)研究,推動最新進(jìn)展
  • 利用機(jī)器學(xué)習(xí)提升產(chǎn)品和業(yè)務(wù)決策的探索性分析

8. 教其他人機(jī)器學(xué)習(xí)

教學(xué)可以幫你鞏固對機(jī)器學(xué)習(xí)核心概念的理解。教他人的方式有很多種,選擇最適合自己的一種:

  • 研究論文
  • 發(fā)表演講
  • 博文教程
  • 在 Kaggle、Quora 和其他網(wǎng)站上回答問題
  • 個人指導(dǎo)和輔導(dǎo)
  • 分享代碼實(shí)例(在 Kaggle 內(nèi)核和 GitHub 上)
  • 教課
  • 寫書
責(zé)任編輯:未麗燕 來源: 36大數(shù)據(jù)
相關(guān)推薦

2024-09-30 05:43:44

2023-02-27 09:08:10

IT文化步驟

2013-11-01 11:06:33

數(shù)據(jù)

2023-02-15 14:09:57

云托管云退出策略

2023-12-05 07:17:27

人工智能企業(yè)

2022-08-05 14:23:08

機(jī)器學(xué)習(xí)計(jì)算復(fù)雜度算法

2018-06-12 10:37:12

云計(jì)算遷移步驟

2020-07-21 08:14:13

TypeScrip

2022-11-04 15:37:04

產(chǎn)品策略開發(fā)競爭

2011-10-08 10:23:13

云計(jì)算云服務(wù)

2025-06-20 07:00:00

CIO數(shù)據(jù)隱私IT 領(lǐng)導(dǎo)者

2021-05-09 22:45:18

機(jī)器學(xué)習(xí)人工智能技術(shù)

2024-10-24 16:54:59

數(shù)據(jù)預(yù)處理機(jī)器學(xué)習(xí)

2009-08-18 13:24:01

C#安裝程序

2022-01-11 14:47:48

人工智能工程挖掘自動化流程發(fā)現(xiàn)

2012-10-29 11:01:17

2017-01-05 09:59:45

2022-02-13 00:10:31

云安全云計(jì)算數(shù)據(jù)

2015-06-05 16:37:55

2010-01-27 10:07:18

交換機(jī)配置dhcp
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號