偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<abbr id="urj3f"><tt id="urj3f"><mark id="urj3f"></mark></tt></abbr>

<blockquote id="urj3f"><dfn id="urj3f"></dfn></blockquote>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

一文讀懂監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)這四種深度學(xué)習(xí)方式

作者：Edison_G 2017-06-12 14:04:45

人工智能深度學(xué)習(xí) 移動(dòng)開(kāi)發(fā)

在文章中，計(jì)算機(jī)視覺(jué)戰(zhàn)隊(duì)將逐個(gè)解釋這些方法背后所蘊(yùn)含的理論知識(shí)。除此之外，計(jì)算機(jī)視覺(jué)戰(zhàn)隊(duì)將分享文獻(xiàn)中經(jīng)常碰到的術(shù)語(yǔ)，并提供與數(shù)學(xué)相關(guān)的更多資源。

一般說(shuō)來(lái)，訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)的方式主要有四種：監(jiān)督、無(wú)監(jiān)督、半監(jiān)督和強(qiáng)化學(xué)習(xí)。在接下來(lái)的文章中，計(jì)算機(jī)視覺(jué)戰(zhàn)隊(duì)將逐個(gè)解釋這些方法背后所蘊(yùn)含的理論知識(shí)。除此之外，計(jì)算機(jī)視覺(jué)戰(zhàn)隊(duì)將分享文獻(xiàn)中經(jīng)常碰到的術(shù)語(yǔ)，并提供與數(shù)學(xué)相關(guān)的更多資源。

監(jiān)督學(xué)習(xí)（Supervised Learning）

監(jiān)督學(xué)習(xí)是使用已知正確答案的示例來(lái)訓(xùn)練網(wǎng)絡(luò)的。想象一下，我們可以訓(xùn)練一個(gè)網(wǎng)絡(luò)，讓其從照片庫(kù)中（其中包含你父母的照片）識(shí)別出你父母的照片。以下就是我們?cè)谶@個(gè)假設(shè)場(chǎng)景中所要采取的步驟。

步驟1：數(shù)據(jù)集的創(chuàng)建和分類

首先，我們要瀏覽你的照片（數(shù)據(jù)集），確定所有有你父母的照片，并對(duì)其進(jìn)行標(biāo)注，從而開(kāi)始此過(guò)程。然后我們將把整堆照片分成兩堆。我們將使用第一堆來(lái)訓(xùn)練網(wǎng)絡(luò)（訓(xùn)練數(shù)據(jù)），而通過(guò)第二堆來(lái)查看模型在選擇我們父母照片操作上的準(zhǔn)確程度（驗(yàn)證數(shù)據(jù)）。

等到數(shù)據(jù)集準(zhǔn)備就緒后，我們就會(huì)將照片提供給模型。在數(shù)學(xué)上，我們的目標(biāo)就是在深度網(wǎng)絡(luò)中找到一個(gè)函數(shù)，這個(gè)函數(shù)的輸入是一張照片，而當(dāng)你的父母不在照片中時(shí)，其輸出為0，否則輸出為1。

此步驟通常稱為分類任務(wù) 。在這種情況下，我們進(jìn)行的通常是一個(gè)結(jié)果為yes or no的訓(xùn)練，但事實(shí)是，監(jiān)督學(xué)習(xí)也可以用于輸出一組值，而不僅僅是0或1。例如，我們可以訓(xùn)練一個(gè)網(wǎng)絡(luò)，用它來(lái)輸出一個(gè)人償還信用卡貸款的概率，那么在這種情況下，輸出值就是0到100之間的任意值。這些任務(wù)我們稱之為回歸。

步驟2：訓(xùn)練

為了繼續(xù)該過(guò)程，模型可通過(guò)以下規(guī)則（激活函數(shù)）對(duì)每張照片進(jìn)行預(yù)測(cè)，從而決定是否點(diǎn)亮工作中的特定節(jié)點(diǎn)。這個(gè)模型每次從左到右在一個(gè)層上操作——現(xiàn)在我們將更復(fù)雜的網(wǎng)絡(luò)忽略掉。當(dāng)網(wǎng)絡(luò)為網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)計(jì)算好這一點(diǎn)后，我們將到達(dá)亮起（或未亮起）的最右邊的節(jié)點(diǎn)（輸出節(jié)點(diǎn)）。

既然我們已經(jīng)知道有你父母的照片是哪些圖片，那么我們就可以告訴模型它的預(yù)測(cè)是對(duì)還是錯(cuò)。然后我們會(huì)將這些信息反饋（feed back）給網(wǎng)絡(luò)。

該算法使用的這種反饋，就是一個(gè)量化“真實(shí)答案與模型預(yù)測(cè)有多少偏差”的函數(shù)的結(jié)果。這個(gè)函數(shù)被稱為成本函數(shù)（cost function），也稱為目標(biāo)函數(shù)（objective function），效用函數(shù)（utility function）或適應(yīng)度函數(shù)（fitness function）。然后，該函數(shù)的結(jié)果用于修改一個(gè)稱為反向傳播（backpropagation）過(guò)程中節(jié)點(diǎn)之間的連接強(qiáng)度和偏差，因?yàn)樾畔慕Y(jié)果節(jié)點(diǎn)“向后”傳播。

我們會(huì)為每個(gè)圖片都重復(fù)一遍此操作，而在每種情況下，算法都在盡量最小化成本函數(shù)。

其實(shí)，我們有多種數(shù)學(xué)技術(shù)可以用來(lái)驗(yàn)證這個(gè)模型是正確還是錯(cuò)誤的，但我們常用的是一個(gè)非常常見(jiàn)的方法，我們稱之為梯度下降（gradient descent）。Algobeans上有一個(gè) “門外漢”理論可以很好地解釋它是如何工作的。邁克爾•尼爾森（Michael Nielsen）用數(shù)學(xué)知識(shí)完善了這個(gè)方法，其中包括微積分和線性代數(shù)。

http://neuralnetworksanddeeplearning.com/chap2.html

步驟3：驗(yàn)證

一旦我們處理了第一個(gè)堆棧中的所有照片，我們就應(yīng)該準(zhǔn)備去測(cè)試該模型。我們應(yīng)充分利用好第二堆照片，并使用它們來(lái)驗(yàn)證訓(xùn)練有素的模型是否可以準(zhǔn)確地挑選出含有你父母在內(nèi)的照片。

我們通常會(huì)通過(guò)調(diào)整和模型相關(guān)的各種事物（超參數(shù)）來(lái)重復(fù)步驟2和3，諸如里面有多少個(gè)節(jié)點(diǎn)，有多少層，哪些數(shù)學(xué)函數(shù)用于決定節(jié)點(diǎn)是否亮起，如何在反向傳播階段積極有效地訓(xùn)練權(quán)值，等等。而你可以通過(guò)瀏覽Quora上的相關(guān)介紹來(lái)理解這一點(diǎn)，它會(huì)給你一個(gè)很好的解釋。

步驟4：使用

最后，一旦你有了一個(gè)準(zhǔn)確的模型，你就可以將該模型部署到你的應(yīng)用程序中。你可以將模型定義為API調(diào)用，例如ParentsInPicture(photo)，并且你可以從軟件中調(diào)用該方法，從而導(dǎo)致模型進(jìn)行推理并給出相應(yīng)的結(jié)果。

稍后我們將詳細(xì)介紹一下這個(gè)確切的過(guò)程，編寫一個(gè)識(shí)別名片的iPhone應(yīng)用程序。

得到一個(gè)標(biāo)注好的數(shù)據(jù)集可能會(huì)很難（也就是很昂貴），所以你需要確保預(yù)測(cè)的價(jià)值能夠證明獲得標(biāo)記數(shù)據(jù)的成本是值得的，并且我們首先要對(duì)模型進(jìn)行訓(xùn)練。例如，獲得可能患有癌癥的人的標(biāo)簽X射線是非常昂貴的，但是獲得產(chǎn)生少量假陽(yáng)性和少量假陰性的準(zhǔn)確模型的值，這種可能性顯然是非常高的。

無(wú)監(jiān)督學(xué)習(xí)（Unsupervised Learning）

無(wú)監(jiān)督學(xué)習(xí)適用于你具有數(shù)據(jù)集但無(wú)標(biāo)簽的情況。無(wú)監(jiān)督學(xué)習(xí)采用輸入集，并嘗試查找數(shù)據(jù)中的模式。比如，將其組織成群（聚類）或查找異常值（異常檢測(cè)）。例如：

•想像一下，如果你是一個(gè)T恤制造商，擁有一堆人的身體測(cè)量值。那么你可能就會(huì)想要有一個(gè)聚類算法，以便將這些測(cè)量組合成一組集群，從而決定你生產(chǎn)的XS，S，M，L和XL號(hào)襯衫該有多大。

你將在文獻(xiàn)中閱讀到的一些無(wú)監(jiān)督的學(xué)習(xí)技術(shù)包括：

•自編碼（Autoencoding）

http://ufldl.stanford.edu/tutorial/unsupervised/Autoencoders/

•主成分分析（Principal components analysis）

https://www.quora.com/What-is-an-intuitive-explanation-for-PCA

•隨機(jī)森林（Random forests）

https://en.wikipedia.org/wiki/Random_forest

•K均值聚類（K-means clustering）

https://www.youtube.com/watch?v=RD0nNK51Fp8

無(wú)監(jiān)督學(xué)習(xí)中最有前景的最新發(fā)展之一是Ian Goodfellow（當(dāng)時(shí)在Yoshua Bengio的實(shí)驗(yàn)室工作時(shí)提出）的一個(gè)想法，稱為“ 生成對(duì)抗網(wǎng)絡(luò) （generative adversarial networks）”，其中我們將兩個(gè)神經(jīng)網(wǎng)絡(luò)相互聯(lián)系：一個(gè)網(wǎng)絡(luò)，我們稱之為生成器，負(fù)責(zé)生成旨在嘗試欺騙另一個(gè)網(wǎng)絡(luò)的數(shù)據(jù)，而這個(gè)網(wǎng)絡(luò)，我們稱為鑒別器。這種方法實(shí)現(xiàn)了一些令人驚奇的結(jié)果，例如可以從文本字符串或手繪草圖生成如照片版逼真圖片的AI技術(shù)。

半監(jiān)督學(xué)習(xí)（Semi-supervised Learning）

半監(jiān)督學(xué)習(xí)在訓(xùn)練階段結(jié)合了大量未標(biāo)記的數(shù)據(jù)和少量標(biāo)簽數(shù)據(jù)。與使用所有標(biāo)簽數(shù)據(jù)的模型相比，使用訓(xùn)練集的訓(xùn)練模型在訓(xùn)練時(shí)可以更為準(zhǔn)確，而且訓(xùn)練成本更低。

為什么使用未標(biāo)記數(shù)據(jù)有時(shí)可以幫助模型更準(zhǔn)確，關(guān)于這一點(diǎn)的體會(huì)就是：即使你不知道答案，但你也可以通過(guò)學(xué)習(xí)來(lái)知曉，有關(guān)可能的值是多少以及特定值出現(xiàn)的頻率。

數(shù)學(xué)愛(ài)好者的福利：如果你對(duì)半監(jiān)督學(xué)習(xí)很感興趣的話，可以來(lái)閱讀這個(gè)朱小津教授的幻燈片教程和2008年回顧的文獻(xiàn)隨筆文章。 (我們會(huì)把這兩個(gè)共享在平臺(tái)的共享文件專欄)

強(qiáng)化學(xué)習(xí)（Reinforcement Learning）

強(qiáng)化學(xué)習(xí)是針對(duì)你再次沒(méi)有標(biāo)注數(shù)據(jù)集的情況而言的，但你還是有辦法來(lái)區(qū)分是否越來(lái)越接近目標(biāo)（回報(bào)函數(shù)（reward function））。經(jīng)典的兒童游戲——“hotter or colder”。（ Huckle Buckle Beanstalk 的一個(gè)變體）是這個(gè)概念的一個(gè)很好的例證。你的任務(wù)是找到一個(gè)隱藏的目標(biāo)物件，然后你的朋友會(huì)喊出你是否越來(lái)越hotter（更接近）或colder（遠(yuǎn)離）目標(biāo)物件。“Hotter/colder”就是回報(bào)函數(shù)，而算法的目標(biāo)就是最大化回報(bào)函數(shù)。你可以把回報(bào)函數(shù)當(dāng)做是一種延遲和稀疏的標(biāo)簽數(shù)據(jù)形式：而不是在每個(gè)數(shù)據(jù)點(diǎn)中獲得特定的“right/wrong”答案，你會(huì)得到一個(gè)延遲的反應(yīng)，而它只會(huì)提示你是否在朝著目標(biāo)方向前進(jìn)。

•DeepMind在Nature上發(fā)表了一篇文章，描述了一個(gè)將強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí)結(jié)合起來(lái)的系統(tǒng)，該系統(tǒng)學(xué)會(huì)該如何去玩一套Atari視頻游戲，一些取得了巨大成功（如Breakout），而另一些就沒(méi)那么幸運(yùn)了（如Montezuma’s Revenge（蒙特祖瑪?shù)膹?fù)仇））。

•Nervana團(tuán)隊(duì)（現(xiàn)在在英特爾）發(fā)表了一個(gè)很好的解惑性博客文章，對(duì)這些技術(shù)進(jìn)行了詳細(xì)介紹，大家有興趣可以閱讀一番。

https://www.nervanasys.com/demystifying-deep-reinforcement-learning/

•Russell Kaplan，Christopher Sauer和Alexander Sosa舉辦的一個(gè)非常有創(chuàng)意的斯坦福學(xué)生項(xiàng)目說(shuō)明了強(qiáng)化學(xué)習(xí)的挑戰(zhàn)之一，并提出了一個(gè)聰明的解決方案。正如你在DeepMind論文中看到的那樣，算法未能學(xué)習(xí)如何去玩Montezuma’s Revenge。其原因是什么呢？正如斯坦福大學(xué)生所描述的那樣，“在稀缺回報(bào)函數(shù)的環(huán)境中，強(qiáng)化學(xué)習(xí)agent仍然在努力學(xué)習(xí)”。當(dāng)你沒(méi)有得到足夠的“hotter”或者“colder”的提示時(shí)，你是很難找到隱藏的“鑰匙”的。斯坦福大學(xué)的學(xué)生基礎(chǔ)性地教導(dǎo)系統(tǒng)去了解和回應(yīng)自然語(yǔ)言提示，例如“climb down the ladder”或“get the key”，從而使該系統(tǒng)成為OpenAI gym中的最高評(píng)分算法。可以點(diǎn)擊算法視頻觀看算法演示。

（http://mp.weixinbridge.com/mp/wapredirect?url=https%3A%2F%2Fdrive.google.com%2Ffile%2Fd%2F0B2ZTvWzKa5PHSkJvQVlsb0FLYzQ%2Fview&action=appmsg_redirect&uin=Nzk3MTk3MzIw&biz=MzA5MzQwMDk4Mg==&mid=2651042109&idx=1&type=1&scene=0）

•觀看這個(gè)關(guān)于強(qiáng)化學(xué)習(xí)的算法，好好學(xué)習(xí)，然后像一個(gè)大boss一樣去玩超級(jí)馬里奧吧。

理查德•薩頓和安德魯•巴托寫了關(guān)于強(qiáng)化學(xué)習(xí)的書(shū)。你也可以點(diǎn)擊查看第二版草稿。 http://incompleteideas.net/sutton/book/the-book-1st.html

責(zé)任編輯：林師授來(lái)源：計(jì)算機(jī)視覺(jué)戰(zhàn)隊(duì)

深度學(xué)習(xí)人工智能

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<ruby id="gckmd"><rp id="gckmd"></rp></ruby>