老照片修復(fù)、尋找系外行星……這里有8個超贊的機器學(xué)習(xí)項目
作者:Kajal Yadav
機器之心編譯
編輯:小舟、杜偉
在人工智能的大潮中,機器學(xué)習(xí)項目琳瑯滿目。哪些項目是兼具代表性和實用性的呢?近日,一位名為 Kajal Yadav 的作者列出了 8 個經(jīng)典的機器學(xué)習(xí)項目,實用又有趣。目前已在 medium 上獲贊 1.7K。
這 8 個項目的主題包括情緒分析、自動摘要生成、情緒檢測、老照片修復(fù)以及深度學(xué)習(xí)生成音樂等。
基于社交媒體的抑郁情緒分析
這是一個非常敏感的話題,以至于被認為是一個迫切需要解決的問題。全球有超過 2.64 億人正在遭受抑郁癥的折磨。抑郁癥是全球致殘的主要原因之一,也是全球疾病負擔(dān)中極為重要的一部分。每年有 80 萬人自殺而死。自殺是 15 到 29 歲人群的第二大致死因素。遺憾的是,抑郁癥的治療往往延遲、不準確甚至完全不起作用。
基于互聯(lián)網(wǎng)的生活為改變早期抑郁癥治療服務(wù)提供了機會,尤其是在年輕人群中。
正如 Pew 研究中心(Pew Research Center)指出的那樣,有 72% 的人使用互聯(lián)網(wǎng)。社交網(wǎng)絡(luò)上發(fā)布的數(shù)據(jù)集對許多領(lǐng)域都非常重要,例如人文科學(xué)和大腦研究。但是,僅依賴專業(yè)領(lǐng)域的支持還遠遠不夠,并且顯式方法論也并不奏效。
所以,通過分析社交媒體帖子中的一些標志性語言,我們可以創(chuàng)建一種新的深度學(xué)習(xí)模型。這種模型可以較傳統(tǒng)方法更早地使人深入了解自身心理狀態(tài)。
借助神經(jīng)網(wǎng)絡(luò)生成體育比賽視頻的文本摘要
該項目的想法主要是基于從體育比賽視頻中提取出準確的摘要。一些體育網(wǎng)站能夠給出比賽的亮點。關(guān)于提取式文本摘要任務(wù),已經(jīng)出現(xiàn)了各種各樣的模型,其中以神經(jīng)網(wǎng)絡(luò)的性能最佳。通常,摘要生成指的是簡要介紹文章的信息,著重傳達事實類信息,同時突出文章重點。
自動創(chuàng)建游戲視頻的輪廓帶來了一項挑戰(zhàn),即找出游戲中精彩的環(huán)節(jié)和亮點。因此,人們可以使用三維卷積網(wǎng)絡(luò)(3D-CNN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)和長短期記憶網(wǎng)絡(luò)(LSTM)等深度學(xué)習(xí)方法,同時也可以先通過機器學(xué)習(xí)算法將視頻分成幾個片段然后應(yīng)用支持向量機(SVM)、神經(jīng)網(wǎng)絡(luò)(NN)、k-means 算法等。
使用 CNN 的手寫方程式求解器
在所有問題中,手寫數(shù)學(xué)表達式識別是計算機視覺研究領(lǐng)域令人困惑的問題之一。借助于圖像處理技術(shù)加持的卷積神經(jīng)網(wǎng)絡(luò)(CNN),我們可以通過手寫數(shù)字(handwritten digit)和數(shù)學(xué)符號來訓(xùn)練手寫方程式求解器。開發(fā)這樣的系統(tǒng)需要用數(shù)據(jù)訓(xùn)練機器,使其熟練學(xué)習(xí)并做出所需的預(yù)測。
使用 NLP 生成商務(wù)會議摘要
曾經(jīng)遇到過這樣的情況,每個人都只想看到摘要而不是報告的全部內(nèi)容。上學(xué)的時候,我們會花費很多時間準備報告,但老師只有時間看摘要。
摘要已經(jīng)成為解決數(shù)據(jù)過多問題的一種無可替代的有效方法。從對話中提取信息具有很好的商業(yè)和教育價值,這可以通過捕獲具有對話結(jié)構(gòu)的統(tǒng)計、語言和情感方面的特征來解決。
通常來說,手動將報告濃縮為一個匯總摘要要花費很多時間,但是用自然語言處理(NLP)來做就會簡單很多。用深度學(xué)習(xí)生成文本摘要能夠理解整篇文章的上下文,對所有需要快速生成文檔摘要的人來說真是太方便了。
用人臉識別來檢測情緒并推薦歌曲
人臉是人體的重要組成部分,它對于了解人的心理狀態(tài)尤為重要。用人臉識別檢測心情并推薦歌曲不僅可以省去歌曲手動分類的麻煩,而且有助于根據(jù)人的情緒特征生成適當(dāng)?shù)牟シ帕斜怼?/p>
人們傾向于根據(jù)心情和興趣聽音樂。所以,我們可以創(chuàng)建一種應(yīng)用程序,通過捕獲面部表情,識別出用戶的情緒并推薦相應(yīng)的歌曲。
計算機視覺是一個跨學(xué)科領(lǐng)域,這一領(lǐng)域的研究致力于在計算機上對數(shù)字圖像和視頻做高水平的理解。計算機視覺組件可用于通過面部表情決定用戶情緒。
文章《20+ Emotion Recognition APIs That Will Leave You Impressed, and Concerned》中介紹了 20 多種有趣且實用的情緒識別 API。
文章鏈接:
https://nordicapis.com/20-emotion-recognition-apis-that-will-leave-you-impressed-and-concerned/
從開普勒等太空飛行器拍攝的圖像中找出宜居的系外行星
在最近十年中,對超過 100 萬顆恒星進行了監(jiān)測,以識別正在凌日行星(transiting planet)。人工解釋系外行星候選者的工作量巨大,并且容易出現(xiàn)人為錯誤,其后果難以評估。卷積神經(jīng)網(wǎng)絡(luò)適用于在嘈雜的時間序列數(shù)據(jù)中,以比最小二乘策略更高的準確性來識別類地系外行星。
老照片修復(fù)

以原始方法修復(fù)受損照片是非常耗時和痛苦的。因此,我們可以通過深度學(xué)習(xí)找出所有的圖像缺陷(如裂縫、劃痕和孔洞),并且借助于圖像修復(fù)算法,我們還可以根據(jù)像素值輕松地找出缺陷,以復(fù)原老照片,并為老照片著色。
用深度學(xué)習(xí)生成音樂
音樂是一種變換頻率的曲調(diào)。因此,自動音樂生成(Automatic Music Generation)是一個用最少的人為調(diào)整作出一小段曲子的過程。最近,深度學(xué)習(xí)工程(deep learning engineering)已成為程序化音樂生成的最前沿技術(shù)。
【本文是51CTO專欄機構(gòu)“機器之心”的原創(chuàng)譯文,微信公眾號“機器之心( id: almosthuman2014)”】