2020年度優(yōu)秀的23個(gè)的機(jī)器學(xué)習(xí)項(xiàng)目(附源代碼)
大數(shù)據(jù)文摘出品
編譯:Luna
我們都知道,教科書(shū)上所學(xué)與實(shí)際操作還是有出入的,那關(guān)于機(jī)器學(xué)習(xí)有什么好的項(xiàng)目可以實(shí)操嗎?
文摘菌為你推薦這篇文章,在本教程中,涵蓋面向初學(xué)者,中級(jí)專(zhuān)家和專(zhuān)家的23種機(jī)器學(xué)習(xí)項(xiàng)目創(chuàng)意,以獲取有關(guān)該增長(zhǎng)技術(shù)的真實(shí)經(jīng)驗(yàn)。這些機(jī)器學(xué)習(xí)項(xiàng)目構(gòu)想將幫助你了解在職業(yè)生涯中取得成功、和當(dāng)下就業(yè)所需的所有實(shí)踐。
通過(guò)項(xiàng)目學(xué)習(xí)是你短期內(nèi)能做的最好投資,這些項(xiàng)目構(gòu)想使你能夠快速發(fā)展和增強(qiáng)機(jī)器學(xué)習(xí)技能。語(yǔ)言上,這些機(jī)器學(xué)習(xí)項(xiàng)目可以用Python,R或任何其他工具開(kāi)發(fā)。
面向初學(xué)者的機(jī)器學(xué)習(xí)項(xiàng)目
在本部分中,我們列出了針對(duì)初學(xué)者/初學(xué)者的頂級(jí)機(jī)器學(xué)習(xí)項(xiàng)目,如果你已經(jīng)從事基礎(chǔ)機(jī)器學(xué)習(xí)項(xiàng)目,請(qǐng)?zhí)料乱徊糠郑褐屑?jí)機(jī)器學(xué)習(xí)項(xiàng)目
1. 鳶尾花分類(lèi)項(xiàng)目
項(xiàng)目構(gòu)想:鳶尾花有不同的種類(lèi),你可以根據(jù)花瓣和萼片的長(zhǎng)度來(lái)區(qū)分它們。這是機(jī)器學(xué)習(xí)初學(xué)者預(yù)測(cè)新鳶尾花種類(lèi)的基礎(chǔ)項(xiàng)目。
數(shù)據(jù)集:鳶尾花分類(lèi)數(shù)據(jù)集
https://archive.ics.uci.edu/ml/datasets/Iris
2. Emojify –使用Python創(chuàng)建自己的表情符號(hào)
項(xiàng)目構(gòu)想:該機(jī)器學(xué)習(xí)項(xiàng)目的目標(biāo)是對(duì)人的面部表情進(jìn)行分類(lèi)并將其映射為表情符號(hào)。我們將建立一個(gè)卷積神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別面部表情。然后,我們將使用相應(yīng)的表情符號(hào)或頭像來(lái)映射這些情感。
源代碼:Emojify項(xiàng)目
https://data-flair.training/blogs/create-emoji-with-deep-learning/
3. 使用機(jī)器學(xué)習(xí)進(jìn)行貸款預(yù)測(cè)
項(xiàng)目構(gòu)想:該ML項(xiàng)目背后的構(gòu)想是建立一個(gè)模型,該模型將對(duì)用戶(hù)可以貸款多少進(jìn)行分類(lèi)。它基于用戶(hù)的婚姻狀況,教育程度,受撫養(yǎng)人數(shù)和就業(yè)情況。我們可以為此項(xiàng)目建立一個(gè)線性模型。
數(shù)據(jù)集:貸款預(yù)測(cè)數(shù)據(jù)集
https://www.kaggle.com/altruistdelhite04/loan-prediction-problem-dataset
4. 住房?jī)r(jià)格預(yù)測(cè)項(xiàng)目
項(xiàng)目構(gòu)想:數(shù)據(jù)集包含波士頓剩余區(qū)域的房?jī)r(jià)。房子的費(fèi)用根據(jù)犯罪率,房間數(shù)量等各種因素而變化。對(duì)于初學(xué)者來(lái)說(shuō),這是一個(gè)很好的ML項(xiàng)目,它可以根據(jù)新數(shù)據(jù)預(yù)測(cè)價(jià)格。
數(shù)據(jù)集:房屋價(jià)格預(yù)測(cè)數(shù)據(jù)集
https://www.cs.toronto.edu/~delve/data/boston/bostonDetail.html
5. MNIST數(shù)字分類(lèi)機(jī)器學(xué)習(xí)項(xiàng)目
項(xiàng)目構(gòu)想:MNIST數(shù)字分類(lèi)python項(xiàng)目使機(jī)器能夠識(shí)別手寫(xiě)數(shù)字。該項(xiàng)目對(duì)于計(jì)算機(jī)視覺(jué)可能非常有用。在這里,我們將使用MNIST數(shù)據(jù)集使用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型。
數(shù)據(jù)集:MNIST數(shù)字識(shí)別數(shù)據(jù)集
https://drive.google.com/file/d/1hJiOlxctFH3uL2yTqXU_1f6c0zLr8V_K/view
源代碼:手寫(xiě)數(shù)字識(shí)別項(xiàng)目
https://data-flair.training/blogs/python-deep-learning-project-handwritten-digit-recognition/
6. 使用機(jī)器學(xué)習(xí)預(yù)測(cè)股價(jià)
項(xiàng)目構(gòu)想:有許多可用于股票市場(chǎng)價(jià)格的數(shù)據(jù)集。這個(gè)機(jī)器學(xué)習(xí)初學(xué)者的項(xiàng)目旨在根據(jù)上一年的數(shù)據(jù)預(yù)測(cè)股票市場(chǎng)的未來(lái)價(jià)格。
數(shù)據(jù)集:股票價(jià)格預(yù)測(cè)數(shù)據(jù)集
https://www.kaggle.com/c/two-sigma-financial-news/data
源代碼:股票價(jià)格預(yù)測(cè)項(xiàng)目
https://data-flair.training/blogs/stock-price-prediction-machine-learning-project-in-python/
7. 泰坦尼克號(hào)生存計(jì)劃
項(xiàng)目構(gòu)想:這將是一個(gè)有趣的項(xiàng)目,因?yàn)槲覀儗㈩A(yù)測(cè)某人是否會(huì)在泰坦尼克號(hào)飛船中幸存下來(lái)。對(duì)于這個(gè)初學(xué)者的項(xiàng)目,我們將使用泰坦尼克號(hào)數(shù)據(jù)集,其中包含幸存者和在泰坦尼克號(hào)飛船中死亡的人的真實(shí)數(shù)據(jù)。
數(shù)據(jù)集:《泰坦尼克號(hào)生存》數(shù)據(jù)集
https://www.kaggle.com/c/titanic
8. 葡萄酒質(zhì)量檢測(cè)項(xiàng)目
項(xiàng)目構(gòu)想:在該項(xiàng)目中,我們可以構(gòu)建一個(gè)界面來(lái)預(yù)測(cè)紅酒的質(zhì)量。它將使用葡萄酒的化學(xué)信息,并基于機(jī)器學(xué)習(xí)模型,它將為我們提供葡萄酒質(zhì)量的結(jié)果。
數(shù)據(jù)集:葡萄酒質(zhì)量數(shù)據(jù)集
https://archive.ics.uci.edu/ml/datasets/wine+quality
9. 假新聞檢測(cè)項(xiàng)目
項(xiàng)目構(gòu)想:虛假新聞像野火一樣傳播,這在這個(gè)時(shí)代是一個(gè)大問(wèn)題。我們可以學(xué)習(xí)如何將假新聞與真實(shí)新聞區(qū)分開(kāi)。我們可以使用監(jiān)督學(xué)習(xí)來(lái)實(shí)現(xiàn)這樣的模型。
數(shù)據(jù)集:檢測(cè)虛假新聞數(shù)據(jù)集
https://drive.google.com/file/d/1er9NJTLUA3qnRuyhfzuN0XUsoIC4a-_q/view
源代碼:假新聞檢測(cè)項(xiàng)目
https://data-flair.training/blogs/advanced-python-project-detecting-fake-news/
到目前為止,如果對(duì)DataFlair提出的的機(jī)器學(xué)習(xí)項(xiàng)目有任何問(wèn)題,歡迎留言。
中級(jí)機(jī)器學(xué)習(xí)項(xiàng)目
1. 音樂(lè)流派分類(lèi)機(jī)器學(xué)習(xí)項(xiàng)目
項(xiàng)目構(gòu)想:該python機(jī)器學(xué)習(xí)項(xiàng)目的思想是開(kāi)發(fā)一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目,并自動(dòng)對(duì)音頻中的不同音樂(lè)流派進(jìn)行分類(lèi)。我們需要使用它們的頻域和時(shí)域低級(jí)特征對(duì)這些音頻文件進(jìn)行分類(lèi)。
源代碼:音樂(lè)流派分類(lèi)項(xiàng)目
https://data-flair.training/blogs/python-project-music-genre-classification/
2. 比特幣價(jià)格預(yù)測(cè)器項(xiàng)目
項(xiàng)目構(gòu)想:比特幣價(jià)格預(yù)測(cè)器是一個(gè)有用的項(xiàng)目。區(qū)塊鏈技術(shù)正在發(fā)展,并且有許多數(shù)字貨幣在上升。該項(xiàng)目將幫助你使用以前的數(shù)據(jù)預(yù)測(cè)比特幣的價(jià)格。
數(shù)據(jù)集:比特幣價(jià)格預(yù)測(cè)數(shù)據(jù)集
https://www.kaggle.com/team-ai/bitcoin-price-prediction/version/1
3. Uber數(shù)據(jù)分析項(xiàng)目
項(xiàng)目構(gòu)想:該項(xiàng)目可用于對(duì)超級(jí)數(shù)據(jù)執(zhí)行數(shù)據(jù)可視化。該數(shù)據(jù)集包含紐約市中的450萬(wàn)個(gè)超級(jí)拾取器。為了分析行程,需要精美地表示很多數(shù)據(jù),以便可以進(jìn)一步改善業(yè)務(wù)。
數(shù)據(jù)集:Uber數(shù)據(jù)分析數(shù)據(jù)集
https://drive.google.com/file/d/1emopjfEkTt59jJoBH9L9bSdmlDC4AR87/view
源代碼:Uber數(shù)據(jù)分析項(xiàng)目
https://data-flair.training/blogs/r-data-science-project-uber-data-analysis/
4. 人格預(yù)測(cè)項(xiàng)目
項(xiàng)目構(gòu)想:Myers Briggs類(lèi)型指示器是一種個(gè)性類(lèi)型系統(tǒng),根據(jù)內(nèi)向,直覺(jué),思維和感知能力將一個(gè)人分為16個(gè)不同的個(gè)性。我們可以根據(jù)他們?cè)谏缃幻襟w上發(fā)布的帖子的類(lèi)型來(lái)確定其個(gè)性。
數(shù)據(jù)集:個(gè)性預(yù)測(cè)數(shù)據(jù)集
https://www.kaggle.com/datasnaek/mbti-type
5. Xbox游戲預(yù)測(cè)項(xiàng)目
項(xiàng)目構(gòu)想:人們?cè)谒阉鲿r(shí)生成的數(shù)據(jù)可用于預(yù)測(cè)用戶(hù)的興趣。BestBuy消費(fèi)電子公司已提供了來(lái)自用戶(hù)的數(shù)百萬(wàn)次搜索的數(shù)據(jù),我們將預(yù)測(cè)用戶(hù)最有興趣購(gòu)買(mǎi)的Xbox游戲。這將用于向游客推薦游戲。
數(shù)據(jù)集:Xbox游戲預(yù)測(cè)數(shù)據(jù)集
https://www.kaggle.com/c/acm-sf-chapter-hackathon-small/overview
6. 信用卡欺詐檢測(cè)項(xiàng)目
項(xiàng)目構(gòu)想:使用卡進(jìn)行大量交易的公司需要發(fā)現(xiàn)系統(tǒng)中的異常情況。該項(xiàng)目旨在建立信用卡欺詐檢測(cè)模型。我們將使用交易及其標(biāo)簽作為欺詐或非欺詐來(lái)檢測(cè)客戶(hù)進(jìn)行的新交易是否為欺詐。
數(shù)據(jù)集:信用卡欺詐檢測(cè)數(shù)據(jù)集
https://drive.google.com/file/d/19BOhwz52NUY3dg8XErVYglctpr5sjTy4/view
源代碼:信用卡欺詐檢測(cè)項(xiàng)目
https://data-flair.training/blogs/data-science-machine-learning-project-credit-card-fraud-detection/
7. 芭比與大腦項(xiàng)目
項(xiàng)目構(gòu)想:芭比娃娃等兒童玩具具有一組預(yù)定義的單詞,可以重復(fù)說(shuō)。我們可以使用機(jī)器學(xué)習(xí)方法使芭比娃娃有一些頭腦。當(dāng)玩具可以用不同的句子理解和說(shuō)話(huà)時(shí),它會(huì)更加吸引人。這是一個(gè)出色的項(xiàng)目,將改善孩子們的學(xué)習(xí)過(guò)程。
8. 使用機(jī)器學(xué)習(xí)進(jìn)行客戶(hù)細(xì)分
項(xiàng)目構(gòu)想:客戶(hù)細(xì)分是一種根據(jù)客戶(hù)的購(gòu)買(mǎi)歷史,性別,年齡,興趣等對(duì)客戶(hù)進(jìn)行細(xì)分的技術(shù)。獲取此信息非常有用,以便商店可以在個(gè)性化營(yíng)銷(xiāo)方面獲得幫助,并為客戶(hù)提供相關(guān)的信息交易。在該項(xiàng)目的幫助下,公司可以運(yùn)行特定于用戶(hù)的活動(dòng)并提供特定于用戶(hù)的報(bào)價(jià),而不是向所有用戶(hù)廣播相同的報(bào)價(jià)。
數(shù)據(jù)集:客戶(hù)細(xì)分?jǐn)?shù)據(jù)集
https://drive.google.com/file/d/19BOhwz52NUY3dg8XErVYglctpr5sjTy4/view
源代碼:客戶(hù)細(xì)分項(xiàng)目
https://data-flair.training/blogs/r-data-science-project-customer-segmentation/
在機(jī)器學(xué)習(xí)項(xiàng)目創(chuàng)意文章的下一部分,我們將為內(nèi)行人士介紹一些高級(jí)項(xiàng)目創(chuàng)意。
高級(jí)機(jī)器學(xué)習(xí)項(xiàng)目
1. 使用機(jī)器學(xué)習(xí)進(jìn)行情感分析
項(xiàng)目構(gòu)想:情感分析是分析用戶(hù)情感的過(guò)程。我們可以將他們的情緒分為正面,負(fù)面或中性。了解如何進(jìn)行情感分析是一個(gè)很棒的項(xiàng)目,并且如今已被廣泛使用。這是最受歡迎的機(jī)器學(xué)習(xí)項(xiàng)目之一。其背后的原因是每家公司都試圖了解客戶(hù)的情緒,如果客戶(hù)滿(mǎn)意,他們會(huì)留下來(lái)。該項(xiàng)目可能顯示出減少客戶(hù)流失的途徑。
數(shù)據(jù)集:情感分析數(shù)據(jù)集
http://ai.stanford.edu/~amaas/data/sentiment/
源代碼:情感分析項(xiàng)目
https://data-flair.training/blogs/data-science-r-sentiment-analysis-project/
2. 安然調(diào)查項(xiàng)目
項(xiàng)目構(gòu)想:安然公司(Enron)在2000年倒閉,但可提供數(shù)據(jù)進(jìn)行調(diào)查。該數(shù)據(jù)庫(kù)包含500,000名在公司工作的真實(shí)員工的電子郵件,因此數(shù)據(jù)對(duì)于執(zhí)行數(shù)據(jù)分析非常有用,許多數(shù)據(jù)科學(xué)家都使用此數(shù)據(jù)集。
數(shù)據(jù)集:安然調(diào)查數(shù)據(jù)集
https://www.cs.cmu.edu/~enron/
3. 語(yǔ)音情感識(shí)別機(jī)器學(xué)習(xí)項(xiàng)目
項(xiàng)目構(gòu)想:這是最好的機(jī)器學(xué)習(xí)項(xiàng)目之一。語(yǔ)音情感識(shí)別系統(tǒng)使用音頻數(shù)據(jù)。它以語(yǔ)音的一部分作為輸入,然后確定說(shuō)話(huà)者以何種情緒說(shuō)話(huà)。我們可以識(shí)別出不同的情緒,例如快樂(lè),悲傷,驚訝,生氣等。該項(xiàng)目可能有助于在與呼叫中心通話(huà)期間識(shí)別客戶(hù)情緒。
數(shù)據(jù)集:語(yǔ)音情感識(shí)別數(shù)據(jù)集
https://drive.google.com/file/d/1wWsrN2Ep7x6lWqOXfr4rpKGYrJhWc8z7/view
源代碼:語(yǔ)音情感識(shí)別項(xiàng)目
https://data-flair.training/blogs/python-mini-project-speech-emotion-recognition/
4. 抓非法捕魚(yú)項(xiàng)目
項(xiàng)目構(gòu)想:這是一個(gè)有趣的機(jī)器學(xué)習(xí)項(xiàng)目。海洋上有許多船,船,不可能手動(dòng)跟蹤每個(gè)人的活動(dòng)。這將是一個(gè)了不起的項(xiàng)目,它可以通過(guò)衛(wèi)星和地理位置數(shù)據(jù)識(shí)別非法偷獵動(dòng)物并捕撈捕魚(yú)活動(dòng)。Global Fishing Watch免費(fèi)提供實(shí)時(shí)數(shù)據(jù),可用于構(gòu)建系統(tǒng)。
數(shù)據(jù)集:捕捉非法捕魚(yú)數(shù)據(jù)集
https://globalfishingwatch.org/map-and-data/
5. 使用協(xié)同過(guò)濾的在線雜貨推薦
項(xiàng)目構(gòu)想:協(xié)作過(guò)濾是一項(xiàng)很棒的技術(shù),可根據(jù)相似用戶(hù)的反應(yīng)來(lái)過(guò)濾出用戶(hù)可能喜歡的項(xiàng)目。雜貨店推薦系統(tǒng)將是一個(gè)使客戶(hù)意識(shí)到自己想要的東西的好項(xiàng)目。
6. 使用機(jī)器學(xué)習(xí)的電影推薦系統(tǒng)
項(xiàng)目構(gòu)想:推薦系統(tǒng)無(wú)處不在,無(wú)論是在線購(gòu)買(mǎi)應(yīng)用程序,電影流媒體應(yīng)用程序還是音樂(lè)流媒體。他們都根據(jù)目標(biāo)客戶(hù)推薦產(chǎn)品。電影推薦系統(tǒng)是增強(qiáng)你的作品集的絕佳項(xiàng)目。
數(shù)據(jù)集:電影推薦系統(tǒng)數(shù)據(jù)集
https://drive.google.com/file/d/1Dn1BZD3YxgBQJSIjbfNnmCFlDW2jdQGD/view
源代碼:電影推薦系統(tǒng)項(xiàng)目
https://data-flair.training/blogs/data-science-r-movie-recommendation/
7. 車(chē)牌自動(dòng)識(shí)別系統(tǒng)
項(xiàng)目構(gòu)想:該機(jī)器學(xué)習(xí)項(xiàng)目的目的是檢測(cè)和識(shí)別車(chē)輛的牌照號(hào),并讀取印在牌照上的牌照號(hào)。這可能是用于安全掃描,流量監(jiān)視等的良好應(yīng)用程序。
源代碼:自動(dòng)車(chē)牌識(shí)別項(xiàng)目
https://techvidvan.com/tutorials/python-project-license-number-plate-recognition/
相關(guān)報(bào)道:
https://data-flair.training/blogs/machine-learning-project-ideas/
【本文是51CTO專(zhuān)欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】