偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Python數(shù)據(jù)科學家的學習路徑

大數(shù)據(jù)
本文的目的就是給數(shù)據(jù)分析方面的Python新手提供一個完整的學習路徑。該路徑提供了你需要學習的利用Python進行數(shù)據(jù)分析的所有步驟的完整概述。

假如你想成為一個數(shù)據(jù)科學家,或者已經(jīng)是數(shù)據(jù)科學家的你想擴展你的技能,那么你已經(jīng)來對地方了。本文的目的就是給數(shù)據(jù)分析方面的Python新手提供一個完整的學習路徑。該路徑提供了你需要學習的利用Python進行數(shù)據(jù)分析的所有步驟的完整概述。如果你已經(jīng)有一些相關的背景知識,或者你不需要路徑中的所有內(nèi)容,你可以隨意調(diào)整你自己的學習路徑,并且讓大家知道你是如何調(diào)整的。

[[319346]]

步驟0:熱身

開始學習旅程之前,先回答第一個問題:為什么使用Python?或者,Python如何發(fā)揮作用?

觀看DataRobot創(chuàng)始人Jeremy在PyCon Ukraine 2014上的30分鐘演講,來了解Python是多么的有用。

步驟1:設置你的機器環(huán)境

現(xiàn)在你已經(jīng)決心要好好學習了,也是時候設置你的機器環(huán)境了。最簡單的方法就是從http://Continuum.io上下載分發(fā)包Anaconda。Anaconda將你以后可能會用到的大部分的東西進行了打包。采用這個方法的主要缺點是,即使可能已經(jīng)有了可用的底層庫的更新,你仍然需要等待Continuum去更新Anaconda包。當然如果你是一個初學者,這應該沒什么問題。

步驟2:學習Python語言的基礎知識

你應該先去了解Python語言的基礎知識、庫和數(shù)據(jù)結(jié)構(gòu)。Codecademy上的Python課程是你最好的選擇之一。完成這個課程后,你就能輕松的利用Python寫一些小腳本,同時也能理解Python中的類和對象。

  • 具體學習內(nèi)容:列表Lists,元組Tuples,字典Dictionaries,列表推導式,字典推導式。
  • 任務:解決HackerRank上的一些Python教程題,這些題能讓你更好的用Python腳本的方式去思考問題。
  • 替代資源:如果你不喜歡交互編碼這種學習方式,你也可以學習谷歌的Python課程。這個2天的課程系列不但包含前邊提到的Python知識,還包含了一些后邊將要討論的東西。

步驟3:學習Python語言中的正則表達式

你會經(jīng)常用到正則表達式來進行數(shù)據(jù)清理,尤其是當你處理文本數(shù)據(jù)的時候。學習正則表達式的最好方法是參加谷歌的Python課程,它會讓你能更容易的使用正則表達式。

步驟4:學習Python中的科學庫—NumPy, SciPy, Matplotlib以及Pandas

從這步開始,學習旅程將要變得有趣了。下邊是對各個庫的簡介,你可以進行一些常用的操作:

  • 根據(jù)NumPy教程進行完整的練習,特別要練習數(shù)組arrays。這將會為下邊的學習旅程打好基礎。
  • 接下來學習Scipy教程??赐闟cipy介紹和基礎知識后,你可以根據(jù)自己的需要學習剩余的內(nèi)容。
  • 這里并不需要學習Matplotlib教程。對于我們這里的需求來說,Matplotlib的內(nèi)容過于廣泛。目前只需要簡單了解一些就可以了。
  • 最后學習Pandas。Pandas為Python提供DataFrame功能(類似于R)。這也是你應該花更多的時間練習的地方。Pandas會成為所有中等規(guī)模數(shù)據(jù)分析的最有效的工具。

您還可以學習兩篇博客Exploratory Data Analysis with Pandas和Data munging with Pandas中的內(nèi)容。

額外資源:

  • 如果你需要一本關于Pandas和Numpy的書,建議Wes McKinney寫的“Python for Data Analysis”。

步驟5:有用的數(shù)據(jù)可視化

參加哈佛CS109的這個課程。你可以跳過前邊的2分鐘,但之后的內(nèi)容都是干貨。你可以根據(jù)這個任務來完成課程的學習。

步驟6:學習Scikit-learn庫和機器學習的內(nèi)容

現(xiàn)在,我們要開始學習整個過程的實質(zhì)部分了。Scikit-learn是機器學習領域最有用的Python庫。這里是該庫的簡要概述。完成哈佛CS109課程的課程10到課程18,這些課程包含了機器學習的概述,同時介紹了像回歸、決策樹、整體模型等監(jiān)督算法以及聚類等非監(jiān)督算法。你可以根據(jù)各個課程的任務來完成相應的課程。

額外資源:

  • 如果說有那么一本書是你必讀的,推薦Programming Collective Intelligence。這本書雖然有點老,但依然是該領域最好的書之一。
  • 此外,你還可以參加來自Yaser Abu-Mostafa的機器學習課程,這是最好的機器學習課程之一。如果你需要更易懂的機器學習技術(shù)的解釋,你可以選擇來自Andrew Ng的機器學習課程,并且利用Python做相關的課程練習。

步驟7:練習,練習,再練習

恭喜你,你已經(jīng)完成了整個學習旅程。

你現(xiàn)在已經(jīng)學會了你需要的所有技能?,F(xiàn)在就是如何練習的問題了,還有比通過在Kaggle上和數(shù)據(jù)科學家們進行競賽來練習更好的方式嗎?深入一個當前Kaggle上正在進行的比賽,嘗試使用你已經(jīng)學過的所有知識來完成這個比賽。

步驟8:深度學習

現(xiàn)在你已經(jīng)學習了大部分的機器學習技術(shù),是時候關注一下深度學習了。很可能你已經(jīng)知道什么是深度學習,但是如果你仍然需要一個簡短的介紹,可以看這里。

我自己也是深度學習的新手,所以請有選擇性的采納下邊的一些建議。deeplearning.net上有深度學習方面最全面的資源,在這里你會發(fā)現(xiàn)所有你想要的東西—講座、數(shù)據(jù)集、挑戰(zhàn)、教程等。你也可以嘗試參加Geoff Hinton的課程,來了解神經(jīng)網(wǎng)絡的基本知識。

附言:這篇文章雖然是2015年的,但是對于剛?cè)腴Tpython,同時想學數(shù)據(jù)科學的同學還是很有參考價值的。而且點開原文后,作者有在開頭更新了一版2019年學習路徑,有興趣的也可以去看看。

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學家

2012-12-26 10:51:20

數(shù)據(jù)科學家

2018-02-28 15:03:03

數(shù)據(jù)科學家數(shù)據(jù)分析職業(yè)

2018-12-24 08:37:44

數(shù)據(jù)科學家數(shù)據(jù)模型

2012-12-06 15:36:55

CIO

2018-03-27 11:02:55

2018-01-25 14:19:32

深度學習數(shù)據(jù)科學遷移學習

2016-04-11 14:15:06

數(shù)據(jù)科學數(shù)據(jù)挖掘工具

2015-08-25 13:20:29

數(shù)據(jù)科學

2018-10-18 09:00:00

機器學習機器學習算法數(shù)據(jù)科學家

2018-10-16 14:37:34

數(shù)據(jù)科學家數(shù)據(jù)分析數(shù)據(jù)科學

2012-06-12 09:33:59

2019-07-05 10:29:17

大數(shù)據(jù)數(shù)據(jù)科學家

2016-05-11 10:36:16

數(shù)據(jù)科學家數(shù)據(jù)科學大數(shù)據(jù)

2015-06-11 10:27:29

數(shù)據(jù)科學家

2014-07-03 09:38:19

2012-12-27 09:52:23

數(shù)據(jù)科學家大數(shù)據(jù)

2019-08-26 09:47:56

數(shù)據(jù)科學家數(shù)據(jù)分析

2019-09-11 14:34:13

排序算法數(shù)據(jù)科學

2020-04-08 17:38:24

Python數(shù)據(jù)音樂
點贊
收藏

51CTO技術(shù)棧公眾號