入行數據科學,這些書一定要看
大數據已經成為這個時代的標志,如何理解和運用大數據,也是我們這個時代的重中之重。因此選擇一本合適的數據科學書至關重要。

近日,在GitHub上看到一張大而全的數據科學書單圖,該圖片分成七大領域,各自都有相對應的推薦書單,本文就為為各位推薦幾本書,希望能夠有助于你在大數據方面的學習。
1、《數據科學入門》

本書從零開始講解數據科學工作,教授數據科學工作所必需的黑客技能,并帶領讀者熟悉數據科學的核心知識——數學和統計學。作者選擇了功能強大、簡單易學的Python語言環(huán)境,親手搭建工具和實現算法,并精心挑選了注釋良好、簡潔易讀的實現范例。書中涵蓋的所有代碼和數據都可以在GitHub上下載。
2、《Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking》

本書清晰易懂,適合統計基礎一般的人用來先理解ML的概念,書中涵蓋大量數據科學的概念,讀起來通俗易懂。你可以把書中大框架都理解了再去看別的更偏重理論或算法的書,
3、《貝葉斯思維》

這本書旨在幫助那些希望用數學工具解決實際問題的人們,但閱讀本書之前你***懂一點概率知識和程序設計。本書在共計15章的篇幅中討論了怎樣解決十幾個現實生活中的實際問題。在解決問題的過程中,作者還潛移默化的幫助讀者形成了建模決策的方法論,在這個意義上,這本書又是一本關于數學建模的成功樣本。
4、《數據科學實戰(zhàn)》

這本書涉及的面包含數據科學的各個層面,是相關專家客座課堂講義的分析和總結,主要涵蓋以下內容:
- 統計推斷、探索性數據分析(EDA)及數據科學工作流程
- 算法
- 垃圾郵件過濾、樸素貝葉斯和數據清理
- 邏輯回歸
- 金融建模
- 推薦引擎和因果關系
- 數據可視化
- 社交網絡與數據新聞
- 數據工程、MapReduce、Pregel和Hadoop
5、《復雜性思考》

本書提供了一系列練習;這些練習都要求學生重新實現一些開創(chuàng)性實驗并對其進行擴展。復雜性吸引人的一個地方在于我們可以通過適當的編程技能與數學知識接觸研究前沿。
6、《統計思維:程序員數學之概率統計》

本書是一本概率統計方面的入門圖書,但視角極為獨特,折射出大數據浪潮的別樣風景。作者將基本的概率統計知識融入Python編程,告訴你如何借助編寫程序,用計算而非數學的方式實現統計分析。
7、《利用Python進行數據分析》

本書含有大量的實踐案例,你將學會如何利用各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)高效地解決各式各樣的數據分析問題,十分適合剛剛接觸Python的分析人員以及剛剛接觸科學計算的Python程序員。
8、《Python數據科學手冊》

本書是對以數據深度需求為中心的科學、針對計算和統計方法的參考書。共有五章,每章介紹一到兩個Python數據科學中的重點工具包。本書適合有編程背景,并打算將開源Python工具用作分析、操作、可視化以及學習數據的數據科學研究人員。
9、《Advanced and Multivariate Statistical Methods》

這是一本關于數據挖掘書籍,書中介紹了多種多元統計方法。