大數(shù)據(jù)分析--R語言開始之旅
R的源起
R是S語言的一種實(shí)現(xiàn)。S語言是由 AT&T貝爾實(shí)驗(yàn)室開發(fā)的一種用來進(jìn)行數(shù)據(jù)探索、統(tǒng)計(jì)分析、作圖的解釋型語言。最初S語言的實(shí)現(xiàn)版本主要是S-PLUS。S-PLUS是一個商業(yè) 軟件,它基于S語言,并由MathSoft公司的統(tǒng)計(jì)科學(xué)部進(jìn)一步完善。后來Auckland大學(xué)的Robert Gentleman 和 Ross Ihaka 及其他志愿人員開發(fā)了一個R系統(tǒng)。R的使用與S-PLUS有很多類似之處,兩個軟件有一定的兼容性。
R is free
R是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個自由、免費(fèi)、源代碼開放的軟件,它是一個用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。
R是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲和處理系統(tǒng);數(shù)組運(yùn)算工具(其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大);完整連貫的統(tǒng)計(jì)分析工具;優(yōu)秀的統(tǒng)計(jì)制圖功能;簡便而強(qiáng)大的編程語言:可操縱數(shù)據(jù)的輸入和輸入,可實(shí)現(xiàn)分支、循環(huán),用戶可自定義功能。
R是一個免費(fèi)的自由軟件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免費(fèi)下載和使用的,在那兒可以下載到R的安裝程序、各種外掛程序和文檔。在R的安裝程序中只包含了8個基礎(chǔ)模塊,其他外在模塊可以通過CRAN獲得。
R的特點(diǎn)
(1) 有效的數(shù)據(jù)處理和保存機(jī)制。
(2) 擁有一整套數(shù)組和矩陣的操作運(yùn)算符。
(3) 一系列連貫而又完整的數(shù)據(jù)分析中間工具。
(4) 圖形統(tǒng)計(jì)可以對數(shù)據(jù)直接進(jìn)行分析和顯示,可用于多種圖形設(shè)備。
(5) 一種相當(dāng)完善、簡潔和高效的程序設(shè)計(jì)語言。它包括條件語句、循環(huán)語句、用戶自定義的遞歸函數(shù)以及輸入輸出接口。
(6) R語言是徹底面向?qū)ο蟮慕y(tǒng)計(jì)編程語言。
(7) R語言和其它編程語言、數(shù)據(jù)庫之間有很好的接口。
(8) R語言是自由軟件,可以放心大膽地使用,但其功能卻不比任何其它同類軟件差。
(9) R語言具有豐富的網(wǎng)上資源
R語言環(huán)境安裝
接下來從R語言的安裝折騰起(本人使用的是win7 32位,其他平臺可觸類旁通)。
R語言的安裝文件可以在http://www.r-project.org/下 載。
頁面的左側(cè)點(diǎn)擊“CRAN”(Comprehensive R Archive Network)即可。
C*AN是大多數(shù)自由軟件采用的發(fā)布方式,除了R以外還有為TeX準(zhǔn)備的CTAN,為Perl弄的CPAN等等。CRAN在世界各 地有很多鏡像,中國的中科院,廈大,中科大等都有鏡像。
下載好安裝文件后即可直接安裝,不過要注意以下兩點(diǎn):
把默認(rèn)安裝目錄中的R版本號去掉,比如要是R告訴你裝在C:/Program Files/R/R-3.0.0/,不要接受這個結(jié)果,把它改成C:/Program Files/R/。這個對于后面安裝RStudio和knitr等都有一些關(guān)系。
避免安裝在中文目錄下。這可以避免很多不必要的編碼問題。
安裝完成后,桌面會有一個R應(yīng)用快捷方式。雙擊打開
>help.start() 開啟幫助文檔
安裝RStudio
推薦在安裝完R語言后安裝RStudio。RStudio是一個R語言的IDE(integrated development environment),集合了各種功能,并且也是跨平臺和開源的。http://www.rstudio.com/ide/download/
現(xiàn)在提供桌面板和服務(wù)器版,個人用戶下載做桌面版即可。下載完成后安裝在默認(rèn)的安裝 目錄,然后就可以使用了
>help.start() 開啟幫助文檔
原文鏈接:http://quasimodo-es.iteye.com/blog/1851000
【編輯推薦】
2.R語言學(xué)習(xí)筆記(2):數(shù)據(jù)類型和數(shù)據(jù)結(jié)構(gòu)
3.R語言進(jìn)階之3:數(shù)據(jù)匯總/透視/提煉
4.用R語言對JPG/JPEG圖片進(jìn)行背景透明處理