常見Hadoop命令使用方法詳解
本節(jié)繼續(xù)和大家一起學(xué)習(xí)一下Hadoop命令的使用方法,在學(xué)習(xí)Hadoop時(shí)只有了解了Hadoop命令如何使用,才能更好的對(duì)Hadoop進(jìn)行操作,下面讓我們一起來學(xué)習(xí)Hadoop命令吧。
version
此Hadoop命令用來打印版本信息。
用法:hadoopversion
CLASSNAME
hadoop腳本可用于調(diào)調(diào)用任何類。
用法:hadoopCLASSNAME
運(yùn)行名字為CLASSNAME的類。
管理命令
hadoop集群管理員常用的命令。
balancer
運(yùn)行集群平衡工具。管理員可以簡單的按Ctrl-C來停止平衡過程。參考Rebalancer了解更多。
用法:hadoopbalancer[-threshold<threshold>]
命令選項(xiàng)描述
-threshold<threshold>磁盤容量的百分比。這會(huì)覆蓋缺省的閥值。
daemonlog
此Hadoop命令用來獲取或設(shè)置每個(gè)守護(hù)進(jìn)程的日志級(jí)別。
用法:hadoopdaemonlog-getlevel<host:port><name>
用法:hadoopdaemonlog-setlevel<host:port><name><level>
命令選項(xiàng)描述
-getlevel<host:port><name>打印運(yùn)行在<host:port>的守護(hù)進(jìn)程的日志級(jí)別。這個(gè)命令內(nèi)部會(huì)連接http://<host:port>/logLevel?log=<name>
-setlevel<host:port><name><level>設(shè)置運(yùn)行在<host:port>的守護(hù)進(jìn)程的日志級(jí)別。這個(gè)命令內(nèi)部會(huì)連接http://<host:port>/logLevel?log=<name>
datanode
運(yùn)行一個(gè)HDFS的datanode。
用法:hadoopdatanode[-rollback]
命令選項(xiàng)描述
-rollback將datanode回滾到前一個(gè)版本。這需要在停止datanode,分發(fā)老的hadoop版本之后使用。
dfsadmin
此Hadoop命令用來運(yùn)行一個(gè)HDFS的dfsadmin客戶端。
用法:hadoopdfsadmin[GENERIC_OPTIONS][-report][-safemodeenter|leave|get|wait][-refreshNodes][-finalizeUpgrade][-upgradeProgressstatus|details|force][-metasavefilename][-setQuota<quota><dirname>...<dirname>][-clrQuota<dirname>...<dirname>][-help[cmd]]
命令選項(xiàng)描述
-report報(bào)告文件系統(tǒng)的基本信息和統(tǒng)計(jì)信息。
-safemodeenter|leave|get|wait安全模式維護(hù)命令。安全模式是Namenode的一個(gè)狀態(tài),這種狀態(tài)下,Namenode
1.不接受對(duì)名字空間的更改(只讀)
2.不復(fù)制或刪除塊
Namenode會(huì)在啟動(dòng)時(shí)自動(dòng)進(jìn)入安全模式,當(dāng)配置的塊最小百分比數(shù)滿足最小的副本數(shù)條件時(shí),會(huì)自動(dòng)離開安全模式。安全模式可以手動(dòng)進(jìn)入,但是這樣的話也必須手動(dòng)關(guān)閉安全模式。
-refreshNodes重新讀取hosts和exclude文件,更新允許連到Namenode的或那些需要退出或入編的Datanode的集合。
-finalizeUpgrade終結(jié)HDFS的升級(jí)操作。Datanode刪除前一個(gè)版本的工作目錄,之后Namenode也這樣做。這個(gè)操作完結(jié)整個(gè)升級(jí)過程。
-upgradeProgressstatus|details|force請求當(dāng)前系統(tǒng)的升級(jí)狀態(tài),狀態(tài)的細(xì)節(jié),或者強(qiáng)制升級(jí)操作進(jìn)行。
-metasavefilename保存Namenode的主要數(shù)據(jù)結(jié)構(gòu)到hadoop.log.dir屬性指定的目錄下的<filename>文件。
對(duì)于下面的每一項(xiàng),<filename>中都會(huì)一行內(nèi)容與之對(duì)應(yīng)
1.Namenode收到的Datanode的心跳信號(hào)
2.等待被復(fù)制的塊
3.正在被復(fù)制的塊
4.等待被刪除的塊
-setQuota<quota><dirname>...<dirname>為每個(gè)目錄<dirname>設(shè)定配額<quota>。
目錄配額是一個(gè)長整型整數(shù),強(qiáng)制限定了目錄樹下的名字個(gè)數(shù)。
命令會(huì)在這個(gè)目錄上工作良好,以下情況會(huì)報(bào)錯(cuò):
1.N不是一個(gè)正整數(shù),或者
2.用戶不是管理員,或者
3.這個(gè)目錄不存在或是文件,或者
4.目錄會(huì)馬上超出新設(shè)定的配額。
-clrQuota<dirname>...<dirname>為每一個(gè)目錄<dirname>清除配額設(shè)定。
命令會(huì)在這個(gè)目錄上工作良好,以下情況會(huì)報(bào)錯(cuò):
1.這個(gè)目錄不存在或是文件,或者
2.用戶不是管理員。
如果目錄原來沒有配額不會(huì)報(bào)錯(cuò)。
-help[cmd]顯示給定命令的幫助信息,如果沒有給定命令,則顯示所有命令的幫助信息。
jobtracker
此Hadoop命令用來運(yùn)行MapReducejobTracker節(jié)點(diǎn)。
用法:hadoopjobtracker
namenode
運(yùn)行namenode。有關(guān)升級(jí),回滾,升級(jí)終結(jié)的更多信息請參考升級(jí)和回滾。
用法:hadoopnamenode[-format]|[-upgrade]|[-rollback]|[-finalize]|[-importCheckpoint]
命令選項(xiàng)描述
-format格式化namenode。它啟動(dòng)namenode,格式化namenode,之后關(guān)閉namenode。
-upgrade分發(fā)新版本的hadoop后,namenode應(yīng)以u(píng)pgrade選項(xiàng)啟動(dòng)。
-rollback將namenode回滾到前一版本。這個(gè)選項(xiàng)要在停止集群,分發(fā)老的hadoop版本后使用。
-finalizefinalize會(huì)刪除文件系統(tǒng)的前一狀態(tài)。最近的升級(jí)會(huì)被持久化,rollback選項(xiàng)將再不可用,升級(jí)終結(jié)操作之后,它會(huì)停掉namenode。
-importCheckpoint從檢查點(diǎn)目錄裝載鏡像并保存到當(dāng)前檢查點(diǎn)目錄,檢查點(diǎn)目錄由fs.checkpoint.dir指定。
secondarynamenode
運(yùn)行HDFS的secondarynamenode。參考SecondaryNamenode了解更多。
用法:hadoopsecondarynamenode[-checkpoint[force]]|[-geteditsize]
命令選項(xiàng)描述
-checkpoint[force]如果EditLog的大小>=fs.checkpoint.size,啟動(dòng)Secondarynamenode的檢查點(diǎn)過程。如果使用了-force,將不考慮EditLog的大小。
-geteditsize打印EditLog大小。
tasktracker
運(yùn)行MapReduce的taskTracker節(jié)點(diǎn)。
用法:hadooptasktracker。本節(jié)關(guān)于Hadoop命令使用方法介紹到這里。
【編輯推薦】
- Hadoop命令手冊使用指南
- 如何實(shí)現(xiàn)Cassandra與Hadoop MapReduce的整合?
- Hadoop集群與Hadoop性能優(yōu)化
- HadoopHBase實(shí)現(xiàn)配置簡單的單機(jī)環(huán)境
- Hadoop MapReduce的簡單應(yīng)用Cascading詳解