HBase 增量備份和還原工具
作者:楊俊華 
  HBase自帶的export/import機制可以實現(xiàn)Backup Restore功能。而且可以實現(xiàn)增量備份。 下面設增量備份的python腳本 在這個腳本中,每天做增量備份,每個月15日做全備份。
 HBase自帶的export/import機制可以實現(xiàn)Backup Restore功能。而且可以實現(xiàn)增量備份。 下面設增量備份的python腳本 在這個腳本中,每天做增量備份,每個月15日做全備份。
- import time
 - import datetime
 - from datetime import date
 - import sys
 - import os
 - tablename=sys.argv[1]
 - backupDst=sys.argv[2]
 - today=date.today()
 - if today.day == 15: //every month, we do a full backup
 - backupSubFolder=backupDst+today.isoformat()+"-full"
 - cmd="hbase org.apache.hadoop.hbase.mapreduce.Export %s %s"%(tablename,backupSubFolder)
 - else:
 - yesterday=datetime.date.today()- datetime.timedelta(days=1)
 - todayTimeStamp=time.mktime(today.timetuple())
 - yesTimeStamp=time.mktime(yesterday.timetuple())
 - backupSubFolder=backupDst+today.isoformat()
 - cmd="hbase org.apache.hadoop.hbase.mapreduce.Export %s %s %s"%(tablename,backupSubFolder,str(int(todayTimeStamp)*1000)
 - print cmd
 - os.system(cmd)
 
而Restore機制就更加簡單
- hbase org.apache.hadoop.hbase.mapreduce.Import tablename restorefolder
 
要注意的是,做Restore時候,原始的表必須是創(chuàng)建好的。所以如果表本身被損壞,需要重新創(chuàng)建一個新的空表,再做Restore。
還有,必須在Hadoop-env.sh中配置好hbase和Zookeeper的路徑,加上這樣的語句
- export HADOOP_CLASSPATH="/usr/lib/hadoop-hbase/hbaseXXX.jar:/usr/lib/hadoop-hbase/lib/zookeeperXXX.jar:/etc/hadoop-hbase/conf"
 
原文鏈接:http://hbase.iteye.com/blog/1172195
【編輯推薦】
- 主流NoSQL數據庫評測之HBase
 - HBase數據庫性能調優(yōu)
 - Facebook實時信息系統(tǒng):HBase每月存儲1350億條信息
 - HBase性能深度分析
 - 基于Java的HBase客戶端編程
 
責任編輯:艾婧 
                    來源:
                    hadoop/hbase 技術討論
 














 
 
 

 
 
 
 