使用HBase Shell接口的幾點(diǎn)注意事項(xiàng)
本文主要介紹了使用HBase Shell接口的幾點(diǎn)注意事項(xiàng),問(wèn)題如下:
問(wèn)題1, HBase(可以理解為不需要建'name'列,hbase自動(dòng)建立一個(gè)用于存儲(chǔ)“行標(biāo)識(shí)”的“列”),舉例如下:
例一:
- create 'employees', 'SN', 'department', 'address' 這個(gè)employees表的結(jié)構(gòu)將為:
- row_id SN department address
- --------------------------------------------------
共有四列,***列用于標(biāo)識(shí)行, 這里你可以當(dāng)做‘name’來(lái)用
插入數(shù)據(jù): put 'employees', 'HongKong', 'SN:', '20080501'
注意是put,不是Ruby的puts
對(duì)比的情況:
創(chuàng)建表:
- create 'employees', 'name', 'SN', 'department', 'address'
此時(shí)數(shù)據(jù)為: 除了標(biāo)識(shí)本身外,還有一個(gè)name列,下面簡(jiǎn)單設(shè)置為一樣的值。
- put 'employees', 'HongKong', 'name:', 'HongKong'
例二:
網(wǎng)上流行資料的例子:
一個(gè)存儲(chǔ)學(xué)生成績(jī)的表:
- name grad course:math course:art
- Tom 1 87
- 97
- Tom 1 87
- 97
- Jerry 2 100 80
這里grad對(duì)于表來(lái)說(shuō)是一個(gè)列,course對(duì)于表來(lái)說(shuō)是一個(gè)列族,這個(gè)列族由兩個(gè)列組成:math和art,當(dāng)然我們可以根據(jù)我們的需要在course中建立更多的列族,如computer,physics等相應(yīng)的列添加入course列族. 建立一個(gè)表格 scores 具有兩個(gè)列族grad 和courese
- hbase(main):002:0> create 'scores', 'grade', 'course'
- 0 row(s) in 4.1610 seconds
分析,請(qǐng)注意,為什么創(chuàng)建的表是沒(méi)有“name”這一列呢? 其實(shí)這里的name列就對(duì)應(yīng)例一的row_id,不用顯式創(chuàng)建的。
導(dǎo)入數(shù)據(jù)為: put 'scores', 'Tom', 'grade:', '1' , Tom對(duì)應(yīng)name
問(wèn)題2. 參數(shù)的警告說(shuō)明
很多人開(kāi)始都碰到類似。
- hbase(main):034:0> put 'employees', 'HongKong', 'name:', 'Hongkong', 'SN:', '20080501'
- ArgumentError: wrong number of arguments (6 for 5)
- hbase(main):033:0> put 'employees', 'Kong', 'name:' 'Kong'
- ArgumentError: wrong number of arguments (3 for 4)
這是參數(shù)數(shù)量不對(duì)的說(shuō)明, 請(qǐng)尤其注意逗號(hào), 空格不能用來(lái)分隔參數(shù)的。
以put為例,參數(shù)一般為5個(gè), 6個(gè) 10個(gè)都報(bào)錯(cuò)。但為什么又有(3 for 4)呢? 5和4個(gè)的時(shí)候可以工作呢? timestamp 是optional的。所以參數(shù)多的時(shí)候, 按照上限5報(bào)警,少的時(shí)候按照下限4報(bào)警。
- Put a cell 'value' at specified table/row/column and optionally
- timestamp coordinates. To put a cell value into table 't1' at
- row 'r1' under column 'c1' marked with the time 'ts1', do:
- hbase> put 't1', 'r1', 'c1', 'value', ts1
問(wèn)題3. 插入數(shù)據(jù)
- hbase(main):030:0> put 'employees', 'Tom', 'name:' 'Tom', 'SN:', '20091101', 'department:', 'D&R', 'address:country', 'China', 'address:city', 'Beijing'
- ArgumentError: wrong number of arguments (11 for 5)
怎么回事呢? 不要老想著SQL, put插入的Cell數(shù)據(jù), 這么多一起來(lái),當(dāng)然報(bào)錯(cuò)咯
問(wèn)題4. 刪除表必須先停,然后再刪: To remove the table, you must first disable it before dropping it
- hbase(main):025:0> disable 'test'
- 09/04/19 06:40:13 INFO client.HBaseAdmin: Disabled test
- 0 row(s) in 6.0426 seconds
- hbase(main):026:0> drop 'test'
- 09/04/19 06:40:17 INFO client.HBaseAdmin: Deleted test
問(wèn)題5. 如何運(yùn)行腳本文件
${HBASE_HOME}/bin/hbase shell PATH_TO_SCRIPT
示例:
- ./hbase shell /data/automation/create_import.hbase
- --------------------------------------------------------------------------------------------
- disable 'employees'
- drop 'employees'
- create 'employees', 'SN', 'department', 'address'
- put 'employees', 'HongKong', 'SN:', '20080501189'
- put 'employees', 'HongKong', 'department:', 'R&D'
- put 'employees', 'HongKong', 'address:country', 'China'
- put 'employees', 'HongKong', 'address:city', 'Beijing'
- put 'employees', 'Cudynia', 'SN:', '20010807368'
- put 'employees', 'Cudynia', 'department:', 'HR'
- put 'employees', 'Cudynia', 'address:country', 'US'
- put 'employees', 'Cudynia', 'address:city', 'San Francisco'
- exit
關(guān)于使用HBase Shell 接口的注意事項(xiàng)就介紹到這里了,希望能夠帶給您收獲!
【編輯推薦】


2011-02-16 08:56:19




