无遮挡边吃摸边吃奶边做,天堂网在线.www天堂在线资源

HBase是一種分布式、可擴展、支持海量數(shù)據(jù)存儲的NoSQL數(shù)據(jù)庫。分布式是因為HBase底層使用HDFS存儲數(shù)據(jù)，可擴展也是基于HDFS的橫向擴展能力，作為大數(shù)據(jù)的存儲當(dāng)然支持海量數(shù)據(jù)的存儲，NoSQL非關(guān)系型數(shù)據(jù)庫表結(jié)構(gòu)和關(guān)系型數(shù)據(jù)庫（如Mysql）的邏輯結(jié)構(gòu)、物理結(jié)構(gòu)很不一樣，性質(zhì)特點、應(yīng)用場景也不一樣。

1、邏輯結(jié)構(gòu)

1）Name Space

命名空間，類似于關(guān)系型數(shù)據(jù)庫的 DatabBase 概念，每個命名空間下有多個表。HBase有兩個自帶的命名空間，分別是 hbase 和 default，hbase 中存放的是 HBase 內(nèi)置的表，default 表是用戶默認使用的命名空間。

2）Region

類似于關(guān)系型數(shù)據(jù)庫的表概念。不同的是，HBase 定義表時只需要聲明列族即可，不需要聲明具體的列。這意味著，往 HBase 寫入數(shù)據(jù)時，字段可以動態(tài)、按需指定。因此，和關(guān)系型數(shù)據(jù)庫相比，HBase 能夠輕松應(yīng)對字段變更的場景。

3）Row

HBase 表中的每行數(shù)據(jù)都由一個 RowKey 和多個 Column（列）組成，數(shù)據(jù)是按照 RowKey的字典順序存儲的，并且查詢數(shù)據(jù)時只能根據(jù) RowKey 進行檢索，所以 RowKey 的設(shè)計十分重要。

4）Column

HBase 中的每個列都由 Column Family(列族)和 Column Qualifier（列限定符）進行限定，例如 info：name，info：age。建表時，只需指明列族，而列限定符無需預(yù)先定義。

5）Time Stamp

用于標識數(shù)據(jù)的不同版本（version），每條數(shù)據(jù)寫入時，如果不指定時間戳，系統(tǒng)會自動為其加上該字段，其值為寫入 HBase 的時間。

6）Cell

由{rowkey, column Family：column Qualifier, time Stamp} 唯一確定的單元。cell 中的數(shù)據(jù)是沒有類型的，全部是字節(jié)碼形式存貯。

2、物理結(jié)構(gòu)

1）Region Server

Region Server 為 Region 的管理者，其實現(xiàn)類為 HRegionServer，主要作用如下:對于數(shù)據(jù)的操作：get, put, delete；對于 Region 的操作：splitRegion、compactRegion。

2）Master

Master 是所有 Region Server 的管理者，其實現(xiàn)類為 HMaster，主要作用如下：對于表的操作：create, delete, alter對于 RegionServer的操作：分配 regions到每個RegionServer，監(jiān)控每個 RegionServer的狀態(tài)，負載均衡和故障轉(zhuǎn)移。

3）Zookeeper

HBase 通過 Zookeeper 來做 Master 的高可用、RegionServer 的監(jiān)控、元數(shù)據(jù)的入口以及集群配置的維護等工作。

4）HDFS

HDFS 為 HBase 提供最終的底層數(shù)據(jù)存儲服務(wù)，同時為 HBase 提供高可用的支持。

3、增刪改查

初學(xué)或者測試階段對HBase操作可以使用HBase shell。增刪改查等基本命令如下：

（1）創(chuàng)建表

create 'test','cf'

test是表名，cf是列族名，你會發(fā)現(xiàn)HBase的表在新建的時候并沒有地方讓你定義列（和關(guān)系型數(shù)據(jù)庫很不一樣吧）。這是因為HBase中的列全部都是靈活的，可以隨便定義的。列只有在你插入第一條數(shù)據(jù)的時候才會生成。那么表的屬性在哪里定義呢？其實HBase的所有數(shù)據(jù)屬性都是定義在列族上的。

（2）查看表屬性

describe 'test'

輸出：

hbase(main):002:0> desc 'test'
Table test is ENABLED
test, {TABLE_ATTRIBUTES => {DURABILITY => 'USE_DEFAULT', METADATA => {'IS_ROOT'
=> 'false', 'LINDORM_TABLE_ATTRS' => '\x00\x08\x00\x00\x00\x16WAL_EDIT_WITH_FULL
_ROW\x05false\x00\x00\x00\x0BCONSISTENCY\x08eventual\x00\x00\x00\x16LEADER_BALAN
CE_ENABLED\x01\xFF\x00\x00\x00\x1FFULL_ROW_EDIT_CARRY_LATEST_DATA\x04true\x00\x0
0\x00\x0FDYNAMIC_COLUMNS\x04true\x00\x00\x00\x0FALLOW_FILTERING\x01\x00\x00\x00\
x00\x13LEADER_BALANCE_TYPE\x06single\x00\x00\x00\x12DEFERRED_LOG_FLUSH\x05false'
, 'TABLEMETAVERSION' => '`\xE4n\x0F'}}
COLUMN FAMILIES DESCRIPTION
{NAME => 'cf', VERSIONS => '1', EVICT_BLOCKS_ON_CLOSE => 'false', NEW_VERSION_BE
HAVIOR => 'false', KEEP_DELETED_CELLS => 'FALSE', CACHE_DATA_ON_WRITE => 'false'
, DATA_BLOCK_ENCODING => 'DIFF', TTL => 'FOREVER', MIN_VERSIONS => '0', REPLICAT
ION_SCOPE => '0', BLOOMFILTER => 'ROW', CACHE_INDEX_ON_WRITE => 'false', IN_MEMO
RY => 'false', CACHE_BLOOMS_ON_WRITE => 'false', PREFETCH_BLOCKS_ON_OPEN => 'fal
se', COMPRESSION => 'ZSTD', BLOCKCACHE => 'true', BLOCKSIZE => '65536', METADATA
=> {'STORAGE_POLICY' => 'DEFAULT', 'COMPRESS_TAGS' => 'true', 'DFS_REPLICATION'
=> '2', 'CHS_PROMOTE_ON_MAJOR' => 'true'}}
1 row(s)
Took 0.2150 seconds

可以看出對表的描述不多，大量的是對列族的描述，列族更像是傳統(tǒng)關(guān)系數(shù)據(jù)庫中的表，而表本身反倒變成只是存放列族的空殼了。

(3)查看表

list

輸出：

hbase(main):001:0> list
TABLE
test
test1
test2
test_ls
4 row(s)
Took 0.6370 seconds
=> ["test", "test1", "test2", "test_ls"]

（4）插入數(shù)據(jù)

put 'test','row1','cf:name','jack'

這條語句的意思就是：往test表插入一個單元格。這個單元格的rowkey為row1，也就是說它是屬于row1這個行中的一個列。該單元格的列族為cf。該單元格的列名為name。數(shù)據(jù)值為jack?？梢娏惺窃诓迦霐?shù)據(jù)的時候產(chǎn)生的，Hbase中列可以自由擴展。表的結(jié)構(gòu)中某一行可能沒有某個列，但數(shù)據(jù)并不以NULL替代，而是壓根沒有該單元格。這樣以稀疏k-v方式存儲數(shù)據(jù)可以大大壓縮數(shù)據(jù)存儲容量。

（5）掃描數(shù)據(jù)

scan 'test'

輸出：

hbase(main):011:0> scan 'test'
ROW COLUMN+CELL
row1 column=cf:name, timestamp=1625911358767, value=jack
1 row(s)
Took 0.5670 seconds

scan命令類似于Mysql中的select * from test。

（6）查看數(shù)據(jù)

scan命令是批量讀取數(shù)據(jù)，查詢某個單元格的數(shù)據(jù)可以用get命令，

get 'test','row1','cf:name'

由于HBase底層使用鍵值對存儲數(shù)據(jù)，查詢一個單元格的數(shù)據(jù)非常快，這和Mysql也完全不同。

（7）刪除數(shù)據(jù)

delete 'test','row1','cf:name'

HBase刪除記錄并不是真的刪除了數(shù)據(jù)，而是放置了一個墓碑標記（tombstone marker），把這個版本連同之前的版本都標記為不可見了。

（8）停用表

disable 'test'

表刪除之前要停用表

（9）刪除表

drop 'test'

4、應(yīng)用場景

HBase采用的是Key/Value的存儲方式，這意味著，即使隨著數(shù)據(jù)量增大，也幾乎不會導(dǎo)致查詢的性能下降。凡事都不可能只有優(yōu)點而沒有缺點。數(shù)據(jù)分析是HBase的弱項，因為對于HBase乃至整個NoSQL生態(tài)圈來說，基本上都是不支持表關(guān)聯(lián)的。

不適用的場景：主要需求是數(shù)據(jù)分析，比如做報表。單表數(shù)據(jù)量不超過千萬。建議使用MySQL或者Oracle數(shù)據(jù)庫。

適用的場景：單表數(shù)據(jù)量超千萬，而且并發(fā)還挺高。數(shù)據(jù)分析需求較弱，或者不需要那么靈活或者實時。

5、參考資料

《HBase不睡覺書》

《HBase原理與實踐》

B站視頻《尚硅谷HBase教程(hbase框架快速入門)》

到此這篇關(guān)于Hbase列式存儲入門的文章就介紹到這了,更多相關(guān)Hbase列式存儲內(nèi)容請搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站！

海外穩(wěn)定服務(wù)器

版權(quán)聲明：本站文章來源標注為YINGSOO的內(nèi)容版權(quán)均為本站所有，歡迎引用、轉(zhuǎn)載，請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站，禁止在非maisonbaluchon.cn所屬的服務(wù)器上建立鏡像，否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來，僅供學(xué)習(xí)參考，不代表本站立場，如有內(nèi)容涉嫌侵權(quán)，請聯(lián)系alex-e#qq.com處理。

相關(guān)文章

mysql學(xué)習(xí)筆記之表的基本操作

centos編譯安裝mysql 5.6及安裝多個mysql實例詳解

mysql 5.7.11 winx64.zip安裝配置方法圖文教程

mysql 5.7.17 winx64.zip安裝配置方法圖文教程

CentOS安裝mysql5.7 及簡單配置教程詳解

MySQL 5.7 zip版本(zip版)安裝配置步驟詳解

MySQL5.6.31 winx64.zip 安裝配置教程詳解

MySQL注入繞開過濾的技巧總結(jié)

一次Mysql死鎖排查過程的全紀錄

Windows10 64位安裝MySQL5.6.35的圖文教程