細數Infobright的相關數據類型
Infobright里面支持所有的MySQL原有的數據類型。其中Integer類型比其他數據類型更加高效。盡可能使用以下的數據類型:
TINYINT,SMALLINT,MEDIUMINT,INT,BIGINT
DECIMAL(盡量減少小數點位數)
DATE ,TIME
效率比較低的、不推薦使用的數據類型有:
BINARY VARBINARY
FLOAT
DOUBLE
VARCHAR
TINYTEXT TEXT
Infobright數據類型使用的一些經驗和注意點:
(1)Infobright的數值類型的范圍和MySQL有點不一樣,比如Infobright的Int的最小值是-2147483647,而MySQl的Int最小值應該是-2147483648。其他的數值類型都存在這樣的問題。
(2)能夠使用小數據類型就使用小數據類型,比如能夠使用SMALLINT就不適用INT,這一點上Infobright和MySQL保持一致。
(3)避免效率低的數據類型,像TEXT之類能不用就不用,像FLOAT盡量用DECIMAL代替,但是需要權衡畢竟DECIMAL會損失精度。
(4)盡量少用VARCHAR,在MySQL里面動態(tài)的Varchar性能就不強,所以盡量避免VARCHAR。如果適合的話可以選擇把VARCHAR改成CHAR存儲甚至專程INTEGER類型。VARCHAR的優(yōu)勢在于分配空間的長度可變,既然Infobright具有那么優(yōu)秀的壓縮性能,個人認為完全可以把VARCHAR轉成CHAR。CHAR會具有更好的查詢和壓縮性能。
(5)能夠使用INT的情況盡量使用INT,很多時候甚至可以把一些CHAR類型的數據往整型轉化。比如搜索日志里面的客戶***id、客戶id等等數據就可以用BIGINT存儲而不用CHAR存儲。其實把時間分割成year、month、day三列存儲也是很好的選擇。在我能見到的系統(tǒng)里面時間基本上是使用頻率***的字段,提高時間字段的查詢性能顯然是非常重要的。當然這個還是要根據系統(tǒng)的具體情況,做數據分析時有時候很需要MySQL的那些時間函數。
(6)varchar和char字段還可以使用comment lookup,comment lookup能夠顯著地提高壓縮比率和查詢性能。
原文標題:http://blog.chinaunix.net/u2/72637/showart_2306106.html