hive數(shù)據(jù)倉庫新增字段方法
新增字段
1、方法1
alter table 表名 add columns (列名 string COMMENT '新添加的列') CASCADE; alter table 表名 add columns (列名 string COMMENT '新添加的列'); hive表中指定位置增加一個字段 分兩步,先添加字段到最后(add columns),然后再移動到指定位置(change) alter table 表名 add columns (列名 string comment '當(dāng)前時間'); -- 正確,添加在最后 alter table 表名 change 列名 string after 指定位置的列名; -- 正確,移動到指定位置,address字段的后面
添加之后字段由于hive底層是文件和系列化的設(shè)計(jì),因此查數(shù)據(jù)會發(fā)現(xiàn)新增的列在所有已有列的后面
CASCADE會刷歷史分區(qū)字段
cascade知識
- cascade的中文翻譯為“級聯(lián)”,也就是不僅變更新分區(qū)的表結(jié)構(gòu)(metadata),同時也變更舊分區(qū)的表結(jié)構(gòu)。
- 對于刪除操作也是,級聯(lián)刪除表中的信息,當(dāng)表A中的字段引用了表B中的字段時,一旦刪除B中該字段的信息,表A的信息也自動刪除。(當(dāng)父表的信息刪除,子表的信息也自動刪除)
- 標(biāo)準(zhǔn)語法如下:

2、方法2 (適用于外部表)
當(dāng)分區(qū)過多的情況下,直接使用alter就行增加字段會報(bào)錯
第一步:刪除分區(qū) ,當(dāng)分區(qū)過多可以寫個for循環(huán)
alter table table_name drop if exists partition(par_col=col_name)
第二步:使用alter操作就行添加字段,這時候就不會因?yàn)榉謪^(qū)過多報(bào)錯
第三步:進(jìn)行修復(fù)分區(qū)
msck repair table 表名;
3、方法3(下下策)
創(chuàng)建新表修改表名,進(jìn)行存儲原表數(shù)據(jù)
將原表進(jìn)行drop,再對新表進(jìn)行改名操作
ALTER TABLE old_name RENAME TO new_name;
修改字段
alter table table_name change column 已有列 修改名稱 類型 comment '';
刪除列
Hive不能直接刪除列,不然底層系列化就亂了,我們可以通過replace語句來替換整張表的字段,達(dá)到同樣的效果
alter table table_name replace columns(column_1 string);
語句中只寫想要保留的字段就可以
以上就是hive中新增字段方法的詳細(xì)內(nèi)容,更多關(guān)于hive新增字段的資料請關(guān)注本站其它相關(guān)文章!
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非maisonbaluchon.cn所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。
關(guān)注官方微信