第一步,在集群中創(chuàng)建自己的數(shù)據(jù)庫(kù)`(create database if not exists zhaozb;)`
進(jìn)入自己的數(shù)據(jù)庫(kù)(use zhaozb;)
第二步,創(chuàng)建一張外表(drop table if exists log_tmp;
create? external table log_tmp(
addr string
'''') )
row format delimited fields terminated by '|'? ? ? ? /已文本中的|為分隔符
location '/user/hive/warehouse/zhaozb.db/log_tmp';? ? /指定外表所建位置
第三步,利用遠(yuǎn)程將windows下的文件上傳到linux系統(tǒng)下,再在linux下運(yùn)用命令(hadoop fs -put /? /)將linux中的文件傳到集群上
查看表log_tmp
select * from log_tmp;
第四步,創(chuàng)建一張orc表,(create table if not exists log_orc(
addr string comment '地址',
'''
) stored as orc;
查看表結(jié)構(gòu) desc log_orc
插入表內(nèi)容 insert into table log_orc select * from log_tmp;
查看表內(nèi)容 select * from log_orc;