Hive的管理表和外部表

管理表
内部表也称之为MANAGED_TABLE;
默认存储在/user/hive/warehouse下,也可以通过location指定;
删除表时,会删除表数据以及元数据;

外部表
外部表称之为EXTERNAL_TABLE;
在创建表时可以自己指定目录位置(LOCATION);
删除表时,只会删除元数据不会删除表数据;

语法

Hive的管理表和外部表

外部表

  • 创建外部表
    create external table if not exists emp_ext2(
    empno int,
    ename string,
    job string,
    mgr int,
    hiredate string,
    sal double,
    comm double,
    deptno int
    )
    row format delimited fields terminated by '\t'
    LOCATION '/user/hive/warehouse/emp';
Hive的管理表和外部表
  • 不用put数据就可以查询数据,因为表所在的目录下有个emp.txt 文件。
    说明:只需要创建表结构,不需要put数据。因为数据已经存在。
    就是你把emp_ext2表删除掉数据还是会存在的,这
    就是外部表。80%的企业都是使用这种方式进行数据管理和使用的。
    Hive的管理表和外部表

说明:外部表删除表时,只会删除元数据不会删除表数据。如果数据在hdfs目录以存在对应的结构,不需要put数据,直接就可以读取里面的文件。

上一篇:高可用Hadoop平台-Flume NG实战图解篇


下一篇:面试问题——英语7 R包更新