Hive - 分区 Hive - 删除表 Hive - 内置运算符 Hive将表组织成分区。这是根据日期,城市和部门等分区列的值将表分成相关部分的一种方法。使用分区,很容易查询一部分数据。 表或分区被细分为 桶, 以向数据提供额外的结构,以用于更高效的查询。Bucketing基于某个表的某列的哈希函数的值进行工作。 例如,名为 Tab1 的表包含员工数据,例如id,姓名,部门和yoj(即加入年份)。假设您需要检索2012年加入的所有员工的详细信息。查询会搜索整个表以获取所需的信息。但是,如果您将员工数据与年份进行分区并将其存储在单独的文件中,则会缩短查询处理时间。以下示例显示如何对文件及其数据进行分区: 以下文件包含employeedata表。 /tab1/employeedata/file1 身份证,姓名,部门,yoj 1,gopal,TP,2012 2,kiran,HR,2012 3,kaleel,SC,2013 4,Prasanth,SC,2013 上述数据使用年份分为两个文件。 /tab1/employeedata/2012/file2 1,gopal,TP,2012 2,kiran,HR,2012 /tab1/employeedata/2013/file3 3,kaleel,SC,2013 4,Prasanth,SC,2013 添加分区 我们可以通过改变表格将分区添加到表格中。让我们假设我们有一个名为 员工 的表,其中包含Id,Name,Salary,Designation,Dept和yoj等字段。 句法: ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec [LOCATION 'location1'] partition_spec [LOCATION 'location2'] ...; partition_spec: : (p_column = p_col_value, p_column = p_col_value, ...) 以下查询用于将分区添加到employee表。 hive> ALTER TABLE employee > ADD PARTITION (year=’2013’) > location '/2012/part2012'; 重命名分区 该命令的语法如下。 ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec; 以下查询用于重命名分区: hive> ALTER TABLE employee PARTITION (year=’1203’) > RENAME TO PARTITION (Yoj=’1203’); 删除分区 以下语法用于删除分区: ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec, PARTITION partition_spec,...; 以下查询用于删除分区: hive> ALTER TABLE employee DROP [IF EXISTS] > PARTITION (year=’1203’); Hive - 删除表 Hive - 内置运算符