实际使用中需要对处理后的数据按照时间分开,后续有按照时间的插入和删除操作,所以用hive的分区表是一个很好的解决方案。
比较蛋疼的是,由于 hive 不支持使用 load 语句进行动态分区插入数据,所以要新建一个表,再用 insert 语句把表中数据导入到新建的分区表中。
测试数据内容
|
|
由于后续还需要使用分区后的数据进行MapReduce操作,所以在后面复制了一段时间字段(分区后,分区字段会变成hive中的文件夹名)
创建表并导入数据
|
|
建立分区表并导入数据
|
|
查看数据
|
|
删除分区
|
|
查看数据
|
|
Forever youthful,forever weeping
实际使用中需要对处理后的数据按照时间分开,后续有按照时间的插入和删除操作,所以用hive的分区表是一个很好的解决方案。
比较蛋疼的是,由于 hive 不支持使用 load 语句进行动态分区插入数据,所以要新建一个表,再用 insert 语句把表中数据导入到新建的分区表中。
|
|
由于后续还需要使用分区后的数据进行MapReduce操作,所以在后面复制了一段时间字段(分区后,分区字段会变成hive中的文件夹名)
|
|
|
|
|
|
|
|
|
|