我新搭建了一个集群需要,把老集群的hive数据迁移到新的集群。整个hive集群的数据又比较大,所以我选择一个表一个表来迁移。
1.导出hive表到hdfs
hive>export table db.testTable to '/tmp/testTable '
2.复制导出的数据到新集群
我在老的集群端执行下面命令,把刚导出的文件复制到新集群
hadoop distcp /tmp/testTable hdfs://192.168.1.13:8020/tmp/
3.新集群导入hive数据表
hive>import table db.testTable from '/tmp/testTable';
4.查看结果
hive> select count(1) from db.testTable;
OK
1724148
Time taken: 46.551 seconds, Fetched: 1 row(s)