[原创] Apache Pig如何按数据分组保存到不同的子目录中(MultiStorage) 2023 年 11 月 15 日2022 年 11 月 06 日 作者 learnhard 查看更多Apache Pig的教程请点击这里。 用Apache Pig进行数据处理的时候,我们通常会在最后把处理结果保存到一个HDFS目录下: STORE result INTO '/my_output_dir'; 这是最常见的情况。 但是,如果我们想根据某个字段,把数据分成多组,分别存储在多个目录下呢?举个可能不恰当的例子,就有点像我们先把数据按某个字段分组: GROUP data BY field; 再把各个group的数据分别存储在不同的目录下一样。 阅读更多