[原创] 如何用Apache Pig输出压缩格式的SequenceFile 2023 年 11 月 18 日2015 年 07 月 24 日 作者 learnhard 查看更多Apache Pig的教程请点击这里。 SequenceFile是Hadoop API提供的一种二进制文件,它将数据以<key,value>的形式序列化到文件中。 如果你要用Apache Pig读取这种类型的数据,可以用 PiggyBank 中的SequenceFileLoader——我没有用过,但肯定是没问题的。 阅读更多