【发布时间】:2015-03-22 07:12:41
【问题描述】:
getShipFiles 和 getCacheFiles 在 EvalFunc 类中有什么区别?
假设此方法中指定的任何文件都可用于分布式缓存中的exec 方法
【问题讨论】:
标签: apache-pig distributed-cache pig-udf
getShipFiles 和 getCacheFiles 在 EvalFunc 类中有什么区别?
假设此方法中指定的任何文件都可用于分布式缓存中的exec 方法
【问题讨论】:
标签: apache-pig distributed-cache pig-udf
getCacheFiles() 允许 UDF 指定它希望放置在分布式缓存中的 hdfs 文件列表。
getShipFiles() 允许 UDF 指定它希望放置在分布式缓存中的本地文件列表。
所以 getShipFiles 从本地文件中获取文件,而 Cache 从 HDFS 中获取文件。
【讨论】: