【发布时间】:2022-01-17 12:46:42
【问题描述】:
我可以创建 0 字节的 ORC 文件吗?
我想测试
- 如果 hive 可以毫无例外地将 0 字节文件加载到外部表中。
- 如果python可以毫无例外地读取0字节的orc文件。
for filename in glob.glob(orc_path):
with open(filename, 'rb') as file:
data = orc.ORCFile(file)
有什么方法可以使用 spark/python/hive 或在命令行中创建 ORC 文件?
提前感谢您的帮助!
【问题讨论】:
-
0字节的ORC文件有效吗?至少,文件末尾有一个部分包含用于解析文件其余部分的信息。即使文件中没有数据,该部分也有其他部分的大小信息,因此会使用字节来表示文件的其余部分没有任何内容。