【发布时间】:2016-03-01 11:47:24
【问题描述】:
PDI 在使用 Microsoft Excel Writer 写入 excel xlsx 文件方面效率低下。
如果数据是手动转换的,Pentaho 输出中转换的 excel 数据文件的大小似乎是原来的三倍。这种低效率是预期的还是有解决方法的。
具有相同转换输出的 CSV 文件的大小要小得多。我配置错了吗?
【问题讨论】:
-
你能举出具体的例子吗?在我的小测试中,使用 PDI 创建的 xlsx 文件的大小是使用 Excel 创建的类似文件的 40%。
-
最近的一个测试用例,CSV 文件输出为 5.7Mb,但 Excel 编写器输出 xlsx 文件为 8.9Mb。通常,xlsx 文件必须比 csv 文件小得多。是否有任何配置我们可能需要检查 Pentaho 中的 Microsoft excel writer。
-
你能列出 zip 文件的内容,列出文件大小和压缩率吗?
-
文件夹 - docProps、xl、_rels。文件 [Content_Types.xml]。那么在您执行的测试中,您的文件最终大小是否增加了 40% 或更小
-
Excel 创建的文件比 Pentaho 大 40%。
标签: excel pentaho etl kettle pentaho-spoon