【问题标题】:Pentaho Data Integration - Dump Excel into tablePentaho 数据集成 - 将 Excel 转储到表格中
【发布时间】:2017-08-04 18:26:46
【问题描述】:

我对这个工具很陌生,想做一个简单的操作:

将数据从 XML 转储到表中。

我有一个 Excel 文件,大约有 10-12 张纸,几乎每张纸都对应一个表格。

第一次Excel输入操作没有问题。

唯一的问题是,我不知道为什么,但是当我尝试编辑(显示工作表列表或获取列列表)第二个 Excel 输入时,软件只是挂起,当它响应时打开带有错误的警告。

这是我正在尝试使用的实际图表的图像:

【问题讨论】:

  • 尝试手动编写 Excel 单元格并运行作业。您正在使用的 excel 文件的大小是多少?
  • 这就像 5MB 的文件,有些工作表有数千行

标签: excel pentaho pentaho-data-integration


【解决方案1】:

这是典型的内存不足问题。 PDI 无法读取文件,需要更多内存来处理 excel 文件。您需要为 PDI 提供更多内存来处理您的 Excel。尝试增加勺子的内存。你可以阅读Increase Spoon memory

或者,尝试使用几行数据复制您的 excel 文件,以保持文件结构不变,例如一个测试文件。您可以使用该测试文件在 excel 步骤中生成必要的工作表名称和列。完成后,您可以指向原始文件并执行作业。

【讨论】:

  • 是的,@Rishu 提出了正确的解决方案。对于信息,占用大量内存的不是读取数据,而是使用 Apache POI 读取数据结构。所以,建议是在一个小电子表格上读取结构,一旦完成,在大 xls 上使用该结构(无需重新解码)。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-03-06
相关资源
最近更新 更多