【问题标题】:Pentaho | GC overhead limit exceeded五角大楼 |超出 GC 开销限制
【发布时间】:2017-02-24 18:07:37
【问题描述】:

我想将 xlsx 文件中的数据插入表中。 Excel 有大约 1,20,000 条记录。但是在运行转换时,我遇到了以下错误:

超出 GC 开销限制

我换了spoon.bat

Xmx2g -XX:MaxPermSize=1024m

但我仍然收到此错误。

有人可以帮忙吗?

【问题讨论】:

  • 尝试更多地使用 Xmx,看看是否有帮助。另外值得使用ps 命令来查看您设置的参数是否实际适用于进程。
  • 您找到解决方案了吗?

标签: garbage-collection pentaho pentaho-spoon pentaho-design-studio pentaho-data-integration


【解决方案1】:

这是 apache POI 的一个已知错误。 xlsx 输入步骤无法读取大文件。 在这种情况下,我通常将我的文件转换为 CVS。 这是jira案例。 http://jira.pentaho.com/browse/PDI-5269

环境变量 PENTAHO_DI_JAVA_OPTIONS 用于在 jre 的开头添加选项。我的设置为“-Xms512m -Xmx3000M -XX:MaxPermSize=256m”

【讨论】:

    【解决方案2】:

    在我的例子中,除了添加 Xms 和 Xmx 参数(这并没有完全解决它)我添加了选项 -XX:-UseGCOverheadLimit 到spoon.sh并且问题解决了。

    【讨论】:

      【解决方案3】:

      将文件拆分为两个不同的文件,将一半的数据保存在一个文件中,将剩余的数据保存在另一个文件中。效果很好。

      【讨论】:

        猜你喜欢
        • 2011-05-21
        • 2017-12-27
        • 2013-07-13
        • 2018-03-29
        • 2012-04-02
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多