【发布时间】:2019-02-09 02:30:41
【问题描述】:
我有一个 oracle 表“order”,它有一个 clob 列“description”,主键是 varchar2“Id”。我正在阅读该列,并且对于表中的每条记录,我正在写入一个 txt 文件 - order_Id.txt。表有大约 400000000 条记录,使用文本文件输出写入文件会导致内存不足堆错误并超出 gc 开销限制。如何分块处理数据?
- 调整了spoon.bat 中的-Xmx 设置
- m/c 有 16gb 内存
*其他详细信息 * 1. 这些是spoon.bat 中的设置。我正在使用水壶 PDI 7.0 设置 PENTAHO_DI_JAVA_OPTIONS="-Xms5500m" "-Xmx15000m" "-XX:MaxPermSize=12384m" 2. 我已将 KETTLE_FILE_OUTPUT_MAX_STREAM_COUNT 和 KETTLE_FILE_OUTPUT_MAX_STREAM_LIFE 也设置为 1000 3.我仍然看到它没有完成\刷新文件。它继续写入空白文件并最终中断 4.我附上了我正在做的确切步骤的截图
【问题讨论】:
标签: kettle