【问题标题】:DBLP parser java OutOfMemoryErrorDBLP 解析器 java OutOfMemoryError
【发布时间】:2015-05-01 16:49:07
【问题描述】:

我想将 DBLP 数据集解析成这样的简单输出

Munir Cochinwala: C. Lee - K. C. Lee  
Hongli Deng: Linda Shapiro - Linda G. Shapiro    
William Retert: John Boyland - John Tang Boyland   
Ales Prazák: Josef V. Psutka - Josef Psutka
M. N. S. Swamy: C. Duanmu - C. J. Duanmu
Bonifacio Martín Galán: Maria del Carmen Arellano Pardo - Carmen Arellano
........

我已经尝试过他们的simple parser,但是堆空间不足。然后我将 xerceslmp.jar 包含到项目库中。此外,我使用 -Xmx2G 将其内存增加到 2G,但我仍然在线程“main”java.lang.OutOfMemoryError 中遇到异常:超出 GC 开销限制。我在 Netbeans 中创建了这个项目,并使用这些参数自定义了它的默认运行配置。

*已编辑 这是我的java

dhcPlus-mbp:fresh-run macbook$ java -version
java version "1.7.0_71"
Java(TM) SE Runtime Environment (build 1.7.0_71-b14)
Java HotSpot(TM) 64-Bit Server VM (build 24.71-b01, mixed mode)

任何帮助将不胜感激。谢谢。

【问题讨论】:

    标签: java parsing xml-parsing


    【解决方案1】:

    我最近一直在从事一个涉及 DBLP 的项目,并且遇到了同样的问题。 什么对我有用:

    javac Parser.java java (-mx900M) -DentityExpansionLimit=1000000 解析器 dblp.xml > 文件名.txt

    我建议省略 (-mx900M),这是对您的内存的优化,但只有在您拥有 java 1.5(我不认为)时才能正确执行。只是因为这个人使用了一些石器时代的 xml 解析器。

    我建议您尝试几个不同版本的 Java。解析器是用 Java 1.6 编写的,这是我使用的版本。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-09-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多