【发布时间】:2015-05-01 16:49:07
【问题描述】:
我想将 DBLP 数据集解析成这样的简单输出
Munir Cochinwala: C. Lee - K. C. Lee
Hongli Deng: Linda Shapiro - Linda G. Shapiro
William Retert: John Boyland - John Tang Boyland
Ales Prazák: Josef V. Psutka - Josef Psutka
M. N. S. Swamy: C. Duanmu - C. J. Duanmu
Bonifacio Martín Galán: Maria del Carmen Arellano Pardo - Carmen Arellano
........
我已经尝试过他们的simple parser,但是堆空间不足。然后我将 xerceslmp.jar 包含到项目库中。此外,我使用 -Xmx2G 将其内存增加到 2G,但我仍然在线程“main”java.lang.OutOfMemoryError 中遇到异常:超出 GC 开销限制。我在 Netbeans 中创建了这个项目,并使用这些参数自定义了它的默认运行配置。
*已编辑 这是我的java
dhcPlus-mbp:fresh-run macbook$ java -version
java version "1.7.0_71"
Java(TM) SE Runtime Environment (build 1.7.0_71-b14)
Java HotSpot(TM) 64-Bit Server VM (build 24.71-b01, mixed mode)
任何帮助将不胜感激。谢谢。
【问题讨论】:
标签: java parsing xml-parsing