【问题标题】:pdfbox extract word coordinatespdfbox提取单词坐标
【发布时间】:2018-07-08 03:54:45
【问题描述】:

你好这个问题参考之前的帖子:

Could someone give me an example of how to extract coordinates for a 'word' using PDFBox

我正在使用 PDFBOX 2.0.10

我已成功编译组合代码,但在尝试运行示例时出现异常错误。

提供的解决方案没有标准的主要方法,这是我感到困惑的地方。

有人可以告诉我如何成功运行组合代码。

package org.apache.pdfbox.examples.text;
import java.io.File;
import java.io.IOException;
import java.io.ByteArrayOutputStream;
import java.io.InputStream;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.util.ArrayList;
import java.util.List;
import org.apache.pdfbox.examples.text.ExtractWordCoordinates;
public class ExtractWordCoordinates2 {
    public static void main(String[] args) throws IOException {
        ExtractWordCoordinates ewc = new ExtractWordCoordinates();
       ewc.testExtractWordsForGoodJuJu();
    }
}

堆栈跟踪

Jul 08, 2018 4:15:41 PM org.apache.pdfbox.pdmodel.graphics.color.PDDeviceRGB suggestKCMS
INFO: To get higher rendering speed on java 8 oder 9,
Jul 08, 2018 4:15:41 PM org.apache.pdfbox.pdmodel.graphics.color.PDDeviceRGB suggestKCMS
INFO:   use the option -Dsun.java2d.cmm=sun.java2d.cmm.kcms.KcmsServiceProvider
Jul 08, 2018 4:15:41 PM org.apache.pdfbox.pdmodel.graphics.color.PDDeviceRGB suggestKCMS
INFO:   or call System.setProperty("sun.java2d.cmm", "sun.java2d.cmm.kcms.KcmsServiceProvider")
Exception in thread "main" java.lang.NullPointerException
        at org.apache.pdfbox.io.ScratchFile.createBuffer(ScratchFile.java:422)
        at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1142)
        at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1041)
        at org.apache.pdfbox.examples.text.ExtractWordCoordinates.testExtractWordsForGoodJuJu(ExtractWordCoordinates.java:47)
        at org.apache.pdfbox.examples.text.ExtractWordCoordinates2.main(ExtractWordCoordinates2.java:17)

ExtractWordCoordinates 可以在这里找到 https://github.com/mkl-public/testarea-pdfbox2/blob/master/src/test/java/mkl/testarea/pdfbox2/extract/ExtractWordCoordinates.java#L69

【问题讨论】:

  • "getting exception error" - 哪个异常?请包括堆栈跟踪。

标签: coordinates extract pdfbox word


【解决方案1】:

问题解决了。

ExtractWordCoordinates 中的以下行返回空值:

    try (   InputStream resource = getClass().getResourceAsStream("apache.pdf")) {

将文档 (apache.pdf) 复制到与 ExtractWordCoordinates.class 相同的目录后,代码运行成功。

【讨论】:

    猜你喜欢
    • 2012-08-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-11
    • 2014-04-27
    • 2012-01-20
    • 1970-01-01
    • 2011-10-11
    相关资源
    最近更新 更多