【问题标题】:Conversion API NPE when converting PDF to plaintext将 PDF 转换为纯文本时的转换 API NPE
【发布时间】:2012-08-20 19:31:42
【问题描述】:

我正在编写一些代码来使用 GAE 的转换 API 对 PDF 进行验证。目前,运行“ConversionResult result = service.convert(conv);”时出现空指针错误。我试图复制教程(https://developers.google.com/appengine/docs/java/conversion/overview)中包含的代码,但我不得不从 BlobStore 获取 Asset 对象。我在下面粘贴了代码和堆栈跟踪;任何想法可能有什么问题?我尝试过尝试... catch,但这只会导致该方法安静地失败。此外,我不能使用内置的错误代码方法,因为没有创建 ConversionResult 对象。我一直在寻找解决这个问题的方法,虽然我发现了一些类似问题的帖子,但我还没有找到任何解决方案。此外,每个人似乎都在使用我上面链接的相同示例代码; google 真的没有更多关于 Conversion 的文档了吗?

感谢您的帮助!

public static void parse(String key, BlobKey bkey) throws IOException {

        BlobstoreInputStream in = new BlobstoreInputStream(bkey);
        byte[] attachmentData = IOUtils.toByteArray(in);
        in.read(attachmentData);

        System.out.println(attachmentData.toString());
        System.out.println(attachmentData.length);
        System.out.println("parse(): blob fetched");

        //Prep for conversion
        Asset fileAsset = new Asset("application/pdf", attachmentData);
        System.out.println(fileAsset.getData().toString());
        Document pdfDoc = new Document(fileAsset);

        ConversionOptions options = ConversionOptions.Builder
                .withOcrInputLanguage("en");
        Conversion conv = new Conversion(pdfDoc, "text/plain", options);
        if (conv.equals(null))
            System.out.println("Conversion is null!");

        // Actual conversion (takes a while!)
        ConversionService service = ConversionServiceFactory.getConversionService();
        if (service.equals(null))
            System.out.println("Service is null!");
        // Fails below!!
        // ¯\(°_o)/¯
        ConversionResult result = service.convert(conv);
        ConversionErrorCode err = result.getErrorCode();
        System.out.println(err.toString());

        // Check for success, return conversion as String
        System.out.println("parse(): 7");
        if (result.success()) {
            System.out.println("parse(): 8");
            // Usually, there will only be 1 asset, but running it through a for loop to be sure
            System.out.println("parse(): 9");
            for (Asset asset : result.getOutputDoc().getAssets()) {
                System.out.println("parse(): 10");
                String text = new String(asset.getData());
                System.out.println("parse(): 11");
                System.out.println(text);

            }
        }
        else { //PDF not converted
            System.out.println("Error: PDF not converted");
            // Maybe add more error handling

        }
}

警告

2012 年 8 月 20 日下午 3:10:55 com.google.apphosting.utils.jetty.JettyLogger 警告

警告:/verifyPDF.jsp java.lang.NullPointerException 在 com.google.appengine.api.conversion.ConversionServicePb$AssetInfo$Builder.setName(ConversionServicePb.java:886) 在 com.google.appengine.api.conversion.AssetProtoConverter.doForward(AssetProtoConverter.java:30) 在 com.google.appengine.api.conversion.AssetProtoConverter.doForward(AssetProtoConverter.java:17) 在 com.google.appengine.repackaged.com.google.common.base.Converter.convert(Converter.java:52) 在 com.google.appengine.api.conversion.DocumentProtoConverter.doForward(DocumentProtoConverter.java:33) 在 com.google.appengine.api.conversion.DocumentProtoConverter.doForward(DocumentProtoConverter.java:18) 在 com.google.appengine.repackaged.com.google.common.base.Converter.convert(Converter.java:52) 在 com.google.appengine.api.conversion.ConversionProtoConverter.doForward(ConversionProtoConverter.java:38) 在 com.google.appengine.api.conversion.ConversionProtoConverter.doForward(ConversionProtoConverter.java:16) 在 com.google.appengine.repackaged.com.google.common.base.Converter.convert(Converter.java:52) 在 com.google.appengine.api.conversion.ConversionRequestProtoConverter.doForward(ConversionRequestProtoConverter.java:40) 在 com.google.appengine.api.conversion.ConversionRequestProtoConverter.doForward(ConversionRequestProtoConverter.java:19) 在 com.google.appengine.repackaged.com.google.common.base.Converter.convert(Converter.java:52) 在 com.google.appengine.api.conversion.ConversionServiceImpl.convertAsync(ConversionServiceImpl.java:94) 在 com.google.appengine.api.conversion.ConversionServiceImpl.convert(ConversionServiceImpl.java:66) 在 com.google.appengine.api.conversion.ConversionServiceImpl.convert(ConversionServiceImpl.java:59) 在 coupflipsite.PDFVerify.parse(PDFVerify.java:73) 在 org.apache.jsp.verifyPDF_jsp._jspService(verifyPDF_jsp.java:65) 在 org.apache.jasper.runtime.HttpJspBase.service(HttpJspBase.java:97) 在 javax.servlet.http.HttpServlet.service(HttpServlet.java:717) 在 org.apache.jasper.servlet.JspServletWrapper.service(JspServletWrapper.java:377) 在 org.apache.jasper.servlet.JspServlet.serviceJspFile(JspServlet.java:313) 在 org.apache.jasper.servlet.JspServlet.service(JspServlet.java:260) 在 com.google.appengine.tools.development.PrivilegedJspServlet.access 101 美元(PrivilegedJspServlet.java:23) 在 com.google.appengine.tools.development.PrivilegedJspServlet$2.run(PrivilegedJspServlet.java:59) 在 java.security.AccessController.doPrivileged(本机方法) 在 com.google.appengine.tools.development.PrivilegedJspServlet.service(PrivilegedJspServlet.java:57) 在 javax.servlet.http.HttpServlet.service(HttpServlet.java:717) 在 org.mortbay.jetty.servlet.ServletHolder.handle(ServletHolder.java:511) 在 org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1166) 在 com.google.appengine.tools.development.HeaderVerificationFilter.doFilter(HeaderVerificationFilter.java:35) 在 org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1157) 在 com.google.appengine.api.blobstore.dev.ServeBlobFilter.doFilter(ServeBlobFilter.java:60) 在 org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1157) 在 com.google.apphosting.utils.servlet.TransactionCleanupFilter.doFilter(TransactionCleanupFilter.java:43) 在 org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1157) 在 com.google.appengine.tools.development.StaticFileFilter.doFilter(StaticFileFilter.java:125) 在 org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1157) 在 com.google.appengine.tools.development.BackendServersFilter.doFilter(BackendServersFilter.java:97) 在 org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1157) 在 org.mortbay.jetty.servlet.ServletHandler.handle(ServletHandler.java:388) 在 org.mortbay.jetty.security.SecurityHandler.handle(SecurityHandler.java:216) 在 org.mortbay.jetty.servlet.SessionHandler.handle(SessionHandler.java:182) 在 org.mortbay.jetty.handler.ContextHandler.handle(ContextHandler.java:765) 在 org.mortbay.jetty.webapp.WebAppContext.handle(WebAppContext.java:418) 在 com.google.appengine.tools.development.DevAppEngineWebAppContext.handle(DevAppEngineWebAppContext.java:94) 在 org.mortbay.jetty.handler.HandlerWrapper.handle(HandlerWrapper.java:152) 在 com.google.appengine.tools.development.JettyContainerService$ApiProxyHandler.handle(JettyContainerService.java:370) 在 org.mortbay.jetty.handler.HandlerWrapper.handle(HandlerWrapper.java:152) 在 org.mortbay.jetty.Server.handle(Server.java:326) 在 org.mortbay.jetty.HttpConnection.handleRequest(HttpConnection.java:542) 在 org.mortbay.jetty.HttpConnection$RequestHandler.content(HttpConnection.java:938) 在 org.mortbay.jetty.HttpParser.parseNext(HttpParser.java:755) 在 org.mortbay.jetty.HttpParser.parseAvailable(HttpParser.java:218) 在 org.mortbay.jetty.HttpConnection.handle(HttpConnection.java:404) 在 org.mortbay.io.nio.SelectChannelEndPoint.run(SelectChannelEndPoint.java:409) 在 org.mortbay.thread.QueuedThreadPool$PoolThread.run(QueuedThreadPool.java:582)

【问题讨论】:

    标签: java google-app-engine


    【解决方案1】:

    首先:转换API是being decommissioned in Nov 2012。你应该换别的东西。

    关于您的问题 - 尝试将“name”参数添加到 Asset 构造函数:

    Asset fileAsset = new Asset("application/pdf", attachmentData, "filename.pdf");
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-08-27
      • 2010-11-06
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多