【问题标题】:Set up OpenNLP: Text Detection using the Vision java API设置 OpenNLP:使用 Vision java API 进行文本检测
【发布时间】:2016-08-04 12:26:17
【问题描述】:

设置 OpenNLP
下载 Tokenizer 数据并将其保存到此目录。

wget http://opennlp.sourceforge.net/models-1.5/en-token.bin

这是谷歌在here问我的问题

我不知道 OpenNLP 是什么,所以我 google 它。

这是 Apache 在其设置 OpenNLP 页面上所说的:

如果您安装了诸如 NetBeans 或 Eclipse 之类的 IDE,它 将使您的开发更容易。但是,勇敢地继续前进

我有 Intellij NetBeans,如何设置它?

在 Intellij 中使用 maven 构建并尝试运行此示例时,这是我得到的错误:

java.io.FileNotFoundException: en-token.bin (The system cannot find the file specified)

当我尝试继续使用 Google 文档时,我在这一行中失败了:

java -cp target/vision-text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp data/

出现错误:

Error: Could not find or load main class com.google.cloud.vision.samples.text.TextApp

【问题讨论】:

    标签: java maven netbeans intellij-idea opennlp


    【解决方案1】:

    看起来你从 OpenNLP 中需要的只是 Tokeniser .bin 文件——这只是库用来对文本进行标记的二进制文件(例如,将句子拆分为单词)。看起来你不需要从那个库中获得任何其他东西 - 如果你查看谷歌视觉 pom 文件(https://github.com/GoogleCloudPlatform/java-docs-samples/blob/master/vision/text/pom.xml),你会看到它们依赖于 OpenNLP JAR,所以在这里你只是抓住了预训练的该库的资源。

    假设你已经克隆了那个 GitHub repo,并且已经成功运行了他们提到的 maven 命令:

    mvn clean compile assembly:single
    

    然后应该将下载的文件 (en-token.bin) 复制到项目目录的根目录(与 pom.xml 相同的位置以及运行 java 命令的位置)。

    如果设置是这样的,那么它应该可以正常工作。

    【讨论】:

    • 执行 clean 我得到:无法执行目标 org.apache.maven.plugins:maven-compiler-plugin:3.3:compile (default-compile) on project text: Fatal error compile: invalid target发布:1.8
    • 听起来像是 java 版本冲突 - 假设需要 java 8,你本地有什么?
    • 是的,这是 mvn 中的 java 问题
    猜你喜欢
    • 2020-01-27
    • 2019-04-24
    • 2017-02-16
    • 2023-03-13
    • 2017-11-28
    • 1970-01-01
    • 1970-01-01
    • 2017-10-20
    • 1970-01-01
    相关资源
    最近更新 更多