设置 OpenNLP：使用 Vision java API 进行文本检测答案

【问题标题】：Set up OpenNLP: Text Detection using the Vision java API设置 OpenNLP：使用 Vision java API 进行文本检测
【发布时间】：2016-08-04 12:26:17
【问题描述】：

设置 OpenNLP
下载 Tokenizer 数据并将其保存到此目录。

wget http://opennlp.sourceforge.net/models-1.5/en-token.bin

这是谷歌在here问我的问题

我不知道 OpenNLP 是什么，所以我 google 它。

这是 Apache 在其设置 OpenNLP 页面上所说的：

如果您安装了诸如 NetBeans 或 Eclipse 之类的 IDE，它将使您的开发更容易。但是，勇敢地继续前进。

我有 Intellij NetBeans，如何设置它？

在 Intellij 中使用 maven 构建并尝试运行此示例时，这是我得到的错误：

java.io.FileNotFoundException: en-token.bin (The system cannot find the file specified)

当我尝试继续使用 Google 文档时，我在这一行中失败了：

java -cp target/vision-text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp data/

出现错误：

Error: Could not find or load main class com.google.cloud.vision.samples.text.TextApp

【问题讨论】：

标签： java maven netbeans intellij-idea opennlp

【解决方案1】：

看起来你从 OpenNLP 中需要的只是 Tokeniser .bin 文件——这只是库用来对文本进行标记的二进制文件（例如，将句子拆分为单词）。看起来你不需要从那个库中获得任何其他东西 - 如果你查看谷歌视觉 pom 文件（https://github.com/GoogleCloudPlatform/java-docs-samples/blob/master/vision/text/pom.xml），你会看到它们依赖于 OpenNLP JAR，所以在这里你只是抓住了预训练的该库的资源。

假设你已经克隆了那个 GitHub repo，并且已经成功运行了他们提到的 maven 命令：

mvn clean compile assembly:single

然后应该将下载的文件 (en-token.bin) 复制到项目目录的根目录（与 pom.xml 相同的位置以及运行 java 命令的位置）。

如果设置是这样的，那么它应该可以正常工作。

【讨论】：

执行 clean 我得到：无法执行目标 org.apache.maven.plugins:maven-compiler-plugin:3.3:compile (default-compile) on project text: Fatal error compile: invalid target发布：1.8
听起来像是 java 版本冲突 - 假设需要 java 8，你本地有什么？
是的，这是 mvn 中的 java 问题