【发布时间】:2017-08-13 17:15:56
【问题描述】:
我正在尝试使用 Apache Beam 0.6.0 在 GCP 上启动 Dataflow 作业。我正在使用 shade 插件编译一个 uber jar,因为我无法使用“mvn:execjava”启动该作业。我包括这个依赖:
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-runners-google-cloud-dataflow-java</artifactId>
<version>0.6.0-SNAPSHOT</version>
</dependency>
我收到以下异常:
Exception in thread "main" java.lang.IllegalArgumentException: Unknown 'runner' specified 'DataflowRunner', supported pipeline runners [DirectRunner]
at org.apache.beam.sdk.options.PipelineOptionsFactory.parseObjects(PipelineOptionsFactory.java:1609)
at org.apache.beam.sdk.options.PipelineOptionsFactory.access$400(PipelineOptionsFactory.java:104)
at org.apache.beam.sdk.options.PipelineOptionsFactory$Builder.as(PipelineOptionsFactory.java:289)
at com.disney.dtss.desa.tools.SpannerSinkTest.main(SpannerSinkTest.java:116)
Caused by: java.lang.ClassNotFoundException: DataflowRunner
at java.net.URLClassLoader.findClass(URLClassLoader.java:381)
at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:331)
at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:264)
at org.apache.beam.sdk.options.PipelineOptionsFactory.parseObjects(PipelineOptionsFactory.java:1595)
我还错过了什么吗?
【问题讨论】:
-
如果 DataflowRunner 未注册,这绝对是预期的输出。你能分享更多关于你的 pom.xml、你的 mvn 调用,或者你的 uber jar 的内容列表以及你是如何调用它的吗?
-
我遇到了同样的问题。当我通过
mvn compile exec:java启动管道时它工作正常,当我构建 jar 时它失败了。 uberjar 包含必要的类。
标签: java maven google-cloud-dataflow apache-beam dataflow