【发布时间】:2015-08-10 06:33:43
【问题描述】:
在 EMR 中的 Spark 上运行作业时,我无法在 Scala 中找到来自 println 调用的错误日志或消息。
我在哪里可以访问这些?
我正在提交Spark job,使用script-runner.jar 将Scala 写入EMR,参数--deploy-mode 设置为cluster 和--master 设置为yarn。它运行良好。
但是我在Amazon EMR UI 中没有看到我的println 语句,它列出了“stderr, stdoutetc. Furthermore if my job errors I don't see why it had an error. All I see is this in thestderr`:
15/05/27 20:24:44 INFO yarn.Client: Application report from ResourceManager:
application identifier: application_1432754139536_0002
appId: 2
clientToAMToken: null
appDiagnostics:
appMasterHost: ip-10-185-87-217.ec2.internal
appQueue: default
appMasterRpcPort: 0
appStartTime: 1432758272973
yarnAppState: FINISHED
distributedFinalState: FAILED
appTrackingUrl: http://10.150.67.62:9046/proxy/application_1432754139536_0002/A
appUser: hadoop
`
【问题讨论】:
标签: scala apache-spark emr