【发布时间】:2018-09-27 02:01:29
【问题描述】:
我正在向 dataproc 发出一个 spark-sql 作业,它只显示表中的一些数据:
gcloud dataproc jobs submit spark-sql --cluster mycluster --region europe-west1 -e "select * from mydb.mytable limit 10"
当数据返回并输出到标准输出时,我看不到列标题,我只看到原始数据,空格分隔。我真的希望输出的格式更好,特别是我想看到列标题。我试过这个:
gcloud dataproc jobs submit spark-sql --cluster mycluster --region europe-west1 -e "SET hive.cli.print.header=true;select * from mydb.mytable limit 10"
但它没有任何影响。
有没有办法让 spark-sql 在 dataproc 上显示列标题?
如果有办法让数据显示如下:
+----+-------+
| ID | Name |
+----+-------+
| 1 | Jim |
| 2 | Ann |
| 3 | Simon |
+----+-------+
那就更好了。
【问题讨论】:
标签: apache-spark-sql google-cloud-dataproc