【发布时间】:2019-11-10 22:34:59
【问题描述】:
我有一个 avro 文件格式的配置单元表(比如 table1),包含 1900 列。当我在 hive 中查询表时 - 我能够获取数据,但是当我在 spark sql 中查询同一个表时,我发现 Metastore 客户端失去了连接。正在尝试重新连接
我还查询了另一个 avro 文件格式的 hive 表(比如 table2),它有 130 列,它在 hive 和 spark 中获取数据。
我观察到的是我可以在 table2 的 hdfs 位置看到数据,但在 table1 hdfs 位置看不到任何数据(但是当我只在 hive 中查询时它正在获取数据)
【问题讨论】:
-
当您从 Spark 查询此 table1 时,您是否一直收到错误 - “Metastore 客户端丢失连接”?当您看到错误时,值得检查 HMS 和后端数据库的可用性。
标签: apache-spark hadoop hive apache-spark-sql