【发布时间】:2020-02-24 23:44:18
【问题描述】:
我在我的 Hive 控制台/.hiverc 文件中使用以下属性,因此每当我查询表时,它都会更新 Hive 元存储的 TBLS 表中的 LAST_ACCESS_TIME 列。
set hive.exec.pre.hooks = org.apache.hadoop.hive.ql.hooks.UpdateInputAccessTimeHook$PreExec;
但是,如果我使用 spark-sql 或 spark-shell,它似乎不起作用,LAST_ACCESS_TIME 不会在 hive 元存储中更新。
这是我阅读表格的方式:
>>> df = spark.sql("select * from db.sometable")
>>> df.show()
我在hive-site.xml 和/etc/hive/conf 和/etc/spark/conf 中都设置了上述钩子。
【问题讨论】:
标签: apache-spark pyspark hive apache-spark-sql