【发布时间】:2021-10-08 04:03:30
【问题描述】:
想要使用 Synapse 笔记本 (pyspark) 获取数据湖中文件的最后更新日期时间。 我们有什么开箱即用的选项吗?
【问题讨论】:
-
我正在使用 mssparkutils.fs.ls 来获取给定位置的文件列表。获取此列表按文件修改日期排序的任何线索都会有所帮助。
-
您是否限制使用 Synapse 笔记本?如果适合您,也可以使用 Azure 数据工厂来完成。
标签: python azure-data-lake azure-synapse