【发布时间】:2022-07-08 04:19:07
【问题描述】:
我们知道, 从 pyspark 脚本(aws 粘合作业)写入 AWS 数据目录的过程是写入 s3 存储桶(eg.csv),使用爬虫并调度它。
还有其他写入 aws 胶水数据目录的方法吗? 我正在寻找一种直接的方法来做到这一点。例如。写入为 hudi 表并同步到 aws 胶水数据目录。
【问题讨论】:
标签: amazon-web-services aws-glue aws-glue-data-catalog aws-glue-spark