【发布时间】:2020-04-27 08:07:40
【问题描述】:
我正在尝试为某些测试填充最大可能的 Glue 作业指标,以下是我创建的设置:
- 爬虫从放置在 S3 存储桶中的 CSV 文件中读取数据(500 行的虚拟客户数据)。
- 使用另一个爬虫来爬取在 Redshift 集群中创建的表。
- ETL 作业最终从 s3 中的 csv 文件读取数据并将其转储到 Redshift 表中。
作业正在运行,没有任何问题,我可以看到最终数据被转储到 Redshift 表中,但是,最后,只有不到 5 个 Cloudwatch 指标被填充:
- glue.jvm.heap.usage
- glue.jvm.heap.used
- glue.s3.filesystem.read_bytes
- glue.s3.filesystem.write_bytes
- glue.system.cpuSystemLoad
还有大约 20 个指标未填充。
还有关于如何填充这些剩余指标的任何建议吗?
【问题讨论】:
标签: amazon-web-services amazon-s3 amazon-redshift metrics aws-glue