【发布时间】:2023-02-07 14:50:38
【问题描述】:
我有一个 ECS 集群,我在其中放置一个作为守护进程运行的容器来监视所有其他进程。但是,我看到这个容器不时地被 OOM 杀死而没有留下任何痕迹。我只是碰巧发现其中一个被杀。这导致了一些日志重复,但我想知道是否有一种方法可以跟踪这些重新启动,因为当我查看 ECS 集群事件时,没有关于此任务以任何方式重新启动的信息。
我对 kubernetes 了解更多,所以我会在这里打个比方。当这种情况发生在 kubernetes 上时,当您从所有 pod (kubectl get pods) 获取信息时,您会看到一个 RESTARTS 计数器,有什么方法可以找到有关 AWS ECS 任务的信息吗?我正在努力寻找文档
我确定了任务,还确定了每个任务的状态以获取更多信息,但我找不到任何提示该进程之前已重新启动或终止。
这是一个任务细节示例
- attachments: []
attributes:
- name: ecs.cpu-architecture
value: x86_64
availabilityZone: us-east-2c
clusterArn: arn:aws:ecs:us-west-2:99999999999:cluster/dev
connectivity: CONNECTED
connectivityAt: '2023-01-24T23:03:23.315000-05:00'
containerInstanceArn: arn:aws:ecs:us-east-2:99999999999:container-instance/dev/eb8875fhfghghghfjyjk88c8f96433b8
containers:
- containerArn: arn:aws:ecs:us-east-2:99999999999:container/dev/05d4a402ee274a3ca90a86e46292a63a/e54af51f-2420-47ab-bff6-dcd4f976ad2e
cpu: '500'
healthStatus: HEALTHY
image: public.ecr.aws/datadog/agent:7.36.1
lastStatus: RUNNING
memory: '750'
name: datadog-agent
networkBindings:
- bindIP: 0.0.0.0
containerPort: 8125
hostPort: 8125
protocol: udp
- bindIP: 0.0.0.0
containerPort: 8126
hostPort: 8126
protocol: tcp
networkInterfaces: []
runtimeId: 75559b7327258d69fe61cac2dfe58b12d292bdb7b3a720c457231ee9e3e4190a
taskArn: arn:aws:ecs:us-east-2:99999999999:task/dev/05d4a402ee274a3ca90a86e46292a63a
cpu: '500'
createdAt: '2023-01-24T23:03:22.841000-05:00'
desiredStatus: RUNNING
enableExecuteCommand: false
group: service:datadog-agent
healthStatus: HEALTHY
lastStatus: RUNNING
launchType: EC2
memory: '750'
overrides:
containerOverrides:
- name: datadog-agent
inferenceAcceleratorOverrides: []
pullStartedAt: '2023-01-24T23:03:25.471000-05:00'
pullStoppedAt: '2023-01-24T23:03:39.790000-05:00'
startedAt: '2023-01-24T23:03:47.514000-05:00'
startedBy: ecs-svc/1726924224402147943
tags: []
taskArn: arn:aws:ecs:us-west-2:99999999999:task/dev/05d4a402ee274a3ca90a86e46292a63a
taskDefinitionArn: arn:aws:ecs:us-west-2:99999999999:task-definition/datadog-agent-task:5
version: 2
【问题讨论】:
标签: amazon-web-services amazon-ecs datadog