ECSクラスターサービスで起動→削除→起動…を繰り返して無限ループする│Soy Pocket

こんにちはますのです。
コンテナを触ったことが無いわたしにも触る機会が舞い降りてきました。

AWSのAmazon ECS内：クラスター、クラスターサービスを構築します。
既存環境を見ながら設定をしていく簡単な作業です。

しかし、そう思ったのも束の間。
パラメータ値が同じなのに、現行では出ないトラブルが発生。

この現象あるあるですが勘弁してほしいものです…。

ECS構築時トラブルの概要

ELBのヘルスチェックに失敗していることが原因の様子…。
しかし、ALBのヘルスチェックの時間を延ばしても変化は起きませんでした。

停止理由：Task failed ELB health checks in (target-group arn:aws:elasticloadbalancing:ap-northeast-1:123456789012:targetgroup/container/123456123456abc)

色々とサイトを見ていたところ、ECSクラスタ＞サービスの「ヘルスチェックの猶予期間」が短いことが原因でした。
※最初に0→180(3分)に変更して変化が無かったのが調査に長引いた要因に…。

事の流れとしてはこんな感じのようです。

そのため、ずっとデプロイと削除を繰り返し行う動きになっていたようですね。

最後はECS側の「ヘルスチェックの猶予期間」を3600秒(60分)にまで延長したらうまく行きました。

既存環境と同じ構成なのにデプロイに時間が掛かる原因は分かりませんでした。
以降は特に影響出ていないので、問題無いと判断してこのまま走らせることを決意したのであります。

AWS ECSにて、サービスで実行したタスクが3分置きに停止してしまう原因がわからない
https://teratail.com/questions/262962

最新情報をチェックしよう！