AWS Storage Gatewayがオフラインから変わらない時にチェックすること

AWS

Twitterで話題のはたらかないいきもの図鑑。
シャチク・ド・ニチの状態が非常に当てはまっておりました。ますのです。

さて、先日AWSからストレージゲートウェイのアップデートするよ!的なメールが届きました。そこでストレージゲートウェイをアップデートしたところ「オフライン」から変わらない。。。。という状況になりましたのです。泣ける。

原因は推奨インスタンスタイプを利用していなかったからなのです。完全に自業自得。

今回は原因調査の際に、ストレージゲートウェイとして利用しているEC2に接続して調べたため、そのやり方をメモしていきます!

発生したトラブルと調査対象について

・「Gateway」がAWS管理コンソール上でオフラインになっていてS3に接続できない。
・EC2(StorageGateWay)のインスタンスは「running」になっている。
・EC2(StorageGateWay)のインスタンスにSSH接続をして調査する。

手順1:EC2(StorageGateway)にSSH接続する

今回はWindows端末からアクセスするため、みんな大好きTeraTermを使い、SSH接続を試みます。

ユーザ名 admin
パスフレーズ (空白)
RSA/DSA/ECDSA/ED25519鍵を使う 秘密鍵:
EC2インスタンス作成時に作成したpemキーを選択

手順2:EC2(StorageGateway)ローカルコンソール画面を確認する

接続するとこんな画面が出てきます。

赤字で何か出てるの怖いですね、これ。って思っていたら完全にエラーメッセージでした。
今回オフラインになっていた原因はコチラの可能性が高いです!

SYSTEM RESOURCE CHECK FAILURE: 1 ERROR FOUND!
[FAIL] Memory Check: System memory 3887 MiB (3900 MiB required)
何やらメモリーのチェックでエラーが出てますね。
ストレージゲートウェイの推奨が「4vCPU/16MiB」なので足りないよというエラーな気配です。
よく見たら、4のコマンドの隣にERRORとWARNINGが1つずつでてますやん…。

手順3:コマンド「3」「5」を実行し、ネットワークとリソースのチェックを行う

大体原因わかりましたが、念の為システムチェックしておきましょう。
一番下の行に「Enter command:」とあります。数字の1〜5のどれかを入力して「Enter」で実行すると、数字に応じたチェックを実行します。

今回はこの2つを実施します。

・3: Test Network Connectivity
・4: View System Resource Check

//[3: Test Network Connectivity]実行結果
Enter command: 3
Testing network connection
client-cp.storagegateway.ap-northeast-1.amazonaws.com:443

[ PASSED ]
proxy-app.storagegateway.ap-northeast-1.amazonaws.com:443
[ PASSED ]
dp-1.storagegateway.ap-northeast-1.amazonaws.com:443
[ PASSED ]Press Return to Continue

//[4: View System Resource Check]実行結果
Enter command: 4

AWS Storage Gateway – System Resource Check Results
Last Checked at 2019-12-03 04:05:06 +0000

[FAIL] Memory Check: System memory 3887 MiB (3900 MiB required)
[WARN] CPU Check: System has 2 virtual processors (4 required)
[ OK ] Disk Size Check

Press Return to Continue

結果から、3のネットワーク系は異常無さそうですね。
4のリソースがだめっぽそうです。vCPUがギリギリ、Memoryは足りなそうです。(t3.mediumですもんそうりゃそうよね。。。)

▼AWSの公式ドキュメントよりエラー内容の詳細

メッセージ 説明
[OK] リソースはシステムリソースチェックに合格しました。
[WARNING] リソースは推奨される要件を満たしていませんが、ゲートウェイは引き続き機能できます。AWS Storage Gateway は、リソースチェックの結果について説明するメッセージを表示します。
[FAIL] リソースは最小要件を満たしていません。ゲートウェイは適切に機能していない可能性があります。AWS Storage Gateway は、リソースチェックの結果について説明するメッセージを表示します。

手順4:結果からインスタンスタイプを上げてみる

手順3からリソースが足りて無さそうということで、インスタンスタイプを変更します。
AWS管理コンソール>EC2>インスタンスより

  1. StorageGatewayのインスタンスを停止する
  2. アクション>インスタンスの設定>インスタンスタイプの変更をクリック
  3. インスタンスタイプを「t3.xlarge」に設定する
  4. StorageGatewayのインスタンスを起動する

以上を行ったことで、Gateway側のステータスに出ていた「オフライン」の表記が「実行中」に切り替わりました!
WindowsServerでの接続も問題なしです!

Storage Gatewayで不具合が起きたときは、EC2インスタンスにSSH接続してシステムチェックをすることで解決の糸口になる可能性があるのでぜひ参考にしてみてください!

 

それでは、社畜戦士たちにご武運を。
駆け出しインフラエンジニアのますのでした。

最新情報をチェックしよう!