
awsを運用しているときにシビアな問題が生じてしまいやすいことが知られているのが容量です。awsの監視をするときにはリソース不足への適切な対応をするのが重要な役割の一つですが、容量の監視に関してはどのような考え方で応じていく必要があるのでしょうか。
現場に応じた適切な対応をするための基本を理解しておきましょう。
容量のトラブルはよくある問題
awsを運用している現場でサーバー監視をするときには容量の問題が生じることはよくあるということは理解しておく必要がある点です。
awsを運用している場合でなくとも障害としては典型的なもので、ディスク容量が不足してしまったためにサーバーがダウンしてしまうという障害はどんな現場でもしばしば発生しています。データのサイズが大きくなってきた影響でディスク容量が不足してしまう問題は確実に起こりやすくなってきている状況があることは監視を担当するエンジニアもその上司もしっかりと理解しておかなければならないポイントでしょう。
今は問題なかったとしても一年後には発生するリスクがある障害だという認識が必要なのです。容量のトラブルは現在だけでなく将来的にも起こるリスクが十分にあります。そのため、エンジニアとしては当然理解しておく必要がありますが、エンジニアを管理する上層部としても当然のこととして認識しておくのが肝心です。
その認識の有無によって障害対策や障害発生時の対処のスピードにも大きな影響を与える恐れがあります。容量の制限を推進する必要があるか、コストをかけてでも容量の拡張をするかを速やかに決断しなければならないからです。
一般的な企業では監視をしているエンジニアには決定権がないので、上層部の認識がないとawsの運用に問題が生じるリスクが高くなります。
容量はコストに大きく影響する

awsを運用する上で容量の監視と最適化がそんなに重要なのかと疑問に思う人もいるでしょう。ディスク容量が不足しているのであれば拡張すれば良いではないかと考えるのももっともなことで、コスト度外視であれば特に問題はない考え方です。
awsを利用するときにはサーバー負荷が大きいことをするほどコストがかかる仕組みになっていて、費用がだんだんと大きくなっていってしまう傾向があります。容量はその典型的なもので、大きくなればなるほどコストがかかるようになるのです。
完全に正比例の関係にあるわけではありませんが、コストを抑えるためにはできるだけ最小量の容量を最適化して運用することが重要になります。では容量をできるだけ少なくするためにはどうしたら良いのかという話になるでしょう。
基本的には限られた容量を適正に配分することによって無駄がないように運用するのが重要です。そのために必要なのが容量の監視を続けていき、状況に応じて割り当てを変えて最適な運用をできるようにすることなのです。
容量の監視そのものは比較的簡単
サーバーの容量を監視するのは難しいのかと疑問に思う人もいるでしょう。サーバーエンジニアとして若干でも業務に携わっていたことがある人ならイメージできることですが、経験がないと簡単か難しいかを判断するのは難しいのは確かです。
結論から言えば、容量の監視そのものは簡単なもので、いつでもサーバーの状態を見てみればどこでどのくらいの容量を使っているのかをリアルタイムで確認することができます。ただ、監視という観点ではこの瞬間においてどこがどのくらい使っているかが重要なのではなく、時系列的に見て容量の再配分を考えることが肝心でしょう。
そのために必要なのがログを作成することで、容量の状況についての常時監視体制を作ってログを記録するのが合理的な方法です。ログの記録はawsの場合にはCloudWatchを使って作成することも可能ですが、一般的なサーバー監視ツールを使っても問題はありません。
比較的簡単なことなのでサーバーに関して少し知識のあるエンジニアであればすぐに自動取得のプログラムを作り上げることができるでしょう。
運用規模が大きいと割り当ては難しい
ログを作成することができたとしても実際に容量の割り当てを最適化するのはかなり難しいこともあります。比較的小規模で利用していて用途も限られているのであれば運用状況から考えて容量を割り当てるのはそれほど難しくないのは確かです。
しかし、運用規模が大きくて使用している容量も膨大になると適切な割り当てをするのが困難になる場合が多く、熟練のエンジニアですら悩んでしまうことがよくあります。awsの運用に関する今後の方針がどうなってるかによっても左右される部分なのでエンジニアには独断で決められない場合もあるでしょう。
管理職が方針を明確にし、エンジニアが悩まないで済むように配慮することも重要になるのです。
失敗しないための方策を考えよう
awsの運用のときには容量については常に最適化された状態にするのが望ましいのは確かです。失敗しないための方策を立てておくのは肝心なことで、3通りの考え方があります。一つ目は常に容量に余裕を持たせておくやり方で、コストはやや負担が大きくなるものの、障害などのトラブルが起こりにくくするのに直結するのが魅力です。
二つ目はawsの運用や監視の経験が豊富なエンジニアを確保することで、適切な運用を常にできる状況にしてくれると期待できます。三つ目の方法は外部の業者に監視を依頼する方法で、awsを専門としている業者に任せれば安心して運用できる体制を速やかに整えられるでしょう。
前述のように運用規模が大きくなるほど監視による最適化は難しくなりがちです。awsでは大容量を要求している企業ほど容量あたりの単価は安くする料金体系にしているので、大規模な運用をするときには容量に余裕を持たせるのが得策でしょう。
比較的小規模な運用をする場合にはエンジニアとして優秀な人を探すか、外部委託するかをよく考える必要があり、コストパフォーマンスを重視して選択するのが最も大切でしょう。
容量に対する認識は現場から上層部まで持とう

awsを導入すると容量に関するトラブルはしばしば発生することは念頭に置いておくことが必要です。現場から上層部までその認識を持つことが適切な運用をすることにつながります。監視によって障害発生が懸念されたときに容量を増やすのか、割り当てを変えるのかを判断しやすいように方針を決めておくと安定した運用ができるでしょう。