s06)サーバーの信頼性
2024年04月03日
サーバーは信頼性が重要
サーバーには重要なデータやシステムが保存され、24時間いつでもクライアントの要請に応じて動作しなければなりません。サーバーが故障してシステムが止まってしまうと、そのサーバーを利用している多くのユーザーが作業を行うことができなくなります。
万が一サーバー上のデータが消えてしまったら、そのデータを必要とするさまざまな作業に不都合が出たり、情報という財産を失いかねません。そのためサーバーはパソコンよりも高い信頼性を求められます。 システムが信頼できるかを評価する項目には、信頼性[狭義]、可用性、保守性があり、それらはMTBFやMTTRや稼働率によって数値で計られます。
信頼性[狭義]は障害が発生しにくいシステムであることを意味します。
保守性は、システムに障害が発生した場合に障害からすぐに回復できることを意味します。
可用性は、システムが常に利用できることを意味します。
これらが高い状態で保たれているとき、システムの信頼性が高いといえます。
信頼性[狭義]、保守性、 可用性に完全性と機密性を加えた5つの要素を、 その頭文字をとってRASISと呼ぶことがあります。 これらは、システムを総合的に評価する際の重要な指標です。
信頼性の指標
信頼性・保守性・可用性は、 数値によって計測することができます。
信頼性を計る指標の1つとして、MTBF(平均故障間隔)があります。MTBFは、修理をくり返して運用するシステムにおいて、 故障から次の故障までの平均的な時間間隔を表す数値です。 稼働時間を故障回数で割ることで求められます。 MTBF が大きいほどシステムの信頼性が高いことになります。
保守性を計る指標としては、 MTTR (平均修理時間) があります。この数値は、修理に要した時間の合計を故障した回数で割ることによって求められ、1回の故障でシステムが停止している時間の平均値を表します。 MTTRが小さいほどシステムの保守性が高いといえます。
可用性を計る指標には、 稼働率があります。 これは、 稼働時間の合計を運転時間の合計で割ることによって求められます。 MTBFとMTTR の和で MTBF を割ることでも計算できます。 稼働率が高いほどシステムの可用性が高いといえます。
MTBF &MTTR
それぞれ
MTBF Mean Time BetweenFailures
MTTR It Mean TimeTo Repair
の頭文字から来ています。
MTBFやMTTRはサーバーに限らまず、HDDや電源装置などでも使われます。また、製品のカタログにMTBFなどの数値が記載されている場合もあります。