検証を詳しく知ろう!② ~異常系試験編~

ベル

前回の授業に引き続き「異常系試験」について、もう少し詳細に解説してみたいと思いますが、まずは、「正常系試験」が問題なく完了していることが大前提です。どうしたらいいのかわからない方は、前回の授業の「正常系試験編」からお読みください。

 

【検証を詳しく知ろう!① ~正常系試験編~】

検証を詳しく知ろう!① ~正常系試験編~

 

今回の授業は「異常系試験編」ということですが、異常系の試験を実施する際に確認しなければいけない観点は2つあります。この両方の観点で確認を行わないと正確な検証データは取れませんので、しっかりログを取得して確認しましょう。

 

 

通信断時間の確認

まず、異常系試験を実施するにあたって、ネットワークが冗長構成になっていることが大前提です。障害が発生すると、通信が復旧しないようなシングル構成であるならば、異常系試験しても意味がないですからね。冗長構成である場合、通信経路で障害を起こして通信が復旧するまでの時間を測定します。想定結果(設計値)と実測値を比較して、想定通りのネットワークになっていることを確認してください。

 

通信断時間を測定する手順としては、まず、連続Pingを実行した状態で障害を発生させます。そうすると通信断が発生しますが、しばらくすると通信が迂回され復旧されてきます。この復旧までの時間を測定し、試験手順書に記録していく形になります。この段取りは、障害時の試験だけでなく、復旧時にも実施する必要があります。

 

よく復旧時の試験を軽視する方もいますが、意外にも復旧試験の方が想定通りの動作してくれないことがあります。そのため、継続的に通信断が発生していなくても、複数回に分けて断が発生することもありますので、両方の試験を実施するようにしましょう。

 

連続Pingを実行するのに、最も有名なフリーソフトを以前の授業で紹介していますので、こちらも参考にしてみてください。きっと役に立ちますよ。

【ExPingを使いこなす方法を学ぼう!】

ExPingを使いこなす方法を学ぼう!

 

 

ステータス確認

異常系試験の確認観点のもう1つとして、ステータス確認があります。これは、正常系試験で確認した内容を障害が発生した時の状態を確認するための試験です。例えば、HSRPを組んでいる場合、障害発生によりActive/Standbyが切替わっていることを確認したり、ルーティングテーブルが障害箇所を迂回した経路に変更されていることなどを確認する必要があります。

 

また、復旧時には正常系のステータスと同じ状態に戻っていることを確認する意味もあります。ただ、物理的に電源をONにしていたり、LANケーブルを再接続すれば復旧したと言うわけではないのです。ちゃんとステータスが正常時と同じ状態になるまで、ログ取得・確認は待つようにしましょう。また、連続Pingもやめないようにしましょうね。

 

その際に取得すべきログは正常系と同様のログをフルセットで取得しましょう。と言うのは、検証が終わり商用環境へリリースされた後に同様の試験を実施しようとするのは、かなりハードルが高くなります。商用環境で検証している間は、業務を止めてもらったりする必要があるからです。そのため、時間がない中の検証であったとしてもログだけはしっかり取るようにしましょう。

 

障害ポイント

異常系試験の確認ポイントがわかったところで、実際、どこで障害を起こして試験をすればいいのか?を考えてみたいと思います。障害ポイントは大きく分けて2つあります。

 

 

1つ目の筐体障害ですが、これは、使用するルータやスイッチの電源のOFF/ONの試験となります。先にも記載しましたが、注意しなければいけないのが、電源ONの時です。ルータよりもスイッチの方が、比較的、電源ONしてステータスが落ち着くまでの時間がかかる傾向があります。その間に、ステータスチェックでポートを一時的にUPさせることがあり、隣接機器のステータスも変更させてしまうので、スタータスが落ち着くまで疎通確認をやめないようにしましょう。

 

2つ目のLANケーブル障害は、ネットワーク機器間のLANケーブルを抜線する試験となります。シンプルそうに見えて、意外にも複雑な場面もあります。代表例としては、直接リンク障害と間接リンク障害です。以下のような構成の場合、ルータからONU間のLANケーブル断(障害①)とONUからWAN側のLANケーブル断(障害②)では、ルータで障害を検知する仕組みが異なります。

 

 

ルータに直接接続されているLANケーブルを抜線する場合(障害①)は、インターフェイスがダウンすることで障害を検知しますが、ONUより先の障害(障害②)であれば、ルータのインターフェイスはダウンしません。そのため、別の検知方法が必要になります。例えば、ダイナミックルーティングのHelloパケットの断だったり、IP-SLAであればポーリングのダウンだったりします。その検知方法によって迂回までにかかる時間が異なりますので、省略していい試験はあまりないのが実態です。

 

まとめ

ベル

今回の授業は、いかがでしたか?前回の正常系試験に続いて異常系試験について学んできましたが、少しでも理解してもらうことが出来ましたでしょうか?異常系試験で最も意識すべきことは、「網羅性」です。検証環境は、WAN回線まで用意して検証するのはなかなか困難なため、どうしても簡易構成になりがちです。そう言った場合は、何が経路の切り替えになるのかを考えて、試験することが重要となります。ここでしっかり勉強していってもらえればと思います。

 

【ホームルーム(商品紹介)】

商品紹介 ~ネットワークエンジニアの便利アイテム!~

商品紹介 ~ネットワークのお勉強に役立つ商品①~

商品紹介 ~ネットワークのお勉強に役立つ商品②~

商品紹介 ~出張時の必須アイテム~

 

 

Follow me!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です