RouteMagic Server ユーザーズ・ガイド -Version3.2-
1. RouteMagic Serverとは

はじめに、RouteMagicのシステム構成とRMSを使ってどのようなことができるのかを紹介します。

1.1 RMSのシステム構成

RouteMagicは、ルータやスイッチ等のネットワーク機器(本書では「監視対象装置」と呼ばれます)のコンソールポートに接続して、機器情報の収集と遠隔操作機能を提供するRouteMagic Controller (RMC) と、RMCや監視対象装置の集中管理環境を提供するRouteMagic Server (RMS)で構成されるシステムです。

RMSは、電子メールやSSHプロトコルでRMCと通信を行い監視対象装置の情報を収集します。RMSの利用者は、インターネットや社内ネットワークを介して、RMSのWebインタフェースにアクセスして各種管理業務を行います。

RMCとRMSを利用するシステムの構成は、下図のようになります。各機器は矢印の方向に向かって、情報の受け渡しを行います。


@RMCからの情報収集と一元管理

RMCはネットワーク機器を常時監視し、機器から出力されるメッセージを取得します。このメッセージは、フィルタリングされ、必要なメッセージのみが接続先のRMSに送信されます。RMSは、各RMCから送信されてくるこれらの情報を、ログとして一元管理します。

ARMSから監視・メンテナンス担当者への通知
RMCから送信されてくる情報によって、監視対象装置で問題が発生したことが検出された場合、RMSは監視・メンテナンス担当者に対して、電子メールでこの情報を通知します。RMSへはインターネットを通じて接続できる(※注1)ため、担当者はどこにいてもこの通知を受け取り、WEBブラウザを利用してRMSにアクセスし、トラブルに迅速に対処することができます。
※注1.インターネット経由でRMSへアクセスできるように設定している場合に限ります。

Bオペレーション
RMSにログインし、ログから障害原因を分析したり、情報収集のためにコマンド発行を行います。

Cコマンド発行要求
RMSからRMC・監視対象装置に対して、各装置の操作や情報収集を行うためのコマンドが送信されます。


1.2 RMSの機能
これまで熟練技術者がこなしてきたネットワーク機器の障害対応を、知識・経験の浅い技術者が代行して解決を図るにはどうすれば良いか。
技術者の作業効率を向上させ、より早く復旧する術はないのか。

――― その回答を結実させたものがRouteMagic Solutionです。

ネットワーク機器に発生した問題の解決には、第一に故障個所の速やかな特定と復旧が急務です。しかし、ネットワーク機器の長期的な安定運用には、根本的な原因の究明と解決を欠かすことはできません。RMSは、障害に対する詳細情報を確実にロギングすることによって、復旧を急ぐあまり疎かになりがちな根本的原因の究明と解決へのアプローチを支援します。

RMSの主な機能は、以下のとおりです。

■ アカウントの管理

RMSは、RMSを導入する組織とRMSシステムの利用者ごとにアカウントを管理します。
(RMSの管理する組織と利用者の種別  『2.RouteMagic Serverの導入イメージ』参照。)
このアカウント管理機能によって、管理組織単位の情報の機密性を保障するとともに、情報を必要とする各担当者への通知を行います。

■ 障害発生の通知

監視対象装置に何らかの問題が発生すると、RMCは暗号化された電子メールで障害発生をRMSに通知します。RMSはこのメールを即時に解析し、設定された条件に基づいて「インシデント」(問題)として登録すると同時に、通知の必要な管理者に、障害と判定する原因となったメッセージなどの情報を電子メールで「同報送信」します。この障害通知メールは、携帯電話メールでも受け取りが可能です。

■ ネットワークトポロジーのグラフィカル表示

RMSでは、監視対象とするネットワーク上の各装置とその動作状態をグラフィカルに表示します。 障害を報告した監視対象装置は赤でブリンク表示されるため、メールにより障害の通知を受けた管理者やオペレータは一目でトラブルの状況を把握することができます。

■ 問題のトラッキング

RMSは、監視対象とする装置から出力されたコンソールメッセージや、装置が正常に応答しないといった情報をRMCから受信すると、これを「インシデント」と呼ばれる単位で管理し、解決までの履歴をトラッキングします。「インシデント」は、設定された条件に基づいてRMSが自動的に生成しますが、任意に分割・結合することが可能です。

オペレータは、必要に応じてインシデントの状態を変更したり、対処の履歴を記録することによって、管理グループ内でのトラブルに関する情報共有を円滑化し、作業効率を向上させることができます。また、問題の解決方法に関する履歴を残すことにより、同様の問題が再度発生した場合に、この情報を活用することも可能です。

■ 復旧作業の支援

RMSは、コンソールメッセージに対するガイダンスや過去の対応履歴情報の提供などにより、トラブルの正確な把握を支援します。また、インシデント発生時の自動的なコマンド発行や、ボタン操作でオペレータが簡単にコマンドを発行できる「定石コマンド」の機能などによって、障害を報告した装置の詳細情報を入手し、対応策の検討に役立てることができます。

また、RMCを経由すれば、SSH(Secure Shell)を使用したセキュアなリモートログイン機能によって機器の遠隔操作を行っていただくことも可能です。

■ 原因の究明と解決

RMSには、コンソールメッセージのみでなく、オペレータが監視対象装置に対して行った操作の記録や、各装置の設定情報などもロギングすることができます。したがって、暫定的な障害の復旧作業を完了した後でも、各種のログ情報を利用して根本的な原因の究明と解決を最小限の作業で迅速に行うことが可能です。

■ 日常業務の支援

RMCは、監視対象装置から定期的に情報を収集してRMSに送信し、RMSはこれらのデータを保存して管理しています。こうした設定情報や各種ログデータは、トラブルの原因究明に利用するのみでなく、RMSからダウンロードして障害報告書や定期レポートの作成に役立てていただくことができます。

■ セキュリティ対応

RMC−RMS間の通信では、各装置のエラーメッセージや設定情報など機密性の高い情報がやり取りされます。このため、RMC−RMS間の通信には、PGPによる電子メールの暗号化機能やSSHプロトコルによる接続機能を提供しています。したがって、インターネットのようなオープンなネットワークを経由した情報転送も可能です。


Back