サーバ監視について

監視と障害対応の内容はプランにより異なります。
[ 各プランの監視と障害対応内容 ]
  ライトプラン 通知プラン 一次対応プラン
標準死活監視 ( 障害復旧含む )
サーバウォッチによるリソース等の監視・通知
サーバウォッチの監視項目に対する障害復旧
( 一次対応手順書による )

標準死活監視

すべてのプランで標準死活監視を行っています。

監視と障害対応について

TCP セッションの応答状況によって、サーバの死活を判断します。応答がない場合、 ICMP による疎通確認やサーバへのログイン可否を確認します。異常がある場合は、速やかにサーバの復旧作業を行います。

なお、標準死活監視で、サーバに何らかの障害を検知した場合、お客さまへの連絡は行いません。障害時の連絡をご希望の場合は、通知プラン・一次対応プランをご利用ください。

監視対象

  • TCP ポート 22 番 ( SSH )
  • TCP ポート 80 番 ( HTTP )
お客さまの運用に不要なポートが監視対象になっている場合、監視対象のポートを変更することが可能です。例えば、 SSH の監視を TELNET に変更することができます。
詳細な監視 ( リソースやサービス ) をご希望の場合は、通知プラン・一次対応プランをご利用ください。

サーバウォッチによるリソース等の監視

通知プランと一次対応プランは、サーバウォッチを使ってリソースなどの監視を行います。

監視の流れ

1. 約 15分間隔で監視します。

監視の間隔は有償で変更可能です。

2. 異常を検知した場合、およそ 1分間隔で 2回リトライします。最初の検知を含め 3回の異常が続いた場合、お客さま指定のメールアドレスに障害通知メールを送信します。

障害が継続している場合は、 1時間に 1回通知します。
一次対応付きを利用時の障害通知メールには、検知内容に加え、その内容に応じた対応手順フローも記載されています。

3.

【 通知プランの場合 】
状況に応じてお客さまによる確認・復旧作業をお願いいたします。VPS のリソースの追加をご希望の場合はご依頼ください。
【 一次対応プランの場合 】
当サービスで状況を確認し、お客さま指定の手順 ( 一次対応手順書 ) による確認・復旧作業やリソースを追加します。
一次対応手順書について

一次対応プランは標準手順書を参考に、障害対応手順をご指示ください。コマンドの実行・ブラウザ確認も可能ですので、都度ご相談ください。ご指定のない場合はこの標準手順書に基づく対応を行います。

対応 1回あたりの作業量について

ご用意いただく手順書に基づく、障害 1 回あたりの作業量の目安は次のとおりです。コマンド数が多くなる場合は、復旧手順をまとめたスクリプトの作成をお願いしております。

コマンド・手順数 10 回まで ( ブラウザ確認等含む )
作業時間 20 分まで
上記の作業量を超える場合はご相談ください。
表中の数字はあくまで目安としての作業量です。目安を超えたからといって対応を停止することはありません。 また、月間の対応件数にも上限はありません。

サーバウォッチの監視のながれ

監視サーバがインターネット経由で HTTP や POP などを監視し、内部監視エージェントがサーバ内のサービス稼働状況を監視し、監視サーバに報告します。

監視対象

1サーバあたり、 最大で 25項目までの監視が可能です。 26項目以上をご希望の場合はご相談ください。

それぞれ監視対象の閾値は変更可能です ( お客さまの運用営状況に合わせて変更の提案を行うことがあります )。

ネットワーク監視

監視対象 内容 異常検出条件
監視サーバと
サーバ間の
ネットワーク
PING ( ICMP ) による
ネットワークの疎通を監視
パケットロス 60% 以上、または RTT ( Round Trip Time ) 1000ms 以上

リソース監視

監視対象 内容 異常検出条件
CPU VPS 内での CPU 使用率を監視 load average ( 5分平均 ) 値が 10以上かつ CPU 使用率 90%以上が 10分間継続
メモリ メモリの使用状況を監視 free領域 ( buffers/cache領域を含む ) が全メモリの 20%以下かつ、過去 10分間のvmstat のスワップイン ( si ) とスワップアウト ( so ) のメモリ量が 30キロバイト/秒以上の場合が連続して 9回 ( 毎分 ) 検出した場合
load average VPS 内の load average
の推移を監視
load average の
過去 1分間の値が 10以上
SWAP SWAP メモリの使用率を監視 swap 領域が 80% 以上
ディスク パーティション毎に
ディスクの使用率を監視
ディスク使用率が 90% 以上

サービス監視 ( サービスの稼働状況監視 )

監視対象 内容 異常検出条件
HTTP ウェブ表示
( ポート 80 ) 監視
監視対象ポートへの
コマンド送受信によって、
サービスの応答状況を
サーバ外部から監視
対象サービスの
ポート異常を検出
( 15分ごとの
監視サーバ巡回時に
異常な応答があった場合や
30 秒間応答がなく
タイムアウトした場合 )
HTTPS ウェブ表示
( ポート 443 ) 監視
POP メール受信接続
( ポート 110 ) 監視
SMTP メール送信接続
( ポート 25 ) 監視
FTP FTP 接続
( ポート 21 ) 監視
TELNET TELNET 接続
( ポート 23 ) 監視
SSH SSH 接続
( ポート 22 ) 監視
DNS ドメインの名前解決が
可能かどうかを監視
DNS でドメインの
名前解決ができない
HTTP・HTTPS のみ、7秒間ウェブの応答がない場合

プロセス監視 ( プロセスの存在監視 )

監視対象 内容 異常検出条件
PostgreSQL サーバ内部にプロセスが
存在しているかを監視
対象プロセスの停止を検出
( 15分ごとの監視サーバ巡回時にプロセスが立ち上がっていない場合や 30秒間応答がなくタイムアウトした場合 )
MySQL
Oracle
CRON
その他デーモン

オプション監視項目

オプション

オプションの監視項目を追加することで、より高度な監視が可能です。各項目の設定数が合計10までであれば、いくつ設定しても料金は変わりません。10以上になる場合はご相談ください。

例:
ログ監視で 5つのログを監視し、URL監視で1つのURLを監視する場合は、合計 6 とカウントします。
監視対象 内容 異常検出条件
帯域 帯域の使用量
( トラフィック ) を監視
指定帯域 ( Mbps 単位 ) を超過
HTTP 文字列監視 HTMLファイルを定期的に受信し、
異常がないか確認
事前指定した文字列が
HTMLファイル中に存在しない場合
URL 監視 URL ( ポート番号も指定可能 ) の
応答コードを確認
正常な応答コード 200を返さない場合
ファイル存在監視 サーバ内に該当ファイルが
存在していることを確認
指定したファイルが存在しない場合
ロードモジュール監視 Linux のモジュールが正常に
ロードされているかを確認
モジュールが認識されていない場合
ログ監視 ファイル中の文字列を監視 ログ中に異常を示す
文字列が記録された場合
オリジナルスクリプトによる監視 お客さまサイドで用意したスクリプトによる監視。お客さまのアプリケーションや、任意の DB応答の監視が可能。※ 詳細は オリジナル監視仕様  をご覧ください。 スクリプトがエラーを検出した場合
イベント処理 障害通知に応じて、任意のコマンドを自動実行。 ( 例:PostgreSQL エラー時、プロセスを自動で再起動する。 ) 障害を検出した場合

レポートの発行

オプション

ご希望の場合は、サーバの稼働状況や障害発生状況のレポートをお客さまに定期的に送信します。

レポートの頻度は、月次送信 ( 月次リポートサンプル  )・週次送信 ( 週次リポートサンプル  ) から選択可能です。

レポートの内容は、それぞれ、前月分、前週分です。

通知プラン・一次対応プラン利用時のご注意

  • 通知プラン・一次対応プランでは、サーバウォッチによる監視にあたり、リソース情報収集プログラムを設置・実行します。関連ディレクトリの削除・変更やプログラムの停止設定は行わないようにお願いします。詳細はお申し込み時にご案内します。
  • 一次対応プランにおいて障害時にサーバ内を確認する際、お客さまがログイン中であったり自動アップデート中やバックアップが実行されていたりする場合は、作業を行うことで不具合が発生する可能性がありますので、作業前にお客さまへ確認する場合があります。
  • リソースの変更を伴う再起動を行う際には、サーバウォッチの監視項目がすべて正常になった時点で完了とさせていただきます。
  • お客さまでセットアップしたアプリケーションについて当サービスのサポートを希望する場合や、お客さまによるバッチ処理 ( at+link で把握できないもの ) をされている場合は、一次対応手順書への記載をお願いします。
  • リソースの変更を行う際には、 VPS の再起動が必要です。再起動にあたってお客さまの都度承諾が必要な場合は、必ず一次対応手順書に記載をお願いします。