インシデントを検出して分類する方法を理解する
ベータ版リリースの制限事項
ステータス ハブはベータ版であるため、機能が制限されています。今後のリリースでは、カバレッジが拡張され、その他の機能が追加される予定です。
このページでは、システム ヘルスに表示されるインシデントを検出して分類する方法について説明します。アトラシアンがこれらのイベントをどのように追跡しているかを知ることは、何を表示し、何を表示しないかの基準を理解するのに役立ちます。
システム ヘルスでキャプチャされるインシデント
システム ヘルスには、ローンチ前に発生した過去のインシデントは表示されないことにご注意ください。
システム ヘルスには、status.atlassian.com の公開ステータス ページと同様に、すべての Atlassian アプリのすべての信頼性インシデントが表示されます。
さらに、次のような信頼性インシデントに対してサイト レベルの影響検出を利用できます。
- Jira または Confluence に影響を与えるもの
- 次のような SLA 対象エクスペリエンスに影響を与えるもの
- Jira: コンテンツ (課題、ボード) の表示、課題の作成、課題の編集
- Confluence: ページの表示、ページの作成、ページの編集、ページ コメントの追加
「エクスペリエンス」とは、Jira での課題の表示や Confluence でのページの作成など、基盤となる機能の論理的な部分です。どのアプリにおいても、基盤となるいくつかのエクスペリエンスによって機能セット全体が構成されています。
信頼性インシデントでは、停止やタスク関連の障害など、何らかの事象によって異常に高いエラー率が引き起こされます。アトラシアンでは、今後サイト レベルの影響データのカバレッジを拡張し、さらに多くのアプリ、エクスペリエンス、インシデント タイプを追加するように取り組んでいます。
インシデント重大度レベル
システム ヘルスでは、重大度が高い順に次のインシデント重大度レベルが使用されます。
重要
major
軽度
インシデントの重大度は複数の要因によって決定されます。これには次のようなものがあります。
インシデントの期間
影響を受けるユーザーの数
ユーザー ワークフローの中断のレベル
たとえば、少数のユーザーに対して Jira プロジェクト設定の読み込み速度低下を引き起こす短期間のインシデントの場合、重大度評価は低くなります。それに対し、多数のユーザーに対して Jira 作業項目の読み込み障害を引き起こす長期間のインシデントの場合、重大度評価は高くなります。
インシデント ステータス
ステータス ハブでは次のインシデント ステータスが使用されます。
調査中: アトラシアンがインシデントを認識しており、根本原因を調査中です。
特定済み: アトラシアンが根本原因を特定し、解決に向けて取り組んでいます。
モニタリング: アトラシアンが修正を実装し、それが機能するかどうかを監視しています。
解決済み: ビジネスへの影響はなくなり、問題は解決しました。
サイト レベルの影響が検出される仕組み
サイト レベルの影響は、主に UI のエラー率を監視することで検出されます。このようなエラーの例としては、ユーザーによる Jira 作業項目の読み込み障害が挙げられます。時間の経過とともにこれらのエラーの数が一定のしきい値に達すると、影響として確定されます。各ユーザーは特定のサイトにリンクされており、各エラーは特定のアプリとエクスペリエンスに対応しています。このデータを活用することで、特定のサイトやエクスペリエンスへの影響を正確に特定できます。
さらに、データベース監視を通じて障害の有無が確認されます。これらのデータベースも特定のアプリやサイトに関連付けられているため、これらの信号は影響検出に役立ちます。