Confluence Data Center のディザスタリカバリ

ディザスタリカバリ戦略は、事業継続計画の重要な部分です。これは災害発生時に従う必要があるプロセスをの概要を説明し、事業を復旧し、業務を継続することを保証します。Confluence の場合、これはプライマリサイトが利用できなくなった場合の Confluence の可用性を保証することを意味しています。

Confluence Data Center ドキュメントは、アトラシアンがサポートする Confluence 用の唯一の高可用性ソリューションです。

Confluence Server から Data Center へのアップグレードでお悩みですか? Confluence Data Center のメリットについて詳細を参照してください。

このページでは、Confluence用のディザスタリカバリ戦略に Confluence Data Center 5.9 以降を使用する方法を説明しています。ただし、主要目標（RTO、RPO、RCO¹）や標準運用手順の設定のような幅広いビジネスプラクティスについてはカバーしていません。

高可用性とディザスタリカバリの違いはなんですか？

「高可用性」、「ディザスタリカバリ」、および「フェイルオーバー」という単語は混同されがちです。このページでは、これらの言葉を次のように定義します。

高可用性 – 特定レベルの可用性を提供する戦略。Confluence の場合は、アプリケーションへのアクセスと許容応答時間です。自動修正と（同じ場所での）フェイルオーバーは通常、高可用性計画の一部です。
ディザスタリカバリ – （災害などで）メインのデータセンターが利用できなくなる場合に、（通常、別の地域にある）別のデータセンターで運用を再開する戦略。（別の場所への）フェイルオーバーはディザスタリカバリの基本的な部分です。
フェイルオーバー - あるマシンが故障した際に、あるマシンが別のマシンから引き継ぐときのことを指します。これは同じデータセンター内またはあるデータセンターから別のデータセンターで行われます。フェイルオーバーは通常、高可用性戦略とディザスタリカバリ計画の両方の一部です。

概要

開始する前に、このガイドで説明されている戦略を実装するには、Confluence Data Center 5.9 以降が必要です。また、クラスタはセットアップおよび設定済みであることを前提としています。「Confluence Data Center クラスタのセットアップ」を参照してください。

このページでは、一般的に「コールドスタンバイ」と呼ばれる戦略について説明しています。これはスタンバイ Confluence インスタンスが継続的に実行されておらず、スタンバイインスタンスを起動し、組織のビジネスニーズに対するサービスを提供するのに適した状態にあることを確認するための管理手順の実行が必要であることを意味しています。

runbook のメンテナンス

詳細な手順は組織によって異なるため、完全な手順の runbook は参照する本番システムから離れたファイルに保持することをお勧めします。runbook は、事前知識や経験にかかわらず、関連するチームの誰もが手順を実施してサービスを復旧できるように十分に詳細化します。runbook にはディザスタリカバリプロセスの以下の部分をカバーする手順が含まれていることが期待されます。

問題の検出
現在の本番環境の分離と正常終了
障害が発生した本番環境と目的の復旧ポイント間のデータの同期
復旧インスタンスへのウォームアップ命令
ドキュメント、コミュニケーション、およびエスカレーションガイドライン

ディザスタリカバリ計画で考慮する必要がある主なコンポーネントは以下のとおりです。

Confluence インストール	スタンバイサイトには、本番サイトと完全に同じバージョンの Confluence がインストールされている必要があります。
データベース	これは Confluence の主要な情報源であり、Confluence データのほとんど（添付ファイルやアバターなどを除く）を含んでいます。データベースをレプリケートし、継続的に最新に維持し、RPO1を満たす必要があります。
添付ファイル	すべての添付ファイルは Confluence Data Center の共有ホームディレクトリに保存されており、スタンバイインスタンスにレプリケートされていることを確認する必要があります。
検索インデックス	検索インデックスは主要な情報源ではなく、いつでもデータベースから再作成することができます。大規模なインストールの場合は長時間かかる可能性があり、インデックスが完全に復旧するまで Confluence の機能は大幅に低下します。Confluence Data Center は検索インデックスのバックアップを共有ホームディレクトリに保存しています。これは共有ホームディレクトリのレプリケーションでカバーされています。
プラグイン	ユーザーがインストールしたプラグインはデータベースに保存されており、データベースのレプリケーションでカバーされています。
その他のデータ	その他の重要ではないアイテムは Confluence Data Center の共有ホームに保存されています。これらがスタンバイインスタンスにレプリケートされていることを確認します。

スタンバイシステムのセットアップ

ステップ 1. Confluence Data Center 5.9 以降をインストールする

スタンバイシステムに同じバージョンの Confluence をインストールします。スタンバイデータベースにアタッチするようにシステムを設定します。

スタンバイ Confluence システムを起動しないでください

Confluence の起動によって、データベースと共有ホームに不要なデータが書き込まれます。

一時的に異なるデータベースおよび異なる共有ホームディレクトリに接続して Confluence を起動し、期待通りに動作することを確認して、インストールをテストすることができます。テスト後にスタンバイデータベースを参照するようデータベース設定を更新し、スタンバイ共有ホームディレクトリを参照する用共有ホームディレクトリ設定を更新することを忘れないでください。

ステップ2.データレプリケーション戦略の実装

スタンバイの場所へのデータのレプリケートは、コールドスタンバイフェイルオーバー戦略において不可欠です。スタンバイのデータが古かったり、インデックスの再作成に数時間かかると、スタンバイ Confluence インスタンスにフェイルオーバーさせたくなくなります。

データベース

以下の Confluence がサポートするデータベースサプライヤーのはすべて独自のデータベースレプリケーションソリューションを提供しています。

表示する...

Oracle: http://www.oracle.com/technetwork/database/features/data-integration/index.html
PostgreSQL: https://wiki.postgresql.org/wiki/Binary_Replication_Tutorial
MySQL: http://dev.mysql.com/doc/refman/5.7/en/replication.html
Microsoft SQL Server: http://msdn.microsoft.com/en-us/library/ms151198.aspx

RTO、RPO、および RCO¹ を満たすデータベースレプリケーション戦略を実装する必要があります。

ファイル

RTO、RPO、および RCO¹ を満たす Confluence 共有ホームディレクトリ用のファイルサーバレプリケーション戦略も実装する必要があります。

クラスタリングの考慮事項

クラスタ化された環境の場合、上記の情報に加え、以下に注意する必要があります。

スタンバイクラスタ	スタンバイクラスタがライブクラスタの構成を反映する必要はありません。要件と予算に応じて、含まれるノードが増減する可能性があります。ノードが少なくなるとスループットが低下しますが、状況に応じて許容される可能性があります。
ファイルの場所	同期が必要なファイルの場所として `<confluencesharedhome>` を記述した場合、クラスタの共有ホームを参照しています。`<confluencelocalhome>` はクラスタ内のノードのローカルホームを参照します。
スタンバイクラスタの起動	最初にクラスタのノードを1つだけ起動し、検索インデックスを復旧させ、他のノードを起動する前に正しく動作することを確認するのが重要です。

ディザスタリカバリテスト

ディザスタリカバリ計画をテストする際は、細心の注意を払ってください。たとえば、テストの更新が本番データベースに挿入された場合など、単純なミスによってライブインスタンスが破損する可能性があります。ディザスタリカバリのテスト中に、実際の災害から復旧する能力に悪影響を及ぼあす可能性があります。

重要なことはメインのデータセンターをディザスタリカバリテストから可能な限り分離することです。

この手順は、スタンバイ環境が正しいデータをすべて持つことを保証しますが、テスト環境はスタンバイ環境から完全に分離されているため、スタンバイインスタンスで起こりうる構成の問題はカバーされていません。

Prerequisites

テストを実施する前に、本番データを分離する必要があります。

データベース

スタンバイデータベースへのレプリケーションをすべて一時的に停止します。
スタンバイデータベースから分離されてメインのデータベースへの接続を持たない別のデータベースにデータをレプリケートします。

添付ファイル、プラグイン、およびインデックス

テスト中にプラグインの更新やインデックスのバックアップが発生しないようにする必要があります。

インデックスバックアップを無効化します。
システム管理者に Confluence で更新を行わないように指示します。
スタンバイ共有ホームディレクトリへのレプリケーションをすべて一時的に停止します。
スタンバイ共有ホームディレクトリから分離されてメインの共有ホームディレクトリへの接続を持たない別のディレクトリにデータをレプリケートします。

インストールフォルダ

ライブインスタンスとスタンバイインスタンスの両方から分離されたスタンバイインストールをクローンします。
<confluencelocalhome>/confluence.cfg.xml ファイルでデータベースへの接続を変更して競合を回避します。
<confluencelocalhome>/confluence.cfg.xml ファイルで共有ホームディレクトリの場所を変更して競合を回避します。
クラスタのセットアップに TCP/IP を使用する場合、宛先の IP アドレスを <confluencelocalhome>/confluence.cfg.xml のテストインスタンスの IP アドレスに変更します。

このあと、データベースを含むスタンバイインスタンスへのすべてのレプリケーションを再開することができます。

ディザスタリカバリテストの実施

本番データを分離したら、以下の手順に従い、ディザスタリカバリ計画をテストします。

新しいデータベースの準備ができており、最新のスナップショットを持ち、レプリケーションを持たないことを確認します。
新しい共有ホームディレクトリの準備ができており、最新のスナップショットを持ち、レプリケーションを持たないことを確認します。
クリーンサーバーに、適切なデータベースおよび共有ホームディレクトリ設定 (<confluencelocalhome>/confluence.cfg.xml) を含む Confluence のコピーがあることを確認します。
スタンバイインスタンスと同様に、テストサーバーで confluence.home がマッピングされていることを確認します。
メールを無効化します (「システムプロパティの設定」の atlassian.mail.senddisabled を参照)。
Confluence を起動します。

フェイルオーバーのハンドリング

プライマリサイトが利用できなくなった場合、スタンバイシステムにフェイルオーバーする必要があります。手順は以下のとおりです。

ライブシステムがシャットダウンされており、データベースの更新がなくなっていることを確認します。
<confluencesharedhome> の内容がスタンバイインスタンスに同期されていることを確認します。
スタンバイデータベースをアクティブ化するのに必要な手順を実施します。
スタンバイインスタンスの1つのノードで Confluence を起動します。
Confluence が起動するのを待ち、期待通りに動作することを確認します。
他の Confluence ノードを起動します。
DNS、HTTP プロキシ、またはその他のフロントエンドデバイスを更新し、トラフィックをスタンバイサーバーにルーティングします。

プライマリインスタンスに戻る

ほとんどの場合、ディザスタの原因となった問題を解決した後、プライマリインスタンスを使用して戻ることになります。妥当なサイズの停止期間をスケジュールできる場合は、この方法が最も簡単です。

必要な操作:

プライマリデータベースをセカンダリの状態と同期させる。
プライマリ共有ホームディレクトリをセカンダリの状態と同期させる。

カットオーバーの実行

スタンバイインスタンスで Confluence をシャットダウンします。
データベースが要求どおり、正しく同期さおよび構成されていることを確認します。
rsync または類似のユーティリティを使用して、共有ホームディレクトリをプライマリサーバーに同期します。
Confluence を起動します。
Confluence が期待どおり動作していることを確認します。
DNS、HTTP プロキシまたはその他のフロントエンドプロキシがを更新し、プライマリサーバーへトラフィックをルーティングするようにします。

その他のリソース

トラブルシューティング

スタンバイインスタンスへのフェールオーバー後に問題が発生した場合、ガイドラインの以下の FAQ を確認してください。

データベースが正しく同期されない場合はどうすればよいですか？

データベースで必要なデータを利用できない場合は、データベースをバックアップから復元する必要があります。

データベースを復元すると、検索インデックスはデータベースと同期された状態ではなくなります。完全なインデックス再作成、バックグラウンドまたはフォアグラウンドを実行するか、ある場合は最新のインデックススナップショットから復元できます。これには各インデックススナップショットのジャーナル ID ファイルが含まれます。インデックススナップショットはお使いのデータベースバックアップよりも古い可能性があり、復元プロセスの一部として同期されます。

検索インデックスが破損している場合はどうすればよいですか？

検索インデックスが破損している場合は、完全なインデックス再作成、バックグラウンドまたはフォアグラウンドを実行するか、ある場合は共有ホームディレクトリからの最新のインデックススナップショットから復元できます。

添付ファイルが欠落している場合はどうすればいですか？

ある場合はバックアップから復元したり、ハードドライブへのアクセス権を持っている場合はプライマリサイトから復元できる場合があります。このような場合には、rsync などのツールが役に立つ場合があります。添付ファイルが欠落していても Confluence は正常に動作しますが、欠落している添付ファイルは利用できず、ユーザーがそれらを再度アップロードできない可能性があります。

フェイルオーバー中、アプリケーションリンクはどうなりますか?

アプリケーションリンクはデータベース内に保存されます。データベースのレプリカが最新であれば、アプリケーションリンクが保存されます。

ただし、リンクの両側が互いのアドレスをどのようにして知るかについても検討する必要があります。

リンク内のパートナーを解決するためにホスト名を使用しており、DNS への更新などを介して、バックアップ Confluence サーバーが同じホスト名を使用している場合でも、リンクをそのままにし、機能する必要があります。
アプリケーションリンクが異なる IP アドレスを使用して構築されている場合、アプリケーションリンクの再構築が必要となります。
社内ネットワークで有効な IP アドレスが使用され、バックアップシステムはリモートや元のファイアウォール外で行われる場合、アプリケーションリンクを再確立する必要があります。

定義

RPO	Recovery Point Objective : 目標復旧地点	障害発生後、Confluence インスタンスをどの程度最新の状態にする必要があるか
RTO	Recovery Time Objective : 目標復旧時間	障害発生後、スタンバイシステムをどの程度の時間で利用できるようにする必要があるか
RCO	Recovery Cost Objective : 目標復旧コスト	ディザスタリカバリソリューションにどの程度の金額をかける意思があるか

製品

Jira Software

Jira Service Management

Jira Work Management

Confluence

Bitbucket

リソース

関連ドキュメント

コミュニティ

システムステータス

提案とバグ

Marketplace

請求とライセンス情報

Confluence Data Center のディザスタリカバリ

Confluence Data Center のドキュメント

このページの内容

お困りですか?

概要

スタンバイシステムのセットアップ

ステップ 1. Confluence Data Center 5.9 以降をインストールする

ステップ2.データレプリケーション戦略の実装

クラスタリングの考慮事項

ディザスタリカバリテスト

Prerequisites

ディザスタリカバリテストの実施

フェイルオーバーのハンドリング

プライマリインスタンスに戻る

カットオーバーの実行

その他のリソース

トラブルシューティング

定義

ページ

Viewport

Confluence

Confluence Data Center のディザスタ リカバリ

Confluence Data Center のドキュメント

このページの内容

関連コンテンツ

お困りですか?

概要

スタンバイ システムのセットアップ

ステップ 1. Confluence Data Center 5.9 以降をインストールする

ステップ2.データ レプリケーション戦略の実装

クラスタリングの考慮事項

ディザスタ リカバリ テスト

Prerequisites

ディザスタ リカバリ テストの実施

フェイルオーバーのハンドリング

プライマリ インスタンスに戻る

カットオーバーの実行

その他のリソース

トラブルシューティング

定義

関連コンテンツ

Confluence Data Center のディザスタリカバリ

スタンバイシステムのセットアップ

ステップ2.データレプリケーション戦略の実装

ディザスタリカバリテスト

ディザスタリカバリテストの実施

プライマリインスタンスに戻る