Confluence Data Center がエンタープライズレベルに対応可能かどうかを確認する方法

Confluence Data Center のデプロイメントに関心を持っている大規模なエンタープライズの場合、エンタープライズレベルのワークロードの処理能力をどのように確保しているかという点に特に着目しているのではないでしょうか。「Confluence Data Center のサンプルデプロイメントと監視戦略」では、当社の Confluence Data Center インスタンス (常に最新バージョンで稼働) のデプロイメント、保守、および監視の方法について説明しました。これにより、当社のこれまでの知見に照らし合わせても最も大きいワークロードを持つインスタンスの 1 つである Confluence が本番環境でどのように実行されるかを直接確認できます。

ただし、弊社自身による Confluence Data Center の実行および使用は、全体の一部にすぎません。この記事では、当社のパフォーマンステストの方法論について説明します。一連のパフォーマンステストをどのようにしてリリースプロセスの各フェーズに組み込んでいったかについて解説します。パフォーマンスの劣化の防止から、さまざまな負荷がかかる条件下での満足のいくパフォーマンス確保まで、あらゆる内容を取り上げます。このようなテストにより、それぞれのバージョンがさまざまなエンタープライズレベルのワークロード (Confluence Data Center 負荷プロファイルに説明) に耐えられることを確認できます。

また、パフォーマンステストの環境とテストハーネスについても詳しく説明します。Confluence Data Center でエンタープライズレベルのワークロードをテストするためのさまざまな方法について紹介します。

開発段階でのパフォーマンステスト

アトラシアンの開発者は、Confluence について提案されたそれぞれの機能や変更について、パフォーマンス面で考えられる影響を検討します。パフォーマンス目標に対するリスクを特定し、リスクの程度を確認するための適切なテストを作成します。品質管理エンジニアは、開発者の要望に応じて技術サポートや検証を行います。

このプロセスの概要を以下に示します。

開発者は次のように、機能のライフサイクルの各ステージにパフォーマンステストを組み込みます。

開発

開発者はそれぞれのローカルマシンで直接パフォーマンステストを実行します。ローカルマシンで行うことで、コード変更がパフォーマンスにおよぼす影響を分離した環境でテストできます。これによって素早いフィードバックループを実現し、インクリメンタルな変更の影響を焦点を絞ってテストできます。たとえば、特定のマクロのフロントエンドを変更する場合、開発者は他のパフォーマンステストを無効にして、そのマクロを含む特定のページのみを対象にテストを実行できます。

Feature branch

分離された環境での機能のパフォーマンスを確認できたら、開発者はほかの Confluence 機能への影響可否をテストします。これを実施するために、開発者は継続的インテグレーション (CI) パイプラインで実行中のフィーチャーブランチビルドに変更をプッシュします。

このパフォーマンステストですべての機能が検証されるわけではありません。パフォーマンスの劣化を引き起こすリスクが低い機能の場合、開発者はその機能を直接 master ブランチにマージできます。

マスターブランチ

すべての機能は最終的に master ブランチにマージされます。そこから CI パイプラインが、新たにマージされたその他すべての機能とともに Confluence をコンパイルします。それぞれの新規ビルドはまずテストインスタンスにインストールされ、その後、本番環境で確認されているもっとも大きいレベルの Confluence ワークロードが適用されます。

master ブランチでの必須のパフォーマンステストは、パフォーマンスの劣化に対する追加の保護レイヤーとなります。これにより、すべての新しい機能が何らかのパフォーマンステストで確実に検証されます。

リリース候補

すべてのリリース候補に最終パフォーマンステストを行い、確立済みのベースラインとテスト結果とを比較して、多量のワークロードを円滑に処理できることを確認します。

エンタープライズ対応可能であるかどうかの検証方法

パフォーマンスの劣化に対する保護に加えて、master ブランチで実行するパフォーマンステストは、ビルドがさまざまなワークロードにどのように耐えるかを調査するうえでも役立ちます。これらの 1 つがエンタープライズ対応ワークロードで、Confluence に対して large サイズのコンテンツとトラフィックを適用します (各コンテンツおよびトラフィックプロファイルにについては「Confluence Data Center 負荷プロファイル」を参照)。

テスト環境とアーキテクチャ

エンタープライズ対応ワークロードのテストは Amazon Web Services (AWS) Virtual Private Cloud で実行されます。これは以下の AWS インスタンスで構成されています。

機能	AWS ノードタイプ	ノードの数
Confluence アプリケーション	c5.2xlarge (Amazon Linux を実行)	4
Synchrony (共同編集用)	c5.2xlarge (Amazon Linux を実行)	1
Load balancer	AWS Application Load Balancer	1
データベース	m4.xlarge	1
Apache JMeter	c4.2xlarge	1
共有ホームディレクトリ	m4.large	1

各ノードタイプについては、インスタンスタイプについての AWS ドキュメント (特に「汎用インスタンス」と「コンピュート最適化インスタンス」) を参照してください。

データベースは PostgreSQL RDS で実行され、large サイズのデータセット (またはコンテンツプロファイル) でプリロードされています。将来的には、他のデータベースプロバイダに対応する同様のテスト環境を追加する予定です。

すべての Confluence アプリケーションノードは、NFS サーバーでホストされている共有ホームフォルダをマウントします。

テクニカルコンポーネント

テストハーネスは、次のコンポーネントで構成されています。

コンポーネント

ロール

説明

JMeter

ロードインジェクタ

テスト用のトラフィックは JMeter を介して生成します。特に、指定したパラメータで HTTP 呼び出しをシミュレートするために JMeter 構成スクリプトを使用します。このようなパラメータには、編集または表示するユーザー名、スペース、ページなどがあります。JMeter は分散型で実行します。これは、負荷を容易に調整できるためです。

JMeter は Javascript の実行または評価や、ページの実際のレンダリングは行いません。このため、当社では Selenium ブラウザを JMeter と同時に実行してページの読み込み時間を測定しています。

Selenium

ロードインジェクタ

Selenium は、より現実的なユーザーエクスペリエンスをシミュレートするため、ユーザーインタラクション部分の実行に使用しています。当社の環境では同じ JMeter を 5 つのヘッドレス Chrome ブラウザで実行しており、これには Javascript の解析と実行も行えるメリットがあります。これにより、全体的なパフォーマンスとともに、さまざまなフロントエンドのパフォーマンスメトリック (例: 解析時間、DOM 読み込み時間) も測定できます。Selenium ブラウザから送信されるカスタムアナリティクスをテストシステムで受け取り、そこでさらに分析を重ねて、ページ読み込み時間のコストの内訳を明らかにします。

Ansible

インフラストラクチャデプロイメント

Ansible playbook を使用して、AWS でのテスト環境のプロビジョニングからロードインジェクタの起動とテストデータの収集まで、テストプロセス全体をオーケストレーションします。オーケストレーションにより、開発プロセス全体を通して複数のビルド間で同タイプのパフォーマンステストを実行できます。

ワークロード

エンタープライズ対応テスト用ワークロードは、当社内部の Confluence Data Center インスタンスにおけるトラフィックやコンテンツに基づいてモデル化しています。これは「Confluence Data Center のサンプルデプロイメントおよび監視戦略」で説明している内容と同等です。データボリュームと HTTP トラフィックの面では、このインスタンスのワークロードは、当社が本番環境で確認しているもっともワークロードが大きい 10 個のインスタンスに含まれます。

ロードインジェクタはさまざまなユーザーアクションをシミュレートするために、複数の HTTP リクエストで構成されたトランザクションを生成します。JMeter と Selenium は Confluence のビジネスクリティカルなワークフローをシミュレートするため、このようなユーザーアクションをともに集約します。

全体で見ると、当社のテストハーネスは、毎時 19,171 トランザクション (毎秒 5.3 トランザクション) を生成します。これは、毎時 431,000 HTTP リクエスト (毎秒 120 リクエスト) と同等のスループットを生成します。

1 時間あたりのトランザクションの内訳を確認するにはここをクリック

テストハーネスが生成する各トランザクションは、1 つのユーザーアクションに対応しています。次の表はこのようなアクションを分類したものです。

ユーザーアクションの分類

トランザクション	1 時間あたりのアクション
ページを表示	4,823
インラインコメントの表示	3,189
ダッシュボードの表示	2,308
ログイン	2,008
ログアウト	1,908
ブログの表示	886
添付ファイルのアップロード	861
ページ / ブログの検索	716
ページの編集	660
ブログコメントの作成	631
ページ / ブログへのいいね!	366
ページの作成	230
ラベルの追加	130
ページの制限	130
ページコメントの作成	120
インラインコメントの作成	100
ブログの作成	105
合計	19,171

データセット

ワークロードと同様、「Confluence Data Center のサンプルデプロイメントおよび監視戦略」で説明したインスタンスのスナップショットの作成後、テストインスタンスのデータセットをモデル化しました。このスナップショットには次の要素を持ちます。

ディメンション	値 (近似値)
合計スペース数	6,550
サイトのスペース	1,500
個人用スペース	5,000
コンテンツ (すべてのバージョン)	16,000, 000
コンテンツ (現在のバージョン)	6,900, 000
コメント	2,000, 000
ローカルユーザー	12,300
ローカルグループ	9,900

実行

テストハーネスが Ansible を介してテスト環境をプロビジョニングすると、エンタープライズ対応テストが次のように進行します。

ウォームアップ

テストは、新たにプロビジョニングされたアーキテクチャ上のコールドアプリケーションで行います。このため、有益な結果を得るには Confluence をウォームアップする必要があります。テストの最初の 15 分間でウォームアップを行い、以降はすべてのテストデータを破棄します。また、この時間を利用して 360 アクティブユーザーのログインも開始します。これを使用して各ユーザーのトランザクションをシミュレートします。テストの間、すべてのアクティブユーザーは Confluence にログインしたままとなり、すべてのユーザーアクションは各ユーザーを通してトリガーされます。

ピーク負荷

ウォームアップ後、テストワークロードを 2 時間適用します。このとき、各アクティブユーザーをワークフローグループに割り当て、そこで一連のユーザーアクションを実行します。各ワークフローグループは Confluence のビジネスクリティカルなワークフローに基づきます。

JMeter を使用して、次の各ユーザーアクションをトリガーします。

ワークフローグループ	操作
ページの作成	ログイン → ダッシュボードの表示 → ページ検索 → ページの表示 → ページへのいいね! → ページの作成 → ページの制限 → ラベルの追加 → ログアウト
ページの編集	ログイン → ダッシュボードの表示 → ページ検索 → ページの表示 → ページの編集 → ページの表示 → 添付ファイルのアップロード → ログアウト
ブログの表示	ログイン → ダッシュボードの表示 → ブログ検索 → ブログの表示 → ブログへのいいね! → インラインコメントの表示 → 添付ファイルのアップロード → コメントの作成 → ログアウト
インラインコメントの表示 / 更新	ログイン → ダッシュボードの表示 → ページの表示 → インラインコメントの表示 → ログアウト
ブログの作成	ログイン → ダッシュボードの表示 → ブログの作成 → 添付ファイルのアップロード → ブログの作成 → インラインコメントの作成 → ログアウト
コメントの作成	ログイン → ダッシュボードの表示 → ページ検索 → ページの表示 → ページコメントの作成 → インラインコメントの作成 → ログアウト

同時に Selenium は次のアクションを含む一般的なワークフローを実行します。

ログイン → ダッシュボードの表示 → ページの作成 → インラインコメントの作成 → 最近表示されたページの表示 → ページの編集 → ブログの表示 → ページの表示 → 人気のページの表示 → ログアウト

ローカル、アクティブ、および同時ユーザー

パフォーマンステストの目的のため、ユーザーを 3 つのタイプに分類しています。

ローカル: Confluence インスタンスにログイン情報を持つすべてのユーザーを対象とします。当社のテストインスタンスのローカルユーザー数は 12,300 です。
アクティブ: 現在ログイン中のすべてのユーザーです。すべてのテストアクションはこれらのユーザーを通して実行します。テストで行うユーザーアクション数は 1 時間あたり 19,171 で、360 のすべてのアクティブユーザーにわたって行います。
同時: ユーザーアクションを同時にトリガーするすべてのアクティブユーザーです。ユーザーアクション間にさまざまな思考時間を設定しているため、テスト中の同時ユーザー数は平均 8 ユーザー、最大 29 ユーザーとなっています。

結果の収集と分析

当社では内部の InfluxDB サーバーを使用して、テストデータをリアルタイムで集約および収集しています。このサーバーでは、テストが進行中でもアクティブに監視可能で、結果を履歴データと比較することもできます。テストハーネスは次のツールを使用してこれらのメトリックを収集し、InfluxDB に送信します。

ツール	説明
Amazon CloudWatch	テスト環境を AWS にデプロイすることで、Cloudwatch を使用して各ノードからリソース使用率の詳細なメトリックを収集できます。
Telegraf	アプリケーションノードに Telegraf エージェントをインストールして Confluence のデータを監視および収集します。これらのデータには、JVMのメトリック、ガベージコレクタの統計情報、休止状態の統計情報、クエリ数、キャッシュ、データベースプールなどがあります。
JMeter プラグイン	このコンポーネントは、InfluxDB に送信されたデータから解析とグラフ作成を行います。これにより、スループット、アクティブスレッド、成功 / エラー率、トランザクション応答時間といったさまざまなタイプのトラフィックデータを視覚化できます。
カスタムツール	ブラウザのナビゲーションタイミングやパフォーマンス結果を InfluxDB に直接送信する一連のスクリプトを開発しました。

InfluxDB データのさまざまな面を視覚化するため、Grafana ベースのダッシュボードをいくつか作成しました。さらに、AWS ノードからすべてのログを送信し、インジェクタを中央 Splunk サーバーにロードしています。インジェクタはここで関連イベントを精査できます。

Atlassian が提供するサービス

この方法についてご不明な点がある場合は、当社の Advisory Service またはプレミアサポートチームにお問い合わせください。

製品

Jira Software

Jira Service Management

Jira Work Management

Confluence

Bitbucket

リソース

関連ドキュメント

コミュニティ

システムステータス

提案とバグ

Marketplace

請求とライセンス情報

Confluence Data Center がエンタープライズレベルに対応可能かどうかを確認する方法

Confluence Data Center のパフォーマンス

このページの内容

お困りですか?

開発段階でのパフォーマンステスト

開発

Feature branch

マスターブランチ

リリース候補

エンタープライズ対応可能であるかどうかの検証方法

テスト環境とアーキテクチャ

テクニカルコンポーネント

ワークロード

ユーザーアクションの分類

データセット

実行

ウォームアップ

ピーク負荷

結果の収集と分析

Atlassian が提供するサービス

ページ

Viewport

Confluence

Confluence Data Center がエンタープライズ レベルに対応可能かどうかを確認する方法

Confluence Data Center のパフォーマンス

このページの内容

関連コンテンツ

お困りですか?

開発段階でのパフォーマンス テスト

開発

Feature branch

マスター ブランチ

リリース候補

エンタープライズ対応可能であるかどうかの検証方法

テスト環境とアーキテクチャ

テクニカル コンポーネント

ワークロード

ユーザー アクションの分類

データ セット

実行

ウォームアップ

ピーク負荷

結果の収集と分析

Atlassian が提供するサービス

関連コンテンツ

Confluence Data Center がエンタープライズレベルに対応可能かどうかを確認する方法

開発段階でのパフォーマンステスト

マスターブランチ

テクニカルコンポーネント

ユーザーアクションの分類

データセット