エンタープライズサポート

AWS OpenSearch サービスには AWS CloudWatch との統合が組み込まれているため、管理対象のクラスターの健全性とパフォーマンスを簡単に監視できます。CloudWatch は OpenSearch ドメインからさまざまなメトリックを自動的に収集します。これらのメトリックを使用してダッシュボードを作成し、運用上のニーズに合ったアラームを設定できます。

AWS によって公開されるメトリック

AWS OpenSearch サービスは、クラスターの健全性、リソース使用率、検索のパフォーマンスを網羅する包括的なメトリックを CloudWatch に公開します。一般的に監視されるメトリックは次のとおりです。

ClusterStatus.green/yellow/red: クラスター全体の健全性を示します。
FreeStorageSpace: データノード上で使用可能なディスク容量。
CPUUtilization: ノード全体の CPU 使用率。
JVMMemoryPressure: JVM ヒープ利用状況。パフォーマンスに影響する可能性があります。
MasterCPUUtilization: マスターノードの CPU 使用率。
SearchLatency と IndexingLatency: 検索およびインデックス化のパフォーマンス。
AutomatedSnapshotFailure: 自動スナップショットのステータス。

利用可能なメトリックの全リストとその説明をご覧ください

推奨される CloudWatch アラーム

OpenSearch の監視に関するほとんどのニーズについては、「Recommended CloudWatch alarms for Amazon OpenSearch Service」ガイドに従うことをお勧めします。このガイダンスでは、クラスターの健全性、ストレージ、CPU、JVM のメモリ負荷、ノード可用性などの重要なメトリックについて説明されています。これらの標準アラームは、OpenSearch クラスターの健全性とパフォーマンスを維持するための強力な基盤となります。

AWS の推奨事項に加えて、特定の高度なメトリックが Confluence ワークロードや特殊なユースケースに特に重要になる場合があります。次のメトリックのアラームを設定することを検討してください。

CurrentPointInTime: 5 分間 (連続して 2 回) にわたり、最大値が 10 より大きい場合に、アラームをトリガーします。
AvgPointInTimeAliveTime: 5 分間 (連続して 2 回) にわたり、平均値が 5 分を超えた場合に、アラームをトリガーします。
ScrollCurrent: 5 分間 (連続して 2 回) にわたり、最大値が 5 より大きい場合に、アラームをトリガーします。これは特に delete_by_query などの操作に関係しています。

これらの追加のアラームは、Confluence で一般的に使用されるものの、AWS の既定の推奨事項ではカバーされないポイントインタイム (PIT) 検索やスクロールコンテキストに関連する問題を検出するのに役立ちます。上記のしきい値と期間は推奨の既定値です。ドメイン、ワークロードパターン、運用 SLO に合わせて調整してください。

アラームの設定

AWS コンソール、AWS CLI、または CloudFormation などの自動化ツールを使用して CloudWatch のアラームとダッシュボードを設定できます。標準的なアラームの場合は、「OpenSearch CloudWatch Alarms」ガイドを使用できます。このガイドには、AWS ドキュメントで推奨されているメトリックが記載されています。

CurrentPointInTime、AvgPointInTimeAliveTime、ScrollCurrent などの Confluence 固有のカスタムアラームについては、ユーザーが独自に定義する必要があります。次に示すのは、これらのカスタムアラーム用の CloudFormation YAML スニペットの例です。

アラートを適時に受け取るためには、SNS などの通知サービスと統合することをお勧めします。CloudWatch ダッシュボードとアラームを利用すると、追加の AWS 料金が発生する場合があることにご注意ください。

CurrentPointInTime のアラーム

# Alarm for CurrentPointInTime
CurrentPointInTimeAlarm:
  Type: AWS::CloudWatch::Alarm
  Properties:
    AlarmName: "CurrentPointInTime-High"
    MetricName: "CurrentPointInTime"
    Namespace: "AWS/ES"
    Statistic: "Maximum"
    Period: 300
    EvaluationPeriods: 2
    Threshold: 10
    ComparisonOperator: "GreaterThanThreshold"
    Dimensions:
      - Name: DomainName
        Value: !Ref OpenSearchDomainName
    AlarmActions:
      - !Ref AlarmNotificationTopic
# Alarm for AvgPointInTimeAliveTime
AvgPointInTimeAliveTimeAlarm:
  Type: AWS::CloudWatch::Alarm
  Properties:
    AlarmName: "AvgPointInTimeAliveTime-High"
    MetricName: "AvgPointInTimeAliveTime"
    Namespace: "AWS/ES"
    Statistic: "Average"
    Period: 300
    EvaluationPeriods: 2
    Threshold: 300
    ComparisonOperator: "GreaterThanThreshold"
    Dimensions:
      - Name: DomainName
        Value: !Ref OpenSearchDomainName
    AlarmActions:
      - !Ref AlarmNotificationTopic
# Alarm for ScrollCurrent
ScrollCurrentAlarm:
  Type: AWS::CloudWatch::Alarm
  Properties:
    AlarmName: "ScrollCurrent-High"
    MetricName: "ScrollCurrent"
    Namespace: "AWS/ES"
    Statistic: "Maximum"
    Period: 300
    EvaluationPeriods: 2
    Threshold: 5
    ComparisonOperator: "GreaterThanThreshold"
    Dimensions:
      - Name: DomainName
        Value: !Ref OpenSearchDomainName
    AlarmActions:
      - !Ref AlarmNotificationTopic

エンタープライズサポート

製品

Jira Software

Jira Service Management

Jira Work Management

Confluence

Bitbucket

リソース

関連ドキュメント

コミュニティ

Marketplace

請求とライセンス情報

Confluence で AWS OpenSearch サービスを監視する

Confluence で OpenSearch を監視する

このページの内容

お困りですか?

AWS によって公開されるメトリック

アラームの設定

ページ

Viewport

Confluence

バージョン

Confluence で AWS OpenSearch サービスを監視する

Confluence で OpenSearch を監視する

このページの内容

関連コンテンツ

お困りですか?

AWS によって公開されるメトリック

アラームの設定

関連コンテンツ