REST API を使用して現在の状態データのデータ エクスポートをトリガーし、アプリケーションの管理コンソールでエクスポートのステータスを表示できます。データは CSV 形式でエクスポートされます。データ エクスポートの一括操作は一度に 1 つしか実行できません。
エクスポートされたデータのスキーマの詳細については、「データ パイプライン エクスポート スキーマ」を参照してください。
- Jira 8.14 以降
- Confluence 7.12 以降
REST API を使用してデータのエクスポートをトリガーするには、次が必要です。
- 有効な Jira Data Center ライセンス
- Jira システム管理者の権限。サポートされている API 認証方法の詳細については、「セキュリティの概要」を参照してください。
エクスポートされたファイルは共有ホーム ディレクトリに保存されるため、このファイルが適切に保護されていることも確認できます。
- データのエクスポートは、アクティビティが少ない時間帯またはアクティビティのないノードで実行します。
課題数 | おおよそのエクスポート時間 | |
Jira Software がインストールされました | Jira Software+Jira Service Management がインストールされました | |
100 万 | 15 分 | 30 分から 2 時間 |
700 万 | 2 時間 | 3 ~ 6 時間 |
3000 万 | 9 時間 | 12 ~ 24 時間 |
テスト パフォーマンス対本番環境の比較
ここで紹介するパフォーマンス データは、当社独自の内部回帰テストに基づいています。お客様の環境におけるデータ エクスポートの実際の時間と影響は、インフラストラクチャ、インストールされているアプリケーション (Jira Software や Jira Service Management など)、構成、負荷によって異なります。
Jira パフォーマンス テストを使用して、AWS 上の Jira Data Center 環境でデータ エクスポートのパフォーマンスをテストしました。この環境には 1 つの c5.9xlarge Jira ノードと 1 つの PostgreSQL データベースがありました。ユーザーの負荷をテストするために、2 つの仮想ユーザー ノード全体で 24 人の仮想ユーザーを使用しました。
アプリケーションが、/jira などのコンテキスト パスを使用するように設定されている場合は、これを必ず以下の例の <base-url>
エクスポートされるデータを fromDate
このパラメーターは、ISO 8601 形式 (yyyy-MM-ddTHH:mmTZD) で設定された日付値のみを受け付けます。以下に例を示します。
- 2020-12-30T23:01Z
- 2020-12-30 T 22:01+01:00
(たとえば、リクエストで URL エンコーディングを使用する必要があります2020-12-30T22%3A03%2B01%3A00
fromDate パラメーターなしでエクスポートをトリガーすると、直近の 365 日内のすべてのデータがエクスポートされます。
認証に cURL と個人アクセス トークンを使用するリクエストの例を次に示します。
curl -H "Authorization:Bearer ABCD1234" -H "X-Atlassian-Token: no-check"
-X POST https://myexamplesite.com/rest/datapipeline/latest/
"X-Atlassian-Token: no-check"
ヘッダーは Confluence にのみ必要です。Jira の場合は省略できます。
コード | 説明 |
202 | データ エクスポートが開始されました。以下に例を示します。
409 | 別のデータ エクスポートがすでに実行されています。
422 | インデックスの整合性がないため、データのエクスポートに失敗しました:
この問題が発生した場合は、インデックスの再作成とデータのエクスポートの再試行が必要になる場合があります。 または、 データが不完全である可能性があることを警告するために、一貫性のないインデックスを強制的にエクスポートすると次の応答が返されます。
アプリケーションの管理コンソールからエクスポートのステータスを確認して、最後にエクスポートを実行した日時を確認できます。データ エクスポート ステータスを表示するには、次の手順に従います。
- In the upper-right corner of the screen, select Administration > System.
- [データ パイプライン] を選択します。
- 開始前 - エクスポートは現在実行されていません
- 開始 - エクスポートは現在実行中です
- 完了 - エクスポートが完了しました
- リクエストをキャンセル - キャンセル リクエストが送信されました
- キャンセル - エクスポートがキャンセルされました
- 失敗 - エクスポートに失敗しました。
失敗したエクスポートまたはキャンセルされたエクスポートの解決については、「データ パイプラインのトラブルシューティング」をご参照ください。
リクエストは 200
ステータス | 応答の例 |
最初のエクスポートを開始する前 |
エクスポート中 |
エクスポートが成功した後 |
キャンセル リクエストのあと、 ただし実際にエクスポートが キャンセルされる前 |
エクスポートがキャンセルされた後 |
コード | 説明 |
200 | キャンセルを受け付けました。
409 | 進行中のエクスポートがないため、リクエストは破棄されました。
自動データ エクスポート キャンセル
と自動でマークされます。ただし、クラッシュまたはハードウェア レベルの障害が発生して JVM に通知されなかった場合、エクスポート プロセスはロックされることがあります。この場合、DELETE
リクエストを通じてエクスポートを CANCELLED としてマークする必要があります。これによって、プロセスがロックから解放されて別のデータ エクスポートを実行できます。
データ エクスポートを設定する
次のシステム プロパティを使用して、エクスポート データの形式を設定できます。
既定値 | 説明 |
plugin.data.pipeline.embedded.line.break.preserve | |
false | 埋め込まれた改行を出力ファイルに保持するかどうかを指定します。Hadoop などのツールでは、改行が問題になる場合があります。 このプロパティはデフォルトで |
plugin.data.pipeline.embedded.line.break.escape.char | |
\\n | 埋め込まれた改行の文字をエスケープします。デフォルトでは、 |
データ エクスポートを実行するたびに、数値ジョブ ID をタスクに割り当てます (最初のデータ エクスポートに対して 1 から開始)。このジョブ ID は、エクスポートされたデータを含むファイルのファイル名と場所で使用されます。
エクスポートされたデータは個別の CSV ファイルとして保存されます。ファイルは次のディレクトリに保存されます。
(クラスターで Jira を実行する場合)<local-home>/data-pipeline/export/<job-id>
クラスタ化されていない Jira を使用している
このエクスポートでデータを読み込んで変換するには、そのスキーマを理解する必要があります。「データ パイプライン エクスポート スキーマ」をご参照ください。
Spark と Hadoop のインポート設定の例
既存の Spark インスタンスまたは Hadoop インスタンスがある場合、次の参照を使用し、さらに変換するためにデータをインポートする方法を設定します。
# File location
file_location = "/FileStore/**/export_2020_09_24T03_32_18Z.csv"
# Automatically set data type for columns
infer_schema = "true"
# Skip first row as it's a header
first_row_is_header = "true"
# Ignore multiline within double quotes
multiline_support = "true"
# The applied options are for CSV files. For other file types, these will be ignored. Note escape & quote options for RFC-4801 compliant files
df = spark.read.format("csv") \
.option("inferSchema", infer_schema) \
.option("header", first_row_is_header) \
.option("multiLine", multiline_support) \
.option("quote", "\"") \
.option("escape", "\"") \
.option("encoding", "UTF-8").load(file_location)
CREATE EXTERNAL TABLE IF NOT EXISTS some_db.datapipeline_export (
`id` string,
`instance_url` string,
`key` string,
`url` string,
`project_key` string,
`project_name` string,
`project_type` string,
`project_category` string,
`issue_type` string,
`summary` string,
`description` string,
`environment` string,
`creator_id` string,
`creator_name` string,
`reporter_id` string,
`reporter_name` string,
`assignee_id` string,
`assignee_name` string,
`status` string,
`status_category` string,
`priority_sequence` string,
`priority_name` string,
`resolution` string,
`watcher_count` string,
`vote_count` string,
`created_date` string,
`resolution_date` string,
`updated_date` string,
`due_date` string,
`estimate` string,
`original_estimate` string,
`time_spent` string,
`parent_id` string,
`security_level` string,
`labels` string,
`components` string,
`affected_versions` string,
`fix_versions` string
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
"escapeChar" = "\\",
'quoteChar' = '"',
'separatorChar' = ','
) LOCATION 's3://my-data-pipeline-bucket/test-exports/'
TBLPROPERTIES ('has_encrypted_data'='false');
データ エクスポートに関する課題のトラブルシューティング
