プラットフォームについて: Data Center - この記事は、Data Center プラットフォームのアトラシアン製品に適用されます。

このナレッジベース記事は製品の Data Center バージョン用に作成されています。Data Center 固有ではない機能の Data Center ナレッジベースは、製品のサーバーバージョンでも動作する可能性はありますが、テストは行われていません。サーバー*製品のサポートは 2024 年 2 月 15 日に終了しました。サーバー製品を利用している場合は、アトラシアンのサーバー製品のサポート終了のお知らせページにて移行オプションをご確認ください。

*Fisheye および Crucible は除く

問題

Office ドキュメント (*.xlsx、*.pptx、*.docx) が特定のしきい値を超えている場合、Confluence でテキストを抽出して検索内容に表示することができません。インデックス用の添付ファイル制限のいくつかがこちらで説明されています。

添付ファイルのサイズを設定する

上のナレッジベースでは、インデックス用に添付ファイルのコンテンツを抽出するプロセスはメモリを大幅に消費し、大規模なファイルがアップロードされるとメモリ不足のエラーを発生させることがわかります。ここにあるサイズ制限は、Confluence でこの問題が発生しないようにするための予防策です。

診断

DEBUG に次のクラスを設定する

com.atlassian.confluence.internal.index.attachment
com.atlassian.confluence.internal.index
com.atlassian.confluence.search.lucene
com.atlassian.bonnie.search.extractor

問題の再現後、次のようなエントリが確認できる。ここでは、テキスト抽出を行うにはドキュメントが大きすぎると記載されており、これがファイルのコンテンツを検索できない理由となっている。

2021-03-06 18:25:56,021 DEBUG [attachment-text-extraction-worker-1] [internal.index.attachment.DefaultAttachmentExtractedTextManager] getContent Can't read extracted text of attachment 884741
2021-03-06 18:25:56,055 WARN [attachment-text-extraction-worker-1] [confluence.impl.hibernate.ConfluenceHibernateTransactionManager] doRollback Performing rollback. Transactions:
  ->[com.atlassian.confluence.internal.index.attachment.AttachmentTextExtractionFunction.apply]: PROPAGATION_REQUIRES_NEW,ISOLATION_DEFAULT (Session #674982162)
 -- referer: http://localhost:8090/pages/resumedraft.action?draftId=884737&draftShareId=ca5fced8-89dd-4fff-8660-4aa3d2903ce3& | url: /rest/documentConversion/latest/conversion/thumbnail/results | traceId: e9c077ee7d66b117 | userName: admin
2021-03-06 18:25:56,056 DEBUG [Caesium-1-1] [search.lucene.extractor.AttachmentExtractedTextExtractor] addFields Error when extracting text for 884741
java.util.concurrent.CompletionException: java.lang.RuntimeException: com.atlassian.bonnie.search.extractor.ExtractorException: Error reading content of PowerPoint document: Document too big for text extraction, bailing out
    at java.util.concurrent.CompletableFuture.encodeThrowable(CompletableFuture.java:273)
    at java.util.concurrent.CompletableFuture.completeThrowable(CompletableFuture.java:280)
    at java.util.concurrent.CompletableFuture$AsyncSupply.run(CompletableFuture.java:1606)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at java.lang.Thread.run(Thread.java:748)
Caused by: java.lang.RuntimeException: com.atlassian.bonnie.search.extractor.ExtractorException: Error reading content of PowerPoint document: Document too big for text extraction, bailing out
    at com.atlassian.confluence.extra.officeconnector.index.AbstractAttachmentExtractor.extract(AbstractAttachmentExtractor.java:33)
    at com.atlassian.confluence.internal.index.attachment.DelegatingAttachmentTextExtractor.lambda$extract$1(DelegatingAttachmentTextExtractor.java:35)
    at java.util.Optional.flatMap(Optional.java:241)
    at com.atlassian.confluence.internal.index.attachment.DelegatingAttachmentTextExtractor.extract(DelegatingAttachmentTextExtractor.java:35)
    at com.atlassian.confluence.internal.index.attachment.AttachmentTextExtractionFunction.apply(AttachmentTextExtractionFunction.java:70)
    at com.atlassian.confluence.internal.index.attachment.AttachmentTextExtractionFunction.apply(AttachmentTextExtractionFunction.java:22)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.springframework.aop.support.AopUtils.invokeJoinpointUsingReflection(AopUtils.java:343)
    at org.springframework.aop.framework.ReflectiveMethodInvocation.invokeJoinpoint(ReflectiveMethodInvocation.java:198)
    at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(ReflectiveMethodInvocation.java:163)
    at org.springframework.transaction.interceptor.TransactionAspectSupport.invokeWithinTransaction(TransactionAspectSupport.java:295)
    at org.springframework.transaction.interceptor.TransactionInterceptor.invoke(TransactionInterceptor.java:98)

We also have a known issue : CONFSERVER-58824 - Failed to extract index from Word doc file smaller than 16MB.

ソリューション

Java のシステムプロパティを設定してインスタンスを再起動することでしきい値をオーバーライドできます。

注意: 6 MB の値は例として利用しています。本番環境に設定をロールアウトする前に、下層のインスタンスでテストするようにしてください。また、この値を増やす際は、テキスト抽出はリソースを消費する処理であることを考慮してください。

拡張子

システムプロパティのキー

例

.docx

officeconnector.textextract.word.docxmaxsize

-Dofficeconnector.textextract.word.docxmaxsize=6052413

.xlsx

officeconnector.excel.extractor.maxlength

-Dofficeconnector.excel.extractor.maxlength=6052413

.pptx

officeconnector.powerpoint.extractor.maxlength

-Dofficeconnector.powerpoint.extractor.maxlength=6052413

説明	Unable to search content in PPT files when ppt file uses design templates or contains images
製品	Confluence

Confluence サポート

使用を開始する

ナレッジベース

製品

Jira Software

Jira Service Management

Jira Work Management

Confluence

Bitbucket

リソース

関連ドキュメント

コミュニティ

システムステータス

提案とバグ

Marketplace

請求とライセンス情報

サイズの大きい Office ファイルのコンテンツが検索できない

お困りですか?

問題

診断

ソリューション

ページ

Viewport

Confluence

サイズの大きい Office ファイルのコンテンツが検索できない

関連コンテンツ

お困りですか?

問題

診断

ソリューション

関連コンテンツ