ドキュメントのコンテンツが検索できない
症状
ログに次のエラーが記録されている。
2012-06-29 14:41:00,327 WARN [scheduler_Worker-2] [bonnie.search.extractor.BaseAttachmentContentExtractor] addFields Error indexing attachment (Attachment: My_PDF_Examplem.pdf v.2 (8912924) admin)
com.atlassian.bonnie.search.extractor.ExtractorException: Error getting content of PDF document
at com.atlassian.bonnie.search.extractor.PdfContentExtractor.extractText(PdfContentExtractor.java:66)
at com.atlassian.bonnie.search.extractor.BaseAttachmentContentExtractor.addFields(BaseAttachmentContentExtractor.java:40)
at com.atlassian.confluence.plugin.descriptor.ExtractorModuleDescriptor$BackwardsCompatibleExtractor.addFields(ExtractorModuleDescriptor.java:36)
at com.atlassian.bonnie.search.BaseDocumentBuilder.getDocument(BaseDocumentBuilder.java:104)
at com.atlassian.confluence.search.lucene.ConfluenceDocumentBuilder.getDocument(ConfluenceDocumentBuilder.java:97)
at com.atlassian.confluence.search.lucene.tasks.AddDocumentIndexTask.perform(AddDocumentIndexTask.java:43)
...
Caused by: java.io.IOException: Error: Expected an integer type, actual=''
at org.apache.pdfbox.pdfparser.BaseParser.readInt(BaseParser.java:1310)
at org.apache.pdfbox.pdfparser.PDFObjectStreamParser.parse(PDFObjectStreamParser.java:81)
at org.apache.pdfbox.cos.COSDocument.dereferenceObjectStreams(COSDocument.java:449)
at org.apache.pdfbox.pdmodel.PDDocument.openProtection(PDDocument.java:1112)
at org.apache.pdfbox.pdmodel.PDDocument.decrypt(PDDocument.java:591)
at com.atlassian.bonnie.search.extractor.PdfContentExtractor.extractText(PdfContentExtractor.java:45)
... 30 more
原因
Confluence で一部の添付ファイルをインデックスできていません。対象のファイルが破損しているか、Confluence のインデックス タスクの実行中にメモリ不足の問題が発生している可能性があります。
回避策
- 添付ファイルのインデックス作成を無効化する方法の手順を利用して、添付ファイルのインデックス作成を無効化します。これによって Confluence によるコンテンツのインデックス作成が停止するため、検索でコンテンツは表示されなくなります。ただし、添付ファイルのタイトルは引き続きインデックスされ、検索可能です。
- 上記が完了したらコンテンツのインデックスをゼロから再構築します。
最終更新日 2016 年 9 月 28 日
Powered by Confluence and Scroll Viewport.