【发布时间】:2011-07-05 14:28:46
【问题描述】:
我想了解是否可以将 Sitecore 的 Lucene 搜索引擎配置为索引 PDF 或 Word 文档?我在本文档 (http://sdn.sitecore.net/upload/sitecore6/65/sitecore_search_and_indexing_sc60-65-a4.pdf) 上查看了 Sitecore 支持站点,但它提到了创建一个文件爬虫类,这向我表明只有通过编写自定义代码才能实现这一点。如果我确实需要编写自定义代码来执行此操作,我是否还需要一些 API 才能从 PDF 文档中提取文本内容?
【问题讨论】:
标签: c# asp.net sitecore sitecore6 sitecore-media-library