【发布时间】:2023-04-02 20:18:02
【问题描述】:
如Apache Solr Reference Guide 中所述,我正在使用 Apache Solr 8.6 在 Linux 中使用 POST 工具对文档进行索引。
POST 工具命令
bin/post -c testcore /testdocs/
文档已成功编入索引。现在,当我在 Solr Admin UI 中搜索字符串时,例如:hello,它正在返回匹配的文档,并且我可以在 _text_ 字段中查看文档内容,因为我使用以下属性将内容存储在 manage-schema .xml
<field name="_text_" type="text_general" multiValued="true" indexed="true" stored="true"/>
它正在索引文档内容并存储在_text_字段中,但它也在_text_字段中存储和显示文档属性,如内容类型和其他文档类型属性。
现在我希望这些属性不应该存储在 _text_ 字段中,而应该只存储实际的文档内容。
solrconfig.xml 配置
<requestHandler name="/update/extract" startup="lazy" class="solr.extraction.ExtractingRequestHandler">
<lst name="defaults">
<str name="lowernames">true</str>
<str name="fmap.meta">ignored_</str>
<str name="fmap.content">_text_</str>
</lst>
</requestHandler>
如果您能进一步指导我,将不胜感激。
【问题讨论】: