【发布时间】:2014-10-18 18:47:02
【问题描述】:
在站起一个基本的码头 Solr example 之后。我试图制作自己的核心来代表我的公司将看到的数据。我创建了一个包含 conf 和数据目录的目录结构,并从 collection1 示例中复制了 core.properties、schema.xml 和 solrconfig.xml。 我编辑了 core.properties 以更改核心名称,并向架构添加了 31 个字段(大多数类型为 text_general、索引、存储、不需要或多值)。
我很确定我已正确设置它,因为我可以在管理页面下拉菜单中看到我的核心并与之交互。问题是,当我提供为新字段设计的文档时,我无法成功查询任何值。我相信数据是在我得到相同的命令行响应时提供的:
"POSTing file incidents.xml...
1 file indexed. ....
COMMITting..."
我认为,索引过程需要更多时间,但是当我将示例文档(例如 <field name="name">Apple 60 GB iPod with Video Playback Black</field> from ipod_video.xml)中的字段节点复制到我的文件副本(incidents2.xml)中时,对任何这些字符串的搜索立即成功.
我的问题最好的例子是两个文件都有以下字段:
<field name="Brand" type="text_general" indexed="true" stored="true" required="false" multiValued="false"/>
<field name="Brand">APPLE</field>
但是,只有第二个文档(具有上述 name 字段)与 apple 的查询一起返回。
感谢您阅读本文;我的问题是:
1) 有没有办法转储文档摄取的分析/标记化阶段?要么我不明白,要么分析选项卡不是为此而设计的。 debugQuery=true 参数给出了相关性得分数据,但没有解释文档被排除在外的原因。
2) 一旦我解决了我的整体问题,我希望索引中包含大文本字段,我可以在 solr 中将长格式文本包装在 CDATA 块中吗?
再次感谢。
【问题讨论】:
标签: solr