【发布时间】:2012-02-25 23:57:00
【问题描述】:
我遇到了问题,Google 并没有给我太多帮助。我正在尝试找出一种在 ColdFusion (9) 中搜索 Solr 索引时忽略 HTML 的方法。
例如,如果我搜索 microsoft 并且我的索引包含 Microsoft© makes Windows®,系统会提示我搜索“Microsoft© 制造 Windows®”,而不是显示实际结果。
正如您在下面看到的,我只是将字符串传递给 cfsearch 的条件属性 - 但同样 - 这样做会产生(我认为的)“脏”结果。
<cfsearch
collection="mycollection"
criteria="microsoft"
name="results"
maxrows="100"
suggestions="always"
contexthighlightbegin="<strong>"
contextHighlightEnd="</strong>"
contextPassages="3"
/>
我一直在查看 Solr's query syntax 的文档,但我没有看到任何关于如何避免此问题的信息。
我应该考虑为索引提供文本的“平面”版本还是有办法避免诸如&copy; / &reg; / &trade; 之类的 HTML 字符串?
我愿意接受建议。
-- 布赖恩。
【问题讨论】:
-
我正在使用 CF10,根据corporatezen.com/2013/11/updating-solr-engine-coldfusion,它应该使用 Solr 3.4。我将
<charFilter class="solr.HTMLStripCharFilterFactory"/>添加到<fieldType name="text">,但搜索结果仍然返回HTML。知道为什么吗?
标签: coldfusion solr coldfusion-9