【发布时间】:2014-01-13 23:27:39
【问题描述】:
虽然我使用其中一种 UTF8 分析器,但 Lucene 不能很好地处理特殊字符(如 ë,它是荷兰语中的常见字符)。 使用本地 Xampp 安装在 Windows 上进行测试得知 ë 由 lucene 存储为 ë
在我的实时站点 (linux-server) 上,情况更糟:当 Lucene 遇到像 ë 这样的字符时,它会完全停止对字符串进行索引。
我只是不明白我做错了什么。 希望有人能解释一下...
【问题讨论】:
-
其他示例 存储为 Â,无论是否使用 html_entity_decode()
标签: php zend-framework lucene