【发布时间】:2011-07-16 21:28:42
【问题描述】:
我正在使用包含 5000 个项目的哈希来匹配句子中的单词,当我匹配例如:if($hash{$word}){Do Something} 时,有时会发生句点出现在单词中,即使它是匹配的存在期间导致不匹配。与哈希匹配时,可以做些什么来忽略任何标点符号吗?
【问题讨论】:
-
您需要考虑像
O'Malley这样的情况,并确定嵌入的引号是否是标点符号。当你想出一组你喜欢的规则时,然后将它们应用于输入的单词以消除所有不是标点符号的内容,然后再在哈希中查找它们。 -
@Jim 我也在考虑这些行,但问题是我需要句点以便在匹配后进行句子边界检测,所以我无法删除句子中的任何标点符号。跨度>
-
能否提供更多示例代码?解决方案可能在于您如何解析单词,也可能在于您如何填充哈希...