【发布时间】:2023-03-11 16:42:01
【问题描述】:
我正在使用带有 nltk 的 Python。我需要处理一些没有任何空格的英文文本,但是 nltk 中的 word_tokenize 函数无法处理这样的问题。那么如何在没有任何空格的情况下标记文本。 Python中有什么工具吗?
【问题讨论】:
-
为什么没有空格?什么是域?
-
你如何识别一个单词?
-
除非您逐个字母地扫描文本并测试所有可能的连续字符组合,否则必须有一个分隔符
-
这是一个有趣的算法问题!我不知道为什么它被否决了。
-
我看到了同样的问题here。希望对你有帮助