【发布时间】:2015-09-30 01:35:34
【问题描述】:
import nltk
from nltk.tokenize import word_tokenize
txt = "finding a common place isn't commonly available among commoners place"
fd = nltk.FreqDist()
for w in word_tokenize(a.lower()):
fd[w] += 1
我有上面的脚本可以正常工作。如果我输入 fd['place'] 我得到 2,如果我输入 fd['common'] 我得到 1。
是否可以键入类似于fd['common*'] 的内容(这不起作用)来获取 3 以及可能的这些匹配项的列表?三场比赛将是(common, commonly, commoners)
我假设它与regex 有关,但不确定如何使用FreqDist() 实现
如果没有,是否有任何其他软件包可以做到这一点?
【问题讨论】:
标签: python regex python-3.x nltk