【发布时间】:2011-05-10 12:13:22
【问题描述】:
我试过了
text = nltk.word_tokenize("hello, my name is John")
words = nltk.pos_tag(text)
for w in words:
print "%s = %s" % (w[0], w[1])
我得到了:
hello = NN
, = ,
my = PRP$
name = NN
is = VBZ
John = NNP
【问题讨论】:
-
这样做的原因是计算机听不懂英语。
-
@Ben @larsmans @Joce 我期待一个感叹词。 @kindall 至少,计算机可以理解单词并寻找它们的定义。但似乎标注器优先考虑“你好”作为名词。