【发布时间】:2009-11-08 00:39:34
【问题描述】:
我正在尝试解析一些文本并将其绘制成图表,就像您处理一个句子一样。我是 NLTK 的新手,正在尝试在 NLTK 中找到可以帮助我完成此任务的东西。到目前为止,我见过nltk.ne_chunk 和nltk.pos_tag。我发现它们不是很有帮助,而且我找不到任何好的在线文档。
我也尝试过使用LancasterStemmer,但我不完全理解它的作用或它应该如何使用或它为什么存在。
有人可以帮我解决这个问题吗?没有任何指路明灯,我真的很茫然,很沮丧。
提前致谢
【问题讨论】:
-
您到底想完成什么?你真的需要语义解析,还是简单的词法分析?您要生成的二元图是什么?
-
最终,我希望能够创建一个代表文本中数据的“树”。完成此操作后,我可以对另一段文本(关于同一主题 - 比如说讲座)做同样的事情,并比较两者的相似/不同之处并合并差异。这最终可以产生一棵具有该讲座最准确表示的“树”
标签: nlp text-parsing nltk