【发布时间】:2015-02-27 21:29:01
【问题描述】:
对于像“这是一个简单的句子”这样的句子,它已被标记为:
[('This', 'DT'), ('is', 'VBZ'), ('a', 'DT'), ('simple', 'JJ'), ('sentence', 'NN')]
并使用以下语法:
my_grammar = nltk.CFG.fromstring("""
... S -> DP VP
... DP -> Det NP
... NP -> Adj N
... VP -> V DP
... Det -> 'DT'
... N -> 'NN'
... V -> 'VBZ'
... Adj -> 'JJ'
... """)
如何输出树形结构。我正在尝试使用词性标签代替已标记的单词,但仍然在树中显示单词本身以获得类似于:
(S
(DP This)
(VP
(V is)
(DP (Det a)
(NP
(Adj simple) (N sentence))))
编辑:我已经尝试了答案here,但是当我开始使用命令时:
for tree in parser.parse(pos_tags):
... print(tree)
什么都不返回
【问题讨论】:
标签: python parsing nltk grammar