【发布时间】:2016-12-30 06:02:13
【问题描述】:
自从有人告诉我 Spacy 是一个用于自然语音处理的强大 Python 模块后,我现在正在拼命寻找一种方法,将单词组合成多个名词短语,最重要的是介词短语。 我怀疑有一个 Spacy 函数,但我猜这将是最简单的方法(SpacySpaCy 导入已经在我的项目中实现)。 尽管如此,我对任何短语识别/分块的可能性持开放态度。
【问题讨论】:
-
你能举一个你具体想要什么的例子吗?也许就像一个示例输入,所需的输出与之对应。
-
当然。作为德语输入的翻译,请使用“我开车去大学需要多长时间?”这样的句子。 (德语“Wie lange brauche ich bis zur Uni?”)。我希望通过远程知道介词短语的组成或通过陈述确切的规则(PP -> PREP + NP),就像在其他蟒蛇模块。由于 SpaCy 用于在我的程序中进行标记,并且似乎只支持名词分块,因此我希望有一个支持模块或只是其中的一个函数来识别其他块。
标签: python nlp chunking phrases spacy