【发布时间】:2016-10-31 18:45:34
【问题描述】:
我最近开始使用 UMass 的 Mallet。我查看是否有一种方法可以使用命令删除前缀/后缀和缩写,就像停用词有命令一样,但是我没有找到任何有关它的信息。如果 Mallet 可以做到这一点,有人能指出我正确的方向吗?如果它不能,但你知道还有其他东西可以做到这一点,你能指出我那个方向吗?
提前致谢!
【问题讨论】:
标签: mallet
我最近开始使用 UMass 的 Mallet。我查看是否有一种方法可以使用命令删除前缀/后缀和缩写,就像停用词有命令一样,但是我没有找到任何有关它的信息。如果 Mallet 可以做到这一点,有人能指出我正确的方向吗?如果它不能,但你知道还有其他东西可以做到这一点,你能指出我那个方向吗?
提前致谢!
【问题讨论】:
标签: mallet
在对语料库运行 Mallet 之前,您可以对语料库进行一些计算语言预处理(例如词干提取或词形还原)。
我不知道在 Mallet 中执行此操作的方法(并且严重依赖于语言)。也许你可以写一个输入过滤器,但我会把它放在 Mallet 之外。
【讨论】: