【问题标题】:How to realize Named entity recognition with OpenNLP for the Albanian language?如何使用 OpenNLP 实现阿尔巴尼亚语的命名实体识别?
【发布时间】:2012-08-15 13:34:04
【问题描述】:

我正在尝试阿尔巴尼亚语的 OpenNLP。为此,我正在使用 OPenNLP 并尝试为阿尔巴尼亚语的人员、位置和组织实体识别构建模型。 我正在构建我自己的语料库,但我需要一位 Open NLP 专家来确认我以下疑问: 1-我应该为每个模型建立一个单独的语料库,例如对于ner-person 建立一个只有标签存在的语料库? 2-是否可以在同一语料库中标记人员、位置和组织,并使用它来训练能够提取所有三种实体类型的单个模型? 3- 是否有资源可以让我找到更多关于 OpenNLP 名称查找器模块中使用的算法的信息?

感谢您的回复,我真的需要您对我的论文的支持

【问题讨论】:

    标签: java nlp opennlp


    【解决方案1】:

    1- 我是否应该为每个模型建立一个单独的语料库,例如对于ner-person 建立一个只有标签存在的语料库? IMO 是的......但是可以让模型包含多种名称类型。如果将它们分开,则可以更轻松地更新和迭代改进给定名称的模型,尤其是在它们是大型模型的情况下。

    2- 是否可以在同一语料库中标记人员、位置和组织,并使用它来训练能够提取所有三种实体类型的单个模型? 是的,这是可能的,但如果您计划在每种名称类型的基础上构建并优化模型,那么将它们分开对我来说更容易。

    3- 是否有资源可以让我找到更多关于 OpenNLP 名称查找器模块中使用的算法的信息? 最好的做法是下拉源代码并使用一些真实数据逐步执行代码……它基于最大熵。

    【讨论】:

      猜你喜欢
      • 2015-04-14
      • 2014-10-26
      • 2013-02-21
      • 2015-03-16
      • 1970-01-01
      • 1970-01-01
      • 2011-10-20
      • 1970-01-01
      • 2015-04-05
      相关资源
      最近更新 更多