【问题标题】:NER for predefined entities预定义实体的 NER
【发布时间】:2019-03-03 03:49:05
【问题描述】:

我正在开发一个应用程序,用于将需求规范中的需求分类为数据库、前端、后端等类别。需求规范是一个单独的文档,我希望在其中查看其中的基础类别。我可以使用 NER 来获取类别吗?如果句子包含与该特定类别匹配的某些单词,则将它们划分为类别。

示例

数据应存储在安全数据库中。

如果我们认为上面给出的句子是一个要求,考虑到它包含的单词(数据库,数据),它应该被归类到数据库类别中。

【问题讨论】:

  • 你可以为你自己的数据和实体训练斯坦福的 NER 标记器,但你必须有大数据集。

标签: machine-learning nlp named-entity-recognition


【解决方案1】:

据我所知,NER 预构建工具无济于事,但我建议您使用 spaCy。它是一种 NER 工具,具有最先进的准确性,并支持重新训练您的 DL 模型并对其进行自定义。希望这会有所帮助!

【讨论】:

  • 谢谢,但它需要大量的数据来训练。
  • 这取决于您要做什么,但您可以搜索可用的数据集。我相信他们在互联网上的某个地方。
  • 我搜索了数据集,甚至请求了它,但它们不可用。正如问题中提到的,我想要一个数据集,该数据集用它所属的分类标记数据集,如数据库、前端或后端。
  • 恐怕你得自己做。但是,我在这里实施了一个项目来分析大型语料库中最重要的事件。我真的认为它可以帮助你。 github.com/yeulam1thienthan/… 例如,只需使用集群对您的规范进行分类,然后选择数据库集群并在数据库集群中选择文档。这就是我的解决方案。
猜你喜欢
  • 2020-06-08
  • 1970-01-01
  • 2019-01-06
  • 1970-01-01
  • 2020-01-12
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多