【发布时间】:2014-05-06 16:14:57
【问题描述】:
请帮助我理解命名实体识别和命名实体提取之间的区别。
【问题讨论】:
-
它们是一样的。
-
您在哪里看到了命名实体提取这个术语?我从来没听说过。你是说信息提取吗?
标签: machine-learning nlp
请帮助我理解命名实体识别和命名实体提取之间的区别。
【问题讨论】:
标签: machine-learning nlp
命名实体识别是对实体(人、地点、组织)的表面形式的识别,即“George Bush”或“Barack Obama”是此文本字符串中的“PERSON”实体。
实体提取将从文本字符串中提取附加信息作为属性。例如,在“乔治·W·布什是奥巴马总统之前的总统”这句话中,承认“奥巴马”是一个具有“头衔=总统”属性的人。
但是,如果您查看软件,则通常会模糊区分。
【讨论】:
没有命名实体提取这样的东西。
更好地解释这句话我会说命名实体提取很简单,具体提取先前识别的命名实体的过程。所以,从某种意义上说,没有真正的理论知识与这个任务相关,只是定义机械操作的问题。
如果我们有兴趣从一段文本中提取所有特定实体或有关它们的附加信息,那么我们必须查看信息或知识提取。
例如,对于信息提取,您可以要求提取出现在文档语料库中的所有城市名称或电子邮件地址。对于这样的任务,可以使用命名实体提取。您甚至可以更通用,只要求提取一般知识,例如以关系的形式(关系提取)。
有关更多详细信息,我建议阅读本书Artificial Intelligence: A Modern Approach 的自然语言处理章节。
【讨论】: