【问题标题】:how to extract exact information from unstructured text如何从非结构化文本中提取准确信息
【发布时间】:2017-11-03 08:46:59
【问题描述】:

我想从非结构化文本中提取一些信息。

例如,我的文字是“控制纽约温度低于 39”

我想要的信息是(“control”、“NewYork”、“temperature”、“under”、“39”)。

结果信息中,“control”表示动作,“NewYork”表示动作目标,“temperature”表示指标,“under 39”表示范围。

但是,文本内容的结构是多种多样的。

以下是一些典型案例。

"Control NewYork temperature under 39"
==>("control","NewYork", "temperature", "under", "39")

"give some money to my brother"
==>("give", "money", "my brother")

"Adjust the height of the table"
==>("adjust", "table", "height")

对我的问题有什么建议吗? 非常感谢!

【问题讨论】:

    标签: nlp information-retrieval


    【解决方案1】:

    您有几种范式可以进行这种结构化预测。 最常见的是:

    使用帧语义:http://www.cs.cmu.edu/~ark/SEMAFOR/

    使用语义角色标签 (SRL):http://cogcomp.org/page/demo_view/srl

    主要区别在于 SRL 的 Semantic Roles 对不同的动词有不同的含义,而 Frame Semantics 是一种抽象,它为语义概念提供了通用角色。

    您可以在 Github 上轻松找到执行帧语义解析或 SRL 的工具。然而,SRL 的使用更为广泛

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-02-26
      • 2014-06-25
      • 1970-01-01
      • 2016-09-07
      • 2014-05-01
      • 2020-09-07
      • 2013-12-13
      • 2013-10-02
      相关资源
      最近更新 更多