【发布时间】:2011-09-28 11:10:16
【问题描述】:
我正在使用 GATE 处理以自然语言编写的文本。我必须从文本中提取身高、体重、bp 等并以结构化形式存储。现在,这些东西(即身高、体重等)可以写成我不知道的多种形式。为我能想到的所有不同方式编写 JAPE 语法,只是对其进行硬编码。我还有其他选择可以更灵活地处理文档吗?
另外,我很困惑我是否可以使用 ANTLR 通过呈现不同的书写高度、体重等方式来生成日语语法?
文本将包含以下内容:
Vitals: Height: 72 inches, Weight is 170 pounds, T is 89.9 degree Fahrenheit. OR
Vitals: He is 184 cm tall, his weight was 67.8 Kg, RR 16 (its respiration rate). OR
Vitals: height is 6ft 3 in, he weighs 70 kg, pulse is 67, Temperature 99.8 degrees.
现在我使用 JAPE 语法和 ANNIE 对文本进行标记,以提取这些生命体征并以结构化形式存储。使用 ANTLR 是否可以灵活地标记此类文本?灵活,因为我不应该为每种表示方式硬编码它,因为你看到身高、体重等可以用多种形式表示。
搜索或开发任何可以生成jape语法的语法生成器是个好主意吗?
如果您需要任何详细信息以更好地理解问题,请告诉我。
非常感谢!!
【问题讨论】:
-
“我是否可以使用ANTLR来生成jape语法”,我不熟悉jape或GATE,但ANTLR一般不适合NLP。 ANTLR 也不会生成其他语法:ANTLR 采用类似 BNF 的语法,它将其转换为词法分析器和/或解析器,可以标记和/或解析您在所述 BNF 类语法中定义的语言。如果您仍然认为 ANTLR 可以用于您的情况,请编辑您的问题并提供一些具体的输入示例以及相应的(所需)输出。
-
@Bart:感谢您的编辑和您的建议!我的问题现在清楚了吗?
-
不,我不会为此使用 ANTLR。
标签: nlp antlr text-processing gate