【问题标题】:UIMA RUTA is not annotating text after "<!"UIMA RUTA 在“<!”之后没有注释文本
【发布时间】:2021-05-10 02:49:42
【问题描述】:

我正在使用 UIMA RUTA 来注释各种文档。它们来自不同的来源,有时会发生字符组合

是否可以选择关闭此行为? 即使我关闭了 MARKUP 注释,

我找到了负责创建大部分 MARKUP 注释的代码部分(org.apache.uima.ruta.seed 包中的 DefaultSeeder),但我无法找到负责 MARKUP 注释的代码部分以 开头

感谢您的任何建议!

【问题讨论】:

  • “即使我关闭了 MARKUP 注释”是什么意思?您是否更新了内部索引?

标签: java uima ruta


【解决方案1】:

有多种选择。最有可能的是,您希望将 RutaEngine 配置为使用不同的播种器,即 TextSeeder 而不是 DefaultSeeder。 TextSeeder 不会创建 MARKUP 注释。

您还可以更改可见性设置,以便正常处理 MARKUP 注释覆盖的文本,例如,使用 ADDRETAINTYPE(MARKUP);

【讨论】:

  • 谢谢彼得,看来我面临的问题在代码中更深一些。首先通过“关闭标记”,我的意思是我试图替换 SeedLexer.java 中的“案例 15” - 在文件末尾的开关中......这删除了标记,但仍然在那些曾经是标记的块中没有形成任何其他注释。
  • 示例:文本文本文本 文本文本。 “”。我尝试了所有 RETAINTYPE 的东西,但似乎“
  • 啊好的,我再仔细看看
  • 你不应该直接改编生成的词法分析器代码,而是改编词法分析器的jflex语法并重新生成类。我假设您的问题是由 TextLexer 中的错误引起的,它仍然会创建 MARKUP 注释(我会修复它)。作为一种解决方法,您能否在 ?
猜你喜欢
  • 2018-08-27
  • 2017-11-07
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多