【问题标题】:apache uima ruta - non english sentence processingapache uima ruta - 非英语句子处理
【发布时间】:2018-12-17 07:13:29
【问题描述】:

我用两种不同的语言(英语、韩语)测试了 RUTA 脚本。 我想得到按单词分割的相同结果。但是韩语句子没有被单词分割。

脚本: 声明最后一个; W {-> Last1};

文档:“这是一个样本。”

结果: 这 , 是 , 一种 , 样本

文档:“이것은 샘플입니다。”
结果 : “”(无)

我想要得到的结果: 이것은 , 샘플입니다

结果什么都没有。我想知道如何将非英语单词检测为 Ruta 中的单词。

希望大家帮忙!!!

【问题讨论】:

    标签: apache uima ruta


    【解决方案1】:

    我使用“拆分”解决了问题。

    句子{-> SPLIT(SPACE)};

    (apache uima rota-core 2.6.1)

    无论如何,我想知道如何使用保留关键字“W”来分隔 unicode 字。

    【讨论】:

    • 使用示例输入和预期结果将 unicode 问题作为不同的问题提出。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-09-13
    • 2018-08-27
    相关资源
    最近更新 更多