apache uima ruta - 非英语句子处理答案

【问题标题】：apache uima ruta - non english sentence processingapache uima ruta - 非英语句子处理
【发布时间】：2018-12-17 07:13:29
【问题描述】：

我用两种不同的语言（英语、韩语）测试了 RUTA 脚本。我想得到按单词分割的相同结果。但是韩语句子没有被单词分割。

脚本：声明最后一个； W {-> Last1};

文档：“这是一个样本。”

结果：这，是，一种，样本

文档：“이것은 샘플입니다。”
结果： “”（无）

我想要得到的结果： 이것은 , 샘플입니다

结果什么都没有。我想知道如何将非英语单词检测为 Ruta 中的单词。

希望大家帮忙！！！

【问题讨论】：

【解决方案1】：

我使用“拆分”解决了问题。

句子{-> SPLIT(SPACE)};

(apache uima rota-core 2.6.1)

无论如何，我想知道如何使用保留关键字“W”来分隔 unicode 字。

【讨论】：