【发布时间】:2023-05-03 06:49:02
【问题描述】:
一些语言,尤其是斯拉夫语言,会根据语法上下文改变人名的结尾。 (对于那些了解语法或学习过对单词(例如德语或俄语)执行此操作的语言的人,并且为了帮助搜索关键字,我说的是名词变格。)
这可能是最简单的一组示例(用波兰语,以保存整个不同字母表的问题):
- Dorothy 看到了猫 — Dorota zobaczyła kota
- 猫看到了多萝西 — Kot zobaczył Dorotę
- 这是 Dorothy 的猫 - 开玩笑说 Doroty
- 我把猫给了 Dorothy — Dałam kota Dorotie
- 我和 Dorothy 去散步了 — Poszłam na spacer z Dorotą
- “你好,多萝西!” — “威塔姆,多罗托!”
现在,如果在这些示例中,此处的名称是由用户输入的,那么就会引入一个语法噩梦的世界。重要的是,如果我选择 Katie (Kasia),examples are not directly comparable — 3 和 4 都是 Kasi,而不是 *Kasy 和 *Kasie — 男性名字将是 wholly different again。
我猜以前有人处理过这种情况,但是我的 Google-fu 今天似乎很弱。我可以找到很多关于自然语言处理的链接,但我认为这正是我想要的。需要明确的是:每个用户我只会有一个用户输入的名称,我需要将它们拒绝为已知配置 - 我将有一个本地化文本,其中包含诸如 {name nominative} 和 @987654330 之类的占位符@,为了争论。我真的不想对文本进行词法分析来解决问题,我只需要拒绝那个用户输入的名称。
任何人对如何执行此操作有任何建议,或者我需要开始致电本地化机构;o)
有兴趣的进一步阅读(全部在*上):
免责声明:我知道这在许多其他语言中都会发生;突出显示斯拉夫语言仅仅是因为我有一个项目将本地化为一些斯拉夫语言。
【问题讨论】:
-
只是一个简短的说明:(对于那些了解语法或学习过对单词执行此操作的语言的人,例如德语或俄语,并帮助搜索关键字,我说的是名词变格.) 你确定这是用德语完成的吗??
-
在德语中,普通名词会根据大小写而变化,而专有名词(包括人名)则不会。
-
@Sebi:汤米是正确的。名词(和代词)变格在德语中确实会发生,但不会发生在地名或人名中。例如,德语中的等价物是 der Tisch > den Tisch > des Tisches > dem Tische。
-
是的,当然,我在谈论他的例子中的地名和个人姓名
-
自然语言处理正是您想要的。毕竟,您正在处理自然语言。
标签: internationalization nlp grammar linguistics