【发布时间】:2013-04-07 21:05:50
【问题描述】:
我正在开发一个小型图书馆自动化软件,我需要确定一个单词是在English 还是Turkish。一个示例场景是这样的:
- 用户输入书名。
- 确定是土耳其语还是英语。
- 将语言组合框设置为相应的语言,以帮助用户填写表格。
我的一个朋友建议我“连接到谷歌翻译并使用它”,这似乎是合理的,但不连接外部服务或数据库的算法更适合我。 (我还搜索土耳其语/英语特定字符,如ç、ş、İ/w、x 来决定)因此我正在搜索一种算法来完成这项工作,可能基于字母频率或类似的东西。文学中有什么可用的吗?提前致谢。 (重要的话我用php,mysql)
【问题讨论】:
-
stackoverflow.com/questions/1441562/… 你也可以检查wiki.apache.org/solr/LanguageDetection Solr 可以给你语言概率(例如这句话是 90% 英语或 10% 土耳其语)
-
这两个词呢?
-
感谢所有回答。 Dagon,我并不期待 100% 准确的算法,法语这是一个爱好项目,我认为提供这样的功能可能会很好。 fsw,你的链接适合我。如果您将其写为答案而不是评论,我会接受您的答案。
标签: php algorithm nlp translation