【发布时间】:2012-01-28 13:48:56
【问题描述】:
起初,我尝试通过 tika 检测波斯语:
how can I detect farsi web pages by tika?
但我知道 tika 不支持波斯语,我必须在 tika 中创建语言配置文件来处理波斯语。但我不知道该怎么做。实际上我无法从以下链接或谷歌中的其他链接中理解任何内容。请帮帮我。
https://issues.apache.org/jira/browse/TIKA-546
我想知道为tika添加语言配置文件的步骤。
【问题讨论】:
标签: apache apache-tika language-detection