【发布时间】:2014-12-13 01:42:12
【问题描述】:
我正在尝试确定给定网站是否已通过编程方式翻译成任何其他语言。
我尝试使用各种组合(例如 es.domain.com、domain.es、domain.com/es 和 domain.com.es)发出 get 请求。然后,我再次请求返回 200 的网站以尝试清除误报(网站呈现英语页面等)。对于这些请求,我使用了一个虚假的 url (xyz123.domain.com, domain.xyz123, domain.com/xzy123) 并确保状态码不是 200 并且正文不是空的。我仍然得到一些误报,例如 www.domain.com 归一家公司所有,而 www.domain.es 归其他公司所有。因此,虽然我获得了对 www.domain.es 的成功响应,但它实际上并不是他们的网站。
有人对如何检查有任何想法吗?
谢谢!
【问题讨论】:
-
这方面确实没有标准。除非网站在其内容或元数据中包含指向翻译版本的链接,否则其他任何内容基本上都是猜测。猜测会导致误报和漏报。
标签: web translation