【问题标题】:How to detect if a website has been translated into other languages?如何检测网站是否已被翻译成其他语言?
【发布时间】:2014-12-13 01:42:12
【问题描述】:

我正在尝试确定给定网站是否已通过编程方式翻译成任何其他语言。

我尝试使用各种组合(例如 es.domain.com、domain.es、domain.com/es 和 domain.com.es)发出 get 请求。然后,我再次请求返回 200 的网站以尝试清除误报(网站呈现英语页面等)。对于这些请求,我使用了一个虚假的 url (xyz123.domain.com, domain.xyz123, domain.com/xzy123) 并确保状态码不是 200 并且正文不是空的。我仍然得到一些误报,例如 www.domain.com 归一家公司所有,而 www.domain.es 归其他公司所有。因此,虽然我获得了对 www.domain.es 的成功响应,但它实际上并不是他们的网站。

有人对如何检查有任何想法吗?

谢谢!

【问题讨论】:

  • 这方面确实没有标准。除非网站在其内容或元数据中包含指向翻译版本的链接,否则其他任何内容基本上都是猜测。猜测会导致误报和漏报。

标签: web translation


【解决方案1】:

查询子域不是检测网站是否已翻译的有效方法。

没有标准表明网站已被翻译,因此任何程序化功能都不准确。

在实施标准之前,您最好的选择是蛮力方法,就像您正在做的那样,并亲自验证网站。

【讨论】:

  • 谢谢,我就是这么想的。通过扫描主页以查找不同语言版本(西班牙语、法语等)的链接,我们发现了一些不错的成功
  • 是的,这将是您最好的选择。扫描语言标签等......希望他们有一天能将其带入标准化。
猜你喜欢
  • 1970-01-01
  • 2011-06-10
  • 1970-01-01
  • 2015-03-12
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-01-28
  • 1970-01-01
相关资源
最近更新 更多