【发布时间】:2016-10-17 11:20:50
【问题描述】:
我有一个 ExpressJS Web 应用程序,用于内部用途,我不希望 Google 为其编制索引。所以我实现了以下路线:
app.get('/robots.txt', function(req,res) {
res.set('Content-Type', 'text/plain');
res.send('User-agent: *\nDisallow: /');
}
我通过点击 URL 并检查响应来验证它工作正常,这是
User-agent: *
Disallow: /
尽管如此,当我搜索网站标题时,我可以在 Google 上看到我的页面结果。该应用程序已上线一年左右,因此无法缓存结果。发生这种情况还有其他可能的原因吗?有什么方法可以解决吗?
【问题讨论】:
-
难道这些你不想让谷歌索引的页面有安全性吗?如果是这样,谷歌不能索引安全页面,因为你必须登录。
that is used for internal purposes给我这句话,确实会告诉我您需要某种身份验证。 -
是的,他们有 OAuth2 身份验证。登录页面是被索引的页面
-
如果它是内部的,并且您想强制它是内部的。您可以检查 IP 地址。无论您在网站上放置什么元标记,都无法保证知道您的页面不会被索引。 Google 可能会遵守 robots.txt 和
meta name,但不能保证其他索引服务也会这样做。 -
You can check the IP address你能解释一下吗 -
req对象可以访问远程的 IP 地址。req.connection.remoteAddress,请注意,如果您在代理后面运行,请确保您的 express 应用启用了trust proxy,否则您将获得代理的 IP。
标签: javascript html seo google-search robots.txt