【问题标题】:How to get file access information on linux (debian)如何在 linux (debian) 上获取文件访问信息
【发布时间】:2015-02-24 13:21:05
【问题描述】:

根据谷歌网站管理员工具,最近我的网络服务器上的 robots.txt 文件出现了一些问题。更准确地说,我得到“由于 robots.txt 无法访问而推迟抓取”。信息。 这很奇怪,因为如果你尝试访问它:http://www.newsflow24.com/robots.txt 看起来还不错,即使是 google 抓取测试器也显示没有问题,但真正的 google bot 似乎有一些问题。

因此,要了解发生了什么,我想知道,我如何查看日志文件或其他内容,以便我可以找出当 google bot 尝试在 x 时间访问 robots.txt 文件时究竟发生了什么。

第一段只是我的问题的介绍,我真正的问题是第二段。

提前致谢。

【问题讨论】:

    标签: linux logging web-crawler monitoring server


    【解决方案1】:

    您的 http 服务器可能会在 /var/log/something 中生成日志,这取决于您使用的服务器。阿帕奇?

    【讨论】:

    • 我正在使用 nginx。这意味着所有与 http 相关的问题都在 /var/log/nginx/errors.log 中进行监控?
    • 是的,所有错误都应该存在。例如,如果 Googlebot 得到 404。
    • 太好了,这些文件正是我需要的。谢谢!
    猜你喜欢
    • 1970-01-01
    • 2010-12-16
    • 2019-08-06
    • 2021-05-20
    • 2010-09-08
    • 1970-01-01
    • 2011-07-08
    • 1970-01-01
    相关资源
    最近更新 更多