如何在 linux (debian) 上获取文件访问信息

【问题标题】：How to get file access information on linux (debian)如何在 linux (debian) 上获取文件访问信息
【发布时间】：2015-02-24 13:21:05
【问题描述】：

根据谷歌网站管理员工具，最近我的网络服务器上的 robots.txt 文件出现了一些问题。更准确地说，我得到“由于 robots.txt 无法访问而推迟抓取”。信息。这很奇怪，因为如果你尝试访问它：http://www.newsflow24.com/robots.txt 看起来还不错，即使是 google 抓取测试器也显示没有问题，但真正的 google bot 似乎有一些问题。

因此，要了解发生了什么，我想知道，我如何查看日志文件或其他内容，以便我可以找出当 google bot 尝试在 x 时间访问 robots.txt 文件时究竟发生了什么。

第一段只是我的问题的介绍，我真正的问题是第二段。

提前致谢。

【问题讨论】：

标签： linux logging web-crawler monitoring server

【解决方案1】：

您的 http 服务器可能会在 /var/log/something 中生成日志，这取决于您使用的服务器。阿帕奇？

【讨论】：

我正在使用 nginx。这意味着所有与 http 相关的问题都在 /var/log/nginx/errors.log 中进行监控？
是的，所有错误都应该存在。例如，如果 Googlebot 得到 404。
太好了，这些文件正是我需要的。谢谢！

猜你喜欢

1970-01-01
2010-12-16
2019-08-06
2021-05-20
2010-09-08
1970-01-01
2011-07-08
1970-01-01

相关资源

下载 2021-06-06
下载 2023-01-21
下载 2021-06-23
下载 2021-06-05

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode