【发布时间】:2010-11-04 10:40:14
【问题描述】:
五年前,我的网站有 51 GB 的 HTTP (Apache) 访问日志。就我的个性而言,我是一个囤积者,这就是为什么我不愿意删除它们,即使它占用的磁盘空间比我想要的要多。我应该硬着头皮删除吗?还是匿名?
人们如何处理他们的旧日志文件?
【问题讨论】:
标签: apache logging access-log
五年前,我的网站有 51 GB 的 HTTP (Apache) 访问日志。就我的个性而言,我是一个囤积者,这就是为什么我不愿意删除它们,即使它占用的磁盘空间比我想要的要多。我应该硬着头皮删除吗?还是匿名?
人们如何处理他们的旧日志文件?
【问题讨论】:
标签: apache logging access-log
我们每天压缩的日志超过 75 Gig。由于显而易见的原因,我们目前不会保留超过一个月的日志,但我们正在研究包括 DFS 在内的解决方案,以便我们可以轻松添加更多日志。存储很便宜,但您始终必须考虑“假设”。每月 0.15 美元/演出,您只需在 S3 上存储每月 8 美元,然后您不必担心会丢失任何东西。我建议你调查一下。
驱动器也很便宜,如果您担心的话,可以买一些便宜的 50 美元驱动器并将日志复制到该驱动器并将它们存储在朋友/亲戚家。 :-)
【讨论】:
我同意其他人的观点:
如果它让您感觉更好,请压缩并刻录到光盘。
如果您需要额外的舒适感,请在异地存放。
如果您只是需要一些东西来分散您对放手的决定的注意力,您可以编写一个解析器,将您的日志剥离到最基本的要素,找到差异,或者以其他方式破坏它们,这样您就可以总结出一些有洞察力的东西,多汁的数据集。然后,您可以保留两件事。 :)
【讨论】:
这是很多日志。你在用logrotate吗?只需将它们拉上拉链即可为您提供所需的空间。我所有的服务器日志都被压缩成 gzip 文件。来自中小型企业 Intranet 的一年日志价值为 174M。
【讨论】:
答案实际上取决于您通常需要对日志做什么、您的业务是什么以及您的(公司?)安全政策。
就我而言,我通常从不删除日志。它们对于发现安全漏洞、行为和趋势非常有用。
如果存储有问题,请考虑使用 Amazon S3 等存储服务,不要忘记压缩它们!我通常将所有超过一个月的压缩日志移到那里。
【讨论】:
我“囤积”的大多数日志文件我要么根据月/季度/年压缩,然后你就会拥有它们,但日志文件可以很好地压缩。如果空间有问题,请刻录到 DVD(也可以制作多个副本)。
【讨论】: