【问题标题】:Log file processing with R使用 R 处理日志文件
【发布时间】:2012-07-22 11:18:11
【问题描述】:

我刚刚发现了 R,它似乎是获取网络服务器日志文件统计信息的理想工具。我研究了几个库,如 zooplyr,但它们都没有提供直接的解决方案来聚合时间戳数据。

是否有任何 R 库或教程或文档专注于分析日志文件之类的数据?哪个强调在切片中聚合时间?

可能的用例:

  • 每天的平均请求时间
  • 每天每个会话的平均请求数
  • 本周获得最慢的请求
  • ...

【问题讨论】:

  • 为什么zooplyr 不适合你?目前您的问题比较模糊,因此难以回答。你能更具体地回答你的问题吗?也许发布一些示例数据并展示您到目前为止所做的尝试?
  • 我的问题本质上是一般性的;)我只是想要一些概述,也许有人已经潜入使用 R 分析日志。我“以某种方式”解决了我的问题,但不是优雅方式。
  • 为什么必须用 R 来做这个?为什么不使用像AWstats 这样的网络服务器日志分析程序?

标签: r logging time-series


【解决方案1】:

这种处理时间戳数据的问题实际上很常见。因为您的问题含糊不清,所以我的回答仅限于一些指针。有关聚合时间序列的示例,请参见(顺便说一句,这些都是我自己的答案):

这些答案都使用相同的策略,结合plyrggplot2 包。这应该让你开始。请注意,这些只是我自己在几分钟内找到的答案。可能还有很多东西要找,特别是如果您正在寻找更具体的问题。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-07-10
    • 1970-01-01
    • 1970-01-01
    • 2020-12-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多