jq如何根据值从唯一键中进行选择答案

【问题标题】：jq how to choose from unique keys based on valuesjq如何根据值从唯一键中进行选择
【发布时间】：2019-03-11 19:28:43
【问题描述】：

我最近学习了更多关于 JSON 的知识，偶然发现了“jq”命令行 JSON 处理器。我正在尝试从我们的 Github 存储库中合并多个关于克隆的 json 文件。其中一些日期重叠，并且由于它们是在一天中的不同时间访问的，因此计数和唯一值略有不同。这是一个例子：

[
  {
    "timestamp": "2018-12-24T00:00:00Z",
    "count": 1,
    "uniques": 1
  },
  {
    "timestamp": "2018-12-24T00:00:00Z",
    "count": 2,
    "uniques": 1
  },
  {
    "timestamp": "2018-12-24T00:00:00Z",
    "count": 3,
    "uniques": 2
  },
  {
    "timestamp": "2018-12-25T00:00:00Z",
    "count": 12,
    "uniques": 5
  },
  {
    "timestamp": "2018-12-25T00:00:00Z",
    "count": 15,
    "uniques": 9
  }
]

生成的代码应该查看时间戳，确定它是否唯一，如果不是，则保留包含最大“计数”的对象。所需输出的示例如下：

[
  {
    "timestamp": "2018-12-24T00:00:00Z",
    "count": 3,
    "uniques": 2
  },
  {
    "timestamp": "2018-12-25T00:00:00Z",
    "count": 15,
    "uniques": 9
  }
]

“jq”似乎是一个非常有用的工具，我已经设法在其他一些情况下使用它，但无法弄清楚是否或如何以这种方式使用它。任何帮助（或方向）将不胜感激！

【问题讨论】：

标签： json command-line jq data-manipulation

【解决方案1】：

使用这两个通用辅助函数可以获得一个简单但有效的解决方案：

def aggregate_by(s; f; g):
  reduce s as $x  (null; .[$x|f] += [$x|g]);

def max_by(s; f):
  reduce s as $s (null;
    if . == null then {s: $s, m: ($s|f)}
    else  ($s|f) as $m
    | if $m > .m then {s: $s, m: $m} else . end
    end)
  | .s ;

有了这些，解决方案就是两条线：

[ aggregate_by(.[]; .timestamp; .)[]
  | max_by(.[]; .count) ]

【讨论】：

完美运行，感谢您的帮助！对“jq”的教程或类似内容有什么建议吗？一直在阅读手册页，但还没有看到关于该工具的大量教程
以下顺序适用于许多人：（1）通过stedolan.github.io/jq/tutorial的官方jq教程工作； (2) 略读手册； (3) 一项或多项：浏览 FAQ、Cookbook、我自己的“面向流的 jq 简介”（github.com/pkoppstein/jq/wiki/…）和/或github.com/stedolan/jq/wiki/jq-Language-Description上的“jq 语言描述”