array(2) {
  ["docs"]=>
  array(10) {
    [0]=>
    array(10) {
      ["id"]=>
      string(3) "428"
      ["text"]=>
      string(77) "Visual Studio 2017 单独启动MSDN帮助（Microsoft Help Viewer）的方法"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(8) "DonetRen"
      ["tagsname"]=>
      string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer"
      ["tagsid"]=>
      string(23) "[401,402,403,"300",404]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400964"
      ["_id"]=>
      string(3) "428"
    }
    [1]=>
    array(10) {
      ["id"]=>
      string(3) "427"
      ["text"]=>
      string(42) "npm -v；报错 cannot find module "wrapp""
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "zzty"
      ["tagsname"]=>
      string(50) "node.js|npm|cannot find module &quot;wrapp“|node"
      ["tagsid"]=>
      string(19) "[398,"239",399,400]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400760"
      ["_id"]=>
      string(3) "427"
    }
    [2]=>
    array(10) {
      ["id"]=>
      string(3) "426"
      ["text"]=>
      string(54) "说说css中pt、px、em、rem都扮演了什么角色"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(12) "zhengqiaoyin"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400640"
      ["_id"]=>
      string(3) "426"
    }
    [3]=>
    array(10) {
      ["id"]=>
      string(3) "425"
      ["text"]=>
      string(83) "深入学习JS执行--创建执行上下文（变量对象，作用域链，this）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "Ry-yuan"
      ["tagsname"]=>
      string(33) "Javascript|Javascript执行过程"
      ["tagsid"]=>
      string(13) "["169","191"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511399901"
      ["_id"]=>
      string(3) "425"
    }
    [4]=>
    array(10) {
      ["id"]=>
      string(3) "424"
      ["text"]=>
      string(30) "C# 排序技术研究与对比"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "vveiliang"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(8) ".Net Dev"
      ["catesid"]=>
      string(5) "[199]"
      ["createtime"]=>
      string(10) "1511399150"
      ["_id"]=>
      string(3) "424"
    }
    [5]=>
    array(10) {
      ["id"]=>
      string(3) "423"
      ["text"]=>
      string(72) "【算法】小白的算法笔记：快速排序算法的编码和优化"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "penghuwan"
      ["tagsname"]=>
      string(6) "算法"
      ["tagsid"]=>
      string(7) "["344"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511398109"
      ["_id"]=>
      string(3) "423"
    }
    [6]=>
    array(10) {
      ["id"]=>
      string(3) "422"
      ["text"]=>
      string(64) "JavaScript数据可视化编程学习（二）Flotr2，雷达图"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "chengxs"
      ["tagsname"]=>
      string(28) "数据可视化|前端学习"
      ["tagsid"]=>
      string(9) "[396,397]"
      ["catesname"]=>
      string(18) "前端基本知识"
      ["catesid"]=>
      string(5) "[198]"
      ["createtime"]=>
      string(10) "1511397800"
      ["_id"]=>
      string(3) "422"
    }
    [7]=>
    array(10) {
      ["id"]=>
      string(3) "421"
      ["text"]=>
      string(36) "C#表达式目录树（Expression）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "wwym"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(4) ".NET"
      ["catesid"]=>
      string(7) "["119"]"
      ["createtime"]=>
      string(10) "1511397474"
      ["_id"]=>
      string(3) "421"
    }
    [8]=>
    array(10) {
      ["id"]=>
      string(3) "420"
      ["text"]=>
      string(47) "数据结构 队列_队列实例：事件处理"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "idreamo"
      ["tagsname"]=>
      string(40) "C语言|数据结构|队列|事件处理"
      ["tagsid"]=>
      string(23) "["246","247","248",395]"
      ["catesname"]=>
      string(12) "数据结构"
      ["catesid"]=>
      string(7) "["133"]"
      ["createtime"]=>
      string(10) "1511397279"
      ["_id"]=>
      string(3) "420"
    }
    [9]=>
    array(10) {
      ["id"]=>
      string(3) "419"
      ["text"]=>
      string(47) "久等了,博客园官方Android客户端发布"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(3) "cmt"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511396549"
      ["_id"]=>
      string(3) "419"
    }
  }
  ["count"]=>
  int(200)
}
222<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="utf-8" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="content-language" content="zh-CN" />
<meta http-equiv="X-UA-Compatible" content="IE=edge" /> 
    <title>MongoDB中聚合工具Aggregate等的介绍与使用 - 爱码网</title>
     
<meta name="keywords" content="MongoDB中聚合工具Aggregate等的介绍与使用" />
<meta name="description" content="目录ECharts异步加载ECharts数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。chart.setOption({    color: [" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<link rel="stylesheet" type="text/css" href="/statics/css/base.css?v=2.7" />
<script src="/statics/js/detail.min.js?v=2.2"></script>   
<script>
   $(document).ready(function () { 
		$("img").error(function () {
			$(this).hide();
		}); 
	}); 
</script>
</head>
<body class="home-template dtpg">
<nav class="main-nav clearfix">
    <div class="inner">
        <ul class="nav">
            <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/" title="爱码网">首页</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/1.html" title="前端技术">前端技术</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/9.html" title="编程语言">编程语言</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/31.html" title="人工智能">人工智能</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/41.html" title="运维知识">运维知识</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/52.html" title="资源下载">资源下载</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/68.html" title="常用小工具">常用小工具</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/72.html" title="技术问答">技术问答</a></li>
                    </ul>            
	 
    </div>
</nav><div class="site-wrapper">
 
    <header style="height: auto;padding: 10px 0px;" class="main-header">
        <div style="max-width:910px" class="main-header-content inner">
                        <h1 class="page-title"><a href="/show-307404449.html" title="MongoDB中聚合工具Aggregate等的介绍与使用">MongoDB中聚合工具Aggregate等的介绍与使用</a></h1>
            
        </div>

    </header>
    <main class="content" role="main">
	

        <div class="leftbox">
    <article class="post tag-uifont tag-webview">
        <header class="post-header">
            <footer class="tc">  
                <time class="post-date" datetime="2022-12-23">2022-12-23</time>
            </footer>
        </header>
        <section class="post-content">
            <div class="contentbef">  
                  
                              </div>

            
<div>
<p>Aggregate是MongoDB提供的众多工具中的比较重要的一个，类似于SQL语句中的<code>GROUP BY</code>。聚合工具可以让开发人员直接使用MongoDB原生的命令操作数据库中的数据，并且按照要求进行聚合。</p>
<p>MongoDB提供了三种执行聚合的方法：Aggregation Pipleline，map-reduce功能和 Single Purpose Aggregation Operations</p>
<p>其中用来做聚合操作的几个函数是</p>
<ul>
<li>
<p><code>aggregate(pipeline,options)</code> 指定 group 的 keys, 通过操作符 <code>$push/$addToSet/$sum</code> 等实现简单的 reduce, 不支持函数/自定义变量</p>
</li>
<li>
<p><code>group({ key, reduce, initial [, keyf] [, cond] [, finalize] })</code> 支持函数(<code>keyf</code>) <code>mapReduce</code> 的阉割版本</p>
</li>
<li>
<p><code>mapReduce</code> </p>
</li>
<li>
<p><code>count(query)</code> </p>
</li>
<li>
<p><code>distinct(field,query)</code></p>
</li>
</ul>
<h3>1、Aggregation Pipleline</h3>
<blockquote>
<p>MongoDB’s <a class="reference internal" href="https://docs.mongodb.com/manual/core/aggregation-pipeline/" rel="nofollow" target="_blank"><span class="doc">aggregation framework</span></a> is modeled on the concept of data processing pipelines. Documents enter a multi-stage pipeline that transforms the documents into an aggregated result.</p>
</blockquote>
<p>管道在*nix中将上一个命令输出的数据作为下一个命令的参数。MongoDB中的管道聚合非常实用，提供高效的数据聚合，并且是MongoDB中数据聚合的首选方法</p>
<p>官方给的图：</p>
<p> </p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldGblpYTXlNREUzTG1OdVlteHZaM011WTI5dEwySnNiMmN2TWpZNE9UZ3hMekl3TVRjeE1pOHlOamc1T0RFdE1qQXhOekV5TURReU1ERTFNVFl4TlRrdE1UWTJORGcxTnpZeE1TNXdibWM9" alt="MongoDB中聚合工具Aggregate等的介绍与使用" title="MongoDB中聚合工具Aggregate等的介绍与使用"></p>
<p> </p>
<div class="likecs_Highlighter sh-gutter">
<div>
<div>
<table border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="gutter">
<div class="line number1 index0 alt2">1</div>
<div class="line number2 index1 alt1">2</div>
<div class="line number3 index2 alt2">3</div>
<div class="line number4 index3 alt1">4</div>
</td>
<td class="code">
<div class="container">
<div class="line number1 index0 alt2"><code class="javascript plain">[</code></div>
<div class="line number2 index1 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">{$match: {status: </code><code class="javascript string">"A"</code><code class="javascript plain">}},</code>
</div>
<div class="line number3 index2 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$group: {_id: </code><code class="javascript string">"$cust_id"</code><code class="javascript plain">, total: {$sum: </code><code class="javascript string">"$amount"</code><code class="javascript plain">}}}</code>
</div>
<div class="line number4 index3 alt1"><code class="javascript plain">]</code></div>
</div>
</td>
</tr></tbody></table>
</div>
</div>
</div>
<p>aggreagte是一个数组，其中包含多个对象（命令），通过遍历Pipleline数组对collection中的数据进行操作。</p>
<p><code>$match</code>：查询条件</p>
<p><code>$group</code>：聚合的配置</p>
<ul>
<li>
<p><code>_id</code>代表你想聚合的数据的主键，上述数据中，你想聚合所有<code>cust_id</code>相同的条目的<code>amount</code>的总和，那<code>_id</code>即被设置为<code>cust_id</code>。<code>_id</code>为<strong>必须</strong>，你可以填写一个空值。</p>
</li>
<li>
<p><code>total</code>代表你最后想输出的数据之一，这里<code>total</code>是每条结果中<code>amount</code>的总和。</p>
</li>
<li>
<p><code>$sum</code>是一个聚合的操作符，另外的操作符你可以在<a href="https://docs.mongodb.org/manual/reference/operator/aggregation-group/" rel="nofollow" target="_blank">官方文档</a>中找到。上图中的命令表示对相同主键（_id）下的<code>amount</code>进行求和。如果你想要计算主键出现的次数，可以把命令写成如下的形式  <code class="sourceCode javascript hljs"><span class="op">{<span class="dt">$sum<span class="op">: <span class="dv">1<span class="op">}</span></span></span></span></span></code></p>
</li>
</ul>
<h4>聚合的过程</h4>
<p>看一下图例，所有的数据先经过<code>$match</code>命令，只留下了<code>status</code>为A的数据，接着，对筛选出的数据进行聚合操作，对相同cust_id的数据进行计算<code>amount</code>总和的操作，最后输出结果。</p>
<h3>二、aggregate具体介绍</h3>
<p>接受两个参数 <code>pipeline</code>/<code>options</code>, <code>pipeline</code> 是 array, 相同的 operator 可以多次使用</p>
<p>pipeline 支持的方法</p>
<ul>
<li>
<p><code>$geoNear</code> geoNear命令可以在查询结果中返回每个点距离查询点的距离</p>
</li>
<li>
<p><code>$group</code> 指定 group 的 <code>_id</code>(key/keys) 和基于操作符(<code>$push</code>/<code>$sum/$addToSet/</code>...) 的累加运算</p>
</li>
<li>
<p><code>$limit</code> 限制条件</p>
</li>
<li>
<p><code>$match</code> 输入过滤条件</p>
</li>
<li>
<p><code>$out</code> 将输出结果保存到 <code>collection</code></p>
</li>
<li>
<p><code>$project</code> 修改数据流中的文档结构</p>
</li>
<li>
<p><code>$redact</code> 是 <code>$project</code>/<code>$match</code> 功能的合并</p>
</li>
<li>
<p><code>$skip 跳过</code></p>
</li>
<li>
<p><code>$sort</code> 对结果排序</p>
</li>
<li>
<p><code>$unwind</code> 拆解数据</p>
</li>
</ul>
<p><code>$group</code> 允许用的累加操作符 <code>$addToSet</code>/<code>$avg</code>/<code>$first</code>/<code>$last</code>/<code>$max</code>/<code>$min</code>/<code>$push</code>/<code>$sum，不被允许的累加操作符<code>$each</code>... ,默认最多可以用 100MB RAM, 增加<code>allowDiskUse</code>可以让<code>$group</code>操作更多的数据</code></p>
<p>下面是aggregate的用法</p>
<div class="likecs_Highlighter sh-gutter">
<div>
<div>
<table border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="gutter">
<div class="line number1 index0 alt2">1</div>
<div class="line number2 index1 alt1">2</div>
<div class="line number3 index2 alt2">3</div>
<div class="line number4 index3 alt1">4</div>
<div class="line number5 index4 alt2">5</div>
<div class="line number6 index5 alt1">6</div>
<div class="line number7 index6 alt2">7</div>
<div class="line number8 index7 alt1">8</div>
<div class="line number9 index8 alt2">9</div>
<div class="line number10 index9 alt1">10</div>
<div class="line number11 index10 alt2">11</div>
<div class="line number12 index11 alt1">12</div>
<div class="line number13 index12 alt2">13</div>
<div class="line number14 index13 alt1">14</div>
<div class="line number15 index14 alt2">15</div>
<div class="line number16 index15 alt1">16</div>
<div class="line number17 index16 alt2">17</div>
<div class="line number18 index17 alt1">18</div>
<div class="line number19 index18 alt2">19</div>
<div class="line number20 index19 alt1">20</div>
<div class="line number21 index20 alt2">21</div>
<div class="line number22 index21 alt1">22</div>
<div class="line number23 index22 alt2">23</div>
<div class="line number24 index23 alt1">24</div>
<div class="line number25 index24 alt2">25</div>
<div class="line number26 index25 alt1">26</div>
<div class="line number27 index26 alt2">27</div>
<div class="line number28 index27 alt1">28</div>
<div class="line number29 index28 alt2">29</div>
<div class="line number30 index29 alt1">30</div>
<div class="line number31 index30 alt2">31</div>
<div class="line number32 index31 alt1">32</div>
<div class="line number33 index32 alt2">33</div>
<div class="line number34 index33 alt1">34</div>
<div class="line number35 index34 alt2">35</div>
<div class="line number36 index35 alt1">36</div>
<div class="line number37 index36 alt2">37</div>
<div class="line number38 index37 alt1">38</div>
<div class="line number39 index38 alt2">39</div>
<div class="line number40 index39 alt1">40</div>
</td>
<td class="code">
<div class="container">
<div class="line number1 index0 alt2"><code class="javascript plain">db.newtest.aggregate([</code></div>
<div class="line number2 index1 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">{$match: {}},</code>
</div>
<div class="line number3 index2 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$skip: 10}, </code><code class="javascript comments">// 跳过 collection 的前 10 行</code>
</div>
<div class="line number4 index3 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">{$project: {group: 1, datetime: 1, category: 1, count: 1}},</code>
</div>
<div class="line number5 index4 alt2">
<code class="javascript spaces">    </code><code class="javascript comments">// 如果不选择 {count: 1} 最后的结果中 count_all/count_avg = 0</code>
</div>
<div class="line number6 index5 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">{$redact: { </code><code class="javascript comments">// redact 简单用法 过滤 group != 'A' 的行</code>
</div>
<div class="line number7 index6 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">$cond: [{$eq: [</code><code class="javascript string">"$group"</code><code class="javascript plain">, </code><code class="javascript string">"A"</code><code class="javascript plain">]}, </code><code class="javascript string">"$$DESCEND"</code><code class="javascript plain">, </code><code class="javascript string">"$$PRUNE"</code><code class="javascript plain">]</code>
</div>
<div class="line number8 index7 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">}},</code>
</div>
<div class="line number9 index8 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$group: {</code>
</div>
<div class="line number10 index9 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">_id: {year: {$year: </code><code class="javascript string">"$datetime"</code><code class="javascript plain">}, month: {$month: </code><code class="javascript string">"$datetime"</code><code class="javascript plain">}, day: {$dayOfMonth: </code><code class="javascript string">"$datetime"</code><code class="javascript plain">}},</code>
</div>
<div class="line number11 index10 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">group_unique: {$addToSet: </code><code class="javascript string">"$group"</code><code class="javascript plain">},</code>
</div>
<div class="line number12 index11 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">category_first: {$first: </code><code class="javascript string">"$category"</code><code class="javascript plain">},</code>
</div>
<div class="line number13 index12 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">category_last: {$last: </code><code class="javascript string">"$category"</code><code class="javascript plain">},</code>
</div>
<div class="line number14 index13 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">count_all: {$sum: </code><code class="javascript string">"$count"</code><code class="javascript plain">},</code>
</div>
<div class="line number15 index14 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">count_avg: {$avg: </code><code class="javascript string">"$count"</code><code class="javascript plain">},</code>
</div>
<div class="line number16 index15 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">rows: {$sum: 1}</code>
</div>
<div class="line number17 index16 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">}},</code>
</div>
<div class="line number18 index17 alt1">
<code class="javascript spaces">    </code><code class="javascript comments">// 拆分 group_unique 如果开启这个选项, 会导致 _id 重复而无法写入 out 指定的 collection, 除非再 $group 一次</code>
</div>
<div class="line number19 index18 alt2">
<code class="javascript spaces">    </code><code class="javascript comments">// {$unwind: "$group_unique"},</code>
</div>
<div class="line number20 index19 alt1">
<code class="javascript spaces">    </code><code class="javascript comments">// 只保留这两个字段</code>
</div>
<div class="line number21 index20 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$project: {group_unique: 1, rows: 1}},</code>
</div>
<div class="line number22 index21 alt1">
<code class="javascript spaces">    </code><code class="javascript comments">// 结果按照 _id 排序</code>
</div>
<div class="line number23 index22 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$sort: {</code><code class="javascript string">"_id"</code><code class="javascript plain">: 1}},</code>
</div>
<div class="line number24 index23 alt1">
<code class="javascript spaces">    </code><code class="javascript comments">// 只保留 50 条结果</code>
</div>
<div class="line number25 index24 alt2">
<code class="javascript spaces">    </code><code class="javascript comments">// {$limit: 50},</code>
</div>
<div class="line number26 index25 alt1">
<code class="javascript spaces">    </code><code class="javascript comments">// 结果另存</code>
</div>
<div class="line number27 index26 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$out: </code><code class="javascript string">"data_agg_out"</code><code class="javascript plain">},</code>
</div>
<div class="line number28 index27 alt1"><code class="javascript plain">], {</code></div>
<div class="line number29 index28 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">explain: </code><code class="javascript keyword">true</code><code class="javascript plain">,</code>
</div>
<div class="line number30 index29 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">allowDiskUse: </code><code class="javascript keyword">true</code><code class="javascript plain">,</code>
</div>
<div class="line number31 index30 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">cursor: {batchSize: 0}</code>
</div>
<div class="line number32 index31 alt1"><code class="javascript plain">})</code></div>
<div class="line number33 index32 alt2"><code class="javascript plain">db.data_agg_out.find()</code></div>
<div class="line number34 index33 alt1"><code class="javascript plain">db.data_agg_out.aggregate([</code></div>
<div class="line number35 index34 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$group: {</code>
</div>
<div class="line number36 index35 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">_id: </code><code class="javascript keyword">null</code><code class="javascript plain">,</code>
</div>
<div class="line number37 index36 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">rows: {$sum: </code><code class="javascript string">'$rows'</code><code class="javascript plain">}</code>
</div>
<div class="line number38 index37 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">}}</code>
</div>
<div class="line number39 index38 alt2"><code class="javascript plain">])</code></div>
<div class="line number40 index39 alt1"><code class="javascript plain">db.data_agg_out.drop()</code></div>
</div>
</td>
</tr></tbody></table>
</div>
</div>
</div>
<ul>
<li>
<p><code>$match</code> 聚合前数据筛选</p>
</li>
<li>
<p><code>$skip</code> 跳过聚合前数据集的 n 行, 如果 <code>{$skip: 10}</code>, 最后 <code>rows = 5000000 - 10</code></p>
</li>
<li>
<p><code>$project</code> 之选择需要的字段, 除了 <code>_id</code> 之外其他的字段的值只能为 1</p>
</li>
<li>
<p><code>$redact</code> 看了文档不明其实际使用场景, 这里只是简单筛选聚合前的数据</p>
</li>
<li>
<p><code>$group</code> 指定各字段的累加方法</p>
</li>
<li>
<p><code>$unwind</code> 拆分 array 字段的值, 这样会导致 <code>_id</code> 重复</p>
</li>
<li>
<p><code>$project</code> 可重复使用多次 最后用来过滤想要存储的字段</p>
</li>
<li>
<p><code>$out</code> 如果 <code>$group</code>/<code>$project</code>/<code>$redact</code> 的 <code>_id</code> 没有重复就不会报错</p>
</li>
<li>
<p>以上方法中 <code>$project</code>/<code>$redact</code>/<code>$group</code>/<code>$unwind</code> 可以使用多次</p>
</li>
</ul>
<h3>二、group</h3>
<p><code>group</code> 比 <code>aggregate</code> 好的一个地方是 <code>map/reduce</code> 都支持用 <code>function</code> 定义, 下面是支持的选项</p>
<ul>
<li>
<code>ns</code> 如果用 <code>db.runCommand({group: {}})</code> 方式调用, 需要 <code>ns</code> 指定 collection</li>
<li>
<code>cond</code> 聚合前筛选</li>
<li>
<code>key</code> 聚合的 key</li>
<li>
<code>initial</code> 初始化 累加 结果</li>
<li>
<code>$reduce</code> 接受 <code>(curr, result)</code> 参数, 将 <code>curr</code> 累加到 <code>result</code>
</li>
<li>
<code>keyf</code> 代替 <code>key</code> 用函数生成聚合用的主键</li>
<li>
<code>finalize</code> 结果处理</li>
</ul>
<p>需要保证输出结果小于 16MB 因为 <code>group</code> 没有提供转存选项</p>
<div class="likecs_Highlighter sh-gutter">
<div>
<div>
<table border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="gutter">
<div class="line number1 index0 alt2">1</div>
<div class="line number2 index1 alt1">2</div>
<div class="line number3 index2 alt2">3</div>
<div class="line number4 index3 alt1">4</div>
<div class="line number5 index4 alt2">5</div>
<div class="line number6 index5 alt1">6</div>
<div class="line number7 index6 alt2">7</div>
<div class="line number8 index7 alt1">8</div>
<div class="line number9 index8 alt2">9</div>
<div class="line number10 index9 alt1">10</div>
<div class="line number11 index10 alt2">11</div>
<div class="line number12 index11 alt1">12</div>
<div class="line number13 index12 alt2">13</div>
<div class="line number14 index13 alt1">14</div>
<div class="line number15 index14 alt2">15</div>
<div class="line number16 index15 alt1">16</div>
<div class="line number17 index16 alt2">17</div>
<div class="line number18 index17 alt1">18</div>
<div class="line number19 index18 alt2">19</div>
<div class="line number20 index19 alt1">20</div>
<div class="line number21 index20 alt2">21</div>
<div class="line number22 index21 alt1">22</div>
<div class="line number23 index22 alt2">23</div>
<div class="line number24 index23 alt1">24</div>
</td>
<td class="code">
<div class="container">
<div class="line number1 index0 alt2"><code class="javascript plain">db.data.group({</code></div>
<div class="line number2 index1 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">cond: {</code><code class="javascript string">'group'</code><code class="javascript plain">: </code><code class="javascript string">'A'</code><code class="javascript plain">},</code>
</div>
<div class="line number3 index2 alt2">
<code class="javascript spaces">    </code><code class="javascript comments">// key: {'group': 1, 'category': 1},</code>
</div>
<div class="line number4 index3 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">keyf: </code><code class="javascript keyword">function</code><code class="javascript plain">(doc) {</code>
</div>
<div class="line number5 index4 alt2">
<code class="javascript spaces">        </code><code class="javascript keyword">var</code> <code class="javascript plain">dt = </code><code class="javascript keyword">new</code> <code class="javascript plain">Date(doc.created);</code>
</div>
<div class="line number6 index5 alt1">
<code class="javascript spaces">        </code><code class="javascript comments">// or</code>
</div>
<div class="line number7 index6 alt2">
<code class="javascript spaces">        </code><code class="javascript comments">// var dt = doc.datetime;</code>
</div>
<div class="line number8 index7 alt1">
<code class="javascript spaces">        </code><code class="javascript keyword">return</code> <code class="javascript plain">{</code>
</div>
<div class="line number9 index8 alt2">
<code class="javascript spaces">            </code><code class="javascript plain">year: doc.datetime.getFullYear(),</code>
</div>
<div class="line number10 index9 alt1">
<code class="javascript spaces">            </code><code class="javascript plain">month: doc.datetime.getMonth() + 1,</code>
</div>
<div class="line number11 index10 alt2">
<code class="javascript spaces">            </code><code class="javascript plain">day: doc.datetime.getDate()</code>
</div>
<div class="line number12 index11 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">}</code>
</div>
<div class="line number13 index12 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">},</code>
</div>
<div class="line number14 index13 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">initial: {count: 0, category: []},</code>
</div>
<div class="line number15 index14 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">$reduce: </code><code class="javascript keyword">function</code><code class="javascript plain">(curr, result) {</code>
</div>
<div class="line number16 index15 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">result.count += curr.count;</code>
</div>
<div class="line number17 index16 alt2">
<code class="javascript spaces">        </code><code class="javascript keyword">if</code> <code class="javascript plain">(result.category.indexOf(curr.category) == -1) {</code>
</div>
<div class="line number18 index17 alt1">
<code class="javascript spaces">            </code><code class="javascript plain">result.category.push(curr.category);</code>
</div>
<div class="line number19 index18 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">}</code>
</div>
<div class="line number20 index19 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">},</code>
</div>
<div class="line number21 index20 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">finalize: </code><code class="javascript keyword">function</code><code class="javascript plain">(result) {</code>
</div>
<div class="line number22 index21 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">result.category = result.category.join();</code>
</div>
<div class="line number23 index22 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">}</code>
</div>
<div class="line number24 index23 alt1"><code class="javascript plain">})</code></div>
</div>
</td>
</tr></tbody></table>
</div>
</div>
</div>
<p>如果要求聚合大量数据, 就需要用到 <code>mapReduce</code></p>
<h3>三、mapReduce</h3>
<ul>
<li>
<code>query</code> 聚合前筛选</li>
<li>
<code>sort</code> 对聚合前的数据排序 用来优化 reduce</li>
<li>
<code>limit</code> 限制进入 map 的数据</li>
<li>
<code>map</code>(function) emit(key, value) 在函数中指定聚合的 K/V</li>
<li>
<code>reduce</code>(function) 参数 <code>(key, values)</code> <code>key</code> 在 map 中定义了, <code>values</code> 是在这个 K 下的所有 V 数组</li>
<li>
<code>finalize</code> 处理最后结果</li>
<li>
<code>out</code> 结果转存 可以选择另外一个 db</li>
<li>
<code>scope</code> 设置全局变量</li>
<li>
<code>jdMode</code>(false) 是否(默认是)把 map/reduce 中间结果转为 BSON 格式, BSON 格式可以利用磁盘空间, 这样就可以处理大规模的数据集</li>
<li>
<code>verbose</code>(true) 详细信息</li>
</ul>
<p>如果设 <code>jsMode</code> 为 true 不进行 BSON 转换, 可以优化 reduce 的执行速度, 但是由于内存限制最大在 emit 数量小于 500,000 时使用</p>
<p>写 mapReduce 时需要注意</p>
<ul>
<li>emit 返回的 value 必须和 reduce 返回的 value 结构一致</li>
<li>
<code>reduce</code> 函数必须幂等</li>
<li>详见 <a href="http://docs.mongodb.org/manual/tutorial/troubleshoot-reduce-function/" rel="nofollow" target="_blank">Troubleshoot the Reduce Function</a>
</li>
</ul>
<div class="likecs_Highlighter sh-gutter">
<div>
<div>
<table border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="gutter">
<div class="line number1 index0 alt2">1</div>
<div class="line number2 index1 alt1">2</div>
<div class="line number3 index2 alt2">3</div>
<div class="line number4 index3 alt1">4</div>
<div class="line number5 index4 alt2">5</div>
<div class="line number6 index5 alt1">6</div>
<div class="line number7 index6 alt2">7</div>
<div class="line number8 index7 alt1">8</div>
<div class="line number9 index8 alt2">9</div>
<div class="line number10 index9 alt1">10</div>
<div class="line number11 index10 alt2">11</div>
<div class="line number12 index11 alt1">12</div>
<div class="line number13 index12 alt2">13</div>
<div class="line number14 index13 alt1">14</div>
<div class="line number15 index14 alt2">15</div>
<div class="line number16 index15 alt1">16</div>
<div class="line number17 index16 alt2">17</div>
<div class="line number18 index17 alt1">18</div>
<div class="line number19 index18 alt2">19</div>
<div class="line number20 index19 alt1">20</div>
<div class="line number21 index20 alt2">21</div>
<div class="line number22 index21 alt1">22</div>
<div class="line number23 index22 alt2">23</div>
<div class="line number24 index23 alt1">24</div>
<div class="line number25 index24 alt2">25</div>
<div class="line number26 index25 alt1">26</div>
<div class="line number27 index26 alt2">27</div>
<div class="line number28 index27 alt1">28</div>
<div class="line number29 index28 alt2">29</div>
<div class="line number30 index29 alt1">30</div>
<div class="line number31 index30 alt2">31</div>
<div class="line number32 index31 alt1">32</div>
<div class="line number33 index32 alt2">33</div>
<div class="line number34 index33 alt1">34</div>
<div class="line number35 index34 alt2">35</div>
<div class="line number36 index35 alt1">36</div>
<div class="line number37 index36 alt2">37</div>
<div class="line number38 index37 alt1">38</div>
<div class="line number39 index38 alt2">39</div>
<div class="line number40 index39 alt1">40</div>
<div class="line number41 index40 alt2">41</div>
<div class="line number42 index41 alt1">42</div>
<div class="line number43 index42 alt2">43</div>
<div class="line number44 index43 alt1">44</div>
<div class="line number45 index44 alt2">45</div>
<div class="line number46 index45 alt1">46</div>
<div class="line number47 index46 alt2">47</div>
</td>
<td class="code">
<div class="container">
<div class="line number1 index0 alt2">
<code class="javascript plain">db.data.mapReduce(</code><code class="javascript keyword">function</code><code class="javascript plain">() {</code>
</div>
<div class="line number2 index1 alt1">
<code class="javascript spaces">    </code><code class="javascript keyword">var</code> <code class="javascript plain">d = </code><code class="javascript keyword">this</code><code class="javascript plain">.datetime;</code>
</div>
<div class="line number3 index2 alt2">
<code class="javascript spaces">    </code><code class="javascript keyword">var</code> <code class="javascript plain">key = {</code>
</div>
<div class="line number4 index3 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">year: d.getFullYear(),</code>
</div>
<div class="line number5 index4 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">month: d.getMonth() + 1,</code>
</div>
<div class="line number6 index5 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">day: d.getDate(),</code>
</div>
<div class="line number7 index6 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">};</code>
</div>
<div class="line number8 index7 alt1">
<code class="javascript spaces">    </code><code class="javascript keyword">var</code> <code class="javascript plain">value = {</code>
</div>
<div class="line number9 index8 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">count: </code><code class="javascript keyword">this</code><code class="javascript plain">.count,</code>
</div>
<div class="line number10 index9 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">rows: 1,</code>
</div>
<div class="line number11 index10 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">groups: [</code><code class="javascript keyword">this</code><code class="javascript plain">.group],</code>
</div>
<div class="line number12 index11 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">}</code>
</div>
<div class="line number13 index12 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">emit(key, value);</code>
</div>
<div class="line number14 index13 alt1">
<code class="javascript plain">}, </code><code class="javascript keyword">function</code><code class="javascript plain">(key, vals) {</code>
</div>
<div class="line number15 index14 alt2">
<code class="javascript spaces">    </code><code class="javascript keyword">var</code> <code class="javascript plain">reducedVal = {</code>
</div>
<div class="line number16 index15 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">count: 0,</code>
</div>
<div class="line number17 index16 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">groups: [],</code>
</div>
<div class="line number18 index17 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">rows: 0,</code>
</div>
<div class="line number19 index18 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">};</code>
</div>
<div class="line number20 index19 alt1">
<code class="javascript spaces">    </code><code class="javascript keyword">for</code><code class="javascript plain">(</code><code class="javascript keyword">var</code> <code class="javascript plain">i = 0; i &lt; vals.length; i++) {</code>
</div>
<div class="line number21 index20 alt2">
<code class="javascript spaces">        </code><code class="javascript keyword">var</code> <code class="javascript plain">v = vals[i];</code>
</div>
<div class="line number22 index21 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">reducedVal.count += v.count;</code>
</div>
<div class="line number23 index22 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">reducedVal.rows += v.rows;</code>
</div>
<div class="line number24 index23 alt1">
<code class="javascript spaces">        </code><code class="javascript keyword">for</code><code class="javascript plain">(</code><code class="javascript keyword">var</code> <code class="javascript plain">j = 0; j &lt; v.groups.length; j ++) {</code>
</div>
<div class="line number25 index24 alt2">
<code class="javascript spaces">            </code><code class="javascript keyword">if</code> <code class="javascript plain">(reducedVal.groups.indexOf(v.groups[j]) == -1) {</code>
</div>
<div class="line number26 index25 alt1">
<code class="javascript spaces">                </code><code class="javascript plain">reducedVal.groups.push(v.groups[j]);</code>
</div>
<div class="line number27 index26 alt2">
<code class="javascript spaces">            </code><code class="javascript plain">}</code>
</div>
<div class="line number28 index27 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">}</code>
</div>
<div class="line number29 index28 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">}</code>
</div>
<div class="line number30 index29 alt1">
<code class="javascript spaces">    </code><code class="javascript keyword">return</code> <code class="javascript plain">reducedVal;</code>
</div>
<div class="line number31 index30 alt2"><code class="javascript plain">}, {</code></div>
<div class="line number32 index31 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">query: {},</code>
</div>
<div class="line number33 index32 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">sort: {datetime: 1},    </code><code class="javascript comments">// 需要索引 否则结果返回空</code>
</div>
<div class="line number34 index33 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">limit: 50000,</code>
</div>
<div class="line number35 index34 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">finalize: </code><code class="javascript keyword">function</code><code class="javascript plain">(key, reducedVal) {</code>
</div>
<div class="line number36 index35 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">reducedVal.avg = reducedVal.count / reducedVal.rows;</code>
</div>
<div class="line number37 index36 alt2">
<code class="javascript spaces">        </code><code class="javascript keyword">return</code> <code class="javascript plain">reducedVal;</code>
</div>
<div class="line number38 index37 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">},</code>
</div>
<div class="line number39 index38 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">out: {</code>
</div>
<div class="line number40 index39 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">inline: 1,</code>
</div>
<div class="line number41 index40 alt2">
<code class="javascript spaces">        </code><code class="javascript comments">// replace: "",</code>
</div>
<div class="line number42 index41 alt1">
<code class="javascript spaces">        </code><code class="javascript comments">// merge: "",</code>
</div>
<div class="line number43 index42 alt2">
<code class="javascript spaces">        </code><code class="javascript comments">// reduce: "",</code>
</div>
<div class="line number44 index43 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">},</code>
</div>
<div class="line number45 index44 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">scope: {},</code>
</div>
<div class="line number46 index45 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">jsMode: </code><code class="javascript keyword">true</code>
</div>
<div class="line number47 index46 alt2"><code class="javascript plain">})</code></div>
</div>
</td>
</tr></tbody></table>
</div>
</div>
</div>
<h4>测试数据：</h4>
<div class="likecs_Highlighter sh-gutter">
<div>
<div>
<table border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="gutter">
<div class="line number1 index0 alt2">1</div>
<div class="line number2 index1 alt1">2</div>
<div class="line number3 index2 alt2">3</div>
<div class="line number4 index3 alt1">4</div>
<div class="line number5 index4 alt2">5</div>
<div class="line number6 index5 alt1">6</div>
<div class="line number7 index6 alt2">7</div>
<div class="line number8 index7 alt1">8</div>
<div class="line number9 index8 alt2">9</div>
<div class="line number10 index9 alt1">10</div>
<div class="line number11 index10 alt2">11</div>
</td>
<td class="code">
<div class="container">
<div class="line number1 index0 alt2"><code class="javascript plain">&gt; db.newtest.find()</code></div>
<div class="line number2 index1 alt1">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544352ba57ccba824d7bf"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"E"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1402764223, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 63, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391126, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"aa"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C8"</code> <code class="javascript plain">}</code>
</div>
<div class="line number3 index2 alt2">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544512ba57ccba824d7c0"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"I"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1413086660, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 93, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391261, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"bb"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C10"</code> <code class="javascript plain">}</code>
</div>
<div class="line number4 index3 alt1">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c1"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"H"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1440750343, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 41, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391111, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"cc"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C1"</code> <code class="javascript plain">}</code>
</div>
<div class="line number5 index4 alt2">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c2"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"S"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1437710373, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 14, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512392136, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"dd"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C10"</code> <code class="javascript plain">}</code>
</div>
<div class="line number6 index5 alt1">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c3"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"Z"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1428307315, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 78, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391166, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"ee"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C5"</code> <code class="javascript plain">}</code>
</div>
<div class="line number7 index6 alt2">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c4"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"R"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1402809274, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 74, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391162, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"ff"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C9"</code> <code class="javascript plain">}</code>
</div>
<div class="line number8 index7 alt1">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c5"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"Y"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1400571321, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 66, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512139164, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"gg"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C2"</code> <code class="javascript plain">}</code>
</div>
<div class="line number9 index8 alt2">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c6"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"L"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1416562128, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 5, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512393165, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"hh"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C1"</code> <code class="javascript plain">}</code>
</div>
<div class="line number10 index9 alt1">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c7"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"E"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1414057884, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 12, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391165, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"ii"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C3"</code> <code class="javascript plain">}</code>
</div>
<div class="line number11 index10 alt2">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544572ba57ccba824d7c8"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"L"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1418879346, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 67, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391167, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"gg"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C3"</code> <code class="javascript plain">}</code>
</div>
</div>
</td>
</tr></tbody></table>
</div>
</div>
</div>
<h3>四、总结</h3>
<table>
<thead><tr>
<th>method</th>
<th>allowDiskUse</th>
<th>out</th>
<th>function</th>
</tr></thead>
<tbody>
<tr>
<td>aggregate</td>
<td>true</td>
<td>pipeline/collection</td>
<td>false</td>
</tr>
<tr>
<td>group</td>
<td>false</td>
<td>pipeline</td>
<td>true</td>
</tr>
<tr>
<td>mapReduce</td>
<td>jsMode</td>
<td>pipeline/collection</td>
<td>true</td>
</tr>
</tbody>
</table>
<ul>
<li>
<code>aggregate</code> 基于累加操作的的聚合 可以重复利用 <code>$project</code>/<code>$group</code> 一层一层聚合数据, 可以用于大量数据(单输出结果小于 16MB) 不可用于分片数据</li>
<li>
<code>mapReduce</code> 可以处理超大数据集 需要严格遵守 mapReduce 中的结构一致/幂等 写法, 可增量输出/合并, 见 <code>out</code> options</li>
<li>
<code>group</code> RDB 中的 <code>group by</code> 简单需求可用(只有 inline 输出) 会产生 <code>read lock</code>
</li>
</ul>
</div>
<div>
<div class="showBottom">
<ul class="showBottomUl">
<li>作者：<a href="http://weibo.com/chenpingzhao" target="_blank" rel="nofollow">踏雪无痕</a>
</li>
<li>出处：<a href="/default/index/url?u=aHR0cDovL3d3dy5jbmJsb2dzLmNvbS9jaGVucGluZ3poYW8v" target="_blank" rel="nofollow">http://www.cnblogs.com/chenpingzhao/</a>
</li>
<li>本文版权归作者和博客园共有，如需转载，请联系<strong>  <a href="/default/index/url?u=aHR0cHM6Ly93d3cuY25ibG9ncy5jb21tYWlsdG86cGluZ3poYW8xOTkwQDE2My5jb20=" rel="nofollow" target="_blank">pingzhao1990#163.com</a></strong> </li>
</ul>
</div>
</div>

<p>Aggregate是MongoDB提供的众多工具中的比较重要的一个，类似于SQL语句中的<code>GROUP BY</code>。聚合工具可以让开发人员直接使用MongoDB原生的命令操作数据库中的数据，并且按照要求进行聚合。</p>
<p>MongoDB提供了三种执行聚合的方法：Aggregation Pipleline，map-reduce功能和 Single Purpose Aggregation Operations</p>
<p>其中用来做聚合操作的几个函数是</p>
<ul>
<li>
<p><code>aggregate(pipeline,options)</code> 指定 group 的 keys, 通过操作符 <code>$push/$addToSet/$sum</code> 等实现简单的 reduce, 不支持函数/自定义变量</p>
</li>
<li>
<p><code>group({ key, reduce, initial [, keyf] [, cond] [, finalize] })</code> 支持函数(<code>keyf</code>) <code>mapReduce</code> 的阉割版本</p>
</li>
<li>
<p><code>mapReduce</code> </p>
</li>
<li>
<p><code>count(query)</code> </p>
</li>
<li>
<p><code>distinct(field,query)</code></p>
</li>
</ul>
<h3>1、Aggregation Pipleline</h3>
<blockquote>
<p>MongoDB’s <a class="reference internal" href="https://docs.mongodb.com/manual/core/aggregation-pipeline/" rel="nofollow" target="_blank"><span class="doc">aggregation framework</span></a> is modeled on the concept of data processing pipelines. Documents enter a multi-stage pipeline that transforms the documents into an aggregated result.</p>
</blockquote>
<p>管道在*nix中将上一个命令输出的数据作为下一个命令的参数。MongoDB中的管道聚合非常实用，提供高效的数据聚合，并且是MongoDB中数据聚合的首选方法</p>
<p>官方给的图：</p>
<p> </p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldGblpYTXlNREUzTG1OdVlteHZaM011WTI5dEwySnNiMmN2TWpZNE9UZ3hMekl3TVRjeE1pOHlOamc1T0RFdE1qQXhOekV5TURReU1ERTFNVFl4TlRrdE1UWTJORGcxTnpZeE1TNXdibWM9" alt="MongoDB中聚合工具Aggregate等的介绍与使用" title="MongoDB中聚合工具Aggregate等的介绍与使用"></p>
<p> </p>
<div class="likecs_Highlighter sh-gutter">
<div>
<div>
<table border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="gutter">
<div class="line number1 index0 alt2">1</div>
<div class="line number2 index1 alt1">2</div>
<div class="line number3 index2 alt2">3</div>
<div class="line number4 index3 alt1">4</div>
</td>
<td class="code">
<div class="container">
<div class="line number1 index0 alt2"><code class="javascript plain">[</code></div>
<div class="line number2 index1 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">{$match: {status: </code><code class="javascript string">"A"</code><code class="javascript plain">}},</code>
</div>
<div class="line number3 index2 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$group: {_id: </code><code class="javascript string">"$cust_id"</code><code class="javascript plain">, total: {$sum: </code><code class="javascript string">"$amount"</code><code class="javascript plain">}}}</code>
</div>
<div class="line number4 index3 alt1"><code class="javascript plain">]</code></div>
</div>
</td>
</tr></tbody></table>
</div>
</div>
</div>
<p>aggreagte是一个数组，其中包含多个对象（命令），通过遍历Pipleline数组对collection中的数据进行操作。</p>
<p><code>$match</code>：查询条件</p>
<p><code>$group</code>：聚合的配置</p>
<ul>
<li>
<p><code>_id</code>代表你想聚合的数据的主键，上述数据中，你想聚合所有<code>cust_id</code>相同的条目的<code>amount</code>的总和，那<code>_id</code>即被设置为<code>cust_id</code>。<code>_id</code>为<strong>必须</strong>，你可以填写一个空值。</p>
</li>
<li>
<p><code>total</code>代表你最后想输出的数据之一，这里<code>total</code>是每条结果中<code>amount</code>的总和。</p>
</li>
<li>
<p><code>$sum</code>是一个聚合的操作符，另外的操作符你可以在<a href="https://docs.mongodb.org/manual/reference/operator/aggregation-group/" rel="nofollow" target="_blank">官方文档</a>中找到。上图中的命令表示对相同主键（_id）下的<code>amount</code>进行求和。如果你想要计算主键出现的次数，可以把命令写成如下的形式  <code class="sourceCode javascript hljs"><span class="op">{<span class="dt">$sum<span class="op">: <span class="dv">1<span class="op">}</span></span></span></span></span></code></p>
</li>
</ul>
<h4>聚合的过程</h4>
<p>看一下图例，所有的数据先经过<code>$match</code>命令，只留下了<code>status</code>为A的数据，接着，对筛选出的数据进行聚合操作，对相同cust_id的数据进行计算<code>amount</code>总和的操作，最后输出结果。</p>
<h3>二、aggregate具体介绍</h3>
<p>接受两个参数 <code>pipeline</code>/<code>options</code>, <code>pipeline</code> 是 array, 相同的 operator 可以多次使用</p>
<p>pipeline 支持的方法</p>
<ul>
<li>
<p><code>$geoNear</code> geoNear命令可以在查询结果中返回每个点距离查询点的距离</p>
</li>
<li>
<p><code>$group</code> 指定 group 的 <code>_id</code>(key/keys) 和基于操作符(<code>$push</code>/<code>$sum/$addToSet/</code>...) 的累加运算</p>
</li>
<li>
<p><code>$limit</code> 限制条件</p>
</li>
<li>
<p><code>$match</code> 输入过滤条件</p>
</li>
<li>
<p><code>$out</code> 将输出结果保存到 <code>collection</code></p>
</li>
<li>
<p><code>$project</code> 修改数据流中的文档结构</p>
</li>
<li>
<p><code>$redact</code> 是 <code>$project</code>/<code>$match</code> 功能的合并</p>
</li>
<li>
<p><code>$skip 跳过</code></p>
</li>
<li>
<p><code>$sort</code> 对结果排序</p>
</li>
<li>
<p><code>$unwind</code> 拆解数据</p>
</li>
</ul>
<p><code>$group</code> 允许用的累加操作符 <code>$addToSet</code>/<code>$avg</code>/<code>$first</code>/<code>$last</code>/<code>$max</code>/<code>$min</code>/<code>$push</code>/<code>$sum，不被允许的累加操作符<code>$each</code>... ,默认最多可以用 100MB RAM, 增加<code>allowDiskUse</code>可以让<code>$group</code>操作更多的数据</code></p>
<p>下面是aggregate的用法</p>
<div class="likecs_Highlighter sh-gutter">
<div>
<div>
<table border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="gutter">
<div class="line number1 index0 alt2">1</div>
<div class="line number2 index1 alt1">2</div>
<div class="line number3 index2 alt2">3</div>
<div class="line number4 index3 alt1">4</div>
<div class="line number5 index4 alt2">5</div>
<div class="line number6 index5 alt1">6</div>
<div class="line number7 index6 alt2">7</div>
<div class="line number8 index7 alt1">8</div>
<div class="line number9 index8 alt2">9</div>
<div class="line number10 index9 alt1">10</div>
<div class="line number11 index10 alt2">11</div>
<div class="line number12 index11 alt1">12</div>
<div class="line number13 index12 alt2">13</div>
<div class="line number14 index13 alt1">14</div>
<div class="line number15 index14 alt2">15</div>
<div class="line number16 index15 alt1">16</div>
<div class="line number17 index16 alt2">17</div>
<div class="line number18 index17 alt1">18</div>
<div class="line number19 index18 alt2">19</div>
<div class="line number20 index19 alt1">20</div>
<div class="line number21 index20 alt2">21</div>
<div class="line number22 index21 alt1">22</div>
<div class="line number23 index22 alt2">23</div>
<div class="line number24 index23 alt1">24</div>
<div class="line number25 index24 alt2">25</div>
<div class="line number26 index25 alt1">26</div>
<div class="line number27 index26 alt2">27</div>
<div class="line number28 index27 alt1">28</div>
<div class="line number29 index28 alt2">29</div>
<div class="line number30 index29 alt1">30</div>
<div class="line number31 index30 alt2">31</div>
<div class="line number32 index31 alt1">32</div>
<div class="line number33 index32 alt2">33</div>
<div class="line number34 index33 alt1">34</div>
<div class="line number35 index34 alt2">35</div>
<div class="line number36 index35 alt1">36</div>
<div class="line number37 index36 alt2">37</div>
<div class="line number38 index37 alt1">38</div>
<div class="line number39 index38 alt2">39</div>
<div class="line number40 index39 alt1">40</div>
</td>
<td class="code">
<div class="container">
<div class="line number1 index0 alt2"><code class="javascript plain">db.newtest.aggregate([</code></div>
<div class="line number2 index1 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">{$match: {}},</code>
</div>
<div class="line number3 index2 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$skip: 10}, </code><code class="javascript comments">// 跳过 collection 的前 10 行</code>
</div>
<div class="line number4 index3 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">{$project: {group: 1, datetime: 1, category: 1, count: 1}},</code>
</div>
<div class="line number5 index4 alt2">
<code class="javascript spaces">    </code><code class="javascript comments">// 如果不选择 {count: 1} 最后的结果中 count_all/count_avg = 0</code>
</div>
<div class="line number6 index5 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">{$redact: { </code><code class="javascript comments">// redact 简单用法 过滤 group != 'A' 的行</code>
</div>
<div class="line number7 index6 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">$cond: [{$eq: [</code><code class="javascript string">"$group"</code><code class="javascript plain">, </code><code class="javascript string">"A"</code><code class="javascript plain">]}, </code><code class="javascript string">"$$DESCEND"</code><code class="javascript plain">, </code><code class="javascript string">"$$PRUNE"</code><code class="javascript plain">]</code>
</div>
<div class="line number8 index7 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">}},</code>
</div>
<div class="line number9 index8 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$group: {</code>
</div>
<div class="line number10 index9 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">_id: {year: {$year: </code><code class="javascript string">"$datetime"</code><code class="javascript plain">}, month: {$month: </code><code class="javascript string">"$datetime"</code><code class="javascript plain">}, day: {$dayOfMonth: </code><code class="javascript string">"$datetime"</code><code class="javascript plain">}},</code>
</div>
<div class="line number11 index10 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">group_unique: {$addToSet: </code><code class="javascript string">"$group"</code><code class="javascript plain">},</code>
</div>
<div class="line number12 index11 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">category_first: {$first: </code><code class="javascript string">"$category"</code><code class="javascript plain">},</code>
</div>
<div class="line number13 index12 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">category_last: {$last: </code><code class="javascript string">"$category"</code><code class="javascript plain">},</code>
</div>
<div class="line number14 index13 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">count_all: {$sum: </code><code class="javascript string">"$count"</code><code class="javascript plain">},</code>
</div>
<div class="line number15 index14 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">count_avg: {$avg: </code><code class="javascript string">"$count"</code><code class="javascript plain">},</code>
</div>
<div class="line number16 index15 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">rows: {$sum: 1}</code>
</div>
<div class="line number17 index16 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">}},</code>
</div>
<div class="line number18 index17 alt1">
<code class="javascript spaces">    </code><code class="javascript comments">// 拆分 group_unique 如果开启这个选项, 会导致 _id 重复而无法写入 out 指定的 collection, 除非再 $group 一次</code>
</div>
<div class="line number19 index18 alt2">
<code class="javascript spaces">    </code><code class="javascript comments">// {$unwind: "$group_unique"},</code>
</div>
<div class="line number20 index19 alt1">
<code class="javascript spaces">    </code><code class="javascript comments">// 只保留这两个字段</code>
</div>
<div class="line number21 index20 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$project: {group_unique: 1, rows: 1}},</code>
</div>
<div class="line number22 index21 alt1">
<code class="javascript spaces">    </code><code class="javascript comments">// 结果按照 _id 排序</code>
</div>
<div class="line number23 index22 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$sort: {</code><code class="javascript string">"_id"</code><code class="javascript plain">: 1}},</code>
</div>
<div class="line number24 index23 alt1">
<code class="javascript spaces">    </code><code class="javascript comments">// 只保留 50 条结果</code>
</div>
<div class="line number25 index24 alt2">
<code class="javascript spaces">    </code><code class="javascript comments">// {$limit: 50},</code>
</div>
<div class="line number26 index25 alt1">
<code class="javascript spaces">    </code><code class="javascript comments">// 结果另存</code>
</div>
<div class="line number27 index26 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$out: </code><code class="javascript string">"data_agg_out"</code><code class="javascript plain">},</code>
</div>
<div class="line number28 index27 alt1"><code class="javascript plain">], {</code></div>
<div class="line number29 index28 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">explain: </code><code class="javascript keyword">true</code><code class="javascript plain">,</code>
</div>
<div class="line number30 index29 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">allowDiskUse: </code><code class="javascript keyword">true</code><code class="javascript plain">,</code>
</div>
<div class="line number31 index30 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">cursor: {batchSize: 0}</code>
</div>
<div class="line number32 index31 alt1"><code class="javascript plain">})</code></div>
<div class="line number33 index32 alt2"><code class="javascript plain">db.data_agg_out.find()</code></div>
<div class="line number34 index33 alt1"><code class="javascript plain">db.data_agg_out.aggregate([</code></div>
<div class="line number35 index34 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">{$group: {</code>
</div>
<div class="line number36 index35 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">_id: </code><code class="javascript keyword">null</code><code class="javascript plain">,</code>
</div>
<div class="line number37 index36 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">rows: {$sum: </code><code class="javascript string">'$rows'</code><code class="javascript plain">}</code>
</div>
<div class="line number38 index37 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">}}</code>
</div>
<div class="line number39 index38 alt2"><code class="javascript plain">])</code></div>
<div class="line number40 index39 alt1"><code class="javascript plain">db.data_agg_out.drop()</code></div>
</div>
</td>
</tr></tbody></table>
</div>
</div>
</div>
<ul>
<li>
<p><code>$match</code> 聚合前数据筛选</p>
</li>
<li>
<p><code>$skip</code> 跳过聚合前数据集的 n 行, 如果 <code>{$skip: 10}</code>, 最后 <code>rows = 5000000 - 10</code></p>
</li>
<li>
<p><code>$project</code> 之选择需要的字段, 除了 <code>_id</code> 之外其他的字段的值只能为 1</p>
</li>
<li>
<p><code>$redact</code> 看了文档不明其实际使用场景, 这里只是简单筛选聚合前的数据</p>
</li>
<li>
<p><code>$group</code> 指定各字段的累加方法</p>
</li>
<li>
<p><code>$unwind</code> 拆分 array 字段的值, 这样会导致 <code>_id</code> 重复</p>
</li>
<li>
<p><code>$project</code> 可重复使用多次 最后用来过滤想要存储的字段</p>
</li>
<li>
<p><code>$out</code> 如果 <code>$group</code>/<code>$project</code>/<code>$redact</code> 的 <code>_id</code> 没有重复就不会报错</p>
</li>
<li>
<p>以上方法中 <code>$project</code>/<code>$redact</code>/<code>$group</code>/<code>$unwind</code> 可以使用多次</p>
</li>
</ul>
<h3>二、group</h3>
<p><code>group</code> 比 <code>aggregate</code> 好的一个地方是 <code>map/reduce</code> 都支持用 <code>function</code> 定义, 下面是支持的选项</p>
<ul>
<li>
<code>ns</code> 如果用 <code>db.runCommand({group: {}})</code> 方式调用, 需要 <code>ns</code> 指定 collection</li>
<li>
<code>cond</code> 聚合前筛选</li>
<li>
<code>key</code> 聚合的 key</li>
<li>
<code>initial</code> 初始化 累加 结果</li>
<li>
<code>$reduce</code> 接受 <code>(curr, result)</code> 参数, 将 <code>curr</code> 累加到 <code>result</code>
</li>
<li>
<code>keyf</code> 代替 <code>key</code> 用函数生成聚合用的主键</li>
<li>
<code>finalize</code> 结果处理</li>
</ul>
<p>需要保证输出结果小于 16MB 因为 <code>group</code> 没有提供转存选项</p>
<div class="likecs_Highlighter sh-gutter">
<div>
<div>
<table border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="gutter">
<div class="line number1 index0 alt2">1</div>
<div class="line number2 index1 alt1">2</div>
<div class="line number3 index2 alt2">3</div>
<div class="line number4 index3 alt1">4</div>
<div class="line number5 index4 alt2">5</div>
<div class="line number6 index5 alt1">6</div>
<div class="line number7 index6 alt2">7</div>
<div class="line number8 index7 alt1">8</div>
<div class="line number9 index8 alt2">9</div>
<div class="line number10 index9 alt1">10</div>
<div class="line number11 index10 alt2">11</div>
<div class="line number12 index11 alt1">12</div>
<div class="line number13 index12 alt2">13</div>
<div class="line number14 index13 alt1">14</div>
<div class="line number15 index14 alt2">15</div>
<div class="line number16 index15 alt1">16</div>
<div class="line number17 index16 alt2">17</div>
<div class="line number18 index17 alt1">18</div>
<div class="line number19 index18 alt2">19</div>
<div class="line number20 index19 alt1">20</div>
<div class="line number21 index20 alt2">21</div>
<div class="line number22 index21 alt1">22</div>
<div class="line number23 index22 alt2">23</div>
<div class="line number24 index23 alt1">24</div>
</td>
<td class="code">
<div class="container">
<div class="line number1 index0 alt2"><code class="javascript plain">db.data.group({</code></div>
<div class="line number2 index1 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">cond: {</code><code class="javascript string">'group'</code><code class="javascript plain">: </code><code class="javascript string">'A'</code><code class="javascript plain">},</code>
</div>
<div class="line number3 index2 alt2">
<code class="javascript spaces">    </code><code class="javascript comments">// key: {'group': 1, 'category': 1},</code>
</div>
<div class="line number4 index3 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">keyf: </code><code class="javascript keyword">function</code><code class="javascript plain">(doc) {</code>
</div>
<div class="line number5 index4 alt2">
<code class="javascript spaces">        </code><code class="javascript keyword">var</code> <code class="javascript plain">dt = </code><code class="javascript keyword">new</code> <code class="javascript plain">Date(doc.created);</code>
</div>
<div class="line number6 index5 alt1">
<code class="javascript spaces">        </code><code class="javascript comments">// or</code>
</div>
<div class="line number7 index6 alt2">
<code class="javascript spaces">        </code><code class="javascript comments">// var dt = doc.datetime;</code>
</div>
<div class="line number8 index7 alt1">
<code class="javascript spaces">        </code><code class="javascript keyword">return</code> <code class="javascript plain">{</code>
</div>
<div class="line number9 index8 alt2">
<code class="javascript spaces">            </code><code class="javascript plain">year: doc.datetime.getFullYear(),</code>
</div>
<div class="line number10 index9 alt1">
<code class="javascript spaces">            </code><code class="javascript plain">month: doc.datetime.getMonth() + 1,</code>
</div>
<div class="line number11 index10 alt2">
<code class="javascript spaces">            </code><code class="javascript plain">day: doc.datetime.getDate()</code>
</div>
<div class="line number12 index11 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">}</code>
</div>
<div class="line number13 index12 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">},</code>
</div>
<div class="line number14 index13 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">initial: {count: 0, category: []},</code>
</div>
<div class="line number15 index14 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">$reduce: </code><code class="javascript keyword">function</code><code class="javascript plain">(curr, result) {</code>
</div>
<div class="line number16 index15 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">result.count += curr.count;</code>
</div>
<div class="line number17 index16 alt2">
<code class="javascript spaces">        </code><code class="javascript keyword">if</code> <code class="javascript plain">(result.category.indexOf(curr.category) == -1) {</code>
</div>
<div class="line number18 index17 alt1">
<code class="javascript spaces">            </code><code class="javascript plain">result.category.push(curr.category);</code>
</div>
<div class="line number19 index18 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">}</code>
</div>
<div class="line number20 index19 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">},</code>
</div>
<div class="line number21 index20 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">finalize: </code><code class="javascript keyword">function</code><code class="javascript plain">(result) {</code>
</div>
<div class="line number22 index21 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">result.category = result.category.join();</code>
</div>
<div class="line number23 index22 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">}</code>
</div>
<div class="line number24 index23 alt1"><code class="javascript plain">})</code></div>
</div>
</td>
</tr></tbody></table>
</div>
</div>
</div>
<p>如果要求聚合大量数据, 就需要用到 <code>mapReduce</code></p>
<h3>三、mapReduce</h3>
<ul>
<li>
<code>query</code> 聚合前筛选</li>
<li>
<code>sort</code> 对聚合前的数据排序 用来优化 reduce</li>
<li>
<code>limit</code> 限制进入 map 的数据</li>
<li>
<code>map</code>(function) emit(key, value) 在函数中指定聚合的 K/V</li>
<li>
<code>reduce</code>(function) 参数 <code>(key, values)</code> <code>key</code> 在 map 中定义了, <code>values</code> 是在这个 K 下的所有 V 数组</li>
<li>
<code>finalize</code> 处理最后结果</li>
<li>
<code>out</code> 结果转存 可以选择另外一个 db</li>
<li>
<code>scope</code> 设置全局变量</li>
<li>
<code>jdMode</code>(false) 是否(默认是)把 map/reduce 中间结果转为 BSON 格式, BSON 格式可以利用磁盘空间, 这样就可以处理大规模的数据集</li>
<li>
<code>verbose</code>(true) 详细信息</li>
</ul>
<p>如果设 <code>jsMode</code> 为 true 不进行 BSON 转换, 可以优化 reduce 的执行速度, 但是由于内存限制最大在 emit 数量小于 500,000 时使用</p>
<p>写 mapReduce 时需要注意</p>
<ul>
<li>emit 返回的 value 必须和 reduce 返回的 value 结构一致</li>
<li>
<code>reduce</code> 函数必须幂等</li>
<li>详见 <a href="http://docs.mongodb.org/manual/tutorial/troubleshoot-reduce-function/" rel="nofollow" target="_blank">Troubleshoot the Reduce Function</a>
</li>
</ul>
<div class="likecs_Highlighter sh-gutter">
<div>
<div>
<table border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="gutter">
<div class="line number1 index0 alt2">1</div>
<div class="line number2 index1 alt1">2</div>
<div class="line number3 index2 alt2">3</div>
<div class="line number4 index3 alt1">4</div>
<div class="line number5 index4 alt2">5</div>
<div class="line number6 index5 alt1">6</div>
<div class="line number7 index6 alt2">7</div>
<div class="line number8 index7 alt1">8</div>
<div class="line number9 index8 alt2">9</div>
<div class="line number10 index9 alt1">10</div>
<div class="line number11 index10 alt2">11</div>
<div class="line number12 index11 alt1">12</div>
<div class="line number13 index12 alt2">13</div>
<div class="line number14 index13 alt1">14</div>
<div class="line number15 index14 alt2">15</div>
<div class="line number16 index15 alt1">16</div>
<div class="line number17 index16 alt2">17</div>
<div class="line number18 index17 alt1">18</div>
<div class="line number19 index18 alt2">19</div>
<div class="line number20 index19 alt1">20</div>
<div class="line number21 index20 alt2">21</div>
<div class="line number22 index21 alt1">22</div>
<div class="line number23 index22 alt2">23</div>
<div class="line number24 index23 alt1">24</div>
<div class="line number25 index24 alt2">25</div>
<div class="line number26 index25 alt1">26</div>
<div class="line number27 index26 alt2">27</div>
<div class="line number28 index27 alt1">28</div>
<div class="line number29 index28 alt2">29</div>
<div class="line number30 index29 alt1">30</div>
<div class="line number31 index30 alt2">31</div>
<div class="line number32 index31 alt1">32</div>
<div class="line number33 index32 alt2">33</div>
<div class="line number34 index33 alt1">34</div>
<div class="line number35 index34 alt2">35</div>
<div class="line number36 index35 alt1">36</div>
<div class="line number37 index36 alt2">37</div>
<div class="line number38 index37 alt1">38</div>
<div class="line number39 index38 alt2">39</div>
<div class="line number40 index39 alt1">40</div>
<div class="line number41 index40 alt2">41</div>
<div class="line number42 index41 alt1">42</div>
<div class="line number43 index42 alt2">43</div>
<div class="line number44 index43 alt1">44</div>
<div class="line number45 index44 alt2">45</div>
<div class="line number46 index45 alt1">46</div>
<div class="line number47 index46 alt2">47</div>
</td>
<td class="code">
<div class="container">
<div class="line number1 index0 alt2">
<code class="javascript plain">db.data.mapReduce(</code><code class="javascript keyword">function</code><code class="javascript plain">() {</code>
</div>
<div class="line number2 index1 alt1">
<code class="javascript spaces">    </code><code class="javascript keyword">var</code> <code class="javascript plain">d = </code><code class="javascript keyword">this</code><code class="javascript plain">.datetime;</code>
</div>
<div class="line number3 index2 alt2">
<code class="javascript spaces">    </code><code class="javascript keyword">var</code> <code class="javascript plain">key = {</code>
</div>
<div class="line number4 index3 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">year: d.getFullYear(),</code>
</div>
<div class="line number5 index4 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">month: d.getMonth() + 1,</code>
</div>
<div class="line number6 index5 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">day: d.getDate(),</code>
</div>
<div class="line number7 index6 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">};</code>
</div>
<div class="line number8 index7 alt1">
<code class="javascript spaces">    </code><code class="javascript keyword">var</code> <code class="javascript plain">value = {</code>
</div>
<div class="line number9 index8 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">count: </code><code class="javascript keyword">this</code><code class="javascript plain">.count,</code>
</div>
<div class="line number10 index9 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">rows: 1,</code>
</div>
<div class="line number11 index10 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">groups: [</code><code class="javascript keyword">this</code><code class="javascript plain">.group],</code>
</div>
<div class="line number12 index11 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">}</code>
</div>
<div class="line number13 index12 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">emit(key, value);</code>
</div>
<div class="line number14 index13 alt1">
<code class="javascript plain">}, </code><code class="javascript keyword">function</code><code class="javascript plain">(key, vals) {</code>
</div>
<div class="line number15 index14 alt2">
<code class="javascript spaces">    </code><code class="javascript keyword">var</code> <code class="javascript plain">reducedVal = {</code>
</div>
<div class="line number16 index15 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">count: 0,</code>
</div>
<div class="line number17 index16 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">groups: [],</code>
</div>
<div class="line number18 index17 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">rows: 0,</code>
</div>
<div class="line number19 index18 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">};</code>
</div>
<div class="line number20 index19 alt1">
<code class="javascript spaces">    </code><code class="javascript keyword">for</code><code class="javascript plain">(</code><code class="javascript keyword">var</code> <code class="javascript plain">i = 0; i &lt; vals.length; i++) {</code>
</div>
<div class="line number21 index20 alt2">
<code class="javascript spaces">        </code><code class="javascript keyword">var</code> <code class="javascript plain">v = vals[i];</code>
</div>
<div class="line number22 index21 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">reducedVal.count += v.count;</code>
</div>
<div class="line number23 index22 alt2">
<code class="javascript spaces">        </code><code class="javascript plain">reducedVal.rows += v.rows;</code>
</div>
<div class="line number24 index23 alt1">
<code class="javascript spaces">        </code><code class="javascript keyword">for</code><code class="javascript plain">(</code><code class="javascript keyword">var</code> <code class="javascript plain">j = 0; j &lt; v.groups.length; j ++) {</code>
</div>
<div class="line number25 index24 alt2">
<code class="javascript spaces">            </code><code class="javascript keyword">if</code> <code class="javascript plain">(reducedVal.groups.indexOf(v.groups[j]) == -1) {</code>
</div>
<div class="line number26 index25 alt1">
<code class="javascript spaces">                </code><code class="javascript plain">reducedVal.groups.push(v.groups[j]);</code>
</div>
<div class="line number27 index26 alt2">
<code class="javascript spaces">            </code><code class="javascript plain">}</code>
</div>
<div class="line number28 index27 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">}</code>
</div>
<div class="line number29 index28 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">}</code>
</div>
<div class="line number30 index29 alt1">
<code class="javascript spaces">    </code><code class="javascript keyword">return</code> <code class="javascript plain">reducedVal;</code>
</div>
<div class="line number31 index30 alt2"><code class="javascript plain">}, {</code></div>
<div class="line number32 index31 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">query: {},</code>
</div>
<div class="line number33 index32 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">sort: {datetime: 1},    </code><code class="javascript comments">// 需要索引 否则结果返回空</code>
</div>
<div class="line number34 index33 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">limit: 50000,</code>
</div>
<div class="line number35 index34 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">finalize: </code><code class="javascript keyword">function</code><code class="javascript plain">(key, reducedVal) {</code>
</div>
<div class="line number36 index35 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">reducedVal.avg = reducedVal.count / reducedVal.rows;</code>
</div>
<div class="line number37 index36 alt2">
<code class="javascript spaces">        </code><code class="javascript keyword">return</code> <code class="javascript plain">reducedVal;</code>
</div>
<div class="line number38 index37 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">},</code>
</div>
<div class="line number39 index38 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">out: {</code>
</div>
<div class="line number40 index39 alt1">
<code class="javascript spaces">        </code><code class="javascript plain">inline: 1,</code>
</div>
<div class="line number41 index40 alt2">
<code class="javascript spaces">        </code><code class="javascript comments">// replace: "",</code>
</div>
<div class="line number42 index41 alt1">
<code class="javascript spaces">        </code><code class="javascript comments">// merge: "",</code>
</div>
<div class="line number43 index42 alt2">
<code class="javascript spaces">        </code><code class="javascript comments">// reduce: "",</code>
</div>
<div class="line number44 index43 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">},</code>
</div>
<div class="line number45 index44 alt2">
<code class="javascript spaces">    </code><code class="javascript plain">scope: {},</code>
</div>
<div class="line number46 index45 alt1">
<code class="javascript spaces">    </code><code class="javascript plain">jsMode: </code><code class="javascript keyword">true</code>
</div>
<div class="line number47 index46 alt2"><code class="javascript plain">})</code></div>
</div>
</td>
</tr></tbody></table>
</div>
</div>
</div>
<h4>测试数据：</h4>
<div class="likecs_Highlighter sh-gutter">
<div>
<div>
<table border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="gutter">
<div class="line number1 index0 alt2">1</div>
<div class="line number2 index1 alt1">2</div>
<div class="line number3 index2 alt2">3</div>
<div class="line number4 index3 alt1">4</div>
<div class="line number5 index4 alt2">5</div>
<div class="line number6 index5 alt1">6</div>
<div class="line number7 index6 alt2">7</div>
<div class="line number8 index7 alt1">8</div>
<div class="line number9 index8 alt2">9</div>
<div class="line number10 index9 alt1">10</div>
<div class="line number11 index10 alt2">11</div>
</td>
<td class="code">
<div class="container">
<div class="line number1 index0 alt2"><code class="javascript plain">&gt; db.newtest.find()</code></div>
<div class="line number2 index1 alt1">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544352ba57ccba824d7bf"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"E"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1402764223, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 63, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391126, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"aa"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C8"</code> <code class="javascript plain">}</code>
</div>
<div class="line number3 index2 alt2">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544512ba57ccba824d7c0"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"I"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1413086660, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 93, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391261, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"bb"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C10"</code> <code class="javascript plain">}</code>
</div>
<div class="line number4 index3 alt1">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c1"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"H"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1440750343, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 41, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391111, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"cc"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C1"</code> <code class="javascript plain">}</code>
</div>
<div class="line number5 index4 alt2">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c2"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"S"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1437710373, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 14, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512392136, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"dd"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C10"</code> <code class="javascript plain">}</code>
</div>
<div class="line number6 index5 alt1">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c3"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"Z"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1428307315, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 78, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391166, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"ee"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C5"</code> <code class="javascript plain">}</code>
</div>
<div class="line number7 index6 alt2">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c4"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"R"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1402809274, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 74, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391162, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"ff"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C9"</code> <code class="javascript plain">}</code>
</div>
<div class="line number8 index7 alt1">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c5"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"Y"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1400571321, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 66, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512139164, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"gg"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C2"</code> <code class="javascript plain">}</code>
</div>
<div class="line number9 index8 alt2">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c6"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"L"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1416562128, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 5, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512393165, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"hh"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C1"</code> <code class="javascript plain">}</code>
</div>
<div class="line number10 index9 alt1">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544562ba57ccba824d7c7"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"E"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1414057884, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 12, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391165, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"ii"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C3"</code> <code class="javascript plain">}</code>
</div>
<div class="line number11 index10 alt2">
<code class="javascript plain">{ </code><code class="javascript string">"_id"</code> <code class="javascript plain">: ObjectId(</code><code class="javascript string">"5a2544572ba57ccba824d7c8"</code><code class="javascript plain">), </code><code class="javascript string">"group"</code> <code class="javascript plain">: </code><code class="javascript string">"L"</code><code class="javascript plain">, </code><code class="javascript string">"created"</code> <code class="javascript plain">: 1418879346, </code><code class="javascript string">"count"</code> <code class="javascript plain">: 67, </code><code class="javascript string">"datetime"</code> <code class="javascript plain">: 1512391167, </code><code class="javascript string">"title"</code> <code class="javascript plain">: </code><code class="javascript string">"gg"</code><code class="javascript plain">, </code><code class="javascript string">"category"</code> <code class="javascript plain">: </code><code class="javascript string">"C3"</code> <code class="javascript plain">}</code>
</div>
</div>
</td>
</tr></tbody></table>
</div>
</div>
</div>
<h3>四、总结</h3>
<table>
<thead><tr>
<th>method</th>
<th>allowDiskUse</th>
<th>out</th>
<th>function</th>
</tr></thead>
<tbody>
<tr>
<td>aggregate</td>
<td>true</td>
<td>pipeline/collection</td>
<td>false</td>
</tr>
<tr>
<td>group</td>
<td>false</td>
<td>pipeline</td>
<td>true</td>
</tr>
<tr>
<td>mapReduce</td>
<td>jsMode</td>
<td>pipeline/collection</td>
<td>true</td>
</tr>
</tbody>
</table>
<ul>
<li>
<code>aggregate</code> 基于累加操作的的聚合 可以重复利用 <code>$project</code>/<code>$group</code> 一层一层聚合数据, 可以用于大量数据(单输出结果小于 16MB) 不可用于分片数据</li>
<li>
<code>mapReduce</code> 可以处理超大数据集 需要严格遵守 mapReduce 中的结构一致/幂等 写法, 可增量输出/合并, 见 <code>out</code> options</li>
<li>
<code>group</code> RDB 中的 <code>group by</code> 简单需求可用(只有 inline 输出) 会产生 <code>read lock</code>
</li>
</ul>
 
                    
                <div style="margin-top: 10px;">
                  </div> 
        </section>
	 
        <footer class="post-footer">
            <section class="author">
                                            </section>
        </footer>
        <p class="mt10">相关文章：</p>
        <div style="width: 100%;" class="contentcard">
      
            <div style="width: 100%;height: auto;" class="carditem litem clearfix"> 
                    <ul style="padding-left: 0rem;" class="cardcont">
                                            </ul>
               </div>   
         </div>
    </article>

  
</div>

<div class="rigthbox contentcard mt10">
 
          <div style="height: auto;" class="carditem litem">
    <div class="cardtit">猜你喜欢 </div>
        <ul class="cardcont">
                        </ul>
   </div> 

<div style="height: auto;" class="carditem litem">
    <div class="cardtit">相关资源 </div>
        <ul class="cardcont">
              
                            </ul>
   </div>
   
    <div style="height: auto;" class="carditem litem">
     <div class="cardtit">相似解决方案 </div>
         <ul class="cardcont">
                          </ul>
    </div>
  
   <div style="height: auto;background-color: #ddd;text-align: center;" class="carditem litem">
    <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
</div> 
   <div  style="height: auto;" class="carditem litem mt20">
    <div class="cardtit">热门标签  </div>
    <div class="tagbox">
                    <a target="_blank" title="Java" href="/default/index/tags?cid=164&cname=Java" >Java</a>
                        <a target="_blank" title="Python" href="/default/index/tags?cid=367&cname=Python" >Python</a>
                        <a target="_blank" title="linux" href="/default/index/tags?cid=274&cname=linux" >linux</a>
                        <a target="_blank" title="javascript" href="/default/index/tags?cid=169&cname=javascript" >javascript</a>
                        <a target="_blank" title="Mysql" href="/default/index/tags?cid=237&cname=Mysql" >Mysql</a>
                        <a target="_blank" title="C#" href="/default/index/tags?cid=187&cname=C%23" >C#</a>
                        <a target="_blank" title="Docker" href="/default/index/tags?cid=243&cname=Docker" >Docker</a>
                        <a target="_blank" title="算法" href="/default/index/tags?cid=344&cname=%E7%AE%97%E6%B3%95" >算法</a>
                        <a target="_blank" title="前端" href="/default/index/tags?cid=160&cname=%E5%89%8D%E7%AB%AF" >前端</a>
                        <a target="_blank" title="SpringBoot" href="/default/index/tags?cid=168&cname=SpringBoot" >SpringBoot</a>
                        <a target="_blank" title="Redis" href="/default/index/tags?cid=227&cname=Redis" >Redis</a>
                        <a target="_blank" title="Vue" href="/default/index/tags?cid=236&cname=Vue" >Vue</a>
                        <a target="_blank" title="spring" href="/default/index/tags?cid=696&cname=spring" >spring</a>
                        <a target="_blank" title="设计模式" href="/default/index/tags?cid=632&cname=%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F" >设计模式</a>
                        <a target="_blank" title=".net core" href="/default/index/tags?cid=381&cname=.net+core" >.net core</a>
                        <a target="_blank" title=".net" href="/default/index/tags?cid=300&cname=.net" >.net</a>
                        <a target="_blank" title="kubernetes" href="/default/index/tags?cid=2179&cname=kubernetes" >kubernetes</a>
                        <a target="_blank" title="c++" href="/default/index/tags?cid=312&cname=c%2B%2B" >c++</a>
                        <a target="_blank" title="数据库" href="/default/index/tags?cid=284&cname=%E6%95%B0%E6%8D%AE%E5%BA%93" >数据库</a>
                        <a target="_blank" title="数据结构" href="/default/index/tags?cid=247&cname=%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84" >数据结构</a>
                        <a target="_blank" title="大数据" href="/default/index/tags?cid=888&cname=%E5%A4%A7%E6%95%B0%E6%8D%AE" >大数据</a>
                        <a target="_blank" title="js" href="/default/index/tags?cid=159&cname=js" >js</a>
                        <a target="_blank" title="机器学习" href="/default/index/tags?cid=171&cname=%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0" >机器学习</a>
                        <a target="_blank" title="微服务" href="/default/index/tags?cid=832&cname=%E5%BE%AE%E6%9C%8D%E5%8A%A1" >微服务</a>
                        <a target="_blank" title="Android" href="/default/index/tags?cid=282&cname=Android" >Android</a>
                        <a target="_blank" title="Go" href="/default/index/tags?cid=839&cname=Go" >Go</a>
                        <a target="_blank" title="程序员" href="/default/index/tags?cid=327&cname=%E7%A8%8B%E5%BA%8F%E5%91%98" >程序员</a>
                        <a target="_blank" title="面试" href="/default/index/tags?cid=637&cname=%E9%9D%A2%E8%AF%95" >面试</a>
                        <a target="_blank" title="JVM" href="/default/index/tags?cid=727&cname=JVM" >JVM</a>
                        <a target="_blank" title="ASP.net core" href="/default/index/tags?cid=179&cname=ASP.net+core" >ASP.net core</a>
                        <a target="_blank" title="云原生" href="/default/index/tags?cid=22056&cname=%E4%BA%91%E5%8E%9F%E7%94%9F" >云原生</a>
                        <a target="_blank" title="人工智能" href="/default/index/tags?cid=270&cname=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD" >人工智能</a>
                        <a target="_blank" title="后端" href="/default/index/tags?cid=1089&cname=%E5%90%8E%E7%AB%AF" >后端</a>
                        <a target="_blank" title="PHP" href="/default/index/tags?cid=281&cname=PHP" >PHP</a>
                        <a target="_blank" title="git" href="/default/index/tags?cid=226&cname=git" >git</a>
                        <a target="_blank" title="CSS" href="/default/index/tags?cid=817&cname=CSS" >CSS</a>
                        <a target="_blank" title="golang" href="/default/index/tags?cid=409&cname=golang" >golang</a>
                        <a target="_blank" title="k8s" href="/default/index/tags?cid=5067&cname=k8s" >k8s</a>
                        <a target="_blank" title="Nginx" href="/default/index/tags?cid=373&cname=Nginx" >Nginx</a>
                        <a target="_blank" title="Django" href="/default/index/tags?cid=634&cname=Django" >Django</a>
                        <a target="_blank" title="mybatis" href="/default/index/tags?cid=720&cname=mybatis" >mybatis</a>
                        <a target="_blank" title="深度学习" href="/default/index/tags?cid=345&cname=%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0" >深度学习</a>
                        <a target="_blank" title="多线程" href="/default/index/tags?cid=986&cname=%E5%A4%9A%E7%BA%BF%E7%A8%8B" >多线程</a>
                        <a target="_blank" title="React" href="/default/index/tags?cid=560&cname=React" >React</a>
                        <a target="_blank" title="架构" href="/default/index/tags?cid=2070&cname=%E6%9E%B6%E6%9E%84" >架构</a>
                        <a target="_blank" title="devops" href="/default/index/tags?cid=2662&cname=devops" >devops</a>
                        <a target="_blank" title="爬虫" href="/default/index/tags?cid=905&cname=%E7%88%AC%E8%99%AB" >爬虫</a>
                        <a target="_blank" title="云计算" href="/default/index/tags?cid=361&cname=%E4%BA%91%E8%AE%A1%E7%AE%97" >云计算</a>
                        <a target="_blank" title="Spring Boot" href="/default/index/tags?cid=201&cname=Spring+Boot" >Spring Boot</a>
                        <a target="_blank" title="LeetCode" href="/default/index/tags?cid=342&cname=LeetCode" >LeetCode</a>
                </div>
       
   </div>
   
        <div id="rightadbox" style="height: 300px;background-color: #ddd;text-align: center;" class="carditem litem">
            <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
        </div> 
</div>
<div class="clearfix"></div>
</main>
    
<div class="yllinks alink"></div>
 

<footer class="site-footer clearfix">
<section class="copyright">By &copy; 2026 <a href="/" title="www.likecs.com">likecs</a> 版权所有,<br/>本站所有数据收集于网络如有侵犯到您的权益请联系 进行下架处理1。 </section>
<section class="poweredby">  <a target="_blank" href="https://beian.miit.gov.cn/">粤ICP备22038628号</a>Powered By  WordPress </section>
<script charset="UTF-8" id="LA_COLLECT" src="//sdk.51.la/js-sdk-pro.min.js"></script>
<script>LA.init({id: "Je3PjbvUssp6BbvY",ck: "Je3PjbvUssp6BbvY"})</script>
<script>
var _hmt = _hmt || [];
(function() {
  var hm = document.createElement("script");
  hm.src = "https://hm.baidu.com/hm.js?2eb031e42d29b7c1a1f16948d2ae2a9f";
  var s = document.getElementsByTagName("script")[0]; 
  s.parentNode.insertBefore(hm, s);
})();
</script>
</footer>  
</div>
<script>
    $(function(){
                    $(".post-content").append('<p style="padding: 20px;color: #cacaca;">原文链接：https://www.cnblogs.com/lovezbs/p/11131575.html</p>')  
            }) 
</script> 
</body>
</html>