【发布时间】:2014-05-24 16:00:21
【问题描述】:
大家好,MarkLogicians,
编辑见下文
我面临以下挑战: 我有来自平面关系表的社会人口统计邮政编码数据。 根据良好实践,我每行创建一个文档。 doc(row) 包含大约 400 个值,分为 7 类 40 个变量,每个变量有 4 到 7 个段。
<doc id=1011AB >
<cat>
<var>
<seg>
25
</seg>
</var>
</cat>
</doc>
有 500.000 个这样的文档,我们需要将 6 位级别聚合到更高的邮政编码级别(4 位)大约 40.000 个文档。
我们有用于为每个文档聚合一个段的工作代码。现在我正在寻找一种将 6 位级别聚合到 4 位级别的解决方案。聚合基本上是加权平均值的计算。
我的问题: 是否有一个优雅的为什么将 6 位级别的文档作为模板并填写它,还是我需要从头开始构建 4 位级别的文档?
=============== 编辑 ====================
好的,现在我有一张地图,我们在其中创建了一个连接键,例如
<map:map xmlns:map="http://marklogic.com/xdmp/map" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xs="http://www.w3.org/2001/XMLSchema">
<map:entry key="Consumententypes (sub):::Type 6, gezin met jongste kind 6+::: gezin met jongste kind 6+">
<map:value xsi:type="xs:double">
0
</map:value>
</map:entry>
<map:entry key="Woning:::Woontype:::De Veelbelovende Starter">
<map:value xsi:type="xs:double">
7.48
</map:value>
</map:entry>
每个键都有对应的值。
我想根据分解键重新创建文档 将“category:::variable:::segment”添加到上述结构中,并将 map:value 添加为元素值。
问题:构建文档的最佳方式是什么?我是创建一个节点,用元素填充它,然后在 ML 中插入它,还是我制作一个空文档并在进行过程中添加东西(似乎不是那么快)
雨果
【问题讨论】:
-
不确定我是否关注您的问题。更多细节和/或示例可能会有所帮助...
标签: aggregate-functions aggregate marklogic