【问题标题】:MLCP Bulk LoadingMLCP 批量加载
【发布时间】:2016-01-20 02:26:46
【问题描述】:

我有近 10000 个 XML(小)文件,我正在通过 MLCP 将它们放入 MarkLogic。在摄取时,我正在做一些转换,转换的主要内容是字典更新。我正在从 XML 元素的输入更新字典。

我收到警告。这个警告的含义和原因是什么?

WARN mapreduce.ContentWriter: XDMP-XDQPNOSESSION

MLCP 提取文档的速度非常慢。我认为这是因为字典更新。有什么方法可以增强 MLCP java 堆内存,或者任何其他方法可以在 ML 服务器上快速摄取这些文档。

请提出建议。

【问题讨论】:

    标签: marklogic mlcp


    【解决方案1】:

    XDMP-XDQPNOSESSION 的文档是指影响 MarkLogic 5.0-2 及之前版本和 4.2-9 及之前版本的错误。如果您使用的是其中一个版本,看起来修复方法是升级它们。

    您提到根据 XML 元素更新 Dictionary。 MLCP 在并行化输入方面做得很好,但是对于每个输入文档,您都在 Dictionary 文档上获取了一个写锁。不确定你想用字典完成什么,但也许你可以使用单词词典来代替。这将在插入文档时自动更新,而无需对单个文件进行写锁定。

    【讨论】:

    • 谢谢戴夫。我正在使用 MarkLogic 7.0-4。我从转换脚本中删除了我的 Dictionary 代码,并毫无延迟地添加了所有 XML。对于字典,我正在使用您建议的单词词典。
    猜你喜欢
    • 2019-06-26
    • 2019-02-22
    • 1970-01-01
    • 2016-06-03
    • 2015-08-23
    • 2018-10-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多