【发布时间】:2016-12-15 00:47:00
【问题描述】:
问题。我的任务是研究如何在 Elasticsearch 中回填数据。到目前为止,有点空。基本要点是:
注意:所有文档都存储在每日索引下,每天大约有 200k 文档。
- 我需要能够重新索引大约 60 天的数据。
- 我需要为每个文档的 payload.time_sec 和 payload.time_nanosec 取两个字段,取其中的值并对它们进行一些数学运算(time_sec * 10**9 + time_nanosec),然后将其作为单个字段返回到重新索引的文件
我正在查看带有批量助手的 Python API 文档: http://elasticsearch-py.readthedocs.io/en/master/helpers.html
但我想知道这是否可能。
我的想法是使用: 批量帮助器提取滚动 ID(批量 _update?),遍历每个文档 ID,从每个停靠栏的两个字段中提取数据,进行数学运算,并使用新字段数据完成更新请求。
有人做过吗?也许有一个 groovy 脚本的东西?
谢谢!
【问题讨论】:
标签: python elasticsearch groovy