【发布时间】:2016-07-12 12:24:05
【问题描述】:
我有一个简单的csv 文件,它有 4 个字段,serial_num、post_code、lat、lon 例如:
serial_num,post_code,LAT,LON
06AA209365,PE10 2AZ,532342,168459
98A819621,PE10 1AA,532342,168459
07FD490906,PE12 1VV,497882,157983
我需要批量插入elasticsearch。 lat lon 字段需要在单个 geo_point 字段中定义,因此我创建了如下映射:
- 索引是serial_data
-
类型是小部件
PUT /serial_data { "mappings": { "widget": { "properties": { "serial_number": { "type": "string" }, "post_code": { "type": "string" }, "location": { "type": "geo_point" } } }} }
我尝试使用embulk 插入数据,因为我认为我有一个定义的映射。如果我将 lat long 定义为 doubles 或 long,那么 embulk 会将 lat, long 解析为单个位置,但它不会,我过于乐观了。
我还认为 embulk 有一个 bulk-input-json 插件,但我找不到它。
问题
任何关于如何批量加载此数据的想法都将不胜感激。
【问题讨论】:
标签: elasticsearch elasticsearch-plugin