【发布时间】:2017-02-27 06:11:13
【问题描述】:
据我所知,Apache spark 要求 json 文件在一个字符串中包含一个记录。我有一个按字段分割的 json 文件,如下所示:
{"id": 123,
"name": "Aaron",
"city": {
"id" : 1,
"title": "Berlin"
}}
{"id": 125,
"name": "Bernard",
"city": {
"id" : 2,
"title": "Paris"
}}
{...many more lines
...}
如何使用 Spark 解析它?我需要预处理器还是可以提供自定义拆分器?
【问题讨论】:
-
您使用的 Spark 版本是什么?
-
@mrsrinivas 1.6.2。有关系吗?
-
不确定。但想根据 Spark 版本添加答案。
标签: json apache-spark