【发布时间】:2015-07-06 22:55:47
【问题描述】:
我有一个结构复杂的 json 文件。
{"Objects":{"items":{"item":[
{
"field1": "value1",
"field2": "value2",
"field3":[
{
"label1":"1",
"label2":"2"
},
{
"label1":"3",
"label2":"4"
}]
}
,
{
//same structure as above object
}
]}}}
文件大小略大于 1GB。我需要读取一个对象并查看特定标签的值是什么,如果它与我拥有的列表匹配,我需要将该对象写入另一个文件中,否则不是。
我知道像 JSONSimple 这样的普通 JSON 解析器无法工作,因为它将数据保存到内存中。我正在尝试使用杰克逊,但发现很难遍历所有对象,因为一次需要一个令牌。对于这种 JSON 格式,使用 Jackson 的流式传输和树结构的有效方法是什么?
或者我可以通过什么方式使用脚本来获取数据并使用它?
【问题讨论】:
-
Python 值得研究吗?
-
我从未使用过 Python。 java有什么用吗?
-
是的,这就是我现在用来解决问题的方法。
-
如何遍历 item 中的所有数组元素?然后是 field3 数组?
标签: java json parsing large-files