【发布时间】:2016-07-01 17:55:13
【问题描述】:
我在 S3 文件夹(例如 s3://data/)中有许多 json 文件(示例如下),格式为 foo.json.gz、foo1.json.gz、foo2.json.gz。其中一个类别(例如 1010)被错误分配,需要将所有文件更改为 1020。我们如何进行此更改并在 S3 中使用修改后的内容重新打包这些文件?
foo.json
{
"flower": "lilly",
"animal": "cat",
"category": "1010"
}
{
"flower": "rose",
"animal": "dog",
"category": "1000"
}
{
"flower": "daisy",
"animal": "cat",
"category": "1010"
}
【问题讨论】:
标签: hadoop apache-spark amazon-s3