【发布时间】:2019-07-28 10:56:23
【问题描述】:
这是我在 AWS GLUE 中的 pyspark 作业得到的结果
{a:1,b:7}
{a:1,b:9}
{a:1,b:3}
但我需要在 s3 上写入这些数据并将其发送到 JSON 数组中的 API 格式
[
{a:1,b:2},
{a:1,b:7},
{a:1,b:9},
{a:1,b:3}
]
我尝试将我的输出转换为 DataFrame,然后应用
toJSON()
results = mapped_dyF.toDF()
jsonResults = results.toJSON().collect()
但现在无法使用'write_dynamic_frame.from_options' 在 s3 上写回结果
因为它需要 DF,但 my'jsonResults' 现在不再是 DataFrame。
【问题讨论】:
-
如果您将条目弹出到数组列中,这可能会起作用,而不是将其转换为 json