【发布时间】:2019-09-27 16:24:11
【问题描述】:
由于我们不能直接从 Json 文件中读取,我使用的是 .txt 文件。 它看起来像更多的元素由“,”分隔。
[
{
"Item_Identifier": "FDW58",
"Outlet_Size": "Medium"
},
{
"Item_Identifier": "FDW14",
"Outlet_Size": "Small"
},
]
我想计算元素的数量,这里我会得到 2。 问题是我无法将文本分隔成用逗号“,”分隔的元素。 即使将其转换为 json 格式,我也会单独获取每一行。
lines = p | 'receive_data' >> beam.io.ReadFromText(
known_args.input)\
| 'jsondumps' >> beam.Map(lambda x: json.dumps(x))\
| 'jsonloads' >> beam.Map(lambda x: json.loads(x))\
| 'print' >> beam.ParDo(PrintFn()) \
【问题讨论】:
标签: python json google-cloud-platform apache-beam