【问题标题】:Read json files from tar.gz folders and convert to pandas dataframe [duplicate]从 tar.gz 文件夹中读取 json 文件并转换为 pandas 数据框 [重复]
【发布时间】:2019-11-23 14:56:03
【问题描述】:

我从未使用过 json 文件,我的问题是我有几个文件夹 tar.gz 包含不同的 json 文件。从每个压缩文件夹中,我只需要读取 AAjson 文件,追加并转换为 pandas 数据框。我是这样尝试的

import os, re
import pandas as pd

import pandas as pd 
import tarfile
import json
from pandas.io.json import json_normalize

cd = "my_path"

dfList = []

for root, dirs, files in os.walk(cd):
 with tarfile.open("dirs", "r:*") as tar:
    for fname in files:
        if re.match("AA_*.json$", fname):
            data = json.load(fname)
            frame = pd.DataFrame.from_dict(json_normilized(data), 
orient='columns')
            dfList.append(frame)    

 df = pd.concat(dfList) 

我发现了错误

FileNotFoundError: [Errno 2] 没有这样的文件或目录:'dirs'

【问题讨论】:

    标签: pandas


    【解决方案1】:
    import pandas as pd
    data = pd.read_json('filepath/filename')
    data
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2020-10-31
      • 1970-01-01
      • 1970-01-01
      • 2020-02-29
      • 1970-01-01
      • 1970-01-01
      • 2021-07-27
      • 1970-01-01
      相关资源
      最近更新 更多