【发布时间】:2015-07-24 02:23:48
【问题描述】:
我需要读取一个以\x01 (^A) 分隔的 CSV 文件,并为我的查找创建一个字典以进一步处理我的业务逻辑。
我的输入文件包含许多列,我需要将 14 列作为键,其余作为值。
之前文件是逗号分隔的,我能够读取文件并创建字典。知道文件以\x01 分隔,我的脚本失败了
这就是我之前创建字典的方式
lake_dataset = csv.DictReader(open(local_registry_file_path+os.path.basename(registryPath),'rb'))
master_dir = {}
for row in lake_dataset:
key = row.pop('TBL_DATASETLOCATION')
key = key.lower().strip()
master_dir[key] = row
【问题讨论】:
-
这是我创建字典的代码,我得到数组越界错误 IndexError: list index out of range rawdata = open("/home/bgy/report/DATASET_2015-07-23. csv", "rb") 用于原始数据中的行:new_row = re.split('\^A', row) key = new_row[13] master_dir[key] = row
标签: python python-2.7 csv