【发布时间】:2020-12-24 16:19:51
【问题描述】:
我有一个包含一百万行的文本文件,格式如下:
{"_id":"0e1daf84-4e4d-11ea-9f43-ba9b7f2413e0","parameterId":"visib_mean_last10min","stationId":"06193","timeCreated":1581590344449633,"timeObserved":1577922600000000,"value":11100}
该文件没有标题。我希望能够将它作为一个数组来观察。
我试过了:
df = pd.read_csv("2020-01_2.txt", delimiter = ",", header = None, names = ["_id", "parameterId", "stationId", "timeCreated", "timeObserved", "value"])
虽然这确实将文件排序为我想要的列和行,但它会将"_id":"0e1daf84-4e4d-11ea-9f43-ba9b7f2413e0" 绘制为我只想要"0e1daf84-4e4d-11ea-9f43-ba9b7f2413e0" 的第一个条目。
如何仅将每个“:”之后的值绘制到数组中?
【问题讨论】:
-
看起来像 JSON 文件,而不是 CSV 文件
-
花点时间阅读帮助中心的editing help。 Stack Overflow 上的格式化与其他站点上的不同。您的帖子看起来越好,其他人就越容易阅读和理解它。
-
为什么在不是 CSV 文件上使用CSV?看起来有人将一堆 MongoDB 文档转储到 JSON 文件中,您是否查看过它的来源(您可以连接到数据库)或 Python 有哪些解析它的选项?跨度>