【发布时间】:2018-07-04 12:21:10
【问题描述】:
我有多个星形模式形式的 csv 文件。要使用 Python 执行分析,最好将所有这些 csv 文件合并到一个 csv 文件中,还是从每个 csv 文件中提取数据然后进行分析?在线用户几乎总是将所有文件合二为一,然后进行分析。但是,合并所有 csv 文件会消除我的星型模式。我目前在每个 csv 文件中大约有 25,000 行和 10 列。每个 csv 文件的大小约为 7 MB。提前感谢您的帮助。
【问题讨论】:
-
@RoadRunner 我应该将所有文件合并到一个大文件中,还是读取多个文件然后从多个文件中进行分析?
-
有多少个csv文件?如果您删除星型模式,这是一个大问题吗?我假设您有 6 个 csv 文件,来自您之前的 question。如果是这种情况,如果将文件组合在一起,文件将在 42MB 左右,这应该不是问题。然后你只需要读取一个文件。否则,只需单独读取文件即可。
-
@RoadRunner 感谢您的帮助!我会将所有文件合并为一个并继续。
标签: python data-analysis