【发布时间】:2019-01-02 17:51:10
【问题描述】:
我有 6 个文件夹,每个文件夹包含 2200 个 CSV 文件,我知道如何将它们全部读取到一个文件中并创建一个联合数据集,但问题是我需要对每个文件应用统计函数,然后存储这些值(从具有该文件名称的每个文件中获取)到另一个文件中。因为我只需要分析每个文件的第 5 列和第 6 列,并计算这些列和每个文件的标准偏差、均值、方差、偏度和峰度。 那么我的数据集将是具有第一列中所有文件名称的文件,Std dev 为第二列,mean 为第三列,依此类推。
我无法通过循环分析(查找第 5 列和第 6 列的统计参数)单 2 文件。如果有人能帮我解决这个问题,那对我很有帮助。
【问题讨论】:
-
那么实际的问题是什么?只需使用类似
lapply(list_of_files, function(x) { df <- read.csv(x)[, 5:6]; # Calculate summary stats and store in output file })
标签: r loops csv for-loop dataframe