【问题标题】:For loop to import .csv files containing text (tweets) [duplicate]For循环导入包含文本(推文)的.csv文件[重复]
【发布时间】:2018-08-06 10:40:45
【问题描述】:

我有一个包含 60 多个 .csv 文件的文件夹,其中包含“抓取的”推文。 每个文件有 6 列:一列只是它们下载的“位置”(不妨去掉它),然后我有一个用于日期,一个用于时间,然后是 3 个重要的:ticker(例如AAPL,MSFT...),推文的正文最后一个标签仅适用于其中的一小部分。我需要做的是运行一个 for 循环,以便能够将 svm 和 NaiveBayes 应用于每个文件,从而预测未标记推文的标签。我已经在训练集上运行了这两种算法,这个循环的输出将是测试集。提前谢谢你。

【问题讨论】:

  • 寻求帮助时,您应该包含一个简单的reproducible example,其中包含可用于测试和验证可能解决方案的示例输入和所需输出。问一个可以明确回答的具体问题。
  • 我没能找到你们所有链接的问题,但我似乎在那里找到了答案,谢谢大家的回答

标签: r csv for-loop twitter


【解决方案1】:

我们可以用list.files得到所有相关文件的字符向量

fn <- list.files(pattern = ".csv$")

然后使用*apply家族的成员读入数据并应用一个函数;例如,像这样:

lst <- lapply(fn, function(x) {
    df <-read.csv(x);
    ## Example: Fit a linear model and return lm object
    return(lm(y ~ x, data = df));
})

lst 然后包含 listlm 对象。如果将lm 替换为svm,则返回对象将是支持向量机分类结果的list

【讨论】:

    猜你喜欢
    • 2022-01-21
    • 1970-01-01
    • 2019-09-25
    • 2018-01-12
    • 2015-08-28
    • 1970-01-01
    • 1970-01-01
    • 2015-02-08
    • 2021-09-21
    相关资源
    最近更新 更多