【发布时间】:2020-01-24 17:16:50
【问题描述】:
我的目录中有几个 PDF 文件。我以前下载过,目前没什么大不了的。
我想在 R 中读取所有这些文件。我的想法是使用“pdftools”包中的“pdf_text”函数并编写如下公式:
mypdftext <- pdf_text(files)
其中“文件”是一个收集所有 PDF 文件名的对象,因此我不必手动编写所有文件名。因为我实际上已经下载了很多文件,所以我会避免写:
mypdftext <- pdf_text("file1.pdf", "file2.pdf", and many more files...)
为了创建对象“pdflist”,我使用了“files
但是“文件”不适用于 pdf_text 函数,可能是因为它是一个向量。我能做些什么呢?
【问题讨论】:
-
您可以
Map覆盖不同的文件名:Map(pdf_text, files),这将返回一个列表。这取决于您希望如何将所有这些文件组合在一起,以了解您接下来要做什么。 -
您可以尝试使用
apply-style 函数,例如mypdftexts <- lapply(files, {function(x) pdf_text(x)})。这将返回一个列表,其中每个元素都是 pdf 文件中的文本。