【发布时间】:2018-07-12 12:23:39
【问题描述】:
我有多个 .pdf 文件(存储在本地文件夹中),其中包含文本。我想在 R 中导入 .pdf 文件(即文本)。我应用了函数“read_dir”(R 包:[textreadr][1])
library ("textreadr")
Data <- read_dir("<MY PATH>")
该功能运行良好。但。对于多个在其名称中包含特殊字符(即字母)的文件(例如'ć';例如'filenameć.pdf'),函数不起作用(错误消息:'The following files failed to read in and were removed:' ...)。
我能做什么?
我尝试通过 R重命名文件(不起作用(可能是由于相同的原因))。这可能是一种解决方法。
我不想手动重命名文件:)
跟进(仅限专家): 对于几个文件,我收到以下错误消息之一(我不知道为什么):
PDF error: Mismatch between font type and embedded font file
或
PDF error: Couldn't find trailer dictionary
有什么建议或提示如何解决这个问题?
【问题讨论】: