【问题标题】:Importing the contents of a word document into R将word文档的内容导入R
【发布时间】:2014-02-14 14:18:32
【问题描述】:

我是 R 新手,已经工作了一段时间,如下所示。我将代码写在一个word文档中,然后我将带有代码的文档复制并粘贴到R中,以使代码运行正常,但是当代码很长(一百页)时,需要花费大量时间R 开始运行代码。这似乎不是一个非常有效的工作程序,我相信还有其他形式来编译 R 代码。

另一方面,我想到的一个是将 word 的内容导入 R 中,我不确定该怎么做。已尝试使用 read.table 但它不起作用,在互联网上查看如何导入数据,但大多数解释都是针对数据表等或数据表等形式的互联网文件。我尝试将文档保存到 csv 中。但是 word 不包括 csv 已尝试使用富文本格式和 XML 包,但包中的说明再次用于导入表和类似文件。我想知道 R 是否有一种有效的方法可以像在 word 文档中一样导入 word 文档。

谢谢

【问题讨论】:

  • 你不能只保存为纯文本文件和source吗?
  • 更改您的工作流程并安装适当的 IDE(例如,RStudio)。您会对语法高亮和向 R 发送代码等功能感到惊讶。
  • 我认为这里的答案是停止使用 Word。它旨在编写文档。我会用一些东西来写代码。我自己使用 RStudio,但也使用记事本 +。其他人有其他偏好。
  • 所有 R 包都在 RStudio 中起作用吗
  • RStudio 只是一个“前端”。 “后端”仍然是 R。所以,当然所有包都可以工作(可能有极其罕见的例外,我从未见过)。

标签: r


【解决方案1】:

如果不检查 word 文档,很难说出最简单的解决方案是什么。假设它只包含代码而没有其他内容,那么从 Word 中将其全部转换为纯文本应该很容易。您可以通过转到文件 -> 另存为,并在“另存为类型”下使用“纯文本”来做到这一点。

然后将文件扩展名从 .txt 编辑为 .R,下载合适的文本编辑器(我可以推荐 RStudio for R),并在其中打开您的代码。然后,您将能够在编辑器中运行代码,而无需使用复制/粘贴。

【讨论】:

    【解决方案2】:

    不,读取表不会这样做。

    Microsoft Word 有自己的格式,除了您输入的文本之外,它还包含大量元数据。您需要一个能够理解 Word 格式的阅读器/解析器。

    Java 开发人员会使用 Apache POI 之类的库来读取并将其解析为单词标记和 n-gram。

    寻找自然语言处理工具,比如这个 R 模块:

    http://cran.r-project.org/web/views/NaturalLanguageProcessing.html

    【讨论】:

    • 或者也许是使用rJava 包的包装器。
    猜你喜欢
    • 2023-02-14
    • 1970-01-01
    • 2011-04-06
    • 1970-01-01
    • 2016-01-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多