【问题标题】:How to replace string for large file in Google Cloud Storage? [closed]如何替换谷歌云存储中大文件的字符串? [关闭]
【发布时间】:2019-12-13 00:54:04
【问题描述】:

我在 Google Cloud Storage 中有一个大文件,例如 100GB。替换此文件内容的字符串的最佳做法是什么?

一个简单的选择是:

  1. 使用本地 SSD 创建 GCE
  2. 下载到 GCE
  3. 运行sed -i 's/old/new/g'文件名
  4. 上传回 GCS

【问题讨论】:

    标签: sed replace google-cloud-platform google-cloud-storage large-data


    【解决方案1】:

    另一种方法是使用数据流。但这对于简单地更新一个字段来说是巨大的……数据准备的 Sallee 事情。新的数据融合是可视化的,但使用 dataproc 执行,仍然过大。

    如果您的文件在大查询中很容易加载,。在 GCS 中加载、转换并将结果导出为相同的格式...

    你的解决方案是我认为最好的。

    【讨论】:

      【解决方案2】:

      GCS 中的存储桶不是文件系统,因此从技术上讲,您无法直接对其进行编辑,您的解决方案是我能想到的最简单的解决方案。

      其他选项: FuseFilestore 用于文件系统支持。 Rsync 允许将本地目录与 GCS 存储桶同步。

      否则,您必须下载/上传以编辑位于 GCS 中的文件(例如您的解决方案与 GCE 虚拟机实例)。

      【讨论】:

        猜你喜欢
        • 2023-03-07
        • 1970-01-01
        • 1970-01-01
        • 2015-01-15
        • 2018-05-31
        • 2021-07-07
        • 2018-10-10
        • 2015-07-17
        • 1970-01-01
        相关资源
        最近更新 更多