【问题标题】:Gsutil downloading Android review stats csv files as binaryGsutil 以二进制形式下载 Android review stats csv 文件
【发布时间】:2015-03-16 19:14:54
【问题描述】:

我正在尝试下载我的 Android 应用的评论数据。

但是 gsutil 下载的文件不是文本文件!

FWIW,我正在运行带有 gsutil 4.7 的 Ubuntu 14.04。

下面是一个例子

stats$ gsutil cat gs://pubsite_prod_rev_xxxxxxxxx/stats/ratings/ratings_com.yyyyyyyyyy_201501_overview.csv
��
�@��uO�X���]]GD/ �FP_G�%�fם���9;:��
                                            �� �5�����sv���g�T��S;�����v�jZ}�={H0B�y�cD~M�O���wC���2F����ZI��9�.p�wM�e��p�3���Rj#^�,�²Ԍ��bY�V`�jy���^�X-�p�2��b�&jg8�+�uV�|�~�N߰����xY:}��_��t�F[�,�������F���xY:}�aY�e���|U:

【问题讨论】:

    标签: android google-play gsutil


    【解决方案1】:

    我第一次运行 gsutil 并看到了同样的东西 - 看起来像二进制垃圾的东西。除了...

    $ gsutil cp gs://pubsite_prod_rev_xxxx/reviews/reviews_com.yyyy.csv .
    $ file reviews_com.yyyy.csv
    $ reviews_com.yyyy.csv: Little-endian UTF-16 Unicode text, with very long lines
    

    所以它是文本,你只需要使用正确的工具来查看它。我设法将它加载到 gedit 中:

    $ gedit reviews_com.yyyy.csv
    

    然后另存为。我相信有更好的方法。

    【讨论】:

    • 我认为 UTF 文本至少部分可见。我以前从未见过原始的 UTF-16。谢谢!
    【解决方案2】:

    您的存储桶中的数据似乎已加密或其他格式。我尝试在相同的环境中下载文件,它对我来说效果很好。所以我建议检查您的文件内容,只需从存储桶中手动下载即可。

    【讨论】:

    【解决方案3】:

    我刚刚为我们的应用下载了三个 .csv 审查文件,并注意到了同样的情况。我正在运行 Mac OS X (yosemite/10.10.1),对我来说,该文件被识别为 gzipped 文件:

    $ file Dec2014.csv
    $ Dec2014.csv: gzip compressed data, from FAT filesystem (MS-DOS, OS/2, NT)
    

    我设法通过将 .zip 添加到文件名的末尾并解压缩它来将其转换为可读文件。然后它是一个完美的文本文件,例如 TextEdit 或 Numbers。

    【讨论】:

      【解决方案4】:

      它可能是 utf-16 编码的。你可以在 Mac 上运行它来转换:

      iconv -f UTF-16 <file>.csv
      

      不幸的是,谷歌获取评论的难度比苹果的 RSS 提要复杂得多……

      【讨论】:

        猜你喜欢
        • 2010-10-09
        • 1970-01-01
        • 2012-11-23
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多