【问题标题】:python adding gibberish when reading from a .rtf file?python从.rtf文件读取时添加乱码?
【发布时间】:2009-10-12 05:36:40
【问题描述】:

我有一个 .rtf 文件,其中只包含一个整数,比如 15。我希望通过 python 读取这个整数并以某种方式操作该整数。但是,python 似乎正在读取与 .rtf 文件相关的大部分元数据。这是为什么?我怎样才能避免它?例如,试图读入这个文件,我得到..

{\rtf1\ansi\ansicpg1252\cocoartf949\cocoasubrtf460 {\fonttbl\f0\fswiss\fcharset0 黑体;} {\colortbl;\red255\green255\blue255;} \margl720\margr720\margb720\margt720\vieww9000\viewh8400\viewkind0 \pard\tx566\tx1133\tx1700\tx2267\tx2834\tx3401\tx3968\tx4535\tx5102\tx5669\tx6236\tx6803\ql\qnatural\pardirnatural

【问题讨论】:

    标签: python file-io rtf


    【解决方案1】:

    这就是 .RTF(即富文本文件)的本质,它们包含额外的数据来定义文本的布局和格式。

    不建议将数据存储在此类文件中,以免遇到您指出的困难。您是否会努力解析此文件并“恢复”您的一个数值,您可能会使您的应用程序面临 RTF 格式更新版本的风险,这可能会导致解析逻辑部分不正确,从而产生错误的数字数据应用程序)。

    为什么不将此信息存储在真正的文本文件中。这可以是一个平面文本文件,或者最好是一个 XML、YAML、JSON 文件,例如为您的应用程序添加“前向”兼容性,您可以在文件中添加额外的参数等。

    但是,如果这个文件是给定的,那么可能存在 Python 库来读取和写入它。检查 Python Package Index (PyPI) 中的 RTF 关键字。

    【讨论】:

      【解决方案2】:

      这正是 RTF 文件所包含的内容,因此 Python(在没有进一步说明的情况下)会为您提供文件所包含的内容。

      您可能正在寻找一个库来读取 RTF 文件的内容,例如pyrtf-ng

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2015-11-24
        • 2020-04-01
        • 1970-01-01
        • 2012-10-07
        • 1970-01-01
        相关资源
        最近更新 更多