【问题标题】:Numpy loadtxt encodingNumpy loadtxt 编码
【发布时间】:2023-03-19 11:49:01
【问题描述】:

我正在尝试使用 numpy.loadtxt 加载数据...我尝试读取的文件使用的是 cp1252 编码。有没有可能用numpy把编码改成cp1252?

以下

import numpy as np
n = 10
myfile = '/path/to/myfile'
mydata = np.loadtxt(myfile, skiprows = n)

给予:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf6 in position 189: invalid start byte

该文件包含元数据(前 n 行),后跟一个浮点数表。

编辑:仅在 Ubuntu (12.04) 上运行此问题时才会出现此问题。在 Windows 上它运行良好。由于这个原因,我认为这个问题与编码有关。

Edit2:如下所示打开文件也可以:

import codecs
data = codecs.open(myfile, encoding='cp1252')
datalines = data.readlines()

但是我想使用 np.loadtext 将数据直接读入一个 numpy 数组。

【问题讨论】:

  • ox6f in cp1252 是ö,你的输入是什么样的?
  • 就您使用numpy 1.8.1n 而言是正确的。它有效。

标签: python numpy encoding ubuntu-12.04 cp1252


【解决方案1】:

我可以自己解决问题。

在使用 numpy 读取文件之前,我只需要使用适当的文件打开文件:

import numpy as np
import codecs

n=10

filecp = codecs.open(myfile, encoding = 'cp1252')
mydata = np.loadtxt(filecp, skiprows = n)

谢谢大家!

【讨论】:

  • 我有一种预感,除非使用上下文管理器 (with),否则这会导致文件描述符泄漏。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-06-13
  • 2014-05-21
  • 2017-12-21
  • 1970-01-01
  • 1970-01-01
  • 2013-05-02
相关资源
最近更新 更多