【发布时间】:2016-02-28 19:55:44
【问题描述】:
我正在尝试使用切片表示法将 numpy 数组中的多个条目分配给单个 unicode 值(来自另一个数组),但如下面的 sn-p 所示,我得到了垃圾:
>>> import numpy as np
>>> a = np.array([u'America/Los_Angeles']*3)
>>> a
array([u'America/Los_Angeles', u'America/Los_Angeles',
u'America/Los_Angeles'],
dtype='<U19')
>>> s = np.zeros(10,dtype=a.dtype)
>>> s
array([u'', u'', u'', u'', u'', u'', u'', u'', u'', u''],
dtype='<U19')
>>> s[0:2] = a[0]
>>> s
array([ u'\uf300\udc41\uf440\udc65\uf080\udc69\ue380\udc61\uf380\udc4c\uef80\udc73\uf340\udc41\uf100\udc67\uf100\udc6cs\uf8ad\ude98\u7ff5\x00\x00\x01\x00\x02\ud7bf\udfff\uf77c\udc30',
u'\uf300\udc41\uf440\udc65\uf080\udc69\ue380\udc61\uf380\udc4c\uef80\udc73\uf340\udc41\uf100\udc67\uf100\udc6cs\uf8ad\ude98\u7ff5\x00\x00\x01\x00\x02\ud7bf\udfff\uf77c\udc30',
u'', u'', u'', u'', u'', u'', u'', u''],
dtype='<U19')
当使用 python 2.7.3 和 numpy 1.6.2 运行它时,我没有问题,得到了我的预期:
>>> s
array([u'America/Los_Angeles', u'America/Los_Angeles', u'', u'', u'', u'',
u'', u'', u'', u''],
dtype='<U19')
但这显然在 python 2.7.10 和 numpy 1.9.2 中发生了变化。我可以想出各种方法来解决这个问题,但我的问题是:获得预期结果的最佳(最 Python、最快、最通用)的解决方案是什么?
这里的上下文是我试图将一堆数组从不规则时间序列扩展为规则时间序列的数组,用于一堆不同类型(float、int、unicode 等)的数组,所以我更愿意找到适用于任何类型的解决方案,而无需大量“if isinstance”子句。
【问题讨论】:
-
使用 Python3.4 和 numpy 1.8.2,我得到了你所期望的
s(py3 没有显示u,但它仍然是U19)。 -
在 Py2.7,np 1.9 中,
a[0]出现此错误,a[[0]]或a[0].item()则没有。换句话说,当分配的值是类型np.unicode_,但不是np.ndarray或unicode。 -
谢谢。我已经选择了 a.item(0);简单而通用。
标签: arrays python-2.7 numpy unicode slice