【发布时间】:2018-02-01 20:28:51
【问题描述】:
我知道这个问题的某些部分可能很简单,但我是这方面的初学者,并且非常感谢最简单的解决方案:我有一个 excel(.xlsx 文件),其中一个列有它的单元格,每个单元格都有一个列表数字列表(数字以空格分隔,每个列表的末尾甚至还有一个空格)。因此,该列看起来像这样:
ColumnHeader
[[[9 9 9 9 9 13 ][11 11 11 11 11 11 ][11 11 11 11 11 11 ][9 9 9 9 9 9 ]
[[[9 9 9 9 9 9 ][9 9 9 9 9 9 ]]]
[[[9 9 9 9 ][14 14 14 14 ][13 13 13 13 ]]]
请注意每个列表如何具有不同数量的列表。另外,请注意,每个列表列表的前后都有一个额外的 [ 和 ]。
理想情况下,我想做的是在 python 中读取整个 xlsx 文件(请记住,文件中的其他列只有数字),将其存储在 pandas 数据框中,但将上面的这一列存储为列表列表。因此,如果我稍后打印此列,我会得到类似下面的内容(如果转换为列表,该系列将是列表列表的列表:
ColumnHeader
[[9,9,9,9,9,13],[11,11,11,11,11,11],[11,11,11,11,11,11],[9,9,9,9,9,9]]
[[9,9,9,9,9,9],[9,9,9,9,9,9]]
[[9,9,9,9],[14,14,14,14],[13,13,13,13]]
如果我只是直接将 xlsx 文件读入 pandas 数据框,它显然会将此列读取为文本,这不是我想要的。
对此的任何帮助将不胜感激。
阿里
【问题讨论】:
-
你能展示一下 pandas 目前是如何读取文件的吗?在此处粘贴一个 sn-p。这可以帮助回答
标签: python excel python-3.x pandas xlsx