【发布时间】:2026-02-07 05:20:04
【问题描述】:
这是我长期面临的一个真正问题。
获取这个数据框:
A B THRESHOLD
NaN NaN NaN
-0.041158 -0.161571 0.329038
0.238156 0.525878 0.110370
0.606738 0.854177 -0.095147
0.200166 0.385453 0.166235
使用pd.read_clipboard 很容易复制。但是,如果其中一个列名有空格:
A B Col #3
NaN NaN NaN
-0.041158 -0.161571 0.329038
0.238156 0.525878 0.110370
0.606738 0.854177 -0.095147
0.200166 0.385453 0.166235
然后,它是这样读的:
A B Col #3
0 NaN NaN NaN NaN
1 -0.041158 -0.161571 0.329038 NaN
2 0.238156 0.525878 0.110370 NaN
3 0.606738 0.854177 -0.095147 NaN
4 0.200166 0.385453 0.166235 NaN
我怎样才能防止这种情况发生?
【问题讨论】:
-
我通常会尝试确保列被多个空格分隔。这样,我可以使用
df = pd.read_clipboard(header=0, sep="\s{2,}", engine="python")之类的东西。 atom 和 sublime text 都允许您在正则表达式中搜索和替换;这应该会有所帮助。 -
@Abdou 谢谢,这是有道理的。
-
我一直想知道其他人如何处理这些问题。感谢您将其转化为问题。
-
@Abdou 是的...
pd.read_clipboard是每个人都在使用但没人谈论的工具...哈哈
标签: python pandas dataframe clipboard