删除“#NULL！”来自 df答案

【问题标题】：Dropping '#NULL!' from df删除“#NULL！”来自 df
【发布时间】：2014-03-23 04:48:35
【问题描述】：

我正在尝试导入一些简单的李克特规模数据并使用堆叠的水平条形图对其进行绘制。

import pandas as pd

path = "C:\\..."
datafile_name = "Motivators.xlsx"
datafile = path + datafile_name

xls_file = pd.ExcelFile(datafile)
df = xls_file.parse('Sheet1')
df = df.drop('Email_Address', 1)

print df[:10]
df.plot(kind='barh', stacked=True)

我不知道pd.ExcelFile() 究竟是如何工作的，但是有没有DROPPING #NULL! VALUES 的选项？

我有大约 3000 条 #NULL! 条目的记录

【问题讨论】：

标签： python excel pandas dataframe

【解决方案1】：

将#NULL! 替换为NaNs 然后dropna。

In [1]: df = pd.DataFrame([1, 2, 3, "#NULL!"])

In [2]: df
Out[2]: 
        0
0       1
1       2
2       3
3  #NULL!

[4 rows x 1 columns]

In [3]: df.replace('#NULL!', np.nan)
Out[3]: 
    0
0   1
1   2
2   3
3 NaN

[4 rows x 1 columns]

In [4]: df.replace('#NULL!', np.nan).dropna()
Out[4]: 
   0
0  1
1  2
2  3

[3 rows x 1 columns]

在pd.read_excel() 中使用na_values='#NULL!' 导入时，最好指定#NULL! 是NaN。

【讨论】：