【发布时间】:2016-04-04 20:55:53
【问题描述】:
在 pandas DataFrame 中计算(不是数字)nan 值的最佳方法是什么?
以下代码:
import numpy as np
import pandas as pd
dfd = pd.DataFrame([1, np.nan, 3, 3, 3, np.nan], columns=['a'])
dfv = dfd.a.value_counts().sort_index()
print("nan: %d" % dfv[np.nan].sum())
print("1: %d" % dfv[1].sum())
print("3: %d" % dfv[3].sum())
print("total: %d" % dfv[:].sum())
输出:
nan: 0
1: 1
3: 3
total: 4
而期望的输出是:
nan: 2
1: 1
3: 3
total: 6
我在 Python 3.5.0 和 Anaconda 2.4.0 中使用 pandas 0.17。
【问题讨论】:
标签: python python-3.x pandas dataframe nan