【发布时间】:2017-12-15 21:42:56
【问题描述】:
我有一个数据框df,其中包含一些按页面浏览量 (PV) 排名的基本网络统计数据:
URL PVs
1 1500
2 1200
3 900
4 700
:
100 25
我正在尝试过滤和计算贡献不同百分位页面浏览量 (PV) 的 URL 数量。比如说,我想知道有多少以及哪些 URL 带来了 90%(或 10%)的 PV。
我计算了百分位数:
df.quantile(np.linspace(.1, 1, 9, 0))
而且我知道我可以像这样遍历行(所以我可以总结它们):
for index, row in df.iterrows():
print row['PVs']
但我无法弄清楚当达到某个阈值时如何停止。感谢您的帮助!
【问题讨论】:
标签: python-2.7 pandas percentile