【发布时间】:2017-02-18 10:58:27
【问题描述】:
从以下摘要中可以看出,9 月 1 日的计数 (1542677) 远低于每月的平均计数。
from StringIO import StringIO
myst="""01/01/2016 8781262
01/02/2016 8958598
01/03/2016 8787628
01/04/2016 9770861
01/05/2016 8409410
01/06/2016 8924784
01/07/2016 8597500
01/08/2016 6436862
01/09/2016 1542677
"""
u_cols=['month', 'count']
myf = StringIO(myst)
import pandas as pd
df = pd.read_csv(StringIO(myst), sep='\t', names = u_cols)
是否有一个数学公式可以定义这个“远低于或太高”(模棱两可)的概念?
如果我定义一个限制(例如 9 或 10%),这很容易。但是如果最低值和倒数第二个最低值之间的差值超过总体 5%,我希望脚本为我决定并返回值。在这种情况下,应返回 9 月的月份计数。
【问题讨论】: