【问题标题】:Calculate Price Change (in last 2 mins) and Price Range (before 2 mins)计算价格变化(最后 2 分钟)和价格范围(2 分钟前)
【发布时间】:2018-11-23 22:38:31
【问题描述】:

我有一个如下所述的数据框:

row_no,last_price,time
01,110.50,10:09
02,111.60,10:09
03,111.50,10:09
04,112.00,10:09
05,112.00,10:10
06,112.60,10:10
07,112.50,10:10
08,113.10,10:10
09,114.30,10:11
10,114.50,10:11
11,115.70,10:11
12,116.50,10:12
13,116.30,10:12
14,116.20,10:12
15,116.50,10:13
16,117.80,10:13
17,117.90,10:13
18,117.50,10:14
19,118.70,10:14
20,118.90,10:14
21,118.30,10:14
22,118.50,10:15
23,119.60,10:15
24,119.50,10:15
25,119.80,10:15

Row_No 列添加用于理解目的。

Last Row = 25 的示例:值应按以下方式计算:

  1. 需要在新列中计算“Price_Change_in_last_2mins”,即 (第 25 行 last_price - 第 15 行 last_price)*100/ (第 15 行 last_price)
  2. 需要在新列中计算“Price_Range_before_2mins”(周期 2 分钟),即(从第 05 行到第 14 行的 last_price 的最大值)-(从第 05 行到第 14 行的 last_price 的最小值)*100/(最小值last_price 从第 05 行到第 14 行)

我想要这样的结果:

row_no,last_price,time,Price_Change_in_last_2mins,Price_Range_before_2mins
01,110.50,10:09,NaN,NaN
02,111.60,10:09,NaN,NaN
03,111.50,10:09,NaN,NaN
04,112.00,10:09,NaN,NaN
05,112.00,10:10,NaN,NaN
06,112.60,10:10,NaN,NaN
07,112.50,10:10,NaN,NaN
08,113.10,10:10,NaN,NaN
09,114.30,10:11,NaN,NaN
10,114.50,10:11,NaN,NaN
11,115.70,10:11,NaN,NaN
12,116.50,10:12,NaN,NaN
13,116.30,10:12,NaN,NaN
14,116.20,10:12,NaN,NaN
15,116.50,10:13,NaN,NaN
16,117.80,10:13,NaN,NaN
17,117.90,10:13,,NaN,NaN
18,117.50,10:14,0.85,4.49
19,118.70,10:14,1.88,4.49
20,118.90,10:14,2.06,4.49
21,118.30,10:14,1.55,4.49
22,118.50,10:15,1.72,3.86
23,119.60,10:15,2.66,3.86
24,119.50,10:15,2.57,3.86
25,119.80,10:15,2.83,3.86

【问题讨论】:

  • 您是否尝试过自己解决这些问题?你能和我们分享一些解决这个问题的尝试吗?
  • 我认为它会帮助你stackoverflow.com/questions/12376863/…使用a.apply(command)
  • 先生,我是 python 新手,无法通过计算时差来处理数据。
  • 我明白你的意思。您可能希望指定您提供的第 15 行和第 25 行的示例是第 25 行的计算...
  • @Pravat,如何在第 24 行获得 0.03?

标签: python python-3.x pandas dataframe list-comprehension


【解决方案1】:

这是一种方法:

def last_2mins(x, df):
    from_time = x.name - datetime.timedelta(minutes=2)
    slice_2min = df.loc[from_time:x.name,:]
    first = slice_2min.iloc[0].last_price
    return (x.last_price - first)*100/first

def before_2mins(x, df):
    from_time = x.name - datetime.timedelta(minutes=2)
    slice_2min = df.loc[from_time:x.name,:]
    max_val = slice_2min.last_price.max()
    min_val = slice_2min.last_price.min()
    return (max_val - min_val)*100/min_val

df = df.set_index(df.time).drop(['time'], axis = 1)
indices = df.loc[df.index.max() - datetime.timedelta(minutes=1):].index.unique()

df_ = df.reset_index()
df_.loc[df_.time.isin(indices), 'last_2mins  '] = \
        df.loc[indices].apply(lambda x: last_2mins(x, df), axis = 1).values
df_.loc[df_.time.isin(indices), 'before_2mins'] = \
        df.loc[indices].apply(lambda x: before_2mins(x, df), axis = 1).values

        time               last_price  last_2mins  before_2mins
0  2018-11-23 10:09:00       110.5         NaN           NaN
1  2018-11-23 10:09:00       111.6         NaN           NaN
2  2018-11-23 10:09:00       111.5         NaN           NaN
3  2018-11-23 10:09:00       112.0         NaN           NaN
4  2018-11-23 10:10:00       112.0         NaN           NaN
5  2018-11-23 10:10:00       112.6         NaN           NaN
6  2018-11-23 10:10:00       112.5         NaN           NaN
7  2018-11-23 10:10:00       113.1         NaN           NaN
8  2018-11-23 10:11:00       114.3         NaN           NaN
9  2018-11-23 10:11:00       114.5         NaN           NaN
10 2018-11-23 10:11:00       115.7         NaN           NaN
11 2018-11-23 10:12:00       116.5         NaN           NaN
12 2018-11-23 10:12:00       116.3         NaN           NaN
13 2018-11-23 10:12:00       116.2         NaN           NaN
14 2018-11-23 10:13:00       116.5         NaN           NaN
15 2018-11-23 10:13:00       117.8         NaN           NaN
16 2018-11-23 10:13:00       117.9         NaN           NaN
17 2018-11-23 10:14:00       117.5    0.858369      2.323580
18 2018-11-23 10:14:00       118.7    1.888412      2.323580
19 2018-11-23 10:14:00       118.9    2.060086      2.323580
20 2018-11-23 10:14:00       118.3    1.545064      2.323580
21 2018-11-23 10:15:00       118.5    1.716738      2.832618
22 2018-11-23 10:15:00       119.6    2.660944      2.832618
23 2018-11-23 10:15:00       119.5    2.575107      2.832618
24 2018-11-23 10:15:00       119.8    2.832618      2.832618

稍后我会花一些时间来添加 cmets。如果您确定Price_Range_before_2mins 中的内容,请告诉我。与此同时,希望这会有所帮助。

【讨论】:

  • 感谢您的代码。是的,我希望根据问题在 2 分钟之前的价格百分比范围持续 2 分钟,即(从第 05 行到第 14 行的 last_price 的最大值)-(从第 05 行到第 14 行的 last_price 的最小值)* 100/(last_price 从第 05 行到第 14 行的最小值)
  • 刚刚意识到 var 名称的更改没有更新。稍后会编辑
  • 先生,在 last_2mins 函数中“first”出现错误 - 未定义
  • 是的,这就是我所说的,我会在我使用笔记本电脑后立即修复
  • 好的@Pravat 现在应该没问题了。看看你是否可以 tweek 函数 before_2mins如果它没有做你想要的,因为我不太明白你的要求
猜你喜欢
  • 2017-04-25
  • 2015-12-14
  • 2011-01-01
  • 1970-01-01
  • 2020-08-20
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多