【发布时间】:2017-09-24 18:37:08
【问题描述】:
我有两个 pandas 数据框(实际数据框要大得多):
events = pd.DataFrame({'Begin':[959.44, 1222.82, 2217.59], 'End':[978.00,1240.41,2799.43]})
markers = pd.DataFrame({'Marker': [0, 256.0, 700, 975.33, 1188.2, 1230.88, 2500, 3120.22]})
我想将事件数据框细分为标记,我试图将其视为垃圾箱,即 [0, 256.0]、[256, 700] 等...试图以另一行结束标记数据框,它说明了在该 bin 期间如何观察到事件的累积总数。每个事件都可能最终出现在多个垃圾箱中。例如,959.44 到 978.00 事件应将 15.89 (978.00-975.33) 计入 700-975.33 bin,其余应计入 975.33,1188.2。
我一直在尝试使用 pandas.cut 对标记数据框进行分箱,但我不确定如何处理多个分箱。这是最好的方法吗?
【问题讨论】:
-
同时添加预期输出。
-
仅从解释中很难预测输出。如果您给出预期的输出,那就太好了。
标签: python pandas numpy dataframe