【发布时间】:2022-01-05 05:09:04
【问题描述】:
我从 FRED 下载了每日原油价格,大约 10k 观察值,一些值是空白的(代码清除它们)。我相信我不能在这里分享excel表格,所以我只是给你一张数据的截图:
我计算差异和回报并清理数据,但我有点卡住了。
下面是帮助您入门的代码:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data = pd.read_csv("DCOILWTICO.csv")
nan_value = float("NaN")
data.replace("", nan_value, inplace=True)
data.replace(".", nan_value, inplace=True)
data['Previous'] = data['DCOILWTICO'].shift(1)
data.dropna(subset=['Previous'],inplace=True)
data.replace("", nan_value, inplace=True)
data.replace(".", nan_value, inplace=True)
data['DCOILWTICO'] = data['DCOILWTICO'].astype(float)
data['Previous'] = data['Previous'].astype(float)
data['Diff'] = data['DCOILWTICO'] - data['Previous']
data['Return'] = (data['DCOILWTICO'] - data['Previous'])/data['Previous']
问题来了:我正在尝试复制下面的图表。(我相信它是使用 Mathematica 生成的)困难的部分是能够以正确的方式创建 bin。查看图表,看起来大约有 200 个垃圾箱。 x 轴是回报,y 轴是频率(已被分箱)。
【问题讨论】:
标签: python pandas plot probability finance