【发布时间】:2021-01-31 21:47:07
【问题描述】:
我正在尝试自动化预测 (1) 每个州的总需求和 (2) 每个州每个客户的需求的过程。应用的统计方法是移动平均线。预测时间提前 1 个月。数据是从具有 5 列的 Excel 表导入的:客户、状态、产品、数量、订单日期。 excel文件可以通过链接https://drive.google.com/file/d/1JlIqWl8bfyJ3Io01Zx088GIAC6rRuCa8/view?usp=sharing找到
一个客户可以与不同的州相关联,例如,Aaron Bergman 可以从华盛顿、德克萨斯和俄克拉荷马的商店购买椅子、艺术品、电话。其他客户具有相同的购买行为。对于 (1) 我尝试使用 For 循环,但它不起作用。错误是 Order_Date 不在索引中
df = pd.read_excel("Sales_data.xlsx")
State_Name = df.State.unique()
Customer_Name = df.Customer.unique()
for x in State_Name:
df = df[['Order_Date', 'Quantity']]
df['Order_Date'].min(), df['Order_Date'].max()
df.isnull().sum()
df.Timestamp = pd.to_datetime(df.Order_Date, format= '%D-%M-%Y %H:%m')
df.index = df.Timestamp
df = df.resample('MS').sum()
rolling_mean = df.Quantity.rolling(window=10).mean()
【问题讨论】:
-
请修正缩进;这是 Python 中对与错的问题。您似乎没有在循环中的任何地方使用
x。这是故意的吗? -
另外,您一直在尝试更新
df。所以在第二遍时,df与 csv 数据不同。
标签: python pandas time-series prediction forecasting