【发布时间】:2014-10-06 19:53:43
【问题描述】:
我有一个不平衡的面板数据集。我创建了一个池化模型,现在需要预测和输入数据集的缺失值。如何做呢? 这是我的数据的打印屏幕:https://imagizer.imageshack.us/v2/1366x440q90/661/RAH3uh.jpg 谢谢!
【问题讨论】:
我有一个不平衡的面板数据集。我创建了一个池化模型,现在需要预测和输入数据集的缺失值。如何做呢? 这是我的数据的打印屏幕:https://imagizer.imageshack.us/v2/1366x440q90/661/RAH3uh.jpg 谢谢!
【问题讨论】:
首先,您的问题似乎过于笼统。如果您真的在询问应该如何预测电子表格的值(即单元格:Z6、AA6、...、AM22、...);是的,你有一个巨大的问题=]。只是一个提示,在您的以下问题中,您应该更具体,例如:我有与 白俄罗斯的家庭相关的这些数据。我搜索了有关预测模型的信息,并尝试了 XPTO1 和 XPTO2。我如何决定哪一个更好?
所以,我在这里真正的意思是,预测并不完全是像 SUM 这样的函数,您可以将其应用于您的数据,仅此而已。预测是一门完整的学科,有很多方法应该针对不同的情况进行测试。例如,要预测数据中的 Z6 单元格,您应该问自己还有哪些其他数据有助于推断数据缺失信息?在某些情况下,过去 5 年的简单平均值就足够了,在另一些情况下,应该考虑更多。
我建议你先看看一些涵盖简单模型的基本材料,比如线性模型,玩弄它们,尝试了解获得的预测的准确性......这最终会解决你的问题,或者至少会解决你的问题帮助您向社区提出更多“可回答”的问题。
最后一个提示:有一个新的 SO 姐妹问答社区可能更适合询问有关预测模型的问题:https://datascience.stackexchange.com/
祝你好运。
【讨论】: