【问题标题】:Dependent vs Independent Variables因变量与自变量
【发布时间】:2020-02-10 00:21:09
【问题描述】:

如果给我一个包含许多变量的大型数据集,是否可以确定其中任何两个是独立的还是依赖的?假设我除了统计研究之外对数据一无所知。

查看相关性/协方差是否能够确定这一点?

这样做的目的是确定哪些变量最适合用于机器学习来预测特定结果。我有一些变量之间的相关性为 0.40 - 0.50,但我不确定是否高度相关 == 依赖性。

谢谢

【问题讨论】:

标签: python statistics data-science cross-validation


【解决方案1】:

依赖和相关是不同的。如果 2 个变量是因变量,则它们是相关的。但是,如果它们是相关的,则不确定它们是否依赖,我们需要领域知识来考虑更多。为了检查相关性,我们可以使用相关系数。对于相关性检验,我们可以使用卡方检验。

【讨论】:

    猜你喜欢
    • 2012-09-24
    • 1970-01-01
    • 2020-03-06
    • 2020-10-24
    • 1970-01-01
    • 1970-01-01
    • 2019-11-02
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多