【发布时间】:2019-04-10 20:29:02
【问题描述】:
所以有两个变量 a -- 年龄大于 40 岁(BINARY 0 或 1) b -- 如果他们有一辆豪华车(二进制 0 或 1)
现在他们有了数据总和值。
- 总样本量 -- 500
- 40岁以上总人数——60人
- 拥有豪车的总人数——40人
- 拥有豪车及以上总人数40——10人
注意:如果有帮助,请绘制维恩图
计算a和b的相关系数?
【问题讨论】:
标签: correlation data-science-experience
所以有两个变量 a -- 年龄大于 40 岁(BINARY 0 或 1) b -- 如果他们有一辆豪华车(二进制 0 或 1)
现在他们有了数据总和值。
注意:如果有帮助,请绘制维恩图
计算a和b的相关系数?
【问题讨论】:
标签: correlation data-science-experience
相关函数可以处理二进制值。即使是分类的或枚举的项目,在后台,计算机也会随机分配数字并测试交互的相关性。对于您的情况,您只是想知道两者相同的频率与相反的频率。如果它们始终彼此相对,您将看到负 1。始终相同的正 1。零表示没有相关性。
【讨论】: