学习内容:(未出安排)
提前学习打卡:分类数据学习
一、分类数据与卡方统计量
- 分类数据:分类数据的结果是频数
- 卡方检验:对分类数据的频数进行分析的统计方法
- 卡方统计量:大于等于0;统计量的分布与自由度有关;描述了观察值与期望值的接近程度;随着自由度继续增大,卡方分布将趋近于对称的正态分布,可以对分类数据进行拟合优度检验和独立性检验
二、拟合优度检验
1.概念:依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异,从而达到分类变量进行分析的目的。
2.例题
三、列联分析-独立性检验
拟合优度检验是对一个分类变量的检验,两个分类变量的问题是否存在联系,可以用列联表的方式呈现,列联分析
独立性检验就是分析列联表中行变量和列变量是否相互独立,是否存在依赖关系
四、列联表的相关测量
对两个变量之间相关程度的测定,用相关系数表示,分类数据之间的相关称为品质相关
1.
五、注意问题
- 条件百分表的方向
如果因变量在样本内的分布不能代表其在总体内的分布,例如为了满足分析的需要,抽样时扩大了因变量某项内容的样本量,这时仍按自变量的方向计算百分表就会歪曲实际情况
2.卡方分布的期望值准则
- 只有两个单元,则每个单元的期望频数必须是5或5以上
- 倘若有两个以上的单元,20%的单元的期望频数小于5,则不能使用卡方检验
##############################################################
@ 2020.01.04 木居居士的统计学小组 第十二周 打卡
安利公益监督学习组织 - 【公众号】数据科学家联盟
https://mp.weixin.qq.com/s/1WWmbLZucz9vIp-4tKKQ5Q
感谢木东大佬、饼干大佬、南头大佬、星空妹砸、Desitiny、 DD-Kylin的无私付出,抱拳ing~