用于确定在每个类别中投票的人的卡方
我的数据集包含以下列: Voted? Political Category 1 Right 0 Left 1 Center 1 Right 1 Right 1 Right 我需要查看哪个类别与投票的人最相关。为此,我需要计算卡方。 我想要按投票分组?和政治类别才能有... »
我的数据集包含以下列: Voted? Political Category 1 Right 0 Left 1 Center 1 Right 1 Right 1 Right 我需要查看哪个类别与投票的人最相关。为此,我需要计算卡方。 我想要按投票分组?和政治类别才能有... »
我有一个包含 30 个样本的向量,我想检验样本来自正态分布的总体的假设。 > N.concentration [1] 0.164 0.045 0.069 0.100 0.050 0.080 0.043 0.036 0.057 0.154 0.133 0.193 [13] 0.129 0.121 0.081 0.178 0.041 0.040 0.116 0.078 0.104 0.... »
在 R 中,当我使用 chisq.test() 函数时,计算的 p 值是多少?是两侧,上尾还是下尾? 提前感谢您帮助这位初学者 chi² 检验的... »
我正在尝试创建卡方特征选择,但是加载数据集时出错。我使用 Panda 库加载数据集。我正在尝试使用 scikit-learn 形式的 train_test_split() 函数,并将 67% 的数据用于训练,33% 用于测试。使用的数据集在第 1 行有标题。如何解决这个问题? 这是使用的编码。 # example of chi squared feature selection for categ... »
我对这个练习有两个疑问: 代码的第一部分完美运行。现在我需要使用卡方检验检查分布是否平坦。 我实现的代码是: #UNIFORM RANDOM SAMPLING import numpy as np #library needed for numerical calculations import matplotlib.pyplot as plt #libra... »
我需要计算卡方 CAT Label 0 A 0.0 1 A 0.0 2 B 1.0 4 A 0.0 6 B 0.0 ... ... ... 3566 C 0.0 3567 A 0.0 3568 B 0.0 3571 C 1.0 我一直在使用交叉表: data = pd.crosstab(df['CAT'],d... »
我有两组分类特征,需要应用卡方检验。我无法利用和理解模块中可用的卡方检验。你能帮我用一个函数来获得 p 值并检验原假设吗?... »
这个问题的一个版本已经被问过几次,但从来没有以最简单的方式问过。基本上,当两组之间的样本量不均匀时,stats::chisq.test 函数不起作用,尽管根据我的理解,卡方检验应该适用于不相等的样本量。 下面是一些测试数据: df1 <- data.frame("x" = c("Yes","No","Yes","No","Yes","No","Yes","No","Yes","No","Ye... »
从单个数据集中,我在目标变量上创建了两个数据集过滤。现在我想使用卡方比较数据集中的所有特征。问题是两个数据集之一比另一个小得多,所以在某些特征中我有一些值在第二个数据集中不存在,当我尝试应用卡方检验时我得到这个错误:“所有参数必须具有相同的长度”。 为了能够使用卡方检验,如何将缺失值添加到价值较小的数据集中? 例子: 我想在两个数据集中的相同特征上使用卡方: chisq.test(table(df... »
总的来说,我对 R 和数据分析还是陌生的。 我有一个包含两部分的数据集: 20 个问题(答案采用 5 点李克特量表格式)8个社会人口变量 这是数据集的缩小样本版本(仅包含 20 个问题中的 3 个和 3 个社会人口统计变量)以备不时之需: data.frame(Q1 = c(1, 2, 2, 1, 3, 4, 3, 5, 2, 2), Q2 = c(2, 3, 5, 5, ... »
我正在处理看起来像这样的非数字数据: Origin ESBL Hospital ESBL Hospital Non-ESBL Hospital ESBL City ESBL Hospital Non-ESBL City ESBL Country ESBL Hospital ESBL 我想比较原点和变量 ESBL 之间是否存在统计关联。 到目前为止,我已经... »
如果我知道更多术语,这可能是一个可以相对快速回答的问题。 我是否正确执行了 JOB 变量独立性的卡方检验? CD %>% select(JOB, DEFAULT) %>% table() %>% chisq.test() unique(CD$JOB) [1] SkilledEmployee/Official [2] Unempl... »
我正在尝试使用 postgres 用户变量通过 RLS 处理多租户。但是,为了性能,我希望我的 webapp 使用 pg 连接池。我遇到了这个线程:https://github.com/jackc/pgx/issues/288#issuecomment-901975396 并决定尝试一下。 我不得不更改一些功能(随时间变化),但我的客户最终看起来像这样: package db import ( ... »
我正在尝试对数据框(CSV)进行卡方检验,如下所示: Lion Elephant Lion 32 19 Elephant 11 27 我使用以下代码进行分析: aovdata <- read.csv("Jungle.csv", header = T) aovdata attach (aovdata) Lion <- as.factor("Lion") Elep... »
我是 R 新手,但我转向它,因为它是我唯一可用的软件,可以在大于 2x2 的表上执行 Fisher 的精确文本。 理论上 \'仅当至少 80% 的单元格的预期频率为 5 或更大,并且没有单元格的预期频率小于 1 时,才执行卡方检验。\' 我经常需要对数百个表进行多次分析,其中一些符合卡方标准,而对于一些应该使用 Fisher 检验。 我知道如何手动完成,通过生成列联表,查看它,计算我是否应该使用 ... »
我有一个数据框: frequencies <- data.frame(row.names = c("a", "b", "c") ,response = c(10, 7, 4) ,no_response = c(12, 12, 7)) > frequencies response... »
我正在尝试对一些患者进行手术而其他患者不进行手术的数据进行 chisq.test 或 prop.test。我想看看两组中两种性别的比例是否相等。在我的手术组和非手术组大小不相等的情况下,最合适的测试是什么? 我正在尝试使用以下代码,使用 data.table 但我也得到了以下错误: > chisq.test(lateral[Surgery == "No", "sex",with=F], la... »
我的 NIR 光谱 (x,y) 文件不提供错误信息。我正在做一个黑体加幂律拟合,代码如下;根据生成的参数值和相应的图,它似乎可以正常工作。然而,卡方值非常小,如下面的示例所示。文档说应该正确缩放残差。执行此操作的确切步骤是什么?感谢您的帮助。 def bb(x, T, const): from scipy.constants import h,k,c x = 1e-6 * x ... »
我有以下数据集(我将只上传4行的样本,真实的有15,000行): import pandas as pd import numpy as np from sklearn.feature_extraction.text import TfidfVectorizer import nltk from nltk.corpus import stopwords from sklearn.feature_s... »
我有一个数据框,其中每一行包含一个列联表的数字,我想在 R 中运行 chisq.test 命令(对数据框中的每一行)。每行的输出应添加到数据框作为新列(X 平方值,p 值)。 DF1: ID1 ID2 female_boxing female_cycling male_boxing male_cycling A zit 43 170 159 710 B tag 37 134 165 744 C ... »