chi-squared - 爱码网

用于确定在每个类别中投票的人的卡方

我的数据集包含以下列： Voted? Political Category 1 Right 0 Left 1 Center 1 Right 1 Right 1 Right 我需要查看哪个类别与投票的人最相关。为此，我需要计算卡方。我想要按投票分组？和政治类别才能有... »

R如何生成正态分布的概率向量，用于chisq.test

我有一个包含 30 个样本的向量，我想检验样本来自正态分布的总体的假设。 > N.concentration [1] 0.164 0.045 0.069 0.100 0.050 0.080 0.043 0.036 0.057 0.154 0.133 0.193 [13] 0.129 0.121 0.081 0.178 0.041 0.040 0.116 0.078 0.104 0.... »

在 R 中获得的默认 p 值

在 R 中，当我使用 chisq.test() 函数时，计算的 p 值是多少？是两侧，上尾还是下尾？提前感谢您帮助这位初学者 chi² 检验的... »

我正在尝试创建卡方特征选择，但是加载数据集时出错。我使用 Panda 库加载数据集。我正在尝试使用 scikit-learn 形式的 train_test_split() 函数，并将 67% 的数据用于训练，33% 用于测试。使用的数据集在第 1 行有标题。如何解决这个问题？这是使用的编码。 # example of chi squared feature selection for categ... »

Python中分布的卡方检验

我对这个练习有两个疑问：代码的第一部分完美运行。现在我需要使用卡方检验检查分布是否平坦。我实现的代码是： #UNIFORM RANDOM SAMPLING import numpy as np #library needed for numerical calculations import matplotlib.pyplot as plt #libra... »

来自 pandas 列的数据的卡方

我需要计算卡方 CAT Label 0 A 0.0 1 A 0.0 2 B 1.0 4 A 0.0 6 B 0.0 ... ... ... 3566 C 0.0 3567 A 0.0 3568 B 0.0 3571 C 1.0 我一直在使用交叉表： data = pd.crosstab(df['CAT'],d... »

卡方检验

我有两组分类特征，需要应用卡方检验。我无法利用和理解模块中可用的卡方检验。你能帮我用一个函数来获得 p 值并检验原假设吗？... »

R中样本量不等的卡方检验

这个问题的一个版本已经被问过几次，但从来没有以最简单的方式问过。基本上，当两组之间的样本量不均匀时，stats::chisq.test 函数不起作用，尽管根据我的理解，卡方检验应该适用于不相等的样本量。下面是一些测试数据： df1 <- data.frame("x" = c("Yes","No","Yes","No","Yes","No","Yes","No","Yes","No","Ye... »

向 table() 添加新值以便能够使用卡方检验

从单个数据集中，我在目标变量上创建了两个数据集过滤。现在我想使用卡方比较数据集中的所有特征。问题是两个数据集之一比另一个小得多，所以在某些特征中我有一些值在第二个数据集中不存在，当我尝试应用卡方检验时我得到这个错误：“所有参数必须具有相同的长度”。为了能够使用卡方检验，如何将缺失值添加到价值较小的数据集中？例子：我想在两个数据集中的相同特征上使用卡方： chisq.test(table(df... »

如何在多个变量之间执行卡方检验并创建结果数据框？

总的来说，我对 R 和数据分析还是陌生的。我有一个包含两部分的数据集： 20 个问题（答案采用 5 点李克特量表格式）8个社会人口变量这是数据集的缩小样本版本（仅包含 20 个问题中的 3 个和 3 个社会人口统计变量）以备不时之需： data.frame(Q1 = c(1, 2, 2, 1, 3, 4, 3, 5, 2, 2), Q2 = c(2, 3, 5, 5, ... »

哪种是测试非数字数据之间显着差异的正确方法？哪个是正确的事后？

我正在处理看起来像这样的非数字数据： Origin ESBL Hospital ESBL Hospital Non-ESBL Hospital ESBL City ESBL Hospital Non-ESBL City ESBL Country ESBL Hospital ESBL 我想比较原点和变量 ESBL 之间是否存在统计关联。到目前为止，我已经... »

如何对分类变量执行卡方检验？

如果我知道更多术语，这可能是一个可以相对快速回答的问题。我是否正确执行了 JOB 变量独立性的卡方检验？ CD %>% select(JOB, DEFAULT) %>% table() %>% chisq.test() unique(CD$JOB) [1] SkilledEmployee/Official [2] Unempl... »

pgxpool 和多租户 BeforeAcquire/AfterAcquire

我正在尝试使用 postgres 用户变量通过 RLS 处理多租户。但是，为了性能，我希望我的 webapp 使用 pg 连接池。我遇到了这个线程：https://github.com/jackc/pgx/issues/288#issuecomment-901975396 并决定尝试一下。我不得不更改一些功能（随时间变化），但我的客户最终看起来像这样： package db import ( ... »

卡方检验 - sum(x) 中的错误：参数无效\'type\'（字符）

我正在尝试对数据框（CSV）进行卡方检验，如下所示： Lion Elephant Lion 32 19 Elephant 11 27 我使用以下代码进行分析： aovdata <- read.csv("Jungle.csv", header = T) aovdata attach (aovdata) Lion <- as.factor("Lion") Elep... »

有没有办法检查是否应该使用卡方或费舍尔精确检验，然后自动运行它？

我是 R 新手，但我转向它，因为它是我唯一可用的软件，可以在大于 2x2 的表上执行 Fisher 的精确文本。理论上 \'仅当至少 80% 的单元格的预期频率为 5 或更大，并且没有单元格的预期频率小于 1 时，才执行卡方检验。\' 我经常需要对数百个表进行多次分析，其中一些符合卡方标准，而对于一些应该使用 Fisher 检验。我知道如何手动完成，通过生成列联表，查看它，计算我是否应该使用 ... »

执行 Fisher 测试，将多个数据框列与相同的向量 R 进行比较

我有一个数据框： frequencies <- data.frame(row.names = c("a", "b", "c") ,response = c(10, 7, 4) ,no_response = c(12, 12, 7)) > frequencies response... »

Chisq.test/prop.test 对不同长度的向量

我正在尝试对一些患者进行手术而其他患者不进行手术的数据进行 chisq.test 或 prop.test。我想看看两组中两种性别的比例是否相等。在我的手术组和非手术组大小不相等的情况下，最合适的测试是什么？我正在尝试使用以下代码，使用 data.table 但我也得到了以下错误： > chisq.test(lateral[Surgery == "No", "sex",with=F], la... »

Python lmfit 给出非常小的卡方；如何缩放残差

我的 NIR 光谱 (x,y) 文件不提供错误信息。我正在做一个黑体加幂律拟合，代码如下；根据生成的参数值和相应的图，它似乎可以正常工作。然而，卡方值非常小，如下面的示例所示。文档说应该正确缩放残差。执行此操作的确切步骤是什么？感谢您的帮助。 def bb(x, T, const): from scipy.constants import h,k,c x = 1e-6 * x ... »

sklearn.feature_selection.chi2 返回 NaN 值列表

我有以下数据集（我将只上传4行的样本，真实的有15,000行）： import pandas as pd import numpy as np from sklearn.feature_extraction.text import TfidfVectorizer import nltk from nltk.corpus import stopwords from sklearn.feature_s... »

chisq.test 对四个数字的每一行进行测试，并在 R 的新数据框中输出

我有一个数据框，其中每一行包含一个列联表的数字，我想在 R 中运行 chisq.test 命令（对数据框中的每一行）。每行的输出应添加到数据框作为新列（X 平方值，p 值）。 DF1： ID1 ID2 female_boxing female_cycling male_boxing male_cycling A zit 43 170 159 710 B tag 37 134 165 744 C ... »