scipy.stats

在 scipy 中将 qmc 作为子模块导入

当我从scipy.stats import qmc 写信时,我在 Jupyter 笔记本中遇到导入错误: ImportError: cannot import name 'qmc' from 'scipy.stats' (C:\winapps\Anaconda3\lib\site-packages\scipy\stats\__init__.py) 我想做 Halton 采样,我该如何解决这个问题... »

将字典值顺序添加到 scipy 函数

我想为字典的每个键计算 p-value 并为 (keys | p-value) 创建一个表。 字典示例: mydict = { 'a': [100, 5, 4, 3], 'b': [66, 0, 75, 12], 'c': [56, 11, 80, 0]} 如何将每个键的 4 值按顺序插入到 Scipy 函数中? 使用 Scipy 函数计算 a 的 p 值示例: import scipy.sta... »

多索引 df 中的线性回归

给定下面的多索引多列数据框,我想将 LinearRegression 应用于此数据框的每个块,例如,对于每个 Station_Number,我想在 LST 和 Value 之间运行回归。 df 看起来像这样: Latitude Longitude LST Elevation Value Station_Number ... »

Python:卡方列联检验(如何解释)

我已经完成了如下卡方应变检验的练习,但我在如何解释结果方面遇到了问题。 以下测试的结果显示 p-val = 0。 那么这是否意味着两个变量不独立? 由于这是一个小数据,我认为变量是独立的。 p-val 为 0 似乎很奇怪。 我是不是做错了什么?? import pandas as pd df = pd.DataFrame({ "~60m2" : [54, 577, 143, 782], ... »

最适合直方图 Iris

我想为每个 Iris 类的每个特征直方图绘制最佳拟合线。 我已经尝试了这些示例中的解决方案:1 和 2,但没有得到我想要的结果。 这是直方图现在的样子,也是我希望它们看起来的样子,但每个类都有一条最佳拟合线。 这是我用来实现此目标的代码。 def load_data(path): data = pd.read_csv(path, sep=',') return data #th... »

ks_2samp 的 p 值是意外的

为什么数组'x'和数组'y'之间的kstest的p值小于0.05?如您所见,它们实际上来自一个分布(即正态分布)。我找不到原因,我很困惑。提前谢谢您! import scipy.stats as st import numpy as np np.random.seed(12) x = np.random.normal(0,1,size=1000) y = np.random.normal(0,1,... »

scipy.stats :高斯核密度估计器中的带宽因子

我生成了一个二维高斯分布(不相关的数据) dist2=np.array([np.random.normal(loc=10,scale=3, size=50000),np.random.normal(loc=5,scale=2, size=50000)]) 我计算了协方差矩阵除以带宽因子,因为协方差属性是数据集的协方差矩阵,由计算的带宽 (kde.factor) 缩放 (https://docs.... »

使用 scipy 的意外置信区间

我使用 scipy 计算了 95% 的置信区间,结果与我的预期不同。 我正在解决一个问题,其中有人掷骰子 20K 次并观察到 ​​3,932 个 6。我被要求为掷出 6 的概率建立 95% 的置信区间。 6 的数量遵循二项式分布,重复次数为 20K,成功概率为 3,932 / 20K。 # Number of observations n_obs = 20000 # Observed propo... »

多元 KDE Scipy Stats - 如果它不是高斯的怎么办?

我正在使用一些 2D 数据进行平滑处理: from scipy.stats import gaussian_kde kde = gaussian_kde(data) 但是如果我的数据不是 Gaussian/tophat/其他选项怎么办?我的在平滑之前看起来更椭圆,所以我真的应该在 x 和 y 中有不同的带宽吗?一个方向的方差高很多,x轴的值也高,感觉一个简单的高斯可能会漏掉什么? ... »

Python Kolmogorov-Smirnov (KS) 测试结果不一致

我正在尝试计算将 CDF 指定为数组的 KS 测试,但是,我遇到了意外的结果。经过进一步评估,我发现根据我是否将 CDF 指定为可调用、字符串或数组的不同结果。我的代码如下: import scipy.stats as st random_variables = st.norm.rvs(loc=1, scale=1,size=1000000) cdf_data = st.norm.cdf(ran... »

如何使用python找出样本均值在+/-一个总体均值单位内的概率为0.95的区间?

我是统计和数据科学领域的初学者,所以请您善待我。 我必须在python中解决以下问题: 问题陈述 - 假设总体变量 X 为 N(3, 0.3) 且 n = 20。必须选择多大的区间才能使样本均值 ????¯ 位于 ±a 单位内的概率为 0.95总体平均 μ? 我知道 68% 的数据在 1 个标准差范围内,即 2.7 到 3.3。 95% 的数据在 2 个标准差范围内,即 2.4 到 3.6。 我的... »

如何在python中找到高于第二个标准差的值的百分比?

问题陈述 - 假设变量 X 具有钟形分布,平均值为 150,标准差为 20。 一种。 X 值在 190 以上的百分比是多少? 到目前为止我的代码: import numpy as np import math import scipy.stats X=scipy.stats.norm(150,20) 我知道 X 的 68% 位于 1 个标准差内,即(130 到 170 之间),95% 位于 2... »

连续分布的 scipy.stats 属性“熵”不能手动工作

scipy.stats 中的每个连续分布都带有一个计算其微分熵的属性:.entropy。与正态分布 (norm) 和其他具有熵的封闭形式解的其他分布不同,其他分布必须依赖于数值积分。 试图找出在这些情况下.entropy 属性调用的是哪个函数,我在scipy.stats._distn_infrastructure.py 中找到了一个名为_entropy 的函数,它与integrate.quad(p... »

为什么 Johnson-SU 分布在 scipy.stats 中没有给出正偏度?

下面的代码映射了Johnson-SU distribution(johnsonsu)的对应参数(a,b,loc,scale)生成的统计矩(均值、方差、偏度、超峰度) )。 对于下面我的代码中指定的循环值范围,没有参数配置会导致正偏度,只有负偏度,即使应该可以将 Johnson-SU 分布参数化为正偏度。 import numpy as np import pandas as pd from sci... »

python scipy.stats 中的 norm.ppf 与 norm.cdf

所以我已经粘贴了我的完整代码供您参考,我想知道这里的 ppf 和 cdf 有什么用?你能解释一下吗?我做了一些研究,发现 ppf(百分比点函数)是 CDF(累积分布函数)的倒数 如果确实如此,如果我将 ppf 和 cdf 分别替换为 1/cdf 和 1/ppf,这段代码不应该工作吗? 请向我解释一下,两者之间的区别。以及如何以及何时使用哪个 这是,顺便说一句,假设检验。 对这么多 cmets 感到... »