scipy.stats - 爱码网

在 scipy 中将 qmc 作为子模块导入

当我从scipy.stats import qmc 写信时，我在 Jupyter 笔记本中遇到导入错误： ImportError: cannot import name 'qmc' from 'scipy.stats' (C:\winapps\Anaconda3\lib\site-packages\scipy\stats\__init__.py) 我想做 Halton 采样，我该如何解决这个问题... »

用于计算 scipy stats 中可用分布的 E(X) 的 Scipy 集成

您好，谁能帮我修复此代码，在此先感谢 from scipy.integrate import quad import math import numpy as np from scipy import stats lognorm_mu = 17.79 lognorm_sigma = 0.81 def integrand(x): return stats.lognorm.pdf(x, s... »

将字典值顺序添加到 scipy 函数

我想为字典的每个键计算 p-value 并为 (keys | p-value) 创建一个表。字典示例： mydict = { 'a': [100, 5, 4, 3], 'b': [66, 0, 75, 12], 'c': [56, 11, 80, 0]} 如何将每个键的 4 值按顺序插入到 Scipy 函数中？使用 Scipy 函数计算 a 的 p 值示例： import scipy.sta... »

多索引 df 中的线性回归

给定下面的多索引多列数据框，我想将 LinearRegression 应用于此数据框的每个块，例如，对于每个 Station_Number，我想在 LST 和 Value 之间运行回归。 df 看起来像这样： Latitude Longitude LST Elevation Value Station_Number ... »

Python：卡方列联检验（如何解释）

我已经完成了如下卡方应变检验的练习，但我在如何解释结果方面遇到了问题。以下测试的结果显示 p-val = 0。那么这是否意味着两个变量不独立？由于这是一个小数据，我认为变量是独立的。 p-val 为 0 似乎很奇怪。我是不是做错了什么？？ import pandas as pd df = pd.DataFrame({ "~60m2" : [54, 577, 143, 782], ... »

如何从前四个矩均值、标准差、偏度和峰度中提取 johnsonsu.rvs() 分布的 a、b？

所以让我们看看我有一个代码： mu=0 # first moment rms=3 # second moment skew=1 # third moment - skewness kurt=3 # fourth moment - kurtosis 问题是我想使用这些参数作为输入并从中提取一些a, b 来提供我的johnsonsu.rvs(a=?, b=?, loc=mu, scale=rms, ... »

最适合直方图 Iris

我想为每个 Iris 类的每个特征直方图绘制最佳拟合线。我已经尝试了这些示例中的解决方案：1 和 2，但没有得到我想要的结果。这是直方图现在的样子，也是我希望它们看起来的样子，但每个类都有一条最佳拟合线。这是我用来实现此目标的代码。 def load_data(path): data = pd.read_csv(path, sep=',') return data #th... »

ks_2samp 的 p 值是意外的

为什么数组'x'和数组'y'之间的kstest的p值小于0.05？如您所见，它们实际上来自一个分布（即正态分布）。我找不到原因，我很困惑。提前谢谢您！ import scipy.stats as st import numpy as np np.random.seed(12) x = np.random.normal(0,1,size=1000) y = np.random.normal(0,1,... »

scipy.stats ：高斯核密度估计器中的带宽因子

我生成了一个二维高斯分布（不相关的数据） dist2=np.array([np.random.normal(loc=10,scale=3, size=50000),np.random.normal(loc=5,scale=2, size=50000)]) 我计算了协方差矩阵除以带宽因子，因为协方差属性是数据集的协方差矩阵，由计算的带宽 (kde.factor) 缩放 (https://docs.... »

使用 scipy 的意外置信区间

我使用 scipy 计算了 95% 的置信区间，结果与我的预期不同。我正在解决一个问题，其中有人掷骰子 20K 次并观察到 3,932 个 6。我被要求为掷出 6 的概率建立 95% 的置信区间。 6 的数量遵循二项式分布，重复次数为 20K，成功概率为 3,932 / 20K。 # Number of observations n_obs = 20000 # Observed propo... »

多元 KDE Scipy Stats - 如果它不是高斯的怎么办？

我正在使用一些 2D 数据进行平滑处理： from scipy.stats import gaussian_kde kde = gaussian_kde(data) 但是如果我的数据不是 Gaussian/tophat/其他选项怎么办？我的在平滑之前看起来更椭圆，所以我真的应该在 x 和 y 中有不同的带宽吗？一个方向的方差高很多，x轴的值也高，感觉一个简单的高斯可能会漏掉什么？ ... »

Python Kolmogorov-Smirnov (KS) 测试结果不一致

我正在尝试计算将 CDF 指定为数组的 KS 测试，但是，我遇到了意外的结果。经过进一步评估，我发现根据我是否将 CDF 指定为可调用、字符串或数组的不同结果。我的代码如下： import scipy.stats as st random_variables = st.norm.rvs(loc=1, scale=1,size=1000000) cdf_data = st.norm.cdf(ran... »

创建 2 个图，但它们重叠成一个图。如何使用 matplotlib 创建 2 个单独的图形？

我正在使用 matplotlib 创建一个密度和 blox 图，但是当我运行我的代码时，我得到一个图，其中两个图相互重叠。如何重组我的代码以输出两个单独的图表？图表图片链接： https://ibb.co/6bCK9MZ import numpy as np import matplotlib.pyplot as plt import pandas as pd import seaborn as... »

将随机变量传递给 sklearn 随机搜索 (RandomizedSearchCV)

下面代码中reciprocal()和expon()有什么用？ svm_grid_R = {'kernel':["linear","rbf"], 'C': reciprocal(20,200000), "gamma" : expon(scale=1.0)} 为什么我们不能只使用range()？ expon(scale=1.0) 和 reciprocal(20,200000) 表示什么范围？对于上... »

如何使用python找出样本均值在+/-一个总体均值单位内的概率为0.95的区间？

我是统计和数据科学领域的初学者，所以请您善待我。我必须在python中解决以下问题：问题陈述 - 假设总体变量 X 为 N(3, 0.3) 且 n = 20。必须选择多大的区间才能使样本均值 ????¯ 位于 ±a 单位内的概率为 0.95总体平均 μ？我知道 68% 的数据在 1 个标准差范围内，即 2.7 到 3.3。 95% 的数据在 2 个标准差范围内，即 2.4 到 3.6。我的... »

如何在python中找到高于第二个标准差的值的百分比？

问题陈述 - 假设变量 X 具有钟形分布，平均值为 150，标准差为 20。一种。 X 值在 190 以上的百分比是多少？到目前为止我的代码： import numpy as np import math import scipy.stats X=scipy.stats.norm(150,20) 我知道 X 的 68% 位于 1 个标准差内，即（130 到 170 之间），95% 位于 2... »

SciKit Learn R-squared 与 Pearson's Correlation R 的平方非常不同

我有 2 个 numpy 数组，就像这样： a = np.array([32.0, 25.97, 26.78, 35.85, 30.17, 29.87, 30.45, 31.93, 30.65, 35.49, 28.3, 35.24, 35.98, 38.84, 27.97, 26.98, 25.98, 34.53, 40.39, 36.3]) b = np.arr... »

连续分布的 scipy.stats 属性“熵”不能手动工作

scipy.stats 中的每个连续分布都带有一个计算其微分熵的属性：.entropy。与正态分布 (norm) 和其他具有熵的封闭形式解的其他分布不同，其他分布必须依赖于数值积分。试图找出在这些情况下.entropy 属性调用的是哪个函数，我在scipy.stats._distn_infrastructure.py 中找到了一个名为_entropy 的函数，它与integrate.quad(p... »

为什么 Johnson-SU 分布在 scipy.stats 中没有给出正偏度？

下面的代码映射了Johnson-SU distribution(johnsonsu)的对应参数(a,b,loc,scale)生成的统计矩(均值、方差、偏度、超峰度) )。对于下面我的代码中指定的循环值范围，没有参数配置会导致正偏度，只有负偏度，即使应该可以将 Johnson-SU 分布参数化为正偏度。 import numpy as np import pandas as pd from sci... »

python scipy.stats 中的 norm.ppf 与 norm.cdf

所以我已经粘贴了我的完整代码供您参考，我想知道这里的 ppf 和 cdf 有什么用？你能解释一下吗？我做了一些研究，发现 ppf（百分比点函数）是 CDF（累积分布函数）的倒数如果确实如此，如果我将 ppf 和 cdf 分别替换为 1/cdf 和 1/ppf，这段代码不应该工作吗？请向我解释一下，两者之间的区别。以及如何以及何时使用哪个这是，顺便说一句，假设检验。对这么多 cmets 感到... »