【发布时间】:2018-02-21 16:22:09
【问题描述】:
考虑以下 Matlab 代码,其中我使用伪随机数生成器生成一些数据。 我希望您能帮助我从统计的角度理解这些数字的“随机性”,我在下面解释。
我先设置了一些参数
%%%%%%%%Parameters
clear
rng default
Xsup=-1:6;
Zsup=1:10;
n_m=200;
n_w=200;
R=n_m;
然后我生成数据
%%%%%%%%Creation of data [XZ,etapair,zetapair,etasingle,zetasingle]
%Vector X of dimension n_mx1
idX=randi(size(Xsup,2),n_m,1); %n_mx1
X=Xsup(idX).'; %n_mx1
%Vector Z of dimension n_wx1
idZ=randi(size(Zsup,2),n_w,1);
Z=Zsup(idZ).'; %n_wx1
%Combine X and Z in a matrix XZ of dimension (n_m*n_w)x2
which lists all possible combinations of values in X and Z
[cX, cZ] = ndgrid(X,Z);
XZ = [cX(:), cZ(:)]; %(n_m*n_w)x2
%Vector etapair of dimension (n_m*n_w)x1
etapair=randn(n_m*n_w,1); %(n_m*n_w)x1
%Vector zetapair of dimension (n_m*n_w)x1
zetapair=randn(n_m*n_w,1); %(n_m*n_w)x1
%Vector etasingle of dimension (n_m*n_w)x1
etasingle=max(randn(n_m,R),[],2); %n_mx1
etasingle=repmat(etasingle, n_w,1); %(n_m*n_w)x1
%Vector zetasingle of dimension (n_m*n_w)x1
zetasingle=max(randn(n_w,R),[],2); %n_wx1
zetasingle=kron(zetasingle, ones(n_m,1)); %(n_m*n_w)x1
现在让我将这些抽签转化为统计术语:
对于t=1,...,n_w*n_m,X(t)可以认为是随机变量X_t的实现
对于t=1,...,n_w*n_m,Z(t)可以认为是随机变量Z_t的实现
对于t=1,...,n_w*n_m,etapair(t)可以认为是随机变量E_t的实现
对于t=1,...,n_w*n_m,zetapair(t)可以认为是随机变量Q_t的实现
对于t=1,...,n_w*n_m,etasingle(t)可以认为是随机变量Y_t的实现
对于t=1,...,n_w*n_m,zetasingle(t)可以认为是随机变量S_t的实现
我的信念是,Matlab 中的伪随机数生成器允许声称
(X_1,X_2,..., Z_1,Z_2,...,E_1,E_2,..., Q_1,Q_2...,Y_1,Y_2,...,S_1,S_2,...) 相互独立
如解释here
作为对这个假设声明的检查,我定义了 W_t:=-E_t-Q_t+Y_t+S_t 并根据经验计算 Pr(W_t<=1|X_t=5, Z_t=1)
如果相互独立成立,那么Pr(W_t<=1|X_t=5, Z_t=1)=Pr(W_t<=1) 及其下面的经验对应物,命名为option1 和option2,应该几乎相同。
%option 1
num1=zeros(n_m*n_w,1);
for h=1:n_m*n_w
if -etapair(h)-zetapair(h)+etasingle(h)+zetasingle(h)<=1 && XZ(h,1)==5 && XZ(h,2)==1
num1(h)=1;
end
end
den1=zeros(n_m*n_w,1);
for h=1:n_m*n_w
if XZ(h,1)==5 && XZ(h,2)==1
den1(h)=1;
end
end
option1=sum(num1)/sum(den1);
%option 2
num2=zeros(n_m*n_w,1);
for h=1:n_m*n_w
if -etapair(h)-zetapair(h)+etasingle(h)+zetasingle(h)<=1
num2(h)=1;
end
end
option2=sum(num2)/(n_m*n_w);
问题:option1 (=0.0021) 和 option2 (=0.0012) 之间的区别是指“几乎”还是我做错了什么?
【问题讨论】:
-
不清楚您的实际问题是什么,因为您要么在谈论一些详细的统计问题(如 Sardar 所建议),要么您似乎在问“鉴于所有这些 随机 i> 由 MATLAB 生成的变量,它们绝对是独立的吗?”,这可以追溯到您的 previous question,答案是“是”。您是期待这里有一个简短的“您是对的”,还是期待关于 MATLAB 如何处理随机数生成的讨论?
-
@Wolfie 首先,我缩短了我的问题(在我执行双随机步骤之前)以使其更容易。其次,我希望讨论一下为什么当我简单地比较条件概率和无条件概率时,Matlab 声称的统计独立性似乎不成立。
-
你听起来很有防御性?我只是想澄清这个问题,以便我可以提供准确的答案......