变量、数据与抽样方法

33:《数据分析基础》的复习笔记1

1.概念

2.变量和数据 详细内容

3.抽样方法(概率抽样)

33学习笔记——描述统计分析1

概念

  • 总体(population):所研究的全部个体的集合。

  • 样本(sample或individul):总体中抽取的一部分元素的集合。

  • 样本量量(sample size):样本容量,样本的元素的数目。

  • 参数(parameter):描述总体特征的概括性数字度量。

  • 统计量(statistic):描述样本特征的概括性数字度量。

  • 数据(数据集):数值(value)的集合,通常被组织为变量和个体。

  • 变量(Variable):要测量的某种特征,数据的主要组成部分。

  • 个体(Individual)(样本):测量或记录的对象。





变量:(详细内容)

1.分类:
- 分类变量(categorical variable):取值为对象的属性、类别、或区间的变量。
- 数值变量(metric variable):取值为数字尺度的变量。


2.数值变量的分类:

  • 离散变量(discrete variable):取值是有限的数值。
  • 连续变量(continuous variable):取值在任意区间内、 或多个区间内是任意值。

3.分类变量的分类:

  • 无序的分类变量(名义(nominal)值分类变量):其取值之间没有顺序关系。
  • 有序的分类变量(顺序(ordinal)值分类变量 / 排序变量):其取值之间具有顺序关系。







数据:(详细内容)

1.分类:

  • 观测数据(observational data):通过调查、或观测收集得到的数据。
  • 实验数据(experimental data):在实验室中控制或干预实验对象所收集得到 的数据。

2.来源:

  • 直接来源:一是来自调查或观察,二是来自实验。
  • 间接来源:主要是公开出版或报道的数据,有些是未公开出版的数据。




抽样方法:(详细内容)
33学习笔记——描述统计分析1

1.简单随机抽样(Simple Random Sampling):直接从总体单位中随机抽选样本单位,每个个体被选入样本的概率都相等。
最基本的抽样方法

  • 有放回抽样(重复抽样):在一个单位被选入样本后,记录其编号,然后又将其放回总体中继续参与随后的抽样过程。
  • 无放回抽样(不重复抽样):在一个单位被选入样本后,不再放回总体参与随后的抽样过程。



2.分层抽样(Stratified sampling)(分类抽样):在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取他定数量的元素组成一个样本。


3.系统抽样(Systematic sampling)(等距抽样):先将总体各元素按照某种顺序排列,并按某种规则确定一个随机起点,然后每隔五定的间距抽取一个元素,直到抽取n个元 素组成一个样本。


4.整群抽样(Cluster sampling):先将总体划分为若干群, 然后以群作为抽样单元从中抽取部分群组组成样本,再对抽中的每个群中包含的所有元素进行调查。

相关文章:

  • 2021-07-03
  • 2021-12-03
  • 2021-11-01
  • 2021-04-24
  • 2021-07-27
  • 2021-05-25
  • 2021-12-08
  • 2021-07-27
猜你喜欢
  • 2022-12-23
  • 2021-03-26
  • 2022-12-23
  • 2022-12-23
  • 2021-04-14
  • 2021-12-02
  • 2021-08-06
相关资源
相似解决方案