【发布时间】:2015-07-25 23:07:52
【问题描述】:
我有一个大学毕业生数据库,想随机抽取大约 1000 条记录的数据样本。
我想确保样本能够代表总体,因此希望包含相同比例的课程,例如
我可以使用以下方法做到这一点:
select top 500 id from degree where coursecode = 1 order by newid()
union
select top 300 id from degree where coursecode = 2 order by newid()
union
select top 200 id from degree where coursecode = 3 order by newid()
但我们有数百个课程代码,因此这会很耗时,我希望能够针对不同的样本大小重复使用此代码,并且不特别希望通过查询和硬编码样本大小。
任何帮助将不胜感激
【问题讨论】:
-
如何确保我在样本中得到正确的比例?
-
如何计算样本量?是基于人口百分比吗?
-
样本将用于问卷调查,因此样本的大小取决于我们有多少预算......我知道这不是很科学!
标签: sql sql-server sample random-sample