【发布时间】:2016-04-04 07:01:31
【问题描述】:
我正在尝试从为其他目的构建的大型多维数据集中提取某些人口统计群体的一些消费模式。我正在使用手动方法(SPSS)进行聚类和回归分析。这算是二次分析还是数据挖掘?我了解统计分析和数据挖掘之间的区别,但在这种情况下似乎介于两者之间......谢谢
【问题讨论】:
-
我从未听说过“二次分析”。定义是什么?
-
您想问统计和数据挖掘的交互作用是什么?请更具体地回答您的问题,因为“二次分析”在这里是令人困惑的术语。
-
当然,我是该领域的新手,我认为这是一个相当普遍的概念:“二次分析涉及使用现有数据,为先前研究的目的而收集,以追求研究兴趣与原始工作不同;这可能是一个新的研究问题或对原始问题的替代观点。在这方面,二级分析不同于旨在编译的定性研究的系统评价和荟萃分析并评估与共同关注或实践领域有关的证据。” (希顿,1998 年)
-
这与数据挖掘本身无关。从这个意义上说,“次要分析”意味着数据是为“主要”研究项目 A 收集的,但随后再次为“次要”项目 B 进行分析,其目标非常不同,最初并未计划。也许很久以后也许由不同的人。如果您想避免自己进行实验的成本,并且其他人已经发布了合适的数据,这在医学中相当普遍。
-
感谢@Anony-Mousse 的回答,但我不明白为什么这与数据挖掘无关,如果根据定义您可以使用多个数据集来发现新模式?这种技术在医学和一般社会研究(例如营销、教育等)中很常见,涉及数据预处理、建模/分析和解释。
标签: methods statistics data-mining spss