IBM Watson Personality Insights：使用原始分数还是百分位分数？答案

【问题标题】：IBM Watson Personality Insights: Use raw or percentile scores?IBM Watson Personality Insights：使用原始分数还是百分位分数？
【发布时间】：2018-09-07 10:29:46
【问题描述】：

我在学术研究项目中使用 IBM Watson Personality Insights。

从目前的分析来看，我注意到同一推文的原始分数和百分位数之间通常存在很大差异，并且在某些情况下，分数甚至处于相反的两端（例如，宜人性原始得分：0.21 和宜人性百分位数） 0.76)。此外，在我的样本人群的总体水平上，百分位数得分的人格特征方差要高得多，而原始得分的方差则非常低（所有观察值都在每个特征的 0.1-0.2 范围内）。

我了解百分位数是标准化分数，对分数的解释不同。我的问题是，旨在将它们应用于回归分析的研究人员通常使用哪个分数（例如，个人的人格特征 - 成功）？在我看到的应用 Personality Insights 的论文中，作者没有讨论他们使用的分数。如果您对此有一些想法并可以分享任何研究，以更详细地讨论他们与 Personality Insights 的方法，那就太好了。

非常感谢您的指导！

【问题讨论】：

标签： ibm-watson personality-insights watson-personality-insights

【解决方案1】：

你说得对，分数有不同的解释。原始分数正是如此，因为归一化分数在更大的人群中。虽然一个特征的原始分数的范围是从 0 到 1，但实际上并非总是如此，分数可能集中在一个较窄的范围内。这就是为什么在上面显示的示例中，原始分数的微小变化可能会对百分位分数产生更大的变化。

请注意，为了计算百分位数，我们针对较大的人群 (100Ks) 运行了配置文件，您可以在其中观察到这些趋势，而这些趋势可能不会在较小的样本中显示。

至于你的其他问题；你会使用哪个分数取决于。一般来说，大多数人使用百分位分数，因为这可以让您了解特定人群与整个人群的比较情况。例如，如果我有兴趣了解一组与另一组的比较，使用百分位分数可以更容易直观地理解差异（25% 的宜人性差异比 0.1 的原始差异更容易理解因为你不知道这是否重要）。另一方面，原始分数主要在您创建更大的模型并将 PI 分数用作特征之一时使用。在这种情况下，使用原始分数通常会有所帮助，因为您可以从更大的模型中得出自己的结论。

【讨论】：