【问题标题】:IBM Watson Personality Insights: Use raw or percentile scores?IBM Watson Personality Insights:使用原始分数还是百分位分数?
【发布时间】:2018-09-07 10:29:46
【问题描述】:
我在学术研究项目中使用 IBM Watson Personality Insights。
从目前的分析来看,我注意到同一推文的原始分数和百分位数之间通常存在很大差异,并且在某些情况下,分数甚至处于相反的两端(例如,宜人性原始得分:0.21 和宜人性百分位数) 0.76)。此外,在我的样本人群的总体水平上,百分位数得分的人格特征方差要高得多,而原始得分的方差则非常低(所有观察值都在每个特征的 0.1-0.2 范围内)。
我了解百分位数是标准化分数,对分数的解释不同。我的问题是,旨在将它们应用于回归分析的研究人员通常使用哪个分数(例如,个人的人格特征 - 成功)?在我看到的应用 Personality Insights 的论文中,作者没有讨论他们使用的分数。如果您对此有一些想法并可以分享任何研究,以更详细地讨论他们与 Personality Insights 的方法,那就太好了。
非常感谢您的指导!
【问题讨论】:
标签:
ibm-watson
personality-insights
watson-personality-insights
【解决方案1】:
你说得对,分数有不同的解释。原始分数正是如此,因为归一化分数在更大的人群中。虽然一个特征的原始分数的范围是从 0 到 1,但实际上并非总是如此,分数可能集中在一个较窄的范围内。这就是为什么在上面显示的示例中,原始分数的微小变化可能会对百分位分数产生更大的变化。
请注意,为了计算百分位数,我们针对较大的人群 (100Ks) 运行了配置文件,您可以在其中观察到这些趋势,而这些趋势可能不会在较小的样本中显示。
至于你的其他问题;你会使用哪个分数取决于。一般来说,大多数人使用百分位分数,因为这可以让您了解特定人群与整个人群的比较情况。例如,如果我有兴趣了解一组与另一组的比较,使用百分位分数可以更容易直观地理解差异(25% 的宜人性差异比 0.1 的原始差异更容易理解因为你不知道这是否重要)。
另一方面,原始分数主要在您创建更大的模型并将 PI 分数用作特征之一时使用。在这种情况下,使用原始分数通常会有所帮助,因为您可以从更大的模型中得出自己的结论。