由PSI高级副总裁兼科学咨询委员会委员Rick Jacobs博士撰写
半个多世纪以来,负责就业决策(招聘、晋升、裁员)的从业者面临的最烦心问题之一是对不同群体的差异选拔。 作为I/O Psychology社区的成员,我们寻求创建和实施公平的测评计划,使具有同等工作能力的人有平等的机会获得工作。确定不利影响是了解选拔计划是否公平的一种方法,也是几十年来我们一直采用的方法。
尽管此概念听起来简单,但对不利影响的测评却引起了激烈辩论。 解决不利影响的方法很多,而且充满争议。我们仍在寻求更好地了解不同群体测评差异的根本原因——这是导致任何不利影响的因素。
不利影响:变大比变化更糟糕?
随着时间的推移,我们衡量不利影响的方式发生了变化。 早些时候,我们研究了所谓的80%或五分之四规则:将一个群体的选拔率与另一个群体的选拔率进行比较的简单计算,然后确定这些比率在范围之内还是超出范围。例如,如果白人候选人的选拔率为20%,则黑人候选人的选拔率必须为16%或更高,以避免确定不利影响。
随着法院对不利影响案件的审理以及使用更复杂的数据分析,我们看到了选拔率之间统计差异的衡量标准。统计显著性已成为评估标准,它同时提供了更高的科学严谨性以及许多分析意义。
雇主面临的最大问题之一是通过基于互联网的测试和其他技术进步吸引大量申请者的能力。统计显著性检验尤其受样本大小的影响。因此,就不利影响而言,可能“变大比变坏更糟糕”(Jacobs、Murphy和Silva,2013年)。如果贵组织的不利影响分析中涉及大量候选人,则必须了解样本大小。此外,统计显著性检验从“零假设”开始,即预期“没有差异”。
但情况并非总是如此。根据数十年研究中对特定类型测试的记录,存在已知差异。如果这些类型的测试指示用于选拔程序,那么“无差异假设”将使结果偏向于发现不利影响。
那么,我们如何减少不利影响?
除了上述测量方法之外,I/O心理学家还在寻找减少不利影响的方法,并取得了一定程度的成功。
分数分段
这种方法基本上着眼于测试得分的差异,并通过将高度相似的分数归于相同分段来减少这些差异。也许在选拔背景中考虑分段的最简单方法是参考我们熟悉的类似分段——学校成绩。在任何班级中,教师都会将学生分数从低到高排列,显示分数从低于50%到接近100%不等。在某些情况下,记录这些实际分数,但更常见的是分为A、B、C等成绩。获得B级成绩的学生的得分在80到89%之间。通过这种方式,可以创建分段。
同样的流程也可用于选拔员工,其中候选人获得类别分数,而不是包含一定程度误差的更精确分数。分段的宽度通常与认为分数中存在的误差量有关。
多选拔工具
减少不利影响的另一种方法是在选拔流程中使用多种测试/工具。 为此,我们通过工作分析来帮助发现促进成功的关键知识、技能、能力和个人特征。例如,几十年来,根据通常被称为公务员考试的认知能力测试来选拔警察。其中许多选拔是基于广泛基础知识评估和思维测量。当这些是用于选拔警察的唯一方法时,我们看到白人警察占据主导地位。在80年代初,警察选拔计划基于如下想法进行了扩展:要成为一名警察,不仅要有智慧,还需要具备良好的沟通能力,有一定程度的同理心,并能够轻松遵守规则。当测评扩大到包括这些概念时,警察部门开始多样化。
这里要传达的信息是,减少不利影响的一种方法是更全面地定义工作,并包括更多不同类型的测评。
不利影响是复杂的,减少不利影响需要在多个方面付出努力。雇主必须跟踪其选拔和晋升制度的运作情况,以及如何改进这些制度,从而提高有效性和增加多样性。