Écrit par Rick Jacobs, Ph.D., vice-président principal et membre du conseil consultatif scientifique
Depuis plus d’un demi-siècle, l’un des problèmes les plus troublants auxquels sont confrontés les professionnels chargés de prendre des décisions en matière d’emploi (recrutement, promotion, réduction des effectifs) est le recrutement différentielle d’individus issus de divers groupes. En tant que membres de la communauté I/O Psychology, nous cherchons à créer et à mettre en œuvre des programmes d’évaluation qui sont équitables et qui font que les personnes ayant une capacité égale à faire le travail ont une chance égale d’obtenir le travail. La détermination de l’impact négatif, une approche pour comprendre si les programmes de sélection sont équitables, fait partie de notre paysage depuis des décennies.
Bien que le concept soit simple, l’évaluation des biais est un sujet de grand débat. Les méthodes de résolution des biais sont nombreuses et controversées. Nous cherchons toujours à mieux comprendre les causes sous-jacentes des différences d’évaluation entre les groupes – le facteur qui précède toute constatation de biais.
Les biais : Est-il pire d’être gros que d’être méchant ?
La façon dont nous mesurons les biais a changé au fil du temps. Au début, nous avons examiné ce que l’on appelait la règle des 80 % ou des 4/5 : un simple calcul comparant le taux de sélection d’un groupe à un autre, puis déterminant si les taux se situent dans la plage ou hors plage. Par exemple, si les candidats blancs sont sélectionnés à un taux de 20 %, le taux de sélection des candidats noirs doit être de 16 % ou plus pour éviter une détermination d’impact négatif.
Au fur et à mesure que les dossiers passaient devant les instances judiciaires et que les données étaient analysées à l’aide d’outils analytiques plus sophistiqués, nous avons constaté des mesures de différence statistique entre les taux de recrutement. La signification statistique est devenue la norme d’évaluation, qui fournit simultanément une plus grande rigueur scientifique ainsi qu’une foule de complications analytiques.
L’un des gros problèmes auxquels sont confrontés les employeurs est la capacité d’attirer un grand nombre de candidats via des tests basés sur Internet et d’autres avancées technologiques. Les tests de signification statistique sont particulièrement influencés par la taille de l’échantillon. Donc, en termes d’impact négatif, il peut être « pire d’être grand que d’être mauvais ». (Jacobs, Murphy et Silva (2013)). Si votre organisation a un grand nombre de candidats dans son analyse de biais, vous devez être conscient de la taille de l’échantillon. De plus, les tests de signification statistique commencent par une « hypothèse nulle », qui énonce l’attente d’« aucune différence ».
Mais ce n’est pas toujours le cas. Comme des décennies de recherche peuvent documenter certains types de tests, des différences connues existent. Si ces types de tests sont indiqués pour être utilisés dans un programme de sélection, « l’hypothèse d’absence de différence » créera un biais des résultats vers une conclusion de biais.
Alors, comment pouvons-nous réduire les biais ?
Outre la méthode de mesure décrite ci-dessus, I/O Psychologists ont cherché des moyens de réduire les biais avec un certain degré de succès.
Répartition des scores
Cette approche examine essentiellement les différences dans les scores de tests et réduit ces différences en rassemblant des scores très similaires. Peut-être que la façon la plus simple d’envisager le regroupement dans un contexte de recrutement est de se tourner vers quelque chose que nous connaissons tous : les notes scolaires. Dans n’importe quelle classe, l’instructeur peut classer les étudiants de bas en haut, affichant des scores allant de moins de 50 % à près de 100 %. Dans certains contextes, ces scores sont en fait enregistrés – mais le plus souvent, nous voyons des personnes recevoir des notes A, B, C, etc. Une personne qui reçoit la note B a obtenu un score compris entre 80 et 89 %. De cette façon, des bandes sont créées.
Le même processus peut être utilisé pour sélectionner les employés où les candidats reçoivent un score de catégorie plutôt que ce qui pourrait être un score plus précis qui inclut un certain degré d’erreur. La largeur de la marge est souvent liée à la quantité d’erreur que l’on croit présente dans un score.
Outils de recrutement multiples
Une autre méthode pour réduire les biais consiste à inclure plusieurs tests/outils dans le processus de recrutement. Dans ce cas, nous nous tournons vers l’analyse de l’emploi pour aider à découvrir les connaissances, les compétences, les capacités et les caractéristiques personnelles clés qui mènent au succès. À titre d’exemple, pendant des décennies, les policiers ont été sélectionnés sur la base de tests d’aptitudes cognitives souvent appelés tests de la fonction publique. Bon nombre d’entre eux étaient des évaluations générales des connaissances accompagnées d’une mesure de la réflexion. Lorsque c’était le seul moyen de sélectionner les policiers, nous avons vu des forces de police à prédominance blanche. Au début des années 80, les programmes dans ce domaine se sont développés sur la base de l’idée que même s’il faut être intelligent pour être policier, il faut également avoir de bonnes compétences en communication, posséder un niveau d’empathie et être à l’aise de travailler dans le respect des règles. Lorsque les évaluations se sont élargies pour inclure ces concepts, les services de police ont commencé à se diversifier.
Le message ici est qu’une façon de réduire les biais est de définir plus complètement le travail et d’inclure des types d’évaluations plus nombreux et différents.
Les biais sont compliqués et sa réduction nécessite des efforts sur plusieurs fronts. Il est important que les employeurs gardent une trace de la façon dont leurs systèmes de recrutement et de promotion fonctionnent et des moyens de les améliorer à la fois pour renforcer la validité et pour accroître la diversité.