Av Rick Jacobs, fil. dr., vice VD och medlem av PSI Science Advisory Board
I mer än ett halvt sekel har en av de mest problematiska frågorna för yrkesverksamma som är engagerade i att fatta beslut om anställningar (rekrytering, befordran, nedskärningar) varit det olika urvalet av individer från olika grupper. Som en del av i I/O-psykologi-gemenskapen försöker vi skapa och implementera bedömningsprogram som är rättvisa och som resulterar i att personer med lika förmåga att utföra jobbet har lika möjligheter att få jobbet. Fastställandet av negativa följder, en metod för att förstå om urvalsprogram är rättvisa, har varit en del av vår verklighet i decennier.
Även om konceptet är enkelt är bedömningen av negativa följder ämne för en omfattande debatt. Metoderna för att lösa negativa följder är många och kontroversiella. Vi försöker fortfarande att bättre förstå de bakomliggande orsakerna till skillnader i bedömningar mellan olika grupper – den faktor som föregår varje upptäckt av negativa följder.
Negativa följder: Värre att vara stor än att vara dålig?
Det sätt vi mäter negativa följder på har förändrats över tid. Tidigt tittade vi på vad som kallades 80 % eller 4/5-regeln: en enkel beräkning som jämförde urvalskvoten för en grupp med en annan och sedan fastställde att kvoterna ligger inom intervallet eller utanför intervallet. Till exempel, om vita kandidater väljs ut med en kvot på 20 %, måste urvalskvoten för svarta kandidater vara 16 % eller mer för att undvika en bestämning av negativa följder.
När ärenden tog sig igenom domstolarna och data analyserades med mer sofistikerade analyser såg vi mått på statistisk skillnad mellan urvalskvoterna. Statistisk signifikans har blivit standarden för utvärdering, vilket samtidigt erbjuder ökad vetenskaplig stringens tillsammans med en mängd analytiska komplikationer.
Ett av de stora problem arbetsgivare står inför är förmågan att attrahera ett stort antal sökande via internetbaserade tester och andra tekniska framsteg. Statistisk signifikanstestning påverkas särskilt av urvalets storlek. Så när det gäller negativa följder kan det vara “värre att vara stor än att vara dålig.” (Jacobs, Murphy och Silva (2013)). Om din organisation har ett stort antal kandidater i sin analys av negativa följder måste du vara medveten om urvalsstorleken. Dessutom börjar statistisk signifikanstestning med en “nollhypotes”, som anger förväntan om “ingen skillnad”.
Men detta är inte alltid fallet. Eftersom årtionden av forskning dokumenterar vissa typer av tester finns det kända skillnader. Om dessa typer av tester är indikerade för användning i ett urvalsprogram kommer hypotesen “ingen skillnad” att skapa en snedvridning av resultaten mot ett konstaterande av negativa följder.
Så, hur minskar vi de negativa följderna?
Bortsett från den mätmetod som beskrivs ovan har I/O-psykologer med viss framgång sökt efter sätt att minska de negativa följderna.
Poängbandning
Denna metod tittar i grund och botten på skillnader i testpoäng och minskar dessa skillnader genom att sätta samman poäng som är väldigt lika. Det kanske enklaste sättet att tänka bandning i ett urvalssammanhang är att se till något vi alla känner till – skolbetyg. I vilken klass som helst kan instruktören gruppera eleverna från låg till hög, och visa poäng från under 50 % till nästan 100 %. I vissa inställningar registreras faktiskt dessa poäng – men oftare ser vi personer som får betygen A, B, C osv. Någon som får betyget B fick någonstans mellan 80 och 89 %. På så vis skapas band.
Samma process kan användas för att välja ut anställda där kandidater får en kategoripoäng snarare än vad som kan vara ett mer exakt betyg som inkluderar en viss grad av fel. Bandets bredd är ofta kopplad till mängden fel som tros vara i en poäng.
Flervalsverktyg
En annan metod för att minska negativa följder är att inkludera flera test/verktyg i urvalsprocessen. Här ser vi till jobbanalysen för att hjälpa till att avslöja nyckelkunskaper, färdigheter, förmågor och personliga egenskaper som leder till framgång. Som ett exempel har poliser i årtionden valts ut baserat på tester av kognitiva förmågor, ofta kallade Civil Service-tester. Många av dessa var brett baserade kunskapsbedömningar tillsammans med ett mått på tänkande. När detta var det enda sättet att välja ut poliser hade vi polisstyrkor som till övervägande delen var vita. I början av 80-talet utökades programmen på det här området utifrån idén att samtidigt som du måste vara smart för att vara polis, så behöver du också ha god kommunikationsförmåga, ha en viss nivå av empati och vara bekväm med att arbeta inom ramen för vissa regler. När bedömningarna utökades till att omfatta dessa begrepp började mångfalden inom polisavdelningarna öka.
Budskapet här är att ett sätt att minska negativa följder är att definiera jobbet på ett mer komplett sätt och inkludera fler och olika typer av bedömningar.
Negativa följder är komplicerat och för att minska det krävs ansträngningar på flera fronter. Det är viktigt att arbetsgivarna har koll på hur deras system för urval och befordringar fungerar och hur de kan förbättras för att både öka validiteten och för att öka mångfalden.