Skrevet af Rick Jacobs, Ph.D., Senior Vice Præsident og Medlem af PSI Science Advisory Board
I mere end et halvt århundrede har et af de mest bekymrende problemer som eksempelvis fagfolk, der er involveret i at træffe beslutninger omkring medarbejdere (ansættelse, forfremmelse, nedskæring) stået over for, den differentierede udvælgelse af individer fra forskellige grupper. Som medlemmer af I/O Psychology-fællesskabet søger vi at skabe og implementere programmer til assessments, der er retfærdige, og som resulterer i, at mennesker med lige muligheder for at udføre jobbet har lige muligheder for at kunne besidde stillingen. Bestemmelsen af negative følger, en tilgang til at forstå, om udvælgelsesprogrammer er retfærdige, har været en del af vores landskab i årtier.
Selvom konceptet er simpelt, er en assessment af negative følger et emne for stor debat. Metoder til at løse negative følger er talrige og kontroversielle. Vi søger stadig bedre at kunne forstå de underliggende årsager til forskelle i assessment på tværs af grupper – den faktor, der går forud for enhver konstatering af negative følger.
Negative følger: Værre at være for stor end at være for dårlig?
Den måde, som vi måler negative følger på, har ændret sig over tid. Tidligt så vi på det, som er kendt som 80 % eller 4/5-reglen: en simpel beregning, der sammenligner udvælgelsesraten for en gruppe med en anden og derefter bestemmer, at satserne er inden for rækkevidde eller uden for rækkevidde. Hvis hvide kandidater for eksempel udvælges med en sats på 20 %, skal udvælgelsesprocenten for sorte kandidater være 16 % eller mere for at undgå en fastsættelse af negative følger.
Efterhånden som sager bevægede sig gennem domstolene, og data blev analyseret ved hjælp af mere sofistikerede analyser, så vi mål for den statistiske forskel mellem udvælgelsesrater. Statistisk signifikans er blevet standarden for evaluering, hvilket samtidig giver større videnskabelig stringens sammen med et væld af analytiske komplikationer.
Et af de store problemer, arbejdsgivere står over for, er evnen til at kunne tiltrække et stort antal ansøgere via internetbaserede tests og andre teknologiske fremskridt. Test af statistisk signifikans er især påvirket af stikprøvestørrelsen. Så med hensyn til negative følger kan det være “værre at være for stor end at være for dårlig.” (Jacobs, Murphy og Silva (2013)). Hvis din organisation har et stort antal kandidater med i sin analyse af negative følger, skal du være opmærksom på stikprøvestørrelsen. Derudover starter testning af statistisk signifikans med en “nulhypotese”, som angiver forventningen om “ingen forskel.”
Men, det er ikke altid tilfældet. Da årtiers forskning kan dokumentere for visse typer af test, eksisterer der kendte forskelle. Hvis disse typer af test er indiceret til brug i et udvælgelsesprogram, vil “ingen forskel nulhypotesen” skabe bias i forhold til resultaterne i retning af en konstatering af negative følger.
Så hvordan reducerer vi de negative følger?
Bortset fra den ovenfor beskrevne målemetode har I/O-psykologer søgt efter måder at reducere negative følger med en vis grad af succes.
Scorebånd
Denne tilgang ser grundlæggende på forskelle inden for testresultater og reducerer disse forskelle ved at sammensætte resultater, der er meget ens. Måske den nemmeste måde at tænke bånd i en udvælgelsessammenhæng er at se på noget, som vi alle kender – skolekarakterer. I en hvilken som helst klasse kan instruktøren opdele eleverne fra lav til høj og vise score fra under 50 % til 100 %. I nogle indstillinger bliver disse resultater faktisk registreret – men oftere ser vi folk, som modtager karaktererne A, B, C osv. En person, som modtager karakteren B, scorede et sted mellem 80 og 89%. På den måde skabes der bånd.
Den samme proces kan benyttes til at udvælge medarbejdere, hvor kandidater modtager en kategoriscore frem for, hvad der kunne være en mere præcis score, der indeholder en vis grad af fejl. Bredden af båndet er ofte knyttet til mængden af fejl, som menes at være til stede i et partitur.
Værktøjer til flere valg
En anden metode til at reducere negative følger er at inkludere flere test/værktøjer i udvælgelsesprocessen. Her ser vi på jobanalysen for at hjælpe med at afdække nøgleviden, færdigheder, evner og personlige egenskaber, som fører til succes. Som et eksempel er politibetjente i årtier blevet udvalgt baseret på diverse test af kognitive evner ofte omtalt som Civil Service tests. Mange af disse var bredt funderede assessments af viden sammen med et mål for tænkning. Da disse var den eneste måde at udvælge politibetjente på, så vi som resultat deraf overvejende hvide politistyrker. I begyndelsen af 80’erne blev programmerne inden for dette område udvidet ud fra idéen om, at selvom du skal være klog for at være politibetjent, skulle du også have gode kommunikationsevner, have et niveau af empati og være komfortabel med at arbejde inden for regler. Da assessments blev udvidet til at omfatte disse begreber, begyndte politiafdelinger at blive mere diversificerede.
Budskabet er denne kontekst er, at en måde at reducere de negative følger på er at definere jobbet mere fuldstændigt og inkludere flere og forskellige typer assessments.
Negative følger er komplicerede, og reduktionen kræver indsats på flere fronter. Det er vigtigt, at arbejdsgivere formår at holde styr på, hvordan deres systemer til udvælgelse og forfremmelse fungerer, og hvordan de kan forbedres både for at øge validiteten og for at øge diversiteten.