Prediction Systems for at tage beskæftigelsesbeslutninger

Det typiske forudsigelsesproblem, det være sig valg, placering eller begge, indebærer anvendelse af en række forudsigere. Disse forudsigere anvendes bedst muligt som vejledere til at træffe beslutning om beskæftigelse. Der er beslutninger som "skal han ansættes til dette job?" Eller "skal hun blive sendt til dette træningsprogram?" Der er flere strategier, som psykologen kan vedtage i form af sin tilgang til beslutningsprocessen. Afhængigt af det særlige forudsigelsessystem, der er vedtaget, kan beskæftigelsesbeslutninger vise sig anderledes.

Mens hvert system har sine egne fordele og ulemper, hver giver en metode til at træffe beslutninger om mennesker baseret på en gruppe af træk eller kvaliteter (forudsigerne), der anses for at være relevante for jobsucces.

De vigtigste systemer er:

(1) Multipelregressionssystemet,

(2) Det multiple cut-off system,

(3) Profil matching system, og

(4) Multipel forhindringssystemet.

Hvert system vil blive undersøgt mere detaljeret i de følgende afsnit.

Flere regressionssystemer:

Som navnet antyder, anvender dette placeringssystem multipelregressionsmodellen til at træffe beslutninger om enkeltpersoner. Multipelregressionsmodellen tager formularen y = b 1 x 1 + b 2 x 2 (antage a = 0) (3.6)

Brugen af ​​en sådan model i udvælgelsen forudsætter, at (1) egenskaberne x 1 og x 2 er lineært relateret til kriterium ydeevne, og at (2) besiddelse af et "parti" af et af trækene kompenserer for kun at have en "lille" "Af det andet træk.

I tilfælde af en situation, hvor f.eks. Bi = 2 og b2 = 4 og a = 0, formlen y = 2x 1 + 4x 2 (3, 7)

ville blive brugt til at forudsige jobsucces. Lad os antage, at en kriterium score på 50 kunne betragtes som tilfredsstillende præstationer af medarbejderne og noget mindre resulterede i en utilfredsstillende præstation. Tabel 3.2 viser nogle testresultater på de to forudsigere for fire teoretiske jobansøgere. Den forudsagte kriteriescore for hver ansøger er også blevet beregnet ved anvendelse af ligning 3.7. Bemærk, at alle fire ansøgere har nøjagtig samme forudsagt kriterium ydeevne, selvom deres test score mønstre adskiller sig ret markant. Når vi går fra person A gennem person D, ser vi, at deres score på test 2 systematisk reduceres.

Imidlertid kompenseres denne dråbe ved en tilsvarende stigning i test 1-ydeevne. Faktisk vil en tæt inspektion vise, at en gevinst på to punkter i test 1 er nødvendig for at kompensere for tabet af hvert punkt på prøve 2. Dette bør ikke være overraskende, da den relative vægt, der er givet til test 2, er dobbelt så stor som test 1 i vores regressionsmodel (dvs. b 1 = 2, b 2 = 4).

Figur 3.5 viser endnu mere tydeligt dynamikken i udvælgelsesprocessen skabt af dataene i tabel 3.2. Konvolutten af ​​scoringer vist i scatter-plot i figur 3.5 viser en situation, hvor de to forudsigere af ydeevne x 1 og x 2 er positivt korrelerede. Hvis korrelationen r12 var nul, ville scatter-plot naturligvis være en cirkel.

Formen af ​​scatter-plot er imidlertid ikke kritisk for det trade-off-koncept, der er forbundet med multiple-regressionssystemet. Da vi har sagt, at enhver person med en forudsagt score på 50 eller bedre skulle betragtes som "tilfredsstillende", kan vi plotte "50-punkts linien" i figur 3.5, der viser alle mulige kombinationer af test 1 og test 2 score, som vil resultere i et kriterium score på nøjagtigt 50 point ved hjælp af ligning 3.7. Som det fremgår af figuren ligger alle fire ansøgere langs denne linje.

Et interessant aspekt af figur 3.5 er, at linjen deler befolkningen af ​​jobsøgere i to grupper eller regioner. Alle ansøgere til højre og over linjen skal have kriterium score (ved hjælp af ligning 3, 7), som vil være over 50. Alle ansøgere til venstre og under linjen vil have kriterium score mindre end 50. Således vil kun de førstnævnte accepteres for beskæftigelse, da det forudsiges, at deres præstationer vil være tilfredsstillende.

Sidstnævnte ansøgere, med forventet ydeevne mindre end tilfredsstillende, afvises med dette udvælgelsessystem. Figur 3.6 udvider figur 3.5 i tre dimensioner, der viser de observerede kriterium scores samt prædiktor score for alle individer.

Det er vigtigt at bemærke, at flyet i figur 3.6, der opdeler medarbejderne til dem, der ville blive valgt ved hjælp af den multiple regressionsmodel givet ved ligning 3.7, og dem, der ville blive afvist, er ikke regressionsplanet. Det er mere korrekt kaldt udvælgelsesplanet. Læseren henvises tilbage til figur 3.4 for en illustration af regressionsplanet i et to-predictor-multiple-regressionssystem.

Forudsætninger, fordele og ulemper ved flere regressionssystemer:

Multipelregression forudsigelsessystemet er en kraftig udvælgelsesprocedure, når den anvendes korrekt. Forudsat den grundlæggende antagelse, at alle relationer er lineære, er sande, har den en matematisk elegance, der er svært at overskride. Man ved for eksempel, at modellen minimerer fejlene i forudsigelsen. En anden fordel ved dette system er, at forudsigere kombineres for at opnå det mest effektive skøn over efterfølgende ydeevne.

Et af de væsentligste punkter i kontroversen vedrørende multipelregressionsmodellen indebærer afvejningsprincippet, så implicit i dets anvendelse. Hvorvidt X-enheder af en variabel kan erstattes af X-enheder på en anden variabel, er altid et problem. Bestemt kan metoden være ekstremt fleksibel. Det er muligt at opsætte ligninger for hver af et antal job, der bruger enten de samme eller forskellige forudsigere. Som følge heraf kan forudsagte scoringer beregnes for hver person for hvert job.

Folk kan derefter ansættes og placeres på et bestemt job ved hjælp af en eller flere af følgende procedurer:

1. Placer hver person på det job, for hvilket den forventede score er højest. Dette antager, at organisationen vil få mest udbytte, hvis hver person er placeret, hvor han har den bedste evne, uanset den absolutte mængde af den egnethed. Hvis ingen stillinger er åbne i det job, ville han blive placeret på et andet job, for hvilket han modtog den anden "bedste kriterium score.

Et problem med en sådan procedure er, at det er muligt, at jobbet selv kan have forskellige minimumskrav til succes. Det kan således ske, at hans bedste score (forudsagt præstation for job A) muligvis ikke er tilstrækkelig til forudsagt succes på job A, mens hans næstbedste score (forudsagt præstation på job B) kunne være langt over den værdi, der var nødvendig for at forudsige succes på job A job B.

2. Placer hver person på det job, hvor hans forventede score er længst over minimumspointen, der er nødvendig for at blive betragtet som tilfredsstillende. Denne metode er mere bekymret over systemets samlede effektivitet i stedet for i hvilken udstrækning hver person er placeret på jobbet, som han kan udføre bedst. Det undgår at sætte nogen på et job, hvor hans præstationer vil være underordnede.

Flere afskæringssystemer:

Det blev tydeligt påpeget i diskussionen om multipelregressionssystemet, at den anvendte model forudsætter lineære forhold mellem forudsigelserne og kriteriet. Et sådant system gøres ofte imod, at mens der for mange træk kan være et lineært forhold mellem prediktor og kriterium over det meste af området, kan der være en vis minimum acceptabel mængde af dette træk, der er nødvendigt for at være en succes arbejder. Denne form for forhold mellem jobpræstationer og test er vist i Figur 3.7.

Præcisor-kriteriefunktionen i Figur 3.7 viser, hvad der sker, når man antager det:

(1) Der er et mindste beløb af forudsigelsesevnen (egenskab X), der er nødvendig for jobsucces og

(2) Enhver mangel eller mangel i træk X under dette minimum kan ikke kompenseres ved at have en masse anden evne, som også har vist sig at forudsige jobsucces.

Et eksempel på en sådan situation kan være et samlingsjob, der kræver både godt syn og manuel fingerfærdighed. Generelt kan man finde ud af, at jo bedre en arbejdstagers vision og jo bedre hans fingerfærdighed, jo mere succesfulde den arbejdstager ville have tendens til at være på jobbet. Der kan dog være et punkt langs visionsdimensionen, ud over hvilken ingen fingerfærdighed ville hjælpe.

Udvælgelses- og placeringsproceduren, der tager højde for dette problem med mindste acceptable værdier, kaldes den multiple cut-off-metode, hvilket betyder at et afskæringspunkt etableres særskilt for hver prediktor. Medmindre en person har en score over cut-offen på alle forudsigere for et givet job, vil han ikke blive placeret på det pågældende job.

Således eksisterer der ikke noget begreb om additiv egenskaber ved denne metode. At falde under minimum på enhver forudsigelse vil diskvalificere den enkelte. Figur 3.8 og 3.9 viser regionerne for accept og afvisning ved anvendelse af det multiple cut-off-system til data svarende til det, der anvendes til at illustrere multiple-regressionssystemet i figurerne 3.5 og 3.6.

Måske er den bedste måde at sammenligne de to metoder på at angive, hvordan de er forskellige med hensyn til, hvem der vælges til jobbet. Figur 3.10 viser afskæringslinjerne for begge selektionsmetoder. Bemærk først og fremmest, at de personer i område 7, uanset hvilken metode der anvendes, altid vil blive accepteret, og de personer i område 1, 3 og 5 vil altid blive afvist. De personer, der skal behandles forskelligt som en funktion af udvælgelsesproceduren, er dem i områderne 2, 4 og 6.

Ved anvendelse af multiple-regressionsselektionssystemet accepteres alle personer i område 2 og 6, mens de i område 4 vil blive afvist. Det omvendte vil ske ved hjælp af den multiple cut-off procedure; folk i område 4 vil blive accepteret, og dem i område 2 og 6 vil blive afvist. Således løser spørgsmålet til en af ​​de relative ønskværdier af disse to grupper af individer.

Løsningen er matematisk kompleks og er blevet vist af Lord (1963) for at være primært en funktion af de to forudsigers pålidelighed. Faktisk er det under alle omstændigheder sandsynligvis ikke nogen procedure, der giver nøjagtigt den bedste løsning ved udvælgelsen af ​​den gruppe medarbejdere med den højeste gennemsnitlige kriterie score. I stedet synes den optimale udvælgelsesstrategi at være en form for kompromis mellem de to metoder (se den stiplede linje i figur 3.10).

Bestemmelse af skærepunkter:

Hvis man vedtager den multiple cut score-teknik, bliver det nødvendigt at bestemme de separate minimum acceptable score for hver af forudsigelserne. Dette er ikke en nem opgave, da der ikke er angivet en "korrekt" måde at oprette en score på under, hvor alle mennesker bliver diskvalificeret. Relationerne involveret i udvælgelsesforholdet og procenten af ​​medarbejderne anses for tilfredsstillende (skæreværdien), han vil begynde at se, hvordan komplekse problemet er, når to forudsigere er involveret.

Generelt bliver processen med at oprette skæreværdier et af forsøg og fejl, hvor forskellige værdier for hver prediktor bliver forsøgt. For hvert par skæringsresultater skal forskeren bestemme, hvor højt gennemsnittet eller kompositkriterietesten af ​​de valgte er med hensyn til andre snitkombinationer. Han skal også tage højde for antallet af jobåbninger i forhold til det samlede antal ansøgere (udvælgelsesforholdsmålet).

Forudsætninger, fordele og ulemper ved flere skærepunkter:

For at opsummere de ovennævnte punkter antager metoden til at skære scorer virkelig et ikke-lineært forhold mellem prediktorer og kriterium. For det andet afviger det begrebet substitution af testresultater, i hvert fald i bestemte dele af området. Den ene klare fordel er, at det normalt er en nem metode til, at medarbejderen skal implementere, fordi der ikke kræves nogen udførlige beregningsmetoder eller formler.

Men som nævnt er en vis prøve og fejl nødvendig for at få skærepunkter, som vil fungere på den mest tilfredsstillende måde. En af sine mere kritiske ulemper er, at den ikke giver en enkelt score for hver enkelt person, som kan bruges til at forudsige, hvor vellykket han vil være på et job i forhold til hans succes på et andet job. Således kan den faktiske jobplacering via skærepunkter blive meget besværlig.

Profil Matching System:

En tredje tilgang til medarbejdervalg og placering er profil matching system. Der er talrige versioner af denne metode, der afviger primært med hensyn til måden profiler matches på. De resterende aspekter af proceduren er dog temmelig uændrede fra version til version. Metoden i sig selv er ret simpel. Hvis man har k variabler (forudsigere), der accepteres som vigtige for succes på jobbet, måler man alle "succesfulde" medarbejdere på jobbet på hver af disse k-forudsigere. Scorerne er derefter gennemsnitlige for at opnå en "typisk" profil for en succesfuld arbejdstager. En hypotetisk typisk profil er vist i Figur 3.11.

I dette eksempel er ti forudsigere blevet brugt til at beskrive den typiske succesfulde medarbejder på job A. Som data tyder på, vil en vellykket arbejdstager på job A have en høj score (i forhold til andre arbejdstagere) på variabler 2, 3, 5, 6, og 8. Hans score på variabler 1, 4, 7, 9 og 10 adskiller sig ikke meget fra arbejdstagernes gennemsnitlige ydeevne generelt. Når først denne form for ideel profil er opnået, bruges den som standard til sammenligning af de enkelte profiler for alle nye ansøgere.

På dette tidspunkt opstår to ret vigtige spørgsmål i profilmetoden. Først, hvordan bestemmer man hvilke forudsigere der er relevante, det vil sige, hvilke skal være inkluderet i profilen? For det andet, i betragtning af at profilelementerne er blevet vellykket udvalgt, hvordan vurderer man i tilstrækkelig grad, i hvilket omfang en persons profil matcher den ideelle profil? Den måde, hvorpå disse to problemer løses, kan uhyre påvirke den eventuelle lydhed og gyldighed af ethvert profil matching system.

Valg af profilelementer:

Hvert profilelement bruges som en forudsigelse for jobsucces, ligesom forudsigelserne i de tidligere diskuterede metoder. Det er da helt sikkert vigtigt at fastslå gyldigheden af ​​hvert profilelement inden brug af det som et middel til at vælge og / eller placere personer på jobbet. Hvilken sikkerhed har vi for eksempel at fattige eller utilfredsstillende arbejdstagere ikke har en sammensat profil, der ligner præcis som vist i figur 3.11? Vi har ingen overhovedet, medmindre vi fortsætter med at finde ud af empirisk, hvad den utilfredsstillende sammensatte ligner ved faktisk at måle en gruppe af disse mennesker på samme træk og computergruppens gennemsnit.

Det bør være indlysende, at kun de forudsigere, som påviser en signifikant forskel i gennemsnitlige score mellem tilfredsstillende og utilfredsstillende grupper, bør inddrages i den ideelle profil. Ethvert træk, der ikke klart skelner mellem "gode" og "dårlige" medarbejdere, vil kun tilføje fejl og forvirring ved at blive indblandet i udvælgelsesprocessen. Da validering af hvert træk er et nødvendigt (men alt for ofte ignoreret) trin i profilelementvalg, kan det være et legitimt spørgsmål at spørge hvorfor ikke blot bruge alle profildelektorer i en multiple-regressionsligning (eller måske endda en flere cut-off ). Faktisk afhænger svaret på, hvilken metode der anvendes til sammenligning af profiler, som det ses i det følgende afsnit.

Metoder til sammenligning af profiler:

Der er to helt forskellige procedurer, der kan vedtages ved sammenligning af hver enkelt profils profiler til den ideelle profil. En metode vælger de personer, der har profiler, der passer mest til kompositmaterialet. Dette resulterer igen i et valg af procedurer afhængigt af, hvordan udtrykket match er defineret.

En måde at definere en god kamp på er at sige, at jo tættere punkterne på en profil er til punkterne i den anden profil, jo bedre er kampen. Denne metode bruger derefter forskellene mellem de to scores på hvert træk for at opnå en lighed af lighed (eller ulighed). Den mest almindelige procedure beregner disse forskelle, kvadrerer dem og tilføjer dem derefter for at få en lighedstakt. Således, hvis vi har en profil med k træk, og hvis vi yderligere definerer

X ij - Resultat af person jeg på træk j

X 8j = Resultat af standardprofil på træk j

derefter D2 = ( Xij - X aj ) 2

og ΣD 2 ville repræsentere i hvilken grad profilen af ​​person jeg matchede standardprofilen. Jo større ΣD 2, jo fattigere kampen. Det er vigtigt at indse, at D 2- metoden ikke beskæftiger sig overhovedet med, hvorvidt antallet af personer jeg falder over eller under kompositmaterialet, det vil sige retning er ikke vigtigt med denne matchende procedure. Alt det, der tæller, er nærhed af profilpunkter.

En anden metode til at definere profilens lighed er udtrykt i forhold til vores gamle ven korrelationskoefficienten. En høj sammenhæng mellem antallet af individuelle er profil og scorerne af den ideelle profil angiver, at de to profiler har lignende mønstre, dvs. individet, jeg scorer højt på de træk, hvor den ideelle profil også har highscores, og han scorer lavt på de træk, hvor den ideelle profil også har lav score. Figur 3.12 viser eksempler på profiler, der illustrerer, hvordan brugen af ​​forskellige metoder til vurdering af lighed kan resultere i, at forskellige personer bliver valgt til jobbet. Undersøgelse af figur 3.12 afslører hurtigt, at det generelle mønster for person B's scoringer duplikerer den af ​​den ideelle eller standardprofil meget tættere end at score person A.

De faktiske scoringer opnået af person A ser imidlertid ud til at være tættere på værdierne for standardprofilen end scorerne på individets B-profil. Vi kan derfor antage, at individet A burde have den lavere (mere ønskelige) ΣD 2 score, mens individuel B skulle have den højere korrelation (mere ønskelig) med standarden.

Som dataene i tabel 3.3 viser, viser det sig sådan. Når værdierne i figur 3.12 bruges til at beregne ΣD 2, er person A's score (ΣD 2 as ) 500, mens person B's score (ΣD 2 bs ) er meget større, med en værdi på 2000. På den anden side, når Korrelationer mellem profiler beregnes, korrelationen mellem profil A og standardprofilen beregnes r som = - 1, 00, mens korrelationen mellem profil B og standarden r bs viser sig at være 1.00-fuldendt aftale. Således, hvis D2-metoden blev anvendt som et udvælgelseskriterium, ville vi vælge person A; hvis vi var - at bruge korrelation mellem profiler som en metode, ville vi vælge person B. "

Valg af procedure:

Hvilken procedure er bedst, er et spørgsmål, der kun kan besvares af empiriske midler i en bestemt indstilling. Efter al sandsynlighed er hverken D2 eller korrelationsmetoden den bedste teknik. Hvis karakteristikaets egenskaber er valgt ud fra at have diskrimineret betydeligt mellem gode og dårlige medarbejdere (som i virkeligheden de burde vælges), så er det logiske fradrag, at der skal ønskes en høj score på et træk og low scorers skal undgås (eller vice versa afhængigt af træk).

Hvis vi som generelt antager, at det betydelige forhold mellem hver egenskab af profil og jobsucces er positiv og lineær, vil vi gerne vælge personer i henhold til en af ​​følgende procedurer:

1. Vælg de personer, hvis profilpunkter har tendens til at være den højeste, dvs. deres gennemsnitlige profil score bruges som et valgindeks. Ved hjælp af denne procedure kan en person have en stor ΣD 2 score og stadigvæk blive valgt, så længe hans profilpoint tendens til at ligge over de tilsvarende profilpunkter for standarden. Denne procedure svarer til anvendelse af en multipelregressionsvalgsmodel, hvor hvert profiltræk er en forudsigelse, og regressionsvægten antages at være ens for hver prediktor. Lav profil scoringer på et træk kan kompenseres ved høj profil scores på et andet træk.

2. Vælg de personer, der har profiler med den højeste gennemsnitlige profil score, og hvis point alle ligger over deres tilsvarende ideelle profilmodeller. Dette svarer naturligvis til en kombination af den multiple cut-off-udvælgelsesmetode og multipelregressionsmetoden.

De ideelle profilpunkter bruges til at fastlægge minimum acceptable scoreværdier. Alle mennesker, der således kvalificerer, evalueres derefter via multipelregressionssystemet. En sådan procedure kan sandsynligvis kun fungere i tilfælde, hvor udvælgelsesforholdet er tilstrækkeligt lille til at gøre det muligt for en at anvende ret strenge afskæringsværdier. Bestemt at bruge den gennemsnitlige score på hvert træk for en gruppe succesfulde medarbejdere som minimum acceptable værdier skaber en stiv hindring for nye ansøgere.

Enhver af disse sidstnævnte procedurer synes en mere retfærdig måde at bruge profiler til udvælgelse end de første to procedurer, D 'eller r. Konceptet om en "ideel" profil, hvor afvigelser i enhver retning betragtes som dårlig kan De alvorligt stillet spørgsmålstegn ved logiske grunde.

Flere forhindringssystemer:

De fleste udvalgssituationer indebærer forsøg på at forudsige senere succes på en opgave ved brug af en eller flere prædiktive foranstaltninger opnået på ansøgningstidspunktet. Nogle udvælgelsessituationer som ledelsestræning omfatter dog nogle lange perioder og ultimativ evaluering efter nogen tid, men med foreløbige evalueringer eller forhindringer på forskellige fremskridt.

Overvej situationen illustreret i figur 3.13. Her har vi diagrammet et træningsprogram, der kan bruges af et stort selskab som et middel til screening, træning og placering af nye universitetsstuderende inden for selskabet. Virksomheden ansætter oprindeligt et bestemt antal akademikere, måske ved hjælp af college karakterer, interviews, anbefalingsbrev og test som et middel til at vælge folk. Alle hyringer bliver fortalt, at deres valg er på prøve, og at de løbende vil blive evalueret under deres træningsprogram. Hvis præstationer under træning ikke er tilfredsstillende, kan de blive frigivet fra programmet.

Det er helt sikkert i selskabets interesse at træffe en nøjagtig beslutning om hver enkelt person så tidligt som muligt. Tilsvarende er det ligeledes i medarbejderens interesse, at en beslutning træffes så tidligt som muligt. Hvorvidt det er muligt at forudsige succes som følge af træningsprogrammet, øges i korrektheden (det vil sige gyldighedsstigninger), jo længere vi er i stand til at observere individets præstationer under træningen. Ved udgangen af ​​den tredje evalueringsperiode skal vi helt sikkert kunne forudsige meget mere præcist, om en sporvogn skal afslutte kurset med succes, end vi kunne gøre på det tidspunkt, hvor han blev ansat.

Situationen er ret analog med problemet med at forudsige de endelige kvaliteter af universitetsstuderende. Det er klart, at man kan få bedre forudsigelser, når den studerende begynder sit seniorår, end på tidspunktet for at han går i skole. Figur 3.14 illustrerer ændringen i validitet, som man logisk kunne forvente at forekomme i en situation som den, der er vist i figur 3.13.

På en måde er mekanikerne i en situation som vist i figur 3.13 identiske med de mere sædvanlige multiple forudsigelsessituationer: Der findes en række forudsigere for succes, men for at opnå hver yderligere forudsigelse er det nødvendigt, at yderligere tid og penge investeres i det praktikant. Sekventielle forudsigere anvendes på flere måder.

Ofte anvendes en af ​​følgende metoder:

1. En person skal score over et minimum af ønskværdigt score i hvert evalueringsstadium. Således bliver hvert trin en forhindring, som praktikanten skal rydde, hvis han skal opbevares i programmet.

2. En sammensat multipelregression beregnes ved hvert successivt evalueringspunkt, og sandsynligheden for succes beregnes for hver person, der forbliver i programmet. Når denne sandsynlighed falder under en vilkårlig værdi (for eksempel 25 procent), falder han fra programmet.

Problemer med begrænsning af rækkevidde:

Et problem, der opstår i sekventielle udvælgelsessituationer, er et problem kendt som effekten af ​​"begrænsning af rækkevidde" ved validitetsestimater. Hvis vi har brugt prediktor 1 til at vælge personer indledningsvis, og så hvis vi efterfølgende beregner sammenhængen mellem prediktor I og kriteriet eller beregner sammenhængen mellem en anden forudsigelse 2 og kriteriet, fandt vores beregnede validitetskoefficienter r 1c eller 2c lektion sted . Ved forudvalg har vi begrænset begrænsning af evne (og derfor forudsigelsesscores), hvilket vil reducere korrelationskoefficienten. Faktisk virker vores predictor 1 på en måde svarende til kontrolvariablen i delvis korrelation; da det allerede har tegnet en del af variansen, vil korrelationen r 2c blive reduceret. For at få et skøn over, hvad validiteten R2c virkelig er, kan man bruge korrektionsformlen.

Hvor

R 2c = Korrigeret validitet af predictor 2 for hele gruppen af ​​ansøgere

r 2c = beregnet validitet for forudsigelse 2 baseret på begrænset gruppe

r 1c = validitet af initial screening instrument, predictor 1

r12 = korrelation mellem forudsigere 1 og 2

S 2 1 = varians af prediktor 1 i originalgruppe

S 2 1 = variance af prediktor 1 i begrænset gruppe.