Metoder anvendt til vurdering af jobpræstation

Den industrielle psykolog har et valg af metoder til at etablere en procedure til vurdering af jobpræstationer, der involverer domme fra enkeltpersoners side. Disse metoder kan grupperes i klasser afhængigt af den type sammenligning der kræves af den enkelte, der foretager bedømmelsen. De tre mest anvendte er rating systemer, ranking systemer og parret sammenligninger.

1. Rating Systems:

Mekanikken i ethvert ratingskala system er ret simpelt. Dommerens opgave er at tage stilling til, i hvilken grad individet besidder eller beskrives af en bestemt karakteristika. Selvom det kan tage mange forskellige former, er det en kendetegnende karakter, at dommeren kan give to personer samme score, et træk, der ikke findes i de to andre metoder.

Numeriske Rating Scales:

Denne formular er nok den mest populære og almindelige type rating skala. Sådanne skalaer kaldes ofte "grafiske skalaer".

Et eksempel er givet nedenfor:

Dommerens opgave er at give hver arbejdstager en score fra 1 til 9, der bedst beskriver hans "grad af pålidelighed." Kriteriescore for en arbejdstager er som regel den gennemsnitlige score for alle dommere. I den situation, hvor et antal forskellige spørgsmål omfatter kriteriet (for eksempel grad af pålidelighed, generelt niveau af arbejdskendskab, forhold til andre arbejdstagere mv.) Bliver problemet mere kompliceret. Ofte er det samlede kriterium, der bruges, simpelthen den samlede score på alle spørgsmål.

Men når flere spørgsmål bruges til at evaluere arbejdstagere, skal man straks stå over for det kompositte versus flere kriteriumproblem. En fremgangsmåde der bliver mere populær i sådanne situationer er at analysere spørgsmålene for at bestemme underliggende uafhængige kriteriedimensioner og derefter tildele "faktor scores" på hver af disse dimensioner, som derefter anvendes som kriterier.

Standardvægt:

En anden type ratingskala indebærer brug af et sæt standarder eller eksempler til sammenligningsformål. Disse bruges i stedet for eller sammen med de verbale forankringspunkter, der findes med den grafiske skala.

En standardskala designet til at vurdere pålidelighed kan se sådan ud:

Rater kan derefter sammenligne den mand han vurderer med mænd på jobbet, der er udpeget som skala referencer. Denne metode kaldes også nogle gange som en man-til-mand sammenligningsskala. Det største problem med standard skalaer findes i at finde passende standarder. Dette kræver normalt en omhyggelig forhåndskalering af en gruppe nuværende medarbejdere. Der er også det meget berolige problem med at bruge disse mænds navne uden forlegenhed. Man skal derfor være meget forsigtig med, at standardskalaen ikke må offentliggøres. Et andet problem er, at intervallerne mellem mændene på skalaen ofte ikke er af samme størrelse.

Fordelen ved metoden er helt tydelig. Så længe en gruppe dommere kan blive enige om kvalifikationerne hos en lille gruppe arbejdstagere, der er velkendte for alle dommere, er der tilvejebragt en færdig sammenligningsskala, der sikrer, at alle dommerne vil have en fælles referent til bedømmelse af resten af mændene.

Kumuleret punktskala (tjekliste):

Mange ratingskalaer kræver, at dommeren skal kontrollere eller angive, hvilken af et antal udsagn, adjektiver eller attributter der er beskrivende for den person, der vurderes. Eksempelvis er ratingformularen vist i figur 7.3 repræsentativ for en adjektiv checkliste.

Hver person får tildelt en samlet score baseret på de bestemte elementer, der er markeret. I det viste eksempel kan en person modtage en + 1 for hver gunstig adjektiv og a - 1 for alle ugunstige adjektiver. I mere udførlige tjeklister kan de forskellige elementer tildeles differentialvægte. For eksempel har Uhrbrock (1961) skalet 2000 udsagn om arbejdstageradfærd.

Hver erklæring er blevet givet en gennemsnitlig skala værdi af sin opfattede favourableness i beskrivelse af en arbejdstager. Udtalelser kan derefter vælges til brug på en checkliste, som igen bruges af vejledere til at bedømme deres medarbejdere. Metoden til scoring kunne være baseret på enten den samlede (algebraiske sum) score for de elementer, der blev kontrolleret eller måske den median (middel) skala værdi for alle de kontrollerede elementer. Nogle eksempler på Uhrbrocks udsagn sammen med deres skalaværdier er vist i tabel 7.3.

Kritisk Incident Check List:

Den kritiske episode er en procedure udviklet af Flanagan (1954). Som normalt brugt, kan det formentlig bedst beskrives som en checkliste bedømmelse procedure. Det er dog også tilstrækkeligt forskelligt i udviklingen, at det fortjener særskilt omtale.

Metoden indebærer tre forskellige trin:

1. Indsamling af kritiske hændelser

2. Skalering af hændelserne

3. Konstruerer tjeklisteskalaen

Trin 1 er, hvad der gør denne metode unik. Begrebet kritisk hændelse refererer til alle de adfærdssituationer hos personer, som tilsynsføreren anser for at være "bemærkelsesværdige". Det bemærkelsesværdige kan til gengæld henvise til forekomster af enten udestående "gode" eller "dårlige" on-the- arbejdsadfærd. Hver vejledende bliver med andre ord bedt om at levere så mange tilfælde af enestående faktisk arbejdsadfærd, som han kan huske. Disse jobhændelser præsenteres derefter (trin to) til en ekspertgruppe, som tildeler skalaværdier med hensyn til graden af ønskelighed for denne hændelse.

I trin tre er der opstillet en tjekliste, der kun omfatter de udsagn eller hændelser, der føltes at være relevante for at definere "gode" og "dårlige" arbejdere. Disse checklister kan derefter bruges af en vejleder til at bedømme sine arbejdere. Ved bedømmelsen af en arbejdstager placerer han simpelthen et mærke sammen med hver hændelse, som han har observeret, at arbejderen "begår" eller udstiller. Resultatet for en arbejdstager tages sædvanligvis som middel- eller middelskalaværdien af alle hændelser kontrolleret for ham (total score kan også bruges).

Den kritiske hændelseskontrol liste har den store fordel, at den er baseret på faktiske arbejdsadfærd eller hændelser. En vejleder er ikke i stand til at blive tvunget til at dømme karaktertræk eller rangere sine arbejdere mv. Han må kun reagere med hensyn til, hvorvidt han har eller ikke har observeret en bestemt hændelse for hver arbejdstager. Kirchner og Dunnette (1957) har rapporteret positive resultater i en undersøgelse, der efter lidt følger proceduren beskrevet ovenfor.

Før du forlader den kritiske hændelsesmetode, skal det understreges, at den har mere generalitet og anvendelse end blot at være en kilde til præstationsvurderingstjekliste. Arbejdsbaserede adfærdshændelser er blevet anvendt meget succesfuldt inden for forskning inden for lederskab (Fleishman, 1955), organisatoriske værdier (Shartle, Brumback og Rizzo, 1964) og kreativitet (Buel, 1960).

2. Rangordningssystemer:

Et karakteristik ved et rating system er, at det tillader to eller flere personer at have samme rating eller skala værdi. Et rangordningssystem af dets natur afskrækker dette. Simpel placering kræver, at dommeren bestiller individer fra højeste til laveste.

En bestemt gruppe af tilsynsførere kan således rangere ti medarbejdere som vist nedenfor:

Ranking systemer har den iboende fordel ved at de er meget enkle at forklare og er normalt let accepteret af de personer, der er tildelt som dommere. Proceduren "giver mening" til dem. Det har også den fordel, at en rater kan rangere et ret stort antal individer uden store vanskeligheder. En tommelfingerregel erkender, at tilfredsstillende og pålidelige resultater med et rangordningssystem kan opnås med Ns så stort som 50 til 60.

Guilford (1954) har påpeget en anden fordel ved rangering. Da dommeren er tvunget til at lave sammenligninger mellem mænd og kvinder snarere end absolutte sammenligninger, skal han sammenligne enkeltpersoner, når de beslutter at placere hinanden over hinanden.

Metoden gør det muligt for dommeren at diskriminere mellem de enkelte personer, der rangeres, uanset om han føler, at de er helt forskellige! Antag, at de ti mænd, der er givet i vores tidligere eksempel, var ret lige i deres evne. Dommerne ville så sandsynligvis have en overordentlig vanskelig tid på at forsøge at rangordne mændene, og dommernes rangeringer ville være meget vildledende med hensyn til de ti fortolkede relatives fortjenester.

En måde at kontrollere denne mulighed er selvfølgelig at bruge flere dommere. Hvis dommerne er enige om deres placeringer, kan muligheden for, at der ikke er "rigtige" eller sande forskelle mellem mændene, diskonteres. I det tidligere eksempel synes dommerne at være rimeligt konsekvente for at dømme hvem der er god og hvem der er en dårlig arbejdstager. Således skal deres valg være baseret på nogle virkelige snarere end tilfældige grunde til at bestille de pågældende mænd. Dette er en fremragende grund til at bruge flere dommere, når det er muligt, og til beregning af aftalen blandt dommere med noget indeks som en korrelationskoefficient.

3. Parrede Sammenligninger:

Selvom rangordensystemerne implicit kræver, at en mand sammenlignes med andre på listen under rangeringsprocessen, er dette ikke systematisk indbygget i metoden. En procedure, der systematisk tvinger rateren til at sammenligne hver mand med hver anden mand, er kendt som metoden til parret sammenligning. For eksempel overveje situationen, hvor fire medarbejdere evalueres af en vejleder. Hvis vi danner alle mulige par af mænd, skal vi have N (N1) / 2 sådanne par dannet; i vores tilfælde 4 (3/2) = 6 par.

Den sædvanlige procedure er da at præsentere hvert par (en ad gangen) til vejlederen. Vejlederen angiver (normalt med et afkrydsningsfelt) hvilken af de to mænd han føler sig bedst. En parret sammenligningsmatrix kan derefter konstrueres som vist nedenfor, hvor følgende regel anvendes: Når en tilsynsførende foretrækker en kolonne i en række, skal du placere et mærke i den celle.

Antag at tilsynsførende X gør følgende vurderinger om de seks par arbejdere:

Hvis vi placerer talemærker i vores matrix ved hjælp af ovenstående regel, har vi følgende:

Således vurderer denne vejleder B som den bedste medarbejder, fulgt i rækkefølge af C, A og D. I praksis er dommerne fra en række dommere inkluderet i matricen for at give et mere stabilt skøn over rækkefølgen af fortjeneste af mændene bliver evalueret. Derudover er det almindeligt at konvertere proportionerne i hver celle til standard scores (Z score) og derefter finde en gennemsnitlig Z-score for hver søjle.

Denne gennemsnitlige Z-score er derefter skalaværdien for den person, der er repræsenteret af den kolonne i matrixen. Fordelen ved denne sidstnævnte procedure ii, at disse skaleringsværdier kan antages at repræsentere ikke kun rangordnen af arbejdstagerens evne, men også som en indikation af, i hvilken grad to arbejdstagere adskiller sig i evnen.

En simpel illustration baseret på svarene fra ti hypotetiske vejledere til de fire mænd, der er vurderet ovenfor, kan være nyttige. Lad os først overveje følgende tallymatrix

Lad os nu konvertere tallymatrixen til en proportionsmatrix, hvor vi definerer en andel som ⁿ / _N, hvor n er lig med antallet af tallymer i en celle, og N er lig med antallet af dommere eller antallet af mulige talemærker. Det er almindeligt at indtaste proportioner på 0, 50 i alle diagonale celler, selvom vi ikke rent faktisk præsenterer en person, der er parret med sig selv til dommerne.

Det næste trin er at konvertere proportionerne til Z score. (En tabel til at gøre dette findes i enhver elementær bog om statistik.)

Hvis vi tilføjer en konstant på 0, 78 til alle skalaværdier for at fjerne negative tegn, kan enkeltpersonerne derefter blive repræsenteret langs en kontinuitet af fortjeneste

Bemærk at afstanden mellem C og A er væsentligt større end afstanden mellem D og A eller B og C. Hvis antagelserne af denne metode er blevet opfyldt, kan disse relative afstande betragtes som vejledende for de relative forskelle i fortjeneste blandt de enkeltpersoner bliver bedømt - et tiltrækkende kendetegn ved denne præstationsvurderingsmetode. For en mere detaljeret dækning af parret sammenligning henvises til Edwards (1957) eller Guilford (1954).

En af ulemperne ved metoden med parrede sammenligninger er, at den ikke er særlig nyttig, når antallet af individer, der skal vurderes, bliver stor. Tidligere blev det påpeget, at en vejleder sandsynligvis kunne rangordre ordre 50 eller 60 arbejdere. Hvis vi forsøgte at bruge den parrede sammenligningsprocedure, ville vi have

50 (49) 72 = 1225 par

Selvom en vejleder kunne arbejde med en hastighed på seks par hvert minut, ville det kræve mere end tre timer at opnå bedømmelsen. Jo større antal personer der skal bedømmes, desto mere astronomiske bliver tidsbehovet.