Klassisk testteori

Klassisk testteori

En test er en Videnskabeligt instrument I det omfang det måler, hvad det har til hensigt, det vil sige, det er gyldigt, og det måler godt, det vil sige, det er nødvendigt eller pålideligt. Hvis vi finder et instrument, som vi ikke kan stole på de foranstaltninger, de leverer, da de varierer fra én gang til et andet, når vi måler det samme objekt, vil vi sige, at det ikke er pålideligt. Et instrument, til at måle korrekt Noget, det skal være præcist, for hvis ikke, måle hvilken foranstaltning, det måler det dårligt. Derfor er det nødvendigt at være nødvendig, men ikke tilstrækkelig tilstand. Derudover skal det være gyldigt, det vil sige, hvilke foranstaltninger med præcision vil være det, der er beregnet til at måle, og intet andet.

Du kan også være interesseret: Element Response Theory - Applications and Tests

Pålidelighed:

Absolut og relativ pålidelighed: Vi kan løse problemet med pålidelighed af en test på to forskellige måder, skønt i den tilfældige baggrund.

Pålidelighed som unøjagtigheden af ​​dens foranstaltninger: Når et emne reagerer på en test opnår en empirisk score, der påvirkes af en fejl. Hvis der ikke var nogen fejl, ville emnet få hans sande score. Testen er unøjagtig, fordi den empiriske score ikke stemmer overens med den autentiske sande score. Denne forskel mellem begge scoringer er prøvefejlen, målefejlen. Han Typisk målefejl være Den typiske afvigelse af målefejl. Han Typisk målefejl Angiver den absolutte præcision af testen, da den tillader at estimere forskellen mellem den opnåede foranstaltning og den, der ville blive opnået, hvis der ikke var nogen fejl.

Pålidelighed som stabiliteten af ​​målene: en test vil være mere pålidelig, jo mere konstant eller stabile resultaterne, de giver, når de gentages, opretholdes. Jo mere stabile resultaterne er to gange, jo større er sammenhængen mellem dem. Denne sammenhæng kaldes Pålidelighedskoefficient. Dette udtrykker os, ikke fejlmængden, men sammenhængen i selve testen og beviset for de oplysninger, det tilbyder. Han Pålidelighedskoefficient udtrykker testens relative pålidelighed.

Pålidelighedskoefficienten og pålidelighedsindekset: - Pålidelighedskoefficienten Af en test er sammenhængen mellem selve testen, for eksempel opnået i to parallelle former: RXX. - Præcisionsindekset Det er sammenhængen mellem de empiriske scoringer af en test og dens sande score: RXV Precision -indekset vil altid være større end pålidelighedskoefficienten for at finde ud af pålidelighedskoefficienten er at fremhæve disse tre klassiske metoder:

  • At finde sammenhængen mellem testen og dens gentagelse: gentagelsesmetoden eller test-retest-metoden: Den består i at anvende den samme test på den samme gruppe to gange, og sammenhængen mellem de to serier af scoringer beregnes. Denne korrelation er pålidelighedskoefficienten. Denne metode giver normalt en højere pålidelighedskoefficient end dem, der er opnået ved andre procedurer, og kan være forurenet af de foruroligende faktorer.
  • Find sammenhængen mellem to parallelle former for testen: Metoden til parallelle former: to parallelle former for den samme test er forberedt, det vil sige to ækvivalente former, der giver de samme oplysninger og gælder for den samme gruppe af emner. Korrelationen mellem de to former er pålidelighedskoefficienten. Med denne metode gentages den samme test ikke, de foruroligende kilder til re-test-pålideligheden undgås.
  • Find sammenhængen mellem to parallelle halvdele af testen: Metoden til de to halvdele: Testen er opdelt i to ækvivalente halvdele, og sammenhængen mellem dem findes. Det er den foretrukne metode, da den er enkel og undgår begrænsningerne i de tidligere procedurer. Du kan vælge de ulige elementer i testen, for at udgøre den ene halvdel og de jævne elementer til at udgøre den anden.

Pålidelighedskoefficienten og sammenhængen mellem parallelle tests

Han Pålidelighedskoefficient Af en test indikerer den andel, at den sande varians er af den empiriske varians: Graf33 Pålidelighedskoefficienten for en test varierer mellem 0 og 1 . For eksempel: Hvis sammenhængen mellem to parallelle tests er Rxx´ = 0'80, betyder det, at 80% af variansen af ​​testen skyldes den autentiske foranstaltning, og resten, det vil sige 20% af variansen af ​​det Test skyldes fejl. Han Pålidelighedsindeks Af en test er sammenhængen mellem dens empiriske score og dens sande score indeks pålidelighed = pålidelighedsindekset er lig med kvadratroten af ​​pålidelighedskoefficienten

Når to parallelle former for en test er uddybet, anvendes variansanalyseproceduren for at verificere afvigelsens homogenitet og forskellen mellem foranstaltningerne. Hvis afvigelserne er homogene, er forskellen mellem strømperne ikke signifikant, og de to former er bygget med det samme antal elementer af samme type og psykologisk indhold, det kan bekræftes, at de er parallelle. Hvis ikke, skal du reformere dem, indtil de er. Fraværet af pålidelighed identificeres med værdien rxx´ = 0 4.- Den typiske målefejl: Forskellen mellem empirisk og ægte score er den tilfældige fejl, kaldet målefejl. Den typiske afvigelse af målefejl kaldes den typiske målefejl. Han Typisk målefejl Tillader estimater om testens absolutte pålidelighed, det vil sige at estimere, hvor meget målefejl påvirker en score.

Pålidelighed og længde: testens længde henviser til antallet af dets elementer. Denne længde afhænger af din pålidelighed. Hvis en test består af tre elementer, kan et emne opnå en score på 1 og en anden eller i en parallel form, en score på

Fra en lejlighed til en anden har scoringen varieret et punkt; Et punkt over tre er en variation på 33%, en høj variation. Hvis forsøgspersoner opnår afslappede variationer af denne type, vil sammenhængen mellem selve testen eller de to parallelle former for testen blive meget reduceret og kan ikke være høj. Hvis testen er meget længere, hvis den for eksempel har 100 elementer, kan et emne opnå 70 point ved en lejlighed og 67 i en parallel form. Igen har det varieret 3 point; Det er en relativt lille varians i forhold til den samlede test, specifikt 3%. Disse små afslappede ændringer af denne størrelsesorden, der forekommer i emnerne af emnerne, når de passerer på en måde til parallellen, er relativt uvæsentlige og vil ikke falde så meget som før sammenhængen mellem de to.

Pålidelighedskoefficienten vil være meget større end i den forrige sag. Spearman-Brown-ligningen udtrykker forholdet mellem pålidelighed og længde. Nøjagtigheden af ​​en test er ugyldig, når længden er 0, og den øges, når længden øges. Selvom stigningen er relativt lavere, da længden er lagt, er større. Dette betyder, at præcisionen vokser meget i begyndelsen og relativt mindre efter. Når længden har en tendens til uendelig, har pålidelighedskoefficienten en tendens til at

Ved at øge længden af ​​en test øges dens præcision, fordi den sande varians stiger med en højere hastighed end fejlvariansen. Dette betyder, at præcisionen af ​​testen øges, fordi andelen af ​​variansen på grund af fejlen falder. Rulon -formlen såvel som Flanagan- og Guttman -formlen er især anvendelige, når pålidelighedskoefficienten beregnes af de to halvdele. Dette er formler, der bruges til beregning af pålidelighedskoefficienten.

Pålidelighed og konsistens: pålidelighedskoefficienten kan også findes på en anden måde, det er den såkaldte kaldte Alpha -koefficient enten Koefficient for generaliserbarhed eller repræsentativitet (Cronbach). Denne alfa -koefficient angiver den præcision, som nogle genstande måler et aspekt af personlighed eller adfærd. Det kan fortolkes som: et skøn over den gennemsnitlige sammenhæng mellem alle mulige genstande i et bestemt aspekt. Et mål for præcisionen af ​​testen baseret på dens sammenhæng eller interne konsistens (indbyrdes sammenhæng mellem dens elementer; i hvilket omfang testenes elementer måler det samme) og dens længde. Angiver repræsentativiteten af ​​testen, det vil sige det beløb, hvor prøven af ​​genstande, der udgør det, er repræsentativ for befolkningen af ​​mulige genstande af samme type og psykologisk indhold. Han Alpha -koefficient afspejler hovedsageligt to grundlæggende koncepter i præcisionen af ​​en test: 1. Sammenhængen mellem dens elementer: i hvilket omfang alle måler den samme ting godt.

Testens længde: Ved at øge antallet af tilfælde af en prøve, og hvis systematiske fejl elimineres, repræsenterer prøven bedre den befolkning, der er uddraget og mere usandsynligt at gribe ind i den afslappede fejl. Hvis testens genstande er dikotomik (ja eller nej, 1 eller 0, aftale eller uenighed osv.), Er alfa -koefficientligningen forenklet, hvilket giver anledning til ligningerne af Kuder-Richardson (KR20 og KR21). I betragtning af et vist antal genstande vil en test være desto mere pålidelig, jo mere homogene. Alfa -koefficienten angiver pålideligheden, så snart den repræsenterer homogenitet og sammenhæng eller intern konsistens af elementerne i en test.

Pålidelighedsstandarder og kriterier

I henhold til varemodellen Expect Space er målet med testen at estimere den foranstaltning, der ville blive opnået, hvis alle elementerne i prøvepladsen blev brugt. Denne foranstaltning ville være den rigtige score, som de reelle foranstaltninger nærmer sig mere eller mindre. I henhold til den grad, i hvilken en prøve af genstande korrelerer med ægte scoringer, er testen mere eller mindre pålidelig. I denne model er korrelationsmatrixen mellem alle elementer i prøvepladsen central.Denne prøvemodel insisterer mere direkte på intern konsistens, og i det omfang den opnår den, garanterer den indirekte stabilitet.

Den lineære model af de parallelle test insisterer mere på scoringens stabilitet, og i det omfang den opnår stabilitet, favoriserer indirekte intern konsistens. Hvis vi anvender en test for at etablere individuelle diagnoser og prognoser, skal pålidelighedskoefficienten være 0,90 op. I kollektive prognoser og klassifikationer er efterspørgslen ikke sådan.

Nogle gange, i en bestemt form for test, såsom personlighed, er det vanskeligt at opnå koefficienter på mere end 0'70. Hvis der anvendes parallelle former eller parallelle halvdele efter et mere eller mindre stort interval, kan afslappede fejl være flere end dem, der påvirker alfakoefficienten. Dette skyldes, at det, der reducerer sammenhængen, ikke kun er de tilfældige fejl, der er iboende i testen og ved en enkelt lejlighed, som er dem, der tager højde for alfa -koefficienten, men også påvirker alle de fejl, der kan komme fra de to forskellige situationer, som kan variere i adskillige detaljer. Derfor er alfa -koefficienten normalt større end de andre koefficienter.

Med undtagelse af den koefficient, der findes ved gentagelse af den samme test, da der er mere sandsynligt, at de tilfældige fejl i den første applikation gentages i det andet, og i stedet for at reducere sammenhængen mellem de to, øger de den. Det skal sikres, at den anden ansøgning er helt uafhængig af den første. Hvis vi opnår dette, vil dette være den nemmeste og mest økonomiske og tilrådelige metode, når vi prøver at værdsætte scoringens stabilitet, især i lange perioder og med komplekse tests. > Næste: Gyldigheden af ​​testene

Denne artikel er kun informativ, i psykologi-online har vi ingen magt til at stille en diagnose eller anbefale en behandling. Vi inviterer dig til at gå til en psykolog for at behandle din særlige sag.

Hvis du vil læse flere artikler, der ligner Klassisk testteori, Vi anbefaler, at du går ind i vores kategori af eksperimentel psykologi.