Logistică și mijloace tehnice și metodologice pentru a asigura dezvoltarea studenților disciplinele „Psihodiagnostic” și „Atelier de psihodiagnostic. Fiabilitatea și validitatea testului - ce este? Cerințe de bază ale criteriilor

Pentru început, să definim domeniul de dezvoltare a acestei probleme și să enumerăm pe scurt oamenii de știință.

Oameni de știință care s-au ocupat de problema fiabilității și validității metodelor în psihodiagnostic: A. Anastasi și alții.

Definiție

Fiabilitatea unei tehnici este stabilitatea rezultatelor pe mai multe examinări.

Valabilitatea unei tehnici este fiabilitatea măsurării unei anumite proprietăți mentale care este supusă măsurării.

Testați fiabilitatea

Luați în considerare mai multe tipuri de fiabilitate a testelor psihodiagnostice.

  1. Fiabilitate prin consistență internă. Partea modificată a testului măsoară o variabilă pe care părțile neschimbate ale testului nu o măsoară.
  2. Retestați fiabilitatea. Retestarea subiecților cu corelarea ulterioară a rezultatelor examenului inițial și final.
  3. Forme de testare paralele de fiabilitate. Crearea echivalentului chestionarului și prezentarea acestuia de către aceiași subiecți pentru corelarea ulterioară a rezultatelor.
  4. Fiabilitatea părților testului poate fi determinată de împărțirea chestionarului în părți; apoi corelați rezultatele obținute.

Figura 1. „Indicatori ai fiabilității testului”

Atunci când se identifică fiabilitatea testului, tehnica trebuie efectuată la intervale de timp semnificative. De asemenea, se recomandă efectuarea unui test pe eșantioane de cel puțin 200 de subiecți.

Valabilitatea testului

Luați în considerare unele tipuri de validitate a testelor în psihodiagnostic.

  1. valabilitate evidentă. Percepțiile subiectului asupra testului.
  2. valabilitate competitivă. Corelarea cu teste similare.
  3. validitate predictivă. Corelarea rezultatelor testelor inițiale și ulterioare.
  4. valabilitate incrementală.
  5. valabilitate diferentiala.
  6. Validitatea conținutului. Reflectarea sarcinilor de testare a aspectelor unui anumit domeniu de studiu.
  7. validitate empirică. Corelarea rezultatelor acestei tehnici cu rezultatele unor tehnici similare la aceleași subiecte.
  8. validitatea criteriului. Relația dintre rezultatele obținute și criteriile externe.
  9. validitatea constructiei.

Una dintre diferențele importante dintre testele psihometrice este că acestea standardizate, iar acest lucru vă permite să comparați indicatorii obținuți de un subiect cu cei din populația generală sau grupurile relevante. Standardizarea testului este cea mai importantă în cazurile în care se realizează compararea indicatorilor examinați.

Aceasta introduce conceptul norme, sau indicatori normativi. Pentru a obține norme standard, un număr mai mare de subiecți trebuie selectat cu atenție în conformitate cu un criteriu clar definit. Atunci când se formează un eșantion de standardizare, trebuie luate în considerare dimensiunea și reprezentativitatea acestuia.

În unele cazuri, este necesar să se formeze mai multe grupuri de standardizare sau să se stratifice grupul de standardizare în funcție de parametri precum vârstă, sex, statut social. Stabilirea standardelor nu este întotdeauna necesară. Atunci când se utilizează teste psihologice într-un studiu științific, normele nu sunt atât de importante și indicatorii bruti de testare sunt suficienți. Normele pentru fiecare grup trebuie prezentate în termeni de medii și abatere standard.

Figura 2. „Structura valabilității”

Transformarea procedurilor și tehnicilor de psihodiagnostic într-un instrument de încredere al științei și practicii depinde de eforturile multor specialiști în depanare psihometrice, proiectând teste care să îndeplinească cerințele psihometrice de bază: fiabilitate, validitate, standardizare. Principiile de bază ale verificării și determinării fiabilității, proiectării și validării metodelor de psihodiagnostic sunt acoperite într-o serie de lucrări speciale de psihodiagnostic (A. Anastasi, A. Bodalsi, V. Stolin, A. Shmelev, K. Gurevich, V. Melnikov etc. .). În acest tutorial, vom descrie conceptele și principiile de bază ale efectuării unui examen psihodiagnostic, cunoașterea căruia este o condiție indispensabilă pentru calificarea profesională a unui psiholog practic.

Psihodiagnostica ca disciplină științifică include trei domenii de cunoaștere psihologică:

domeniul psihologiei care studiază aceste fenomene mentale;

psihometria - știința de a măsura diferențele individuale și variabilele diagnosticabile;

utilizarea practică a cunoștințelor psihologice în scopul impactului psihologic adecvat și asistenței oamenilor în rezolvarea problemelor lor.

Baza metodologică a psihodiagnosticului este psihometria. Această știință este cea care dezvoltă tehnologia pentru crearea unor metode specifice de psihodiagnostic și determină metodologia pentru asigurarea cerințelor științifice pentru acestea:

fiabilitate - consistența internă a părților testului și reproductibilitatea rezultatelor în timpul testării repetate;

validitate - reflectarea în rezultatele testelor a exact proprietății pentru diagnosticul căreia este destinată;

fiabilitate - protecția testului de influența asupra rezultatelor dorinței subiectului de a le schimba în direcția dorită;

reprezentativitate - prezența normelor pentru rezultatele unui sondaj de masă în populația pentru care este conceput testul, permițând evaluarea gradului de abatere de la valorile medii ale oricărui indicator individual.

Aceste cerințe psihometrice se aplică diferitelor grupe de teste, în timp ce în cea mai mare măsură - testelor obiective și chestionarelor de personalitate, în cea mai mică măsură - tehnicilor proiective.

Evaluarea obiectivă a metodelor și testelor psihologice înseamnă determinarea fiabilității acestora. În psihometrie, termenul de „fiabilitate” se referă întotdeauna la consistența scorurilor obținute de la aceiași subiecți.

Cât de util este acest test? Chiar își face treaba? Aceste întrebări pot, și uneori duc, la discuții lungi și inutile. Prejudecățile, concluziile subiective, predilecțiile personale duc, potrivit lui A. Anastasi, pe de o parte, la o supraestimare a capacităților unui anumit test, iar pe de altă parte, la respingerea lui încăpățânată. Singura modalitate de a răspunde la astfel de întrebări este testarea empirică. Evaluare obiectivă testele psihologice înseamnă în primul rând determinarea fiabilității și validității acestora în situații specifice.



Testați fiabilitatea este consistența scorurilor obținute de la aceiași subiecți atunci când sunt retestate cu același test sau forma echivalentă a acesteia.

Dacă un copil are un IQ de 110 luni și 80 vineri, atunci este evident că un astfel de indicator cu greu poate fi luat cu încredere. În mod similar, dacă un individ a identificat corect 40 de cuvinte într-o serie de 50 de cuvinte și 20 într-o altă serie considerată echivalentă, atunci niciunul dintre acești indicatori nu poate fi considerat ca o măsură a înțelegerii sale verbale. Desigur, în ambele exemple este posibil ca doar unul dintre cei doi indicatori să fie eronat, dar numai testarea ulterioară poate confirma acest lucru; din datele date rezultă doar că împreună indicatorii nu pot fi corecti.

Înainte ca un test psihologic să devină cunoscut, trebuie efectuat un test obiectiv aprofundat al fiabilității sale. Fiabilitatea poate fi testată în raport cu schimbările temporale, selecția anumitor elemente sau eșantionul de testare a personalității experimentatorului sau procesorului de scoruri ale testului și alte aspecte ale testării. Este foarte important să specificați exact tipul de fiabilitate și modul în care este determinată, deoarece același test se poate modifica în diferite aspecte. De asemenea, este de dorit să aveți informații despre numărul și caracteristicile persoanelor asupra cărora a fost testată fiabilitatea testului.

Astfel de informații vor permite utilizatorului testului să decidă cât de fiabil este testul pentru grupul căruia intenționează să-l aplice.

Cea mai completă explicație a fiabilității metodelor de testare este dată de A. Anastasi. Fiabilitatea este înțeleasă ca consistența rezultatelor testelor obținute atunci când este aplicată în mod repetat acelorași subiecți în momente diferite de timp, folosind seturi diferite de sarcini echivalente sau când alte condiții de examinare se modifică. Calculul se bazează pe fiabilitate erori de masurare, care serveşte la indicarea limitelor probabile ale fluctuaţiilor mărimii măsurate apărute sub influenţa unor factori aleatori străini. În sensul său cel mai larg, fiabilitatea se referă la măsura în care diferențele individuale în rezultatele testelor sunt „adevărate” și în ce măsură pot fi atribuite erorilor aleatorii. Dacă traducem acest lucru în limbajul termenilor tehnici, atunci măsurarea fiabilității testului ne permite să estimăm valoarea varianței totale a indicatorilor de testare, care este variația erorii.Întrebarea, totuși, este ce este considerată variația erorii. Aceiași factori, care sunt străini în raport cu unele probleme, sunt deja considerați surse de diferențe „adevărate” la rezolvarea altor probleme. De exemplu, dacă suntem interesați de fluctuațiile de dispoziție, atunci schimbările de zi cu zi ale rezultatelor unui test de stare emoțională ar putea fi legate de scopul testării și, prin urmare, de adevărata variație a rezultatelor. Dar dacă testul este conceput pentru a măsura caracteristici de personalitate mai stabile, atunci aceleași fluctuații zilnice pot fi atribuite variației erorii.

În mod semnificativ, orice modificare a condițiilor în care este efectuat testul, dacă nu sunt relevante pentru scopul său, crește varianța erorii. Prin urmare, respectând condiții uniforme de testare (controlul mediului general, constrângerile de timp, instruirea subiectului, contactul cu acesta și alți factori similari), experimentatorul reduce varianța erorii și crește fiabilitatea testului. Dar chiar și în condiții optime, niciun test nu este un instrument absolut fiabil. Prin urmare, un set standard de date de testare ar trebui să includă și o măsură a fiabilității. O astfel de măsură caracterizează testul atunci când este aplicat în condiții standard și se efectuează cu subiecți similari celor care au participat la eșantionul normativ. Prin urmare, este necesar să se furnizeze și informații despre acest eșantion.

K. M. Gurevich definește fiabilitatea ca „un concept extrem de complex și multifațetat, una dintre principalele funcții ale căruia este de a evalua constanța rezultatelor testelor” [Gurevich, 1981].

În principiu, putem spune că fiabilitatea ar trebui să justifice eroarea de măsurare - ar trebui să arate cât de mult din variabilitatea indicatorilor este eronată. Există mai mulți factori principali care determină nivelul de fiabilitate. Astfel, fiabilitatea va tinde întotdeauna să crească dacă condițiile procedurii de testare sunt menținute constante, deoarece acest lucru reduce eroarea în variabilitatea parametrului măsurat. La acel moment, multiplicitatea țintelor, complexitatea problemei, variabilitatea situațiilor, de regulă, măresc eroarea de măsurare, reducând astfel fiabilitatea.

Există tot atâtea varietăți de fiabilitate a testului câte condiții există care afectează rezultatele testelor, astfel încât orice astfel de condiții pot fi străine în raport cu obiectivul și apoi

varianța cauzată de acestea ar trebui inclusă în varianța erorii. Cu toate acestea, doar câteva tipuri de fiabilitate își găsesc aplicații practice. Deoarece toate tipurile de fiabilitate reflectă gradul de consistență sau consistență a două serii de indicatori obținuți independent, atunci măsura lor poate fi coeficient de corelație. O discuție mai specifică despre corelarea cu o descriere detaliată a procedurilor de calcul este dată în manualele de statistică pentru profesori și psihologi (V. Avanesov, A. Gusev, Ch. Izmailov, M. Mikhalevskaya și alții).

În practică, sunt utilizate trei metode principale de evaluare a fiabilității testelor:

1) retestare;

2) testare paralelă;

3) metoda de divizare.

Să luăm în considerare fiecare dintre ele separat.

Retestare Este una dintre principalele metode de măsurare a fiabilității. Repetat

testarea unui eșantion de subiecți se efectuează cu același test după un anumit interval de timp în aceleași condiții. Retestarea este denumită în mod obișnuit ca retest, iar fiabilitatea măsurată în acest fel este retest fiabilitatea. Schema de evaluare a fiabilității retestării este următoarea:

În acest caz, coeficientul de corelație dintre rezultatele a două teste este luat ca indice de fiabilitate.

Metoda de retestare are atât avantaje, cât și dezavantaje. Printre avantaje se numără naturalețea și simplitatea determinării coeficientului de fiabilitate. Dezavantajele includ incertitudinea în alegerea intervalului dintre două măsurători. Apariția incertitudinii temporale se datorează faptului că retestarea diferă de cea inițială. Subiecții sunt deja familiarizați cu conținutul testului, își amintesc răspunsurile inițiale și sunt ghidați de aceștia atunci când repetă testul. Prin urmare, în timpul testării repetate, se observă adesea fie „potrivirea” la rezultatele inițiale, fie, ca urmare a negativismului, demonstrarea unor rezultate „noi”. Pentru a evita acest lucru, atunci când se citează fiabilitatea retestării în manualul de testare, ar trebui să indicați intervalului de timp căruia îi corespunde. Datorită faptului că fiabilitatea retestării scade odată cu creșterea intervalului de timp, cei mai fiabili sunt coeficienții mari de fiabilitate obținuți cu intervale clar mari între teste. Factorii de fiabilitate insuficient de mari pot fi rezultatul determinării neoptimale a intervalelor de timp.

Testare paralelăÎn acest caz, multiplicitatea măsurătorilor este organizată folosind teste paralele sau echivalente. Testele paralele sunt cele care măsoară aceeași proprietate a psihicului cu aceeași eroare. În acest caz, aceiași indivizi efectuează mai multe versiuni ale aceluiași test sau teste echivalente. De regulă, utilizarea practică a acestui tip de fiabilitate este asociată cu dificultăți semnificative, deoarece este extrem de dificil să se construiască mai multe variante ale unui test în așa fel încât subiectul să nu poată detecta omogenitatea lor psihologică. Și influența distorsionantă a antrenamentului în acest caz nu este complet eliminată. În plus, se pune întrebarea: tipurile alternative de fiabilitate sunt caracteristici ale fiabilității testului și nu parametri de echivalență a testului? La urma urmei, dacă două forme de testare sunt efectuate în același tip de condiții constante, atunci, cel mai probabil, sunt investigați indicatorii de echivalență a celor două forme de testare, și nu indicatorii fiabilității testelor în sine. Eroarea de măsurare în acest caz este determinată de fluctuațiile în execuția testului și nu de fluctuațiile structurii testului.

Schema de utilizare a testelor paralele pentru a măsura fiabilitatea este următoarea:

Se numește coeficientul de corelație calculat între două teste fiabilitate echivalentă.

metoda de divizare Este o dezvoltare a metodei de testare paralelă și se bazează pe presupunerea paralelismului nu numai a formelor individuale de testare, ci și a sarcinilor individuale în cadrul unui singur test. Acesta este unul dintre cele mai simple teste ale testului, când se calculează coeficientul de corelație dintre jumătățile sale. Cum, atunci, să împărțim testul în două jumătăți pentru a putea alinia ambele jumătăți pe una sau alta bază specifică? Cel mai adesea, sarcinile de testare sunt împărțite în par-impar, ceea ce permite într-o oarecare măsură eliminarea posibilelor deficiențe. Principalul avantaj al acestui tip de fiabilitate este independența rezultatelor testelor față de elemente de activitate precum antrenamentul, antrenamentul, antrenamentul, oboseala etc. La împărțirea testului în două părți, indicele de fiabilitate este calculat conform formulei Spearman-Brown, care l-a propus independent unul de celălalt. Articolele lor au fost publicate în același număr al unei reviste de psihologie cu concluzii și formule [Avanesov , 1982]. În formula lor

R(x, 0=2 RJ\ + R, y

unde R este coeficientul de corelație al celor două jumătăți ale testului. Ca coeficient al indicelui de fiabilitate, se ia în considerare modulul mediu al coeficientului de corelație al tuturor itemilor de testare sau coeficientul mediu de determinare.

Deci, am luat în considerare trei metode empirice de evaluare a fiabilității testelor: retestarea cu același test, retestarea cu o formă paralelă a testului și împărțirea testului.

Care dintre aceste metode oferă o estimare reală a fiabilității unui test? Ce metodă ar trebui folosită? Răspunsul la această întrebare depinde de gusturile personale și de obiectivele studiului.

La utilizarea metodei testării repetate, obținem o estimare a gradului de stabilitate a rezultatelor în timp și în funcție de condițiile de testare. Prin urmare, se mai numește și factorul de fiabilitate a retestării factor de stabilitate sau stabilitate Test. Atunci când se utilizează metoda formelor paralele și metoda despărțirii, se evaluează gradul de consistență reciprocă a părților testului. Prin urmare, factorii de siguranță obținuți prin aceste două metode sunt interpretați ca agitare și omogenitate, omogenitate teste.

Pe lângă indicatorii de stabilitate și omogenitate, R. B. Cattell consideră că este necesar să se ia în considerare indicatorul transferabilitate. Este o evaluare a capacității testului de a menține acuratețea măsurătorilor în diferite eșantioane, subculturi și populații. Împreună, stabilitatea, omogenitatea și portabilitatea formează o caracteristică complexă a fiabilității, pe care R. B. Cattell o numește consistentași definește ca „măsura în care un test continuă să prezică ceea ce a prezis cândva, în ciuda modificărilor (în anumite limite): a) măsura în care testul a fost aplicat; b) conditiile in care a fost aplicat; c) compoziţia probei în care se aplică.

În cele din urmă, există un tip de fiabilitate care este direct legat de fiabilitatea testerului. O estimare a fiabilității testerului este obținută prin simulări de testare independente de către doi experimentatori diferiți.

Fiabilitatea rezultatelor testelor depinde nu numai de fiabilitatea testului în sine și de procedura de efectuare a acestuia. Un factor important care influențează rezultatele interpretării datelor este specificul unui anumit eșantion. Cele mai semnificative caracteristici ale eșantionului, din acest punct de vedere, trebuie recunoscute ca omogenitate socio-psihologică în diverși parametri; De asemenea, se iau în considerare vârsta și sexul.

A. G. Shmelev își propune să efectueze secvența de acțiuni atunci când se verifică fiabilitatea, după cum urmează [Psihodiagnostic general, 1987]:

1. Aflați dacă există date privind fiabilitatea testului propus spre utilizare, asupra cărei populații și în ce situație de diagnostic a fost efectuat testul. Dacă nu a existat un test, sau dacă caracteristicile noii populații și situații sunt clar specifice, retestați fiabilitatea, ținând cont de posibilitățile de mai jos.

2. Dacă este posibil, apoi retestați pe întregul eșantion de standardizare și calculați toți coeficienții dați atât pentru întregul test, cât și pentru itemii individuali. O analiză a coeficienților obținuți va ajuta la înțelegerea cât de neglijabilă este eroarea de măsurare.

3. Dacă posibilitățile sunt limitate, retestați numai pe o parte a eșantionului (cel puțin 30 de subiecți), calculați manual corelația de rang pentru a evalua

consistența (metoda divizării) și stabilitatea întregului test.

Desigur, conceptele considerate ale psihodiagnosticului sunt atributele sale cele mai importante. Cu toate acestea, scorurile ridicate de fiabilitate singure nu determină valoarea practică a testului. Factorul principal care vă permite să măsurați rezultatele țintă ale testării psihologice este validitatea.

Fiabilitatea ca stabilitate

Stabilitatea rezultatelor testelor sau retest reliability (engleză - test-retest reliability) - posibilitatea de a obține aceleași rezultate de la subiecți în cazuri diferite.

Stabilitatea este determinată folosind re-testare (retestare):

În această metodă, se propune efectuarea mai multor măsurători cu o anumită perioadă de timp (de la o săptămână la un an) cu același test. Dacă corelația dintre rezultatele diferitelor măsurători este mare, atunci testul este destul de fiabil. Valoarea cea mai puțin satisfăcătoare pentru fiabilitatea retestării este 0,5. Cu toate acestea, fiabilitatea tuturor testelor nu poate fi testată prin această metodă, deoarece calitatea, fenomenul sau efectul evaluat pot fi în sine instabile (de exemplu, starea noastră de spirit, care se poate schimba de la o măsurare la alta). Un alt dezavantaj al retestării este efectul de dependență. Subiecții sunt deja familiarizați cu acest test și pot chiar să-și amintească majoritatea răspunsurilor de la finalizarea anterioară.

În legătură cu cele de mai sus, se utilizează un studiu al fiabilității metodelor de psihodiagnostic folosind forme paralele, în care se construiesc seturi echivalente sau paralele de sarcini. În acest caz, subiecții efectuează un test complet diferit în condiții similare. Cu toate acestea, există dificultăți în a demonstra că cele două forme sunt într-adevăr echivalente. În ciuda acestui fapt, în practică, formele paralele de teste sunt utile în stabilirea fiabilității testelor.

Fiabilitatea ca consistență internă

Consistenta interna(Engleză - consistență internă) este determinată de legătura fiecărui element specific al testului cu rezultatul general, de măsura în care fiecare element este în conflict cu celelalte, de cât de mult măsoară fiecare întrebare individuală semnul la care întregul testul este dirijat. Cel mai adesea, testele sunt concepute astfel încât să aibă un grad ridicat de consistență internă și datorită faptului că, dacă o variabilă este măsurată printr-o parte a testului, atunci în alte părți, dacă nu sunt în concordanță cu prima , aceeași variabilă nu poate fi măsurată. Astfel, pentru ca un test să fie valid, acesta trebuie să fie consecvent.

Cu toate acestea, există și un punct de vedere opus. Cattell spune că consistența internă ridicată este de fapt opusul validității: fiecare întrebare ar trebui să acopere o zonă mai mică sau să aibă o semnificație mai restrânsă decât criteriul măsurat. Dacă toți itemii sunt foarte consecvenți, ei sunt foarte corelați și, prin urmare, un test de încredere va măsura doar o variabilă relativ „îngustă” cu variații mici. Conform raționamentului lui Cattell, valabilitatea maximă există atunci când toți itemii testului nu sunt corelați între ei, iar fiecare dintre ei are o corelație pozitivă cu criteriul. Cu toate acestea, un astfel de test ar avea o fiabilitate scăzută a consistenței interne.

Pentru a verifica consistența internă, aplicați:

  1. Metoda divizării sau metoda pieselor autonome
  2. Metoda goală echivalentă

Metoda de fiabilitate pe jumătate

Această metodă constă în împărțirea/împărțirea testului în două părți egale (de exemplu, întrebări pare și impare, prima și a doua jumătate), apoi găsirea corelației dintre ele. Dacă corelația este mare, testul poate fi considerat fiabil.

Metoda goală echivalentă

OIE constă în aplicarea a două forme de testare comparabile între ele pentru un eșantion mare (de exemplu, formele L și M pentru măsurarea scalei de inteligență Stanford-Binet).Se compară rezultatele obținute din cele două formulare și se calculează o corelație. Dacă coeficientul de corelație este mare, atunci testul este de încredere. Dezavantajul acestei metode este că implică un proces atât de lung și laborios precum crearea a două forme echivalente.

Alfa lui Cronbach

Această metodă, propusă de Lee Cronbach, compară răspândirea fiecărui element cu răspândirea totală a întregii scale. Dacă răspândirea scorurilor la test este mai mică decât răspândirea scorurilor pentru fiecare întrebare individuală, atunci fiecare întrebare individuală își propune să exploreze același teren comun. Ele produc o valoare care poate fi considerată adevărată. Dacă o astfel de valoare nu poate fi calculată, adică se obține o distribuție aleatorie la răspunsul la întrebări, testul nu este de încredere și alfa lui Cronbach va fi egal cu 0. Dacă toate întrebările măsoară același atribut, atunci testul este de încredere. iar alfa lui Cronbach în acest caz va fi egal cu 1.

calculul lui Cronbach

Cronbach este definit ca

unde este numărul de itemi din scară, este varianța punctajului total la test și este varianța itemului.

O modalitate alternativă de calcul este următoarea:

unde N este numărul de itemi din scară, este varianța medie pentru eșantion, este media tuturor covarianțelor dintre componentele eșantionului.

În prezent, Cronbach este calculat folosind SPSS, STATISTICA și alte pachete statistice moderne, eventual folosind Microsoft Excel.

sensul lui Cronbach

Alfa lui Cronbach va crește în general pe măsură ce corelațiile încrucișate ale variabilelor cresc și, prin urmare, este considerat un marker al consistenței interne în evaluarea validității rezultatelor testelor. Întrucât corelațiile încrucișate maxime dintre variabilele pentru toți itemii sunt prezente dacă se măsoară același lucru, alfa lui Cronbach indică indirect măsura în care toți itemii măsoară același lucru. Astfel, alfa este cel mai potrivit de utilizat atunci când toate elementele au ca scop măsurarea aceluiași fenomen, proprietate, fenomen. Cu toate acestea, trebuie remarcat faptul că o valoare ridicată a coeficientului indică prezența unei baze comune pentru un set de întrebări, dar nu înseamnă că există un singur factor în spatele lor - unidimensionalitatea scării ar trebui confirmată de metode suplimentare.Când se măsoară o structură eterogenă, alfa lui Cronbach va fi adesea scăzută. Astfel, alfa nu este potrivit pentru evaluarea fiabilității instrumentelor în mod deliberat eterogene (de exemplu, pentru MMPI original, în acest caz este logic să se efectueze măsurători separate pentru fiecare scară).

Testele concepute profesional sunt considerate a avea o consistență internă de cel puțin 0,90.

Coeficientul alfa poate fi folosit și pentru a rezolva alte tipuri de probleme. Astfel, poate fi folosit pentru a măsura gradul de consistență al experților care evaluează un anumit obiect, stabilitatea datelor în timpul măsurătorilor multiple etc.

Fundamentul teoretic al lui Cronbach

Alfa lui Cronbach poate fi considerată ca o extensie a lui Cuder-Richardson-20, care este echivalentul pentru a trata dihotomii sau variabile care iau doar două valori (de exemplu răspunsuri adevărat/fals).

Α lui Cronbach este teoretic legat de formula de predicție Spearman-Brown. Și ambele formule decurg din teoria clasică a testului, care constă în faptul că fiabilitatea rezultatelor testului poate fi exprimată ca raportul dintre variațiile scorurilor adevărate și totale (eroarea și scorul adevărat).

Vezi si

Pe lângă fiabilitatea testelor, există și fiabilitatea observației - fiabilitatea inter-observatori. МН este procentul de coincidență a rezultatelor observării experților între ei.

Fiabilitate și valabilitate

Fiabilitatea arată că rezultatele studiului în curs de desfășurare sunt apropiate de adevăr, iar validitatea arată că rezultatele se referă într-adevăr la fenomenul pe care cercetătorul îl studiază. Un studiu valid este automat de încredere, dar invers nu este neapărat cazul. Un studiu de încredere poate să nu fie valabil.

Literatură

Paul Kline. „Ghid de referință pentru proiectarea testelor”, Kiev, 1994.

Legături

  • Fiabilitatea testelor din cartea lui V.S. Kim „Testarea realizărilor educaționale”

Fundația Wikimedia. 2010 .

Fiabilitatea unui test este o măsură a gradului de acuratețe cu care un test măsoară o anumită proprietate sau comportament al unui individ. Fiabilitatea caracterizează testul prin prisma rezistenței sale la interferențe (externe și interne).

Un test este foarte fiabil atunci când testul măsoară cu acuratețe proprietatea pe care intenționează să o măsoare. Următoarele sunt criteriile de acuratețe:

1) La reaplicarea testului la aceiași subiecți, în aceleași condiții, după un anumit interval de timp, rezultatele ambelor teste nu diferă semnificativ unele de altele.

2) Acțiunile factorilor străini aleatoriu nu au un impact semnificativ asupra rezultatelor testelor.

Următorii factori pot fi numiți ca factori străini: starea emoțională și oboseala, dacă nu sunt incluși în gama caracteristicilor studiate, temperatura, iluminarea încăperii și altele. Astfel de factori aleatori străini sunt numiți și factori de instabilitate a procedurii de măsurare.

3) Când testul este repetat la aceiași subiecți, după un anumit interval de timp, în condiții modificate, rezultatele ambelor teste nu diferă semnificativ unul de celălalt. Modificat înseamnă următoarele condiții: alt experimentator, starea respondentului și altele.

Cel mai adesea, fiabilitatea este interpretată în următoarele sensuri:

1) Fiabilitatea instrumentului de măsurare în sine este caracterizată de factorul de fiabilitate. Determinarea empirică a acestui coeficient este o condiție prealabilă pentru admiterea testului pentru utilizarea acestuia în activitățile practice ale unui psiholog. Nivelul de fiabilitate al unui test depinde de:

a) corectitudinea selectării sarcinilor, din punct de vedere al coerenței lor reciproce;

b) Omogenitate internă - actualizare în sarcini de aceeași proprietate;

c) Omogenitatea generală și consistența reciprocă a sarcinilor individuale.

Pentru a verifica fiabilitatea instrumentului de măsurare, care face posibilă aprecierea gradului de omogenitate (omogenitate), este utilizată metoda de împărțire sau împărțire a testului în părți, în care elementele de testare sunt împărțite în pare și impar (uneori prima jumătate și a doua jumătate), procesate separat, iar apoi rezultatele a două serii obținute pe un eșantion reprezentativ sunt corelate între ele, iar măsura fiabilității este coeficientul de corelație calculat prin formula Spearman (vezi 3.1.1) . Tehnica este recunoscută ca fiind fiabilă dacă coeficientul de corelație Spearman (r s) obținut nu este mai mic de +0,75 - +0,85. Dar, în stadiul inițial al dezvoltării testului, puteți obține un coeficient de corelație scăzut - +0,46 - +0,50, ceea ce indică faptul că un număr de elemente de testare au specificitate și ar trebui eliminate din test și procedura repetată. O scădere a coeficientului de fiabilitate poate apărea și ca urmare a eterogenității socio-psihologice a eșantionului pe care a fost testată fiabilitatea testului.


2) Stabilitatea trăsăturii studiate se caracterizează prin coeficientul de stabilitate. Vă permite să judecați cât de stabilă, stabilă este trăsătura, care este măsurată prin această tehnică.

Pentru a măsura stabilitatea unui test se folosește o tehnică cunoscută sub numele de test - un retest, care constă în re-testarea unui eșantion de subiecți cu același test după un anumit interval de timp în aceleași condiții. Intervalul de timp depinde de vârstă (de exemplu, la copiii mici, pot apărea modificări în decurs de o lună), de evenimentele care apar cu subiectul în viață, de conținutul și natura sarcinilor de testare. Odată cu creșterea intervalului de timp în secvența: , stabilitatea caracteristicii tinde să scadă și, prin urmare, cea mai mare problemă este încercarea de a răspunde la întrebarea despre momentul optim de retestare. Cel mai adesea, mulți autori dau perioada dintre prima și testarea repetată pentru adulți ca câteva luni, dar nu mai mult de 6. Pentru copiii mici - câteva săptămâni.

Măsura stabilității testului este coeficientul de corelație dintre rezultatele primelor teste și ale celor repetate la același eșantion de subiecți. Factorul de stabilitate calculat din formula lui Spearman (a se vedea 3.1.1 (r s)) nu trebuie să fie mai mic decât r s = +0,8.

Fiabilitatea testului este unul dintre criteriile pentru calitatea testului, referindu-se la acuratețea măsurătorilor psihologice. Cu cât este mai mare fiabilitatea unui test, cu atât este relativ mai liber de erori de măsurare. Fiabilitatea testului este considerată într-o singură abordare: ca stabilitatea rezultatelor în timpul testării repetate; pe de altă parte, ca manifestare a gradului de echivalență a două teste identice ca formă și scop (paralele).

Fiabilitatea caracterizează testele de proprietăți, dar nu și stările. Proprietăți:

  • 1. Reproductibilitatea rezultatelor studiului.
  • 2. Precizia măsurătorilor.
  • 3. Stabilitatea rezultatelor.

Gradul de fiabilitate al metodelor depinde de mulți factori. Dintre factorii negativi, sunt citați cel mai des următorii:

  • 1. instabilitatea proprietății diagnosticate;
  • 2. imperfecțiunea metodelor de diagnostic (instrucțiunile sunt întocmite neglijent, sarcinile sunt de natură eterogenă, instrucțiunile de prezentare a metodologiei subiecților nu sunt formulate clar etc.);
  • 3. situația în schimbare a examinării (momente diferite ale zilei în care se efectuează experimentele, iluminarea diferită a încăperii, prezența sau absența zgomotului străin etc.);
  • 4. diferențe în comportamentul experimentatorului (de la experiență la experiență el prezintă instrucțiuni diferit, stimulează îndeplinirea sarcinilor în moduri diferite etc.);
  • 5. fluctuații ale stării funcționale a subiectului (într-un experiment se remarcă sănătatea bună, în altul - oboseală etc.);
  • 6. Elemente de subiectivitate în metodele de evaluare și interpretare a rezultatelor (când se consemnează răspunsurile subiecților, răspunsurile sunt evaluate în funcție de gradul de completitudine, originalitate etc.).

K.M. Gurevich interpretează fiabilitatea ca:

  • 1. Fiabilitatea instrumentului de măsurare în sine (factor de fiabilitate);
  • 2. Stabilitatea trăsăturii studiate (coeficient de stabilitate);
  • 3. Constanta, i.e. independenţa relativă a rezultatelor faţă de personalitatea experimentatorului (coeficient de constanţă).

Indicatorul care caracterizează instrumentul de măsurare se propune a fi numit coeficient de fiabilitate; un indicator care caracterizează stabilitatea proprietății măsurate - coeficientul de stabilitate; iar indicatorul de apreciere a influenţei personalităţii experimentatorului – prin coeficientul de constanţă. În această ordine se recomandă verificarea metodologiei: este indicat să se verifice mai întâi instrumentul de măsură. Dacă datele obținute sunt satisfăcătoare, atunci este posibil să se procedeze la stabilirea unei măsuri a stabilității proprietății măsurate și după aceea, dacă este necesar, să se ocupe de criteriul constanței. (Fiabilitate: retestare, forme paralele, părți ale corpului, consistență internă, dispersie factor).

Se spune că o metodă este foarte fiabilă atunci când metoda măsoară cu acuratețe proprietatea pe care intenționează să o măsoare. Următoarele sunt criteriile de acuratețe:

Când metoda este aplicată în mod repetat acelorași subiecți în aceleași condiții după un anumit interval de timp, rezultatele ambelor teste nu diferă semnificativ unul de celălalt.

Acțiunile factorilor străini aleatoriu nu afectează semnificativ rezultatele testului. Următorii factori pot fi numiți ca factori străini: starea emoțională și oboseala, dacă nu sunt incluși în gama caracteristicilor studiate, temperatura, iluminarea încăperii etc. Astfel de factori străini aleatori sunt numiți și factori de instabilitate a procedurii de măsurare.

Când metoda este aplicată în mod repetat acelorași subiecți după un anumit interval de timp în condiții modificate, rezultatele ambelor teste nu diferă semnificativ unul de celălalt. Schimbat înseamnă următoarele condiții: alt experimentator, starea respondentului etc.

Există diferite metode de evaluare a fiabilității:

Metoda retestării - testarea repetată a unui eșantion de subiecți cu același test după un anumit interval de timp în aceleași condiții. Intervalul de timp depinde de vârstă (de exemplu, la copiii mici, pot apărea modificări în decurs de o lună), precum și de evenimentele care apar cu subiectul în viață.

TESTINTERVALRETEST

Coeficientul de corelare dintre rezultatele a două teste este luat ca indice de fiabilitate. Corelația ridicată care rezultă poate fi rezultatul pregătirii subiectului asupra sarcinilor de acest tip; corelația scăzută poate fi rezultatul modificărilor cu subiectul și poate indica, de asemenea, nefiabilitatea testului.

Fiabilitatea formelor interschimbabile - testarea repetată a unui eșantion de subiecți cu o formă paralelă a testului după un interval de timp minim în aceleași condiții.

TEST INTERVALTEST A"

Coeficientul de corelare dintre rezultatele testului a două forme paralele ale testului este luat ca indice de fiabilitate. Un coeficient de corelație ridicat și un interval mare între două teste indică o fiabilitate ridicată a testului.

Posibila înșelăciune din partea subiectului, sofisticarea lui, evenimentele care au avut loc în intervalul dintre teste, nu au un efect special (ca în metoda retestării) asupra gradului de fiabilitate a testului. Dacă factorul de formare este redus la testarea cu forme paralele, atunci are loc adesea efectul de transfer al principiului sarcinilor. Efectul de transfer trebuie luat în considerare la construirea formelor paralele.

Cerințe pentru construirea formelor paralele:

  • 1. Formele paralele trebuie să fie teste construite independent, dar să îndeplinească aceleași cerințe;
  • 2. trebuie să conțină același număr de sarcini cu un grad similar de dificultate;
  • 3. Echivalența formelor paralele trebuie verificată prin metoda retestării.

Definiția constanței, adică relativă independenţă a rezultatelor faţă de personalitatea experimentatorului. Deoarece tehnica este dezvoltată pentru utilizare ulterioară de către alte psihodiagnostice, este necesar să se determine în ce măsură rezultatele ei sunt influențate de personalitatea experimentatorului. Coeficientul de constanță se determină prin corelarea rezultatelor a două experimente efectuate pe aceeași probă, dar de experimentatori diferiți. Coeficientul de corelație nu trebuie să fie mai mic de 0,80.

Vizualizări