Klasyczna teoria testów

Klasyczna teoria testów / Psychologia eksperymentalna

Test to instrument naukowy w zakresie, w jakim mierzy to, co zamierza, to znaczy jest poprawny i dobrze mierzy, to znaczy jest precyzyjny lub wiarygodny. Jeśli znajdziemy instrument, którego nie możemy ufać środkom, które zapewniają, ponieważ różnią się one od czasu do czasu, gdy mierzymy ten sam obiekt, to powiemy, że nie jest on wiarygodny. Instrument do pomiaru prawidłowo coś, to musi być precyzyjne, bo inaczej zmierzyć to, co mierzysz, zmierzyć to źle. Dlatego precyzja jest warunkiem koniecznym, ale niewystarczającym. Ponadto musi być ważna, to znaczy dokładnie mierzy to, co ma mierzyć, i nic więcej.

Możesz być także zainteresowany: Teoria odpowiedzi na przedmiot - aplikacje i test

Niezawodność:

Absolutna i względna niezawodność: możemy rozwiązać problem wiarygodności testu na dwa różne sposoby, chociaż w tle są one zbieżne.

Wiarygodność jako niedokładność pomiarów: gdy podmiot odpowiada na test, uzyskuje wynik empiryczny, na który ma wpływ błąd. Gdyby nie było błędu, podmiot uzyskałby swój prawdziwy wynik. Test jest nieprecyzyjny, ponieważ wynik empiryczny nie odpowiada prawdziwemu wynikowi. Ta różnica między wynikami jest błędem próbkowania, błędem pomiaru. The typowy błąd pomiaru będzie odchylenie standardowe błędów pomiaru. The typowy błąd pomiaru wskazuje absolutną dokładność testu, ponieważ pozwala oszacować różnicę między uzyskanym pomiarem a tym, który zostałby uzyskany, gdyby nie było błędu.

Niezawodność jako stabilność pomiarów: test będzie bardziej niezawodny, im bardziej stałe lub stabilne będą wyniki, które zapewnia, gdy jest powtarzany. Im bardziej stabilne są wyniki dwukrotnie, tym większa jest korelacja między nimi. Ta korelacja jest nazywana współczynnik niezawodności. Wyraża to nie ilość błędu, ale spójność testu z samym sobą i stałość oferowanych przez niego informacji. The współczynnik niezawodności wyraża względną wiarygodność testu.

Współczynnik niezawodności i wskaźnik niezawodności: - Współczynnik niezawodności testu to korelacja testu z samym sobą, uzyskana na przykład w dwóch równoległych formach: rxx. - Indeks precyzji jest korelacja między empirycznymi wynikami testu i jego prawdziwymi wynikami: rxv Wskaźnik precyzji zawsze będzie większy niż współczynnik niezawodności. Aby poznać współczynnik niezawodności, te trzy klasyczne metody są warte podkreślenia:

  • Znajdź korelację między testem a jego powtórzeniem: metoda powtarzania lub testowania: polega na dwukrotnym zastosowaniu tego samego testu do tej samej grupy i obliczeniu korelacji między dwiema seriami wyników. Ta korelacja jest współczynnikiem niezawodności. Ta metoda zazwyczaj zapewnia wyższy współczynnik niezawodności niż te uzyskane w innych procedurach i może być zanieczyszczona przez czynniki zakłócające.
  • Znajdź korelację między dwiema równoległymi formami testu: Metoda równoległych form: Przygotuj dwie równoległe formy tego samego testu, tj. Dwie równoważne formy, które dają te same informacje i dotyczą tej samej grupy podmiotów. Korelacja między tymi dwoma formami to współczynnik niezawodności. Dzięki tej metodzie, nie powtarzając tego samego testu, unika się niepokojących źródeł wiarygodności ponownego testu.
  • Znajdź korelację między dwiema równoległymi połówkami testu: Metoda dwóch połówek: Test jest podzielony na dwie równoważne połowy i znaleziono korelację między nimi. Jest to preferowana metoda, ponieważ jest prosta i ignoruje ograniczenia poprzednich procedur. Możesz wybrać nieparzyste elementy testu, aby stanowiły połowę, a parzyste elementy stanowić drugą.

Współczynnik niezawodności i korelacja między testami równoległymi

The współczynnik niezawodności testu wskazuje proporcję, że prawdziwa wariancja ma wariancję empiryczną: grafika33 Współczynnik niezawodności testu waha się od 0 do 1. Na przykład: jeśli korelacja między dwoma równoległymi testami to rxx´ = 0,80, oznacza, że ​​80% wariancji testu wynika z rzeczywistej miary, a reszta, czyli 20% wariancji testu wynika z błędu. The wskaźnik niezawodności testu jest korelacja między jego wynikami empirycznymi a jego wiarygodnym wskaźnikiem wiarygodności = Wskaźnik niezawodności jest równy pierwiastkowi kwadratowemu współczynnika niezawodności

Po opracowaniu dwóch równoległych form testu stosuje się procedurę analizy wariancji w celu sprawdzenia jednorodności wariancji i różnicy między miarami. Jeśli wariancje są jednorodne, różnica między średnimi nie jest znacząca i dwie formy są skonstruowane z taką samą liczbą elementów tego samego typu i treści psychologicznych, można powiedzieć, że są równoległe. Jeśli nie, musisz je zreformować, dopóki nie będą. Brak niezawodności jest identyfikowany z wartością rxx´= 0 4.- Typowy błąd pomiaru: Różnica między wynikiem empirycznym a rzeczywistym jest błędem losowym, zwanym błędem pomiaru. Odchylenie standardowe błędów pomiaru nazywane jest typowym błędem pomiaru. The typowy błąd pomiaru pozwala oszacować bezwzględną wiarygodność testu, czyli oszacować, jak duży błąd pomiaru wpływa na wynik.

Niezawodność i długość: długość testu odnosi się do liczby jego elementów. Niezawodność zależy od tej długości. Jeśli test składa się z trzech elementów, podmiot może raz uzyskać wynik 1, aw innym, lub równolegle, wynik

Z jednej okazji do drugiej wynik różnił się o jeden punkt; punkt powyżej trzech to różnica 33%, duża zmienność. Jeśli badani otrzymają losowe wariacje tego typu, korelacja testu ze sobą lub z dwiema równoległymi formami testu będzie znacznie zmniejszona i nie będzie wysoka. Jeśli test jest znacznie dłuższy, jeśli masz na przykład 100 przedmiotów, podmiot może uzyskać 70 punktów w jednym przypadku i 67 w trybie równoległym. Od jednego do drugiego zmieniło się 3 punkty; jest to stosunkowo mała wariancja w stosunku do całkowitego testu, a konkretnie 3%. Te niewielkie przypadkowe zmiany tej wielkości, które występują w punktacji badanych, przechodząc z jednej formy do równoległej, są stosunkowo nieistotne i nie zmniejszą się tak bardzo, jak przed korelacją między obiema.

Współczynnik niezawodności będzie znacznie wyższy niż w poprzednim przypadku. Równanie Spearmana-Browna wyraża zależność między niezawodnością a długością. Precyzja testu wynosi zero, gdy długość wynosi 0, i wzrasta wraz ze wzrostem długości. Chociaż wzrost jest stosunkowo mniejszy, ponieważ długość tej części jest większa. Oznacza to, że precyzja rośnie na początku i stosunkowo później. Gdy długość ma tendencję do nieskończoności, współczynnik niezawodności ma tendencję

Zwiększając długość testu, zwiększa się jego dokładność, ponieważ zwiększa on prawdziwą wariancję z prędkością wyższą niż wariancja błędu. Oznacza to, że dokładność testu wzrasta, ponieważ zmniejsza się proporcja wariancji spowodowana błędem. Formuła Rulona, ​​a także wzór Flanagana i Guttmana, są szczególnie przydatne przy obliczaniu współczynnika niezawodności metodą dwóch połówek. Są to formuły używane do obliczania współczynnika niezawodności.

Niezawodność i spójność: współczynnik niezawodności można również znaleźć w inny sposób, jest to tzw współczynnik alfa o współczynnik uogólnienia lub reprezentatywności (Cronbach). Ten współczynnik alfa wskazuje dokładność, z jaką niektóre elementy mierzą aspekt osobowości lub zachowania. Można to interpretować jako: Oszacowanie średniej korelacji wszystkich możliwych elementów w pewnym aspekcie. Miara dokładności testu zgodnie z jego spójnością lub wewnętrzną spójnością (wzajemne powiązanie między jego elementami, w jakim stopniu elementy testowe mierzą to samo) i jego długość. Wskazując reprezentatywność testu, czyli ilość, w jakiej próbka elementów, które go tworzą, jest reprezentatywna dla populacji możliwych elementów tego samego typu i treści psychologicznych. The współczynnik alfa odzwierciedla głównie dwie podstawowe koncepcje precyzji testu: 1. Związek między jego elementami: stopień, w jakim wszystkie mierzą to samo.

Długość testu: przy zwiększaniu liczby przypadków próbki i wyeliminowaniu błędów systematycznych próbka reprezentuje populację lepiej niż jest pobierana i jest bardziej nieprawdopodobne, że wystąpi błąd przypadkowy. Jeśli elementy testu są dychotomiczne (tak lub nie, 1 lub 0, zgoda lub niezgodność itp.), Równanie współczynnika alfa jest uproszczone, co daje równania Kuder-Richardson (KR20 i KR21). Biorąc pod uwagę pewną liczbę elementów, test będzie bardziej niezawodny, gdy będzie bardziej jednorodny. Współczynnik alfa mówi nam o niezawodności, ponieważ reprezentuje jednorodność i spójność lub wewnętrzną spójność elementów testu.

Standardy i kryteria niezawodności

Zgodnie z modelem przestrzeni próbnej przedmiotów celem testu jest oszacowanie miary, która zostałaby uzyskana, gdyby wszystkie elementy w przestrzeni próbnej zostały wykorzystane. Miarą tą byłby prawdziwy wynik, do którego rzeczywiste pomiary są mniej więcej przybliżone. W zależności od stopnia, w jakim próbka elementów koreluje z prawdziwymi wynikami, test jest mniej lub bardziej wiarygodny. W tym modelu centralna jest macierz korelacji między wszystkimi pozycjami w przestrzeni próbnej, przy czym ten przykładowy model kładzie większy nacisk na wewnętrzną spójność, a jeśli go osiągnie, pośrednio gwarantuje stabilność..

Liniowy model testów równoległych kładzie większy nacisk na stabilność wyników iw zakresie, w jakim osiąga stabilność, pośrednio sprzyja wewnętrznej spójności. Jeśli zastosujemy test do ustalenia indywidualnych diagnoz i prognoz, współczynnik niezawodności powinien wynosić 0,90. W prognozach i zbiorczych klasyfikacjach to nie tyle wymóg, choć nie jest wygodnie uciec od 0'90 do 0'80.

Czasami w niektórych rodzajach testów, takich jak testy osobowości, trudno jest osiągnąć współczynniki powyżej 0,70. Jeśli równoległe formy lub równoległe połówki są stosowane po mniej więcej dużym odstępie, przypadkowe błędy mogą być liczniejsze niż te, które wpływają na współczynnik alfa. Dzieje się tak, ponieważ to, co redukuje korelację, to nie tylko błędy losowe istotne dla testu i jednorazowe, które uwzględniają współczynnik alfa, ale także wpływają na wszystkie błędy, które mogą wyniknąć z dwóch różnych sytuacji , które mogą się różnić w wielu szczegółach. Dlatego współczynnik alfa jest zazwyczaj większy niż inne współczynniki.

Z wyjątkiem współczynnika znalezionego przez powtórzenie tego samego testu, ponieważ istnieje większe prawdopodobieństwo, że losowe błędy pierwszej aplikacji są powtarzane w drugiej i zamiast zmniejszania korelacji między nimi, zwiększ je. Należy upewnić się, że druga aplikacja jest całkowicie niezależna od pierwszej. Jeśli to osiągniemy, będzie to najłatwiejsza i najtańsza metoda i wskazana przy ocenie stabilności wyników, szczególnie w długich okresach czasu i przy złożonych testach. > Dalej: Ważność testów

Ten artykuł ma charakter czysto informacyjny, w psychologii internetowej nie mamy zdolności do diagnozowania ani zalecania leczenia. Zapraszamy do pójścia do psychologa, aby w szczególności zająć się twoją sprawą.

Jeśli chcesz przeczytać więcej artykułów podobnych do Klasyczna teoria testów, Zalecamy wejście do naszej kategorii psychologii eksperymentalnej.