Teoria odpowiedzi na przedmiot - Aplikacje i test

W zakresie Teoria testów psychometrycznych Pojawiły się różne denominacje, które obecnie przybierają nazwę „Teoria odpowiedzi na przedmiot” (F.M. Lord, 1980). To określenie przedstawia pewne różnice w stosunku do modelu klasycznego: 1. - relacja między wartością oczekiwaną wyników podmiotu a cechą (cechą odpowiedzialną za wartości) nie jest zwykle liniowa. 2.- ma na celu dokonywanie indywidualnych prognoz bez konieczności odwoływania się do cech grupy normatywnej.

Możesz być także zainteresowany: Classical Test Theory Index

Teoria odpowiedzi na element lub modele cechy ukrytej w teorii testów
Modele teorii odpowiedzi przedmiotu (tri)
Estymacja parametrów
Konstrukcja testowa
Zastosowania teorii odpowiedzi przedmiotu
Interpretacja wyników

Teoria odpowiedzi na element lub modele cechy ukrytej w teorii testów

Widzimy zatem, że ta teoria odpowiedzi na przedmiot zapewnia możliwość oddzielnego opisywania zarówno przedmiotów, jak i jednostek; Uważa również, że odpowiedź udzielona przez podmiot zależy od poziomu umiejętności, który znajduje się w rozpatrywanym zakresie. Źródłem tych modeli jest Lazarsfeld, 1950, który wprowadził termin „ukryta cecha” .

Stąd uważa się, że każda osoba ma indywidualny parametr, który jest odpowiedzialny za cechy podmiotu, zwane także „cechą”. Ta cecha nie jest bezpośrednio mierzalna, dlatego parametr indywidualny nazywany jest zmienną ukrytą. Podczas stosowania testów można uzyskać dwie różne rzeczy, prawdziwy wynik i skalę sprawności; Osiąga się to, jeśli przekażemy dwa testy tej samej sprawności tej samej grupie.

W teorii cech ukrytych lub teorii odpowiedzi na przedmiot Prawdziwy wynik to wartość oczekiwana na podstawie zaobserwowanego wyniku. Według Pana prawdziwy wynik i sprawność są tym samym, ale wyrażone w różnych skalach pomiaru.

Modele teorii odpowiedzi przedmiotu (tri)

Modele błędów dwumianowych: zostały wprowadzone przez Lorda (1965), który zakłada, że obserwowany wynik odpowiada liczbie poprawnych odpowiedzi uzyskanych w teście (których przedmioty mają wszystkie te same trudności i mają lokalną niezależność, to znaczy, że prawdopodobieństwo na odpowiedź poprawnie na przedmiot nie mają wpływu odpowiedzi udzielone na inne przedmioty).

Modele Poissona: modele te są odpowiednie dla tych testów, które mają dużą liczbę elementów iw których prawdopodobieństwo prawidłowej lub niepoprawnej odpowiedzi jest małe. Z kolei w tej grupie mamy różne modele:

Poissoński model Rascha, których hipotezy są następujące: każdy test ma dużą liczbę elementów binarnych niezależnych lokalnie. prawdopodobieństwo błędu w każdym elemencie jest niewielkie. Prawdopodobieństwo popełnienia błędu przez podmiot zależy od dwóch rzeczy: trudności testu i zdolności podmiotu. addytywność trudności, rozumiana jako wynik mieszania dwóch równoważnych testów w jednym teście, którego trudność jest sumą trudności dwóch początkowych testów.
Model Poissona do oceny prędkości: Model ten został również zaproponowany przez Rascha i został scharakteryzowany, ponieważ uwzględnia się szybkość wykonywania testu. Model można zaproponować na dwa sposoby: policzyć liczbę popełnionych błędów i liczbę słów odczytanych w jednostce czasu. policz liczbę popełnionych błędów i czas poświęcony na zakończenie czytania tekstu. Prawdopodobieństwo realizacji pewnej liczby słów w teście (i) przez podmiot (j), przez pewien czas (t)
Ojiva Normalne modele: jest modelem zaproponowanym przez Pana (1968), który jest używany w testach z elementami dychotomicznymi i tylko jedną zmienną wspólną. Jego wykres byłby następujący: Podstawowe założenia charakteryzujące ten model to:

przestrzeń ukrytego wariantu jest jednowymiarowa (k = 1).
lokalna niezależność między intemami.
metryka zmiennej ukrytej może być wybrana tak, aby krzywa każdego elementu była normalną głowicą.

Modele logistyczne; Jest to model bardzo podobny do poprzedniego, ale ma również więcej zalet w porównaniu z jego matematycznym traktowaniem. Funkcja logistyczna ma następującą postać: Istnieją różne modele logistyczne w zależności od liczby parametrów, które mają:

2-parametrowy model logistyczny, Birnbaum 1968, wśród jego cech charakterystycznych wspominamy, że jest on jednowymiarowy, istnieje lokalna niezależność, elementy są dychotomiczne itd.
3-parametrowy model logistyczny, Panie, charakteryzuje się tym, że prawdopodobieństwo trafienia przez wróżenie jest czynnikiem, który wpłynie na wykonanie testu. 4.3. 4-parametrowy model logistyczny: model zaproponowany przez McDonald 1967 i Barton-Lord w 1981 r., Którego celem jest wyjaśnienie przypadków, w których osoby o wysokim poziomie sprawności nie reagują prawidłowo na przedmiot.
Logistyczny model Rascha: Ten model jest tym, który wygenerował największą liczbę zadań, mimo że ma wadę, to jest, że jego dostosowanie do rzeczywistych danych jest trudniejsze, ale w przeciwieństwie do tego zaletą, która sprawia, że jest tak używana, jest to, że nie wymaga dużych Rozmiary próbek do regulacji.

Estymacja parametrów

Najczęściej stosowaną metodą jest Maksymalne Prawdopodobieństwo, obok tej metody stosowane są procedury aproksymacji numerycznej, takie jak Newton-Raphson i Scoring (Rao). Metoda największej wiarygodności opiera się na zasadzie uzyskiwania estymatorów nieznanych parametrów, które maksymalizują prawdopodobieństwo uzyskania wspomnianych próbek. Oprócz Maksymalnego prawdopodobieństwa wykorzystywana jest również estymacja Bayesa, oparta na twierdzeniu Bayesa, która polega na włączeniu wszystkich znanych informacji, a priori, które są istotne dla procesu wnioskowania. Bardziej dogłębna analiza metody bayesowskiej do oceny parametrów sprawnościowych jest przeprowadzona przez Birnbauma (1996) i Owena (1975). .

FUNKCJE INFORMACYJNE

Najlepszym testem, który można skonstruować, jest ten, który dostarcza najwięcej informacji na temat cechy ukrytej. Kwantyfikacja tych informacji odbywa się poprzez „funkcje informacyjne”. Formuła funkcji informacyjnej Birnbaum 1968 jest następująca: Należy wziąć pod uwagę, że informacje uzyskane w teście są sumą informacji o każdym elemencie, poza tym wkład każdego przedmiotu nie zależy od reszty elementów które składają się na test. Ogólnie można powiedzieć, że informacje we wszystkich modelach:

zależy od poziomu sprawności.
Im większe nachylenie krzywej, tym więcej informacji.
zależy od wariancji wyników, im jest to wyższe, tym mniej informacji.

Konstrukcja testowa

Pierwsze zadanie a jednym z najważniejszych w czasie konstruowania testu jest wybór elementów, poprzedni akord założeń teoretycznych, które muszą określać cechę, którą test ma mierzyć. Pojęcie „analiza przedmiotu” odnosi się do zestawu formalnych procedur przeprowadzanych w celu wybrania tych elementów, które ostatecznie utworzą test. Informacje, które są uważane za najbardziej istotne w odniesieniu do tych pozycji, są następujące:

Trudność przedmiotu, procent osób, które na niego odpowiedzą.
Dyskryminacja, korelacja każdej pozycji z całkowitym wynikiem testu.
Rozproszenie lub analiza błędów, ich wpływ jest istotny, wpływa na trudność przedmiotu i powoduje niedoszacowanie wartości dyskryminacji.

W momencie ustanawiania wskaźników różnych indeksów zazwyczaj używane są statystyki lub indeksy, przy czym najczęściej używane są następujące:

Indeks trudności Indeks dyskryminacja Indeks niezawodności Wskaźnik ważności Znane indeksy, które należy wziąć pod uwagę przy wyborze elementów, które będą stanowić test, zobaczymy, jakie kroki są niezbędne do skonstruowania testu:

Specyfikacja problemu.
Wymień szeroki zestaw elementów i debuguj je.
Wybór modelu.
Przetestuj wstępnie wybrane elementy.
Wybierz najlepsze przedmioty.
Przestudiuj cechy testu
Ustal normy interpretacji uzyskanego końcowego testu.

Z poprzednich punktów należy zauważyć, że wybór modelu, punkt 3, będzie zależał od celów testowanych, cech i jakości danych oraz dostępnych zasobów. Kiedy model jest wybrany, biorąc pod uwagę teoretyczne warunki, w jakich może być zastosowany, nie pomimo swoich zalet muszą być analizowane w każdym przypadku iw szczególnych okolicznościach. Właściwości, które można przypisać do tych modeli, które tworzą Teoria odpowiedzi na przedmiot (TRI), Mogą na nie wpływać:

wymiarowość testu rzadka dostępność próbki brak zasobów komputerowych Istnieje wiele preferencji podczas korzystania z jednego lub innych modeli, zobaczmy je: normalne modele głowic nie są zwykle używane w aplikacjach, ich wartość jest teoretyczna.
Rasch: nadaje się do porównania poziomego (porównywalne testy na poziomach trudności z podobnymi rozkładami sprawności). mieć różne formy tego samego testu. * 2 i 3 parametry: to te, które najlepiej pasują do różnych problemów.
wykryć błędne wzorce odpowiedzi. do pionowego wyrównania testów (porównaj testy o różnych poziomach trudności i różnych rozkładach sprawności).

1 i 2 parametry:

nadaje się do zbudowania jednej skali, dzięki czemu można porównać umiejętności na różnych poziomach.

Na wybór modelu, oprócz zamierzonego celu, może mieć wpływ wielkość próbki; W przypadku, gdy próbka jest duża i reprezentatywna, nie będzie problemu ani z modelem klasycznym, ani z cechą ukrytą. Ale w TRI ( teoria odpowiedzi na przedmiot ) mała próbka zmusza do wyboru modeli o małej liczbie parametrów, nawet modelu uniparameter.

Zastosowania teorii odpowiedzi przedmiotu

Zobaczmy, jakie są najczęstsze zastosowania: a) Wyrównanie testów, czasami konieczne jest powiązanie wyników uzyskanych w różnych testach, z dwoma możliwymi celami:

Korekcja pozioma: dąży się do uzyskania różnych form tego samego testu.
Wyrównanie pionowe: celem jest zbudowanie jednej skali umiejętności o różnych poziomach trudności. Jeśli chodzi o wyrównywanie testów, Lord (1980) wprowadza pojęcie „równości”, co oznacza, że dla każdego przedmiotu dwa testy mogą być wymienne, ponieważ stosuje się, że jeden lub drugi nie zmieni poziomu umiejętności, który został oszacowany. dla tematu.

Badanie stronniczości przedmiotu jest wypaczone, gdy średnio daje znacząco różne wyniki w określonych grupach, które są uważane za część tej samej populacji.

Testy dostosowane lub średnie , Dzięki TRI można skonstruować zindywidualizowane testy, które pozwolą w bardziej precyzyjny sposób określić prawdziwą wartość danej cechy. Elementy będą administrowane sekwencyjnie, ustawienie jednego lub drugiego elementu będzie zależało od odpowiedzi podanych powyżej. Istnieją różne rodzaje dostosowanych testów, zwracamy uwagę na następujące:

procedura dwuetapowa, Lord 1971; Bertz i Weiss 1973 - 1974. Pierwszy test jest zaliczany jako pierwszy i w zależności od wyników podawany jest drugi test.
Procedura w kilku etapach, jest taka sama jak poprzednia, tylko proces obejmuje więcej etapów.
Naprawiono model rozgałęzienia, Lord 1970, 1971, 1974; Mussio 1973. Wszyscy badani rozwiązują ten sam przedmiot, w zależności od odpowiedzi, zestaw przedmiotów zostaje rozwiązany.
Zmienny model rozgałęziony opiera się na niezależności między elementami i właściwościami estymatorów największej wiarygodności.

Bank przedmiotów, Posiadanie dużego zestawu elementów poprawi jakość testu, ale w tym celu elementy muszą najpierw przejść proces debugowania. Aby sklasyfikować przedmioty, należy wziąć pod uwagę, która funkcja ma mierzyć test, że ten element będzie częścią.

Interpretacja wyników

Wagi: jego celem jest zaoferowanie kontinuum do porządkowania, klasyfikowania lub określania, jaka jest względna wielkość ocenianej cechy; pozwoli to ustalić różnice i podobieństwa między ludźmi w odniesieniu do tej cechy. Skale używane w psychologii to: nominalna, porządkowa, interwał i przyczyna; skale te są skonstruowane na podstawie wyników testów, wyników zwanych „wynikami bezpośrednimi” .

Wpisz : aby opisać test, należy przekształcić bezpośrednie wyniki w inne, które można łatwo zinterpretować, ponieważ typowy wynik ujawni pozycję podmiotu w odniesieniu do grupy i pozwoli nam dokonać porównań wewnątrz i międzyosobniczych. Istnieją dwa typy pisania:

Liniowy, zachowaj kształt rozkładu i nie modyfikuj rozmiaru korelacji.
Nieliniowe nie zachowują rozkładu ani wielkości korelacji .

SKALA APTITUDE W TRI budowana skala jest skalą odpowiadającą poziomom sprawności; Skala ta jest scharakteryzowana, ponieważ szacunki i odniesienia są dokonywane bezpośrednio w odniesieniu do zdolności i jej skali. Ponadto ta zdolność, która jest szacowana, zależy tylko od kształtu krzywej charakterystycznej przedmiotów. W możliwych skalach wskazujemy dwa:

Skala, zaproponowana przez Woodcocka (1978) i zdefiniowana przez następujący wzór:
Skala WITS, zaproponowana przez Wrighta (1977), ta skala jest modyfikacją poprzedniej i wynika z następującej zależności:

Ten artykuł ma charakter czysto informacyjny, w psychologii internetowej nie mamy zdolności do diagnozowania ani zalecania leczenia. Zapraszamy do pójścia do psychologa, aby w szczególności zająć się twoją sprawą.

Jeśli chcesz przeczytać więcej artykułów podobnych do Teoria odpowiedzi na przedmiot - Aplikacje i test, Zalecamy wejście do naszej kategorii psychologii eksperymentalnej.

« Teoria systemów otwartych - definicja i cechy Teoria Michaela Tomasello, co czyni nas ludźmi? »