Ważność testu
Jeśli test jest używany do tego, co jest zamierzone, mówimy, że jest ważny. Na przykład a test inteligencji Jest ważny, jeśli mierzy inteligencję. Niezawodność to stopień, w jakim narzędzie oceny zapewnia stabilne i spójne wyniki. Cniezawodność testów jest miarą wiarygodności uzyskaną przez podanie tego samego testu dwa razy w ciągu okresu grupie osób.
Możesz być także zainteresowany: Klasyczna teoria testuWażność testów
Testy są ważne w zakresie, w jakim mierzą, co powinny mierzyć. Możemy odróżnić pozorną ważność od udowodnionej ważności:
- Widoczna ważność : odnosi się do stopnia, w jakim test wydaje się mierzyć to, co chcesz zmierzyć.
- Sprawdzona ważność : jest to ten, który został zweryfikowany w jakiś empiryczny lub eksperymentalny sposób. Sprawdzona ważność jest empiryczna lub teoretyczna.
- Ważność empiryczna : jest empiryczny, gdy został udowodniony w praktyczny sposób. Na przykład test wyboru kierowców jest ważny, jeśli odróżnisz dobro od złych kierowców, mimo że nie wiesz dokładnie, dlaczego je dostałeś.
- Ważność teoretyczna: odzwierciedla stopień, w jakim udowodniono za pomocą naukowych argumentów, że test mierzy właściwość lub cechę, którą próbuje zmierzyć.
Na przykład test inteligencji będzie miał teoretyczną ważność, gdy jest na to dowód oparty na logicznej i eksperymentalnej weryfikacji.
- Pozorna ważność: test ma widoczną ważność, jeśli wydaje się, że mierzy to, co próbuje zmierzyć. Nie jest to wystarczająca trafność, choć często jest to konieczne. Wiele razy wygodne jest, że test wydaje się ważny dla osób, które muszą na nie odpowiedzieć. Przy innych okazjach konieczne jest, aby test nie mierzył tego, co mierzy. Jest to pierwszy wymóg skutecznej ważności. Aby to osiągnąć, nie wystarczy, że test wydaje się ważny, należy sprawdzić, czy tak jest.
- Sprawdzona ważność: Skuteczna ważność jest potwierdzona ważnością. Istnieje wiele sposobów udowodnienia ważności, niektóre są empiryczne, a inne logiczno-eksperymentalne..
- Ważność empiryczna lub kryterium: test ma empiryczną ważność, jeśli udowodniono, że służy on pewnym praktycznym celom. Na przykład test jest ważny, aby wybrać kierowców, jeśli rozróżnisz różne stopnie doświadczenia w prowadzeniu pojazdu.
The ważność empiryczna nazywa się to również ważność kryterium, i aby to sprawdzić, należy określić zewnętrzne kryterium ważności. W omawianym przykładzie zewnętrznym kryterium jest doświadczenie w prowadzeniu pojazdu. The współczynnik ważności testu jest to korelacja między testem a kryterium. Jeśli najlepszymi w teście są te, które prowadzą lepiej, test będzie miał wysoki współczynnik ważności w odniesieniu do tego kryterium, a my będziemy mieć empirycznie ważny test, aby wybrać kierowców.
Ta ważność jest naukowo ślepa, ponieważ nie wiemy, na jakiej podstawie opiera się test. Test jest ważny dla wybranych kierowców, nie wiemy dlaczego. Ważność empiryczna może być sklasyfikowana jako:
- Potencjalna lub prognostyczna trafność lub rokowanie: Jest to ta, która jest weryfikowana przez korelację między testem a kryterium mierzonym później. Na przykład, jeśli mamy wielu aspirujących pilotów i chcemy wybrać tych, którzy są bardziej skłonni, by po studiach i ćwiczeniach zdobyć dobrych pilotów. Możemy zastosować pewne testy, które doceniają wymagania bycia dobrym kierowcą i przyjmują wszystkich kandydatów. Po studiach i odpowiednich praktykach zmierzymy przedmioty w kryterium, które gwarantuje, że będziemy dobrym pilotem. Jeśli testy, na które odpowiedzieli badani w chwili przyjęcia, mają wysoką korelację ze umiejętnościami pilota, mierzonymi po nauce, być może lata później, można stwierdzić, że te testy mają wysoką perspektywiczną trafność. Ważność ta została nazwana trafnością prospektywną, predykcyjną i prognostyczną, ponieważ umożliwia przewidywanie lub wygodne przewidywanie wyników przedmiotów w kryterium, służy do wyboru kandydatów, którzy najprawdopodobniej są dobrymi pilotami.
- Ważność kontrolna lub towarzysząca lub równoczesna: Weryfikacja ważności jest zazwyczaj zbyt kosztowna, aby ją przetestować; Zazwyczaj wykracza to poza praktyczne możliwości psychologa. Z tego powodu często stosuje się metodę kontroli, współistnienia lub jednoczesnej ważności. Jest taki sam jak poprzednia procedura, ale testy i kryterium są mierzone w tym samym czasie lub jednocześnie. Na przykład wybrana jest próbka pilotów na czas, stosowane są odpowiednie testy i są one mierzone według kryterium umiejętności. Współczynnik współistnienia będzie korelacją między testami a kryterium. Informuje nas, w jakim stopniu dobre i złe w teście są w tym momencie dobre i złe w kryterium. Nie gwarantuje to, że kandydaci z najlepszymi wynikami w testach będą najlepszymi pilotami.
- Retrospektywna ważność: Jest to korelacja między testami, zastosowana w pewnym momencie, a kryterium, które zostało zmierzone przed, być może, lata wcześniej. Jego celem jest przewidzenie przeszłego kryterium, aby dowiedzieć się z obecnych czynników i warunków, które w przeszłości miały wpływ na badanych, i które wyjaśniają niektóre z obecnych cech badanych.
- Ważność teoretyczna: test ma trafność teoretyczna Jeśli mierzysz to, co zamierzasz zmierzyć.
Ilość, w jakiej jest mierzona, jest wskazywana przez logiczne i eksperymentalne argumenty, które odpowiadają jego relacji do wewnętrznego kryterium. Istnieje kilka typów poprawności teoretycznej i są one następujące
- Ważność treści lub próbki : Głównie odnosi się do testów wydajności, wiedzy lub kompetencji zawodowych. Na przykład test pisowni jest ważny, jeśli jego treść jest odpowiednia. Aby sprawdzić tę ważność, zostanie sprawdzone pole ortografii i zostanie sprawdzone, czy elementy składające się na test są bezstronną i wystarczającą próbką tego pola. Tego typu ważności nie można określić w żadnej korelacji. Wyraża związek między testem a wewnętrznym kryterium utworzonym przez podmiot, którego dotyczy test. Stosunek będzie wyższy, ponieważ cały przedmiot jest lepiej reprezentowany przez test. Tę ważność osiąga się, ponieważ istnieją gwarancje, że różne aspekty pewnej dziedziny wiedzy lub umiejętności, które próbują zmierzyć, zostały jasno określone. Kryteria ważności próbki testu wskazują, że nie reprezentuje ona odpowiednio pola, do którego się odnosi.
- Poprawność konstrukcji lub konceptualna : Polega na sprawdzeniu, zgodnie z metodologią badań naukowych, że test mierzy zmienną, do której się odnosi. Celem jest zagwarantowanie naukowo, że zmienna, którą test próbuje zmierzyć, jest dopuszczalną zmienną, której koncepcja ma wystarczającą spójność logiczną w teoretycznym systemie psychologii i jest poparta wystarczającymi weryfikacjami eksperymentalnymi, które ją sprawdzają. Na przykład, przed zaoferowaniem ważnego testu do pomiaru inteligencji, konieczne będzie wyjaśnienie, co to jest inteligencja, którą test próbuje zmierzyć.
- Ważność czynnikowa: Występuje, gdy różne testy są skorelowane z określoną cechą, a następnie poddane relacji silni.
- Zgodna ważność: Jeśli mierzymy różne zmienne za pomocą testów tego samego typu, testy odnoszące się do zmiennej muszą mieć ze sobą wyższe korelacje niż testy z innymi zmiennymi..
- Ważność dyskryminacyjna: Jeśli mierzymy różne zmienne za pomocą testów tego samego typu i tej samej zmiennej z testami różnych typów, te testy różnych typów odnoszące się do tej samej zmiennej muszą mieć większe korelacje niż testy tego samego typu, które odnoszą się do do różnych zmiennych.
- Ważność strukturalna: Jest to stopień, w jakim test mierzy opracowanie lub cechę teoretyczną. Wszelkie dane, które dają pewne informacje o naturze rozważanej cechy i warunkach, które wpływają na jej rozwój i manifestacje, są przydatne dla tego typu ważności.
Ten artykuł ma charakter czysto informacyjny, w psychologii internetowej nie mamy zdolności do diagnozowania ani zalecania leczenia. Zapraszamy do pójścia do psychologa, aby w szczególności zająć się twoją sprawą.
Jeśli chcesz przeczytać więcej artykułów podobnych do Ważność testu, Zalecamy wejście do naszej kategorii psychologii eksperymentalnej.