4 różnice między rzetelnością a trafnością (w nauce)
Ponieważ w języku potocznym mają bardzo podobne znaczenia, łatwo jest pomylić terminy rzetelności i trafności, gdy mówimy o nauce, a konkretnie o psychometrii..
Z tym tekstem zamierzamy wyjaśnić główne różnice między niezawodnością a trafnością. Mam nadzieję, że przydatne będzie wyjaśnienie tej powszechnej wątpliwości.
- Powiązany artykuł: „Psychometria: badanie ludzkiego umysłu poprzez dane”
Czym jest niezawodność?
W psychometrii pojęcie „niezawodność” odnosi się do dokładności instrumentu; W szczególności współczynniki niezawodności informują nas o spójności i stabilności działań podejmowanych za pomocą tego narzędzia.
Im większa niezawodność instrumentu, tym mniejsza liczba losowych i nieprzewidywalnych błędów, które pojawią się podczas używania go do pomiaru pewnych atrybutów. Niezawodność wyklucza przewidywalne błędy, czyli te, które podlegają kontroli eksperymentalnej.
Zgodnie z klasyczną teorią testów, niezawodność jest proporcją wariancji, która jest wyjaśniona przez prawdziwe wyniki. Zatem bezpośredni wynik w teście składałby się z sumy błędu losowego i wyniku rzeczywistego.
Dwa główne składniki niezawodności są one tymczasową stabilnością i wewnętrzną spójnością. Pierwsza koncepcja wskazuje, że wyniki zmieniają się nieznacznie, gdy są mierzone przy różnych okazjach, podczas gdy wewnętrzna spójność odnosi się do stopnia, w jakim elementy tworzące test mierzą ten sam psychologiczny konstrukt.
Dlatego wysoki współczynnik wiarygodności wskazuje, że wyniki testu zmieniają się nieznacznie wewnętrznie i w funkcji czasu, a w skrócie, że instrument nie ma błędów pomiaru.
- Może jesteś zainteresowany: „Rodzaje testów psychologicznych: ich funkcje i cechy”
Definicja ważności
Kiedy mówimy o ważności, odnosimy się do tego, czy test poprawnie mierzy konstrukcję, którą zamierza zmierzyć. Ta koncepcja jest zdefiniowana jako związek między wynikiem uzyskanym w teście a innym powiązanym środkiem; stopień korelacji liniowej między obydwoma elementami określa współczynnik ważności.
Również w badaniach naukowych wysoka trafność wskazuje stopień, w jakim wyniki uzyskane za pomocą danego instrumentu lub badania mogą być uogólnione.
Istnieją różne rodzaje ważności, które zależą od sposobu ich obliczania; to sprawia, że jest to termin o bardzo różnych znaczeniach. Zasadniczo możemy rozróżnić trafność treści, kryterium ważności (lub empiryczne) i trafność konstrukcji.
Ważność treści określa, w jakim stopniu elementy testu psychometrycznego stanowią reprezentatywną próbkę elementów składających się na oceniany konstrukt. Instrument musi zawierać wszystkie podstawowe aspekty konstrukcji; Na przykład, jeśli chcemy przeprowadzić odpowiedni test do pomiaru depresji, musimy koniecznie uwzględnić elementy, które oceniają stan umysłu i spadek przyjemności..
Ważność kryteriów mierzy zdolność instrumentu do przewidywania aspektów związanych z cechą lub obszarem zainteresowania. Wreszcie, zamierzona jest poprawność konstrukcji Określ, czy test mierzy to, co zamierzasz zmierzyć, na przykład z konwergencji z wynikami uzyskanymi w podobnych testach.
Różnice między niezawodnością a trafnością
Chociaż te dwie właściwości psychometryczne są ściśle ze sobą powiązane, prawda jest taka, że odnoszą się do wyraźnie zróżnicowanych aspektów. Zobaczmy, jakie są te różnice.
1. Przedmiot analizy
Niezawodność jest cechą instrumentu, w tym sensie, że mierzy właściwości przedmiotów, które go zawierają. Z drugiej strony ważność nie odnosi się dokładnie do instrumentu, ale do uogólnień, które wynikają z wyników uzyskane dzięki temu.
2. Informacje, które dostarczają
Chociaż jest to nieco uproszczony sposób podejścia, zwykle stwierdza się, że trafność wskazuje, że narzędzie psychometryczne faktycznie mierzy konstrukt, który zamierza zmierzyć, podczas gdy niezawodność odnosi się do tego, czy mierzy go poprawnie, bez błędów.
3. Sposób ich obliczania
Trzy procedury są zasadniczo stosowane do pomiaru niezawodności: metoda dwóch połówek, jedna z równoległych form i test-powtórzenie. Najczęściej używana jest procedura dwóch połówek, w której elementy są dzielone na dwie grupy po odebraniu testu; następnie analizowana jest korelacja między dwiema połowami.
Metoda równoległych lub alternatywnych form polega na stworzeniu dwóch równoważnych testów do pomiaru, w jakim stopniu korelują one między sobą pozycje. Test-test polega po prostu na zdaniu testu dwa razy, w warunkach jak najbardziej zbliżonych. Obie procedury można łączyć, dając początek testowi-testowi z równoległymi formami, który polega na pozostawieniu przedziału czasowego między pierwszą formą testu a drugą.
Z drugiej strony ważność jest obliczany na różne sposoby w zależności od typu, ale ogólnie wszystkie metody opierają się na porównaniu wyniku w teście obiektywnym i innych danych tych samych podmiotów w odniesieniu do podobnych cech; celem jest to, że test może działać jako predyktor cechy.
Wśród metod stosowanych do oceny trafności znajdujemy analizę czynnikową i technikę macierzy z wieloma metodami i wieloma cechami. Ważność treści jest często określana przez racjonalne, nie statystyczne analizy; na przykład obejmuje pozorną ważność, która odnosi się do subiektywnej oceny ekspertów dotyczącej ważności testu.
4. Związek między obiema koncepcjami
Rzetelność instrumentu psychometrycznego wpływa na jego ważność: im jest bardziej niezawodny, tym większa jest jego ważność. Dlatego współczynniki ważności narzędzia są zawsze niższe niż współczynniki niezawodności, a ważność pośrednio informuje nas o niezawodności.