4 różnice między rzetelnością a trafnością (w nauce)

Ponieważ w języku potocznym mają one bardzo podobne znaczenie, łatwo pomylić terminy rzetelność i trafność, gdy mówimy o nauce, a konkretnie o psychometrii.

Za pomocą tego tekstu zamierzamy wyjaśnić główne różnice między rzetelnością a trafnością. Mamy nadzieję, że wyjaśnienie tego często zadawanego pytania okaże się przydatne.

Powiązany artykuł: „Psychometria: badanie ludzkiego umysłu poprzez dane"

Co to jest niezawodność?

W psychometrii pojęcie „niezawodność” odnosi się do precyzji instrumentu; W szczególności współczynniki rzetelności informują nas o spójności i stabilności pomiarów wykonanych tym narzędziem.

Im wyższa niezawodność instrumentu, tym mniej przypadkowych i nieprzewidywalnych błędów, które pojawią się podczas używania go do pomiaru pewnych atrybutów. Niezawodność wyklucza błędy przewidywalne, czyli takie, które podlegają kontroli eksperymentalnej.

Zgodnie z klasyczną teorią testów rzetelność to część wariancji, która jest wyjaśniona wynikami prawdziwymi. Zatem bezpośredni wynik w teście składałby się z sumy błędu losowego i wyniku prawdziwego.

instagram story viewer

Dwa główne składniki niezawodności to stabilność czasowa i spójność wewnętrzna. Pierwsza koncepcja wskazuje, że wyniki zmieniają się nieznacznie, gdy są mierzone przy różnych okazjach, podczas gdy Spójność wewnętrzna odnosi się do stopnia, w jakim elementy składające się na test mierzą ten sam konstrukt. psychologiczny.

Dlatego wysoki współczynnik rzetelności wskazuje, że wyniki w teście ulegają niewielkim fluktuacjom wewnętrznie i w funkcji czasu, a krótko mówiąc, że przyrząd jest wolny od błędów pomiarowych.

Możesz być zainteresowany: "Rodzaje testów psychologicznych: ich funkcje i charakterystyka"

definicja ważności

Kiedy mówimy o trafności, odnosimy się do tego, czy test poprawnie mierzy konstrukt, który zamierza zmierzyć. Pojęcie to określa się jako związek między wynikiem uzyskanym w teście a innym powiązanym miernikiem; stopień korelacji liniowej między obydwoma elementami określa współczynnik ważności.

Podobnie w badaniach naukowych wysoka trafność wskazuje na stopień, w jakim wyniki uzyskane za pomocą określonego instrumentu lub w badaniu można uogólnić.

Istnieją różne rodzaje ważności, które zależą od sposobu jej obliczania; Oznacza to, że jest to termin o bardzo różnych znaczeniach. Zasadniczo możemy wyróżnić trafność treściowa, trafność kryterialna (lub empiryczna) i trafność konstrukcyjna.

Trafność treściowa określa, w jakim stopniu pozycje testu psychometrycznego są reprezentatywną próbką elementów składających się na oceniany konstrukt. Instrument musi obejmować wszystkie podstawowe aspekty konstrukcji; Na przykład, jeśli chcemy przeprowadzić adekwatny test do pomiaru depresji, koniecznie musimy uwzględnić pozycje oceniające nastrój i zmniejszoną przyjemność.

Trafność kryterium mierzy zdolność instrumentu do przewidywania aspektów związanych z cechą lub obszarem zainteresowania. Wreszcie, konstrukt trafności ma na celu określić, czy test mierzy to, co ma mierzyć, na przykład ze zbieżności z wynikami uzyskanymi w podobnych testach.

Różnice między rzetelnością a trafnością

Chociaż te dwie właściwości psychometryczne są ze sobą ściśle powiązane, prawda jest taka, że odnoszą się one do wyraźnie zróżnicowanych aspektów. Zobaczmy, na czym polegają te różnice.

1. Przedmiot analizy

Niezawodność jest cechą charakterystyczną instrumentu w tym sensie, że mierzy właściwości elementów, z których się składa. Z drugiej strony, ważność nie odnosi się dokładnie do instrumentu, ale raczej uogólnienia dokonane na podstawie wyników uzyskany dzięki niemu.

2. Informacje, które dostarczają

Chociaż jest to nieco uproszczony sposób ujmowania tego, ogólnie rzecz biorąc, zwykle stwierdza się, że ważność wskazuje, że narzędzie psychometryczny faktycznie mierzy konstrukt, który ma mierzyć, podczas gdy rzetelność odnosi się do tego, czy mierzy go poprawnie, bez błędy.

3. Sposób ich obliczania

Do pomiaru niezawodności stosuje się trzy główne procedury: metoda dwóch połówek, metoda form równoległych i test-retest. Najczęściej stosowana jest procedura dwóch połówek, w której pozycje są dzielone na dwie grupy po udzieleniu odpowiedzi na test; następnie analizowana jest korelacja między dwiema połówkami.

Metoda form równoległych lub alternatywnych polega na stworzeniu dwóch równoważnych testów, aby zmierzyć, w jakim stopniu pozycje są ze sobą skorelowane. Test-retest opiera się po prostu na dwukrotnym zdaniu testu, w możliwie najbardziej zbliżonych warunkach. Obie procedury można łączyć, dając początek testowi-retestowi z równoległymi formami, który polega na pozostawieniu odstępu czasowego między pierwszą formą testu a drugą.

Z drugiej strony ważność oblicza się na różne sposoby w zależności od typu, ale generalnie wszystkie metody opierają się na porównaniu wyniku w teście obiektywnym z innymi danymi uzyskanymi od tych samych osób w odniesieniu do podobnych cech; celem jest, aby test mógł działać jako predyktor cechy.

Wśród metod wykorzystywanych do oceny trafności znajdujemy analizę czynnikową oraz technikę macierzy wielu metod i wielu cech. Podobnie ważność treści jest często określana na podstawie racjonalnej, a nie statystycznej analizy; obejmuje na przykład trafność twarzy, która odnosi się do subiektywnej oceny ekspertów na temat trafności testu.

4. Związek między obydwoma pojęciami

Rzetelność narzędzia psychometrycznego wpływa na jego trafność: im bardziej jest ona wiarygodna, tym większa będzie również jej ważność. Dlatego współczynniki trafności narzędzia są zawsze niższe od współczynników rzetelności, a trafność pośrednio informuje nas o rzetelności.