Надежность в психометрии: что это такое и как ее оценивают в тестах

Если вы изучали психологию или другие родственные профессии, концепция надежности наверняка вам знакома. Но... Из чего именно он состоит? Надежность в психометрии - это качество или свойство измерительных инструментов. (например, тесты), что позволяет проверить точность, согласованность и стабильность результатов измерений.

В этой статье мы расскажем, из чего состоит это свойство, приведем несколько примеров для пояснения. концепцию, и мы объясняем различные способы расчета коэффициента надежности в психометрии.

Статья по теме: "Психометрия: что это такое и за что отвечает?"

Что такое надежность в психометрии?

Надежность - это понятие, охватываемое психометрикой, дисциплиной, отвечающей за измерение психологических переменных человека с помощью различных техник, методов и инструментов. Таким образом, надежность в психометрии, должна быть избыточность, состоит из психометрического свойства, которое подразумевает отсутствие погрешностей измерения определенного инструмента (например, тест).

Он также известен как степень согласованности и стабильности оценок, полученных в разных измерениях с помощью одного и того же инструмента или теста.

instagram story viewer

Другой синоним надежности в психометрии - «точность».. Таким образом, мы говорим, что тест надежен, если он точен, не содержит ошибок, а его измерения стабильны и последовательны на протяжении повторных измерений.

Помимо надежности в психологии, в каких областях появляется и используется это понятие? В разных областях, таких как социальные исследования и образование.

Примеры

Чтобы лучше проиллюстрировать, из чего состоит эта психометрическая концепция, рассмотрим следующий пример: мы используем термометр для измерения дневной температуры в классе. Мы проводим измерения в десять часов утра каждого дня в течение недели.

Мы будем говорить, что термометр надежен (у него высокая надежность), если, измеряя более или менее одинаковую температуру каждый день, термометр указывает на это (то есть измерения близки друг к другу, нет больших скачков или больших различия).

Вместо, если измерения полностью отличаются друг от друга (температура примерно одинакова каждый день), это будет означать, что указанный прибор не обладает хорошей надежностью (поскольку его измерения нестабильны или непротиворечивы во времени).

Другой пример для понимания концепции надежности в психометрии: представим, что мы ежедневно в течение нескольких дней взвешиваем корзину с тремя яблоками и записываем результаты. Если эти результаты сильно различаются по результатам последовательных измерений (то есть, когда мы их повторяем), это будет указывать на то, что что надежность шкалы плохая, поскольку измерения будут непоследовательными и нестабильными (антагонисты надежности).

Таким образом, надежный инструмент - это тот, который показывает последовательные и стабильные результаты в повторяющихся процессах измерения определенной переменной.

Вариативность мер

Как мы узнаем, надежен ли инструмент? Например, исходя из вариативности ваших измерений. То есть, если оценки, которые мы получаем (многократно измеряя одно и то же) с помощью указанного прибора, сильно различаются между да, мы будем считать, что его значения неточны, и, следовательно, инструмент не имеет хорошей надежности (это не надежный).

Экстраполируя это на психологические тесты и ответы испытуемого на один из них, мы видим, как тот факт, что он неоднократно отвечал на один и тот же тест в одних и тех же условиях, предоставит нам показатель надежности теста, основанный на вариативности оценок.

Вам может быть интересно: "Виды психологических тестов: их функции и характеристики"

Расчет: коэффициент надежности

Как рассчитать надежность в психометрии? Из коэффициента надежности, который можно рассчитать двумя разными способами: из процедур, включающих два приложения или только одно. Мы увидим различные способы его вычисления в этих двух больших блоках:

1. Два приложения

В первой группе мы находим различные способы (или процедуры), которые позволяют рассчитать коэффициент надежности из двух приложений теста. Давайте узнаем их, а также их недостатки:

1.1. Параллельные или эквивалентные формы

С помощью этого метода мы получаем меру надежности, в данном случае также называемую «эквивалентностью». Метод состоит из одновременного применения двух тестов: X (исходный тест) и X '(эквивалентный тест, который мы создали). Недостатков этой процедуры в основном два: утомляемость испытуемого и построение двух тестов.

1.2. Тест-ретест

Второй метод в рамках процедур расчета коэффициента надежности для двух приложений - это тест-ретест, который позволяет нам получить стабильность теста. Он в основном состоит из применить X-тест, подождать некоторое время и повторно применить тот же X-тест к тому же образцу.

Недостатками этой процедуры являются: изучение того, что исследуемый субъект мог усвоить за этот промежуток времени, эволюция человека, которая может изменить результаты, и т. Д.

1.3. Тест-ретест с альтернативными формами

Наконец, еще один способ рассчитать надежность в психометрии - начать с повторного тестирования с альтернативными формами. Это комбинация двух предыдущих процедур.Поэтому, хотя его можно использовать в определенных случаях, в нем накапливаются недостатки обоих.

Процедура состоит из проведения X-теста, прохождения определенного периода времени и проведения X-теста (то есть эквивалентного теста, созданного из оригинала, X).

2. Одно приложение

С другой стороны, процедуры расчета надежности в психометрии (коэффициента надежности) из При однократном применении тестового или измерительного прибора они делятся на две подгруппы: две половины и ковариация между Предметы. Давайте посмотрим на это более подробно, чтобы лучше понять:

2.1. Две половины

В таком случае, тест просто разделен на два. В этом разделе мы находим три типа процедур (способов разделения теста):

Параллельные формы: применяется формула Спирмена-Брауна.
Эквивалентные формы: применяется формула Рулона или Гуттмана-Фланагана.
Врожденные формы: Применяется формула Раджу.

2.2. Ковариация между предметами

Ковариация между предметами включает в себя анализ взаимосвязи между всеми тестовыми заданиями. В нем мы также находим три метода или формулы, типичные для психометрии:

Коэффициент альфа Кроанбаха: его значение колеблется от 0 до 1. Кудер-Ричардсон (KR20): применяется, когда элементы являются дихотомическими (то есть, когда они принимают только два значения). Гуттман.

3. Другие методы

Помимо процедур, которые включают одно или два применения теста для расчета коэффициента надежности, Мы нашли другие методы, такие как: межэкспертная надежность (которая измеряет согласованность теста), метод Хойта, и т.п.

Библиографические ссылки:

Каплан, Р.М., & Саккуццо, Д.П. (2010). Психологическое тестирование: принципы, применение и проблемы. (8-е издание). Белмонт, Калифорния: Уодсворт, Cengage Learning.
Мартинес, М.А., Эрнандес, М.Дж. и Эрнандес, М.В. (2014). Психометрия. Мадрид: Альянс.
Мартинес Ариас, Р. (2006). Психометрия. Мадрид: Анайя.
Моралес Вальехо, Педро (2007). Статистика применима к общественным наукам. Надежность тестов и весов. Мадрид: Папский университет Комильяс. п. 8.
Прието, Херардо; Дельгадо, Ана Р. (2010). Надежность и достоверность. Роли психолога (Испания: Генеральный совет официальных ассоциаций психологов) 31 (1): 67-74.