4 различия между надежностью и валидностью (в науке)

Поскольку в разговорном языке они имеют очень схожие значения, термины «надежность» и «валидность» легко спутать, когда мы говорим о науке и, в частности, о психометрии.

Этим текстом мы намерены разъяснить Основные различия между надежностью и валидностью. Мы надеемся, что вы найдете полезным прояснить этот распространенный вопрос.

Статья по теме: "Психометрия: изучение человеческого разума с помощью данных"

Что такое надежность?

В психометрии понятие «надежность» относится к точности прибора; В частности, коэффициенты надежности информируют нас о согласованности и стабильности измерений, выполненных с помощью указанного инструмента.

Чем выше надежность прибора, тем меньше случайных и непредсказуемых ошибок возникнет при его использовании для измерения определенных атрибутов. Достоверность исключает предсказуемые ошибки, то есть те, которые подлежат экспериментальному контролю.

Согласно классической теории тестирования, надежность — это доля дисперсии, которая объясняется истинными оценками. Таким образом, прямая оценка в тесте будет состоять из суммы случайной ошибки и истинной оценки.

instagram story viewer

Две главные составляющие надежности являются временная стабильность и внутренняя согласованность. Первая концепция указывает на то, что оценки мало меняются при измерении в разных случаях, в то время как Внутренняя согласованность относится к степени, в которой элементы, составляющие тест, измеряют одну и ту же конструкцию. психологический.

Таким образом, высокий коэффициент надежности указывает на то, что баллы в тесте мало колеблются внутри и в зависимости от времени и, короче говоря, что прибор свободен от ошибок измерения.

Вам может быть интересно: "Виды психологических тестов: их функции и особенности"

определение действительности

Когда мы говорим о валидности, мы имеем в виду, правильно ли тест измеряет конструкцию, которую он намеревается измерить. Это понятие определяется как взаимосвязь между оценкой, полученной на тесте, и другой связанной мерой; степень линейной корреляции между обоими элементами определяет коэффициент достоверности.

Точно так же в научных исследованиях высокая достоверность указывает на степень, в которой результаты, полученные с помощью определенного инструмента или исследования, могут быть обобщены.

Существуют разные типы достоверности, которые зависят от способа ее расчета; Это означает, что это термин с очень разными значениями. В основном мы можем различать содержательная валидность, критериальная (или эмпирическая) валидность и конструктная валидность.

Валидность содержания определяет, в какой степени элементы психометрического теста являются репрезентативной выборкой элементов, составляющих оцениваемый конструкт. Инструмент должен включать все основные аспекты конструкции; Например, если мы хотим провести адекватный тест для измерения депрессии, мы обязательно должны включить в него пункты, оценивающие настроение и снижение удовольствия.

Валидность критерия измеряет способность инструмента предсказывать аспекты, связанные с интересующей чертой или областью. Наконец, конструктивная валидность направлена на определить, измеряет ли тест то, для чего он предназначен, например, из сходимости с оценками, полученными в аналогичных тестах.

Различия между надежностью и валидностью

Хотя эти два психометрических свойства тесно связаны, правда в том, что они относятся к четко дифференцированным аспектам. Давайте посмотрим, в чем заключаются эти различия..

1. Объект анализа

Надежность является характеристикой прибора в том смысле, что он измеряет свойства элементов, из которых он состоит. С другой стороны, действительность относится не только к инструменту, но и к обобщения, сделанные по результатам полученные через него.

2. Информация, которую они предоставляют

Хотя это несколько упрощенная формулировка, в общих чертах обычно утверждается, что валидность указывает на то, что инструмент Психометрический показатель фактически измеряет конструкт, который он призван измерять, в то время как надежность относится к тому, правильно ли он его измеряет, без ошибки.

3. Как они рассчитываются

Для измерения надежности используются три основные процедуры: метод двух половинок, метод параллельных форм и тест-ретест. Наиболее широко используется процедура двух половин, в которой вопросы делятся на две группы после того, как тест дан; затем анализируется корреляция между двумя половинами.

Метод параллельных или альтернативных форм состоит в создании двух эквивалентных тестов для измерения степени корреляции элементов друг с другом. Тест-ретест просто основан на прохождении теста дважды, в максимально похожих условиях. Обе процедуры можно комбинировать, что приводит к тесту-ретесту с параллельными формами, который состоит в оставлении временного интервала между первой формой теста и второй.

С другой стороны, действительность рассчитывается по-разному в зависимости от типа, но в целом все методы основаны на сравнении оценки в объективном тесте и других данных от тех же испытуемых по сходным признакам; цель состоит в том, чтобы тест мог действовать как предиктор признака.

Среди методов, используемых для оценки валидности, мы находим факторный анализ и многометодный матричный метод. Точно так же валидность содержания часто определяется рациональным, а не статистическим анализом; например, он включает кажущуюся валидность, которая относится к субъективному суждению экспертов о валидности теста.

4. Связь между обоими понятиями

Надежность психометрического инструмента влияет на его достоверность: чем он надежнее, тем больше будет и его валидность.. Следовательно, коэффициенты валидности инструмента всегда ниже коэффициентов надежности, а валидность косвенно информирует нас о надежности.