4 различия между надежностью и валидностью (в науке)
Поскольку в разговорном языке они имеют очень схожие значения, термины «надежность» и «валидность» легко спутать, когда мы говорим о науке и, в частности, о психометрии.
Этим текстом мы намерены разъяснить Основные различия между надежностью и валидностью. Мы надеемся, что вы найдете полезным прояснить этот распространенный вопрос.
- Статья по теме: "Психометрия: изучение человеческого разума с помощью данных"
Что такое надежность?
В психометрии понятие «надежность» относится к точности прибора; В частности, коэффициенты надежности информируют нас о согласованности и стабильности измерений, выполненных с помощью указанного инструмента.
Чем выше надежность прибора, тем меньше случайных и непредсказуемых ошибок возникнет при его использовании для измерения определенных атрибутов. Достоверность исключает предсказуемые ошибки, то есть те, которые подлежат экспериментальному контролю.
Согласно классической теории тестирования, надежность — это доля дисперсии, которая объясняется истинными оценками. Таким образом, прямая оценка в тесте будет состоять из суммы случайной ошибки и истинной оценки.
Две главные составляющие надежности являются временная стабильность и внутренняя согласованность. Первая концепция указывает на то, что оценки мало меняются при измерении в разных случаях, в то время как Внутренняя согласованность относится к степени, в которой элементы, составляющие тест, измеряют одну и ту же конструкцию. психологический.
Таким образом, высокий коэффициент надежности указывает на то, что баллы в тесте мало колеблются внутри и в зависимости от времени и, короче говоря, что прибор свободен от ошибок измерения.
- Вам может быть интересно: "Виды психологических тестов: их функции и особенности"
определение действительности
Когда мы говорим о валидности, мы имеем в виду, правильно ли тест измеряет конструкцию, которую он намеревается измерить. Это понятие определяется как взаимосвязь между оценкой, полученной на тесте, и другой связанной мерой; степень линейной корреляции между обоими элементами определяет коэффициент достоверности.
Точно так же в научных исследованиях высокая достоверность указывает на степень, в которой результаты, полученные с помощью определенного инструмента или исследования, могут быть обобщены.
Существуют разные типы достоверности, которые зависят от способа ее расчета; Это означает, что это термин с очень разными значениями. В основном мы можем различать содержательная валидность, критериальная (или эмпирическая) валидность и конструктная валидность.
Валидность содержания определяет, в какой степени элементы психометрического теста являются репрезентативной выборкой элементов, составляющих оцениваемый конструкт. Инструмент должен включать все основные аспекты конструкции; Например, если мы хотим провести адекватный тест для измерения депрессии, мы обязательно должны включить в него пункты, оценивающие настроение и снижение удовольствия.
Валидность критерия измеряет способность инструмента предсказывать аспекты, связанные с интересующей чертой или областью. Наконец, конструктивная валидность направлена на определить, измеряет ли тест то, для чего он предназначен, например, из сходимости с оценками, полученными в аналогичных тестах.
Различия между надежностью и валидностью
Хотя эти два психометрических свойства тесно связаны, правда в том, что они относятся к четко дифференцированным аспектам. Давайте посмотрим, в чем заключаются эти различия..
1. Объект анализа
Надежность является характеристикой прибора в том смысле, что он измеряет свойства элементов, из которых он состоит. С другой стороны, действительность относится не только к инструменту, но и к обобщения, сделанные по результатам полученные через него.
2. Информация, которую они предоставляют
Хотя это несколько упрощенная формулировка, в общих чертах обычно утверждается, что валидность указывает на то, что инструмент Психометрический показатель фактически измеряет конструкт, который он призван измерять, в то время как надежность относится к тому, правильно ли он его измеряет, без ошибки.
3. Как они рассчитываются
Для измерения надежности используются три основные процедуры: метод двух половинок, метод параллельных форм и тест-ретест. Наиболее широко используется процедура двух половин, в которой вопросы делятся на две группы после того, как тест дан; затем анализируется корреляция между двумя половинами.
Метод параллельных или альтернативных форм состоит в создании двух эквивалентных тестов для измерения степени корреляции элементов друг с другом. Тест-ретест просто основан на прохождении теста дважды, в максимально похожих условиях. Обе процедуры можно комбинировать, что приводит к тесту-ретесту с параллельными формами, который состоит в оставлении временного интервала между первой формой теста и второй.
С другой стороны, действительность рассчитывается по-разному в зависимости от типа, но в целом все методы основаны на сравнении оценки в объективном тесте и других данных от тех же испытуемых по сходным признакам; цель состоит в том, чтобы тест мог действовать как предиктор признака.
Среди методов, используемых для оценки валидности, мы находим факторный анализ и многометодный матричный метод. Точно так же валидность содержания часто определяется рациональным, а не статистическим анализом; например, он включает кажущуюся валидность, которая относится к субъективному суждению экспертов о валидности теста.
4. Связь между обоими понятиями
Надежность психометрического инструмента влияет на его достоверность: чем он надежнее, тем больше будет и его валидность.. Следовательно, коэффициенты валидности инструмента всегда ниже коэффициентов надежности, а валидность косвенно информирует нас о надежности.