Надійність у психометрії: що це таке і як оцінюється в тестах
Якщо ви вивчали психологію чи іншу кар’єру, пов’язану з цим, напевно поняття надійності вам знайоме. Але... З чого саме він складається? Надійність у психометрії - це якість або властивість вимірювальних приладів (наприклад, тести), що дозволяє перевірити, чи вони точні, послідовні та стабільні у своїх вимірах.
У цій статті ми розповімо вам, з чого складається ця властивість, наведемо кілька прикладів для уточнення ми пояснюємо різні способи розрахунку коефіцієнта надійності в психометрії.
- Пов’язана стаття: "Психометрія: що це і за що вона відповідає?"
Що таке надійність у психометрії?
Надійність - це поняття, охоплене психометрією, дисципліною, що відповідає за вимірювання психологічних змінних людської істоти за допомогою різних технік, методів та інструментів. Таким чином, надійність у психометрії, надмірність, що має силу, складається з психометричної властивості, яка передбачає відсутність похибок вимірювань певного приладу (наприклад, тест).
Він також відомий як ступінь узгодженості та стабільності балів, отриманих при різних вимірах за допомогою одного і того ж приладу або тесту.
Іншим синонімом надійності в психометрії є «точність».. Таким чином, ми говоримо, що тест є надійним, коли він точний, він не призводить до помилок і його вимірювання є стабільними та послідовними протягом повторних вимірювань.Окрім надійності в психології, в яких галузях ця концепція з’являється та використовується? У різних сферах, таких як соціальні дослідження та освіта.
Приклади
Щоб краще проілюструвати, з чого складається ця психометрична концепція, розглянемо такий приклад: ми використовуємо термометр для вимірювання добової температури в класі. Ми проводимо вимірювання о десятій годині ранку кожного дня протягом тижня.
Ми скажемо, що термометр надійний (він має високу надійність), якщо, роблячи більш-менш однакову температуру щодня, термометр вказує на це (тобто вимірювання знаходяться близько один до одного, немає великих стрибків або великих відмінності).
Натомість, якщо вимірювання повністю відрізняються один від одного (температура більш-менш однакова щодня), це буде означати, що зазначений прилад не має належної надійності (оскільки його вимірювання не стабільні або несуперечливі з часом).
Ще один приклад для розуміння концепції надійності в психометрії: давайте уявимо, що ми зважуємо кошик з трьома яблуками щодня протягом декількох днів і реєструємо результати. Якщо ці результати сильно змінюються протягом послідовних вимірювань (тобто, коли ми повторюємо їх), це свідчить про це що надійність шкали не є хорошою, оскільки вимірювання будуть непослідовними та нестабільними (антагоністи надійності).
Таким чином, надійним інструментом є той, який показує стабільні та стабільні результати у повторних процесах вимірювання певної змінної.
Варіативність заходів
Як ми дізнаємось, чи надійний прилад? Наприклад, починаючи з мінливості ваших вимірювань. Тобто, якщо бали, які ми отримуємо (багаторазово вимірюючи одне і те ж) за допомогою згаданого приладу, сильно варіюються між собою так, ми будемо вважати, що його значення не є точними, і тому прилад не має належної надійності (це не так надійний).
Екстраполюючи це на психологічні тести та відповіді випробуваного на один із них, ми бачимо, як той факт, що він відповідав на той самий тест за однакових умов, неодноразово, надасть нам показник надійності тесту, заснований на мінливості балів.
- Вас може зацікавити: "Види психологічних тестів: їх функції та характеристики"
Розрахунок: коефіцієнт надійності
Як ми розраховуємо надійність у психометрії? З коефіцієнта надійності, який можна розрахувати двома різними способами: з процедур, що включають два додатки або лише один. Ми побачимо різні способи його обчислення в цих двох великих блоках:
1. Дві програми
У першій групі ми знаходимо різні способи (або процедури) дозволяють розрахувати коефіцієнт надійності з двох застосувань тесту. Давайте знати їх, а також їх недоліки:
1.1. Паралельні або еквівалентні форми
За допомогою цього методу ми отримуємо міру надійності, яку в цьому випадку також називають «еквівалентністю». Метод полягає у одночасному застосуванні двох тестів: X (оригінальний тест) та X '(еквівалентний тест, який ми створили). Недоліків цієї процедури в основному два: втома обстежуваного та побудова двох тестів.
1.2. Тест-повторний тест
Другим методом, в рамках процедур розрахунку коефіцієнта надійності з двох застосувань, є тест-повторне тестування, що дозволяє отримати стабільність тесту. В основному він складається з застосуйте X-тест, дозвольте пройти певний проміжок часу і повторно застосуйте той самий X-тест до тієї ж проби.
Недоліками цієї процедури є: вивчення того, що обстежуваний міг набути за той проміжок часу, еволюція людини, яка може змінити результати тощо.
1.3. Тест-повторне тестування з альтернативними формами
Нарешті, ще один спосіб розрахунку надійності в психометрії - це почати з тесту-повторного тестування з альтернативних форм. Це поєднання двох попередніх процедурТому, хоча його можна використовувати в певних випадках, він накопичує недоліки обох.
Процедура складається з адміністрування X-тесту, проходження певного періоду часу, та адміністрування X-тесту (тобто еквівалентного тесту, створеного з оригіналу X).
2. Єдина заявка
З іншого боку, процедури розрахунку надійності в психометрії (коефіцієнт надійності) з a При одноразовому застосуванні випробувального або вимірювального приладу вони поділяються на дві підгрупи: дві половини та коваріація між ними предметів. Давайте розглянемо це більш детально, щоб це було краще зрозуміло:
2.1. Дві половинки
В цьому випадку, тест просто ділиться на два. У цьому розділі ми знаходимо три типи процедур (способи розділити тест):
- Паралельні форми: застосовується формула Спірмена-Брауна.
- Еквівалентні форми: застосовується формула Рулона або Гутмана-Фланагана.
- Вроджені форми: застосовується формула Раджу.
2.2. Коваріація між елементами
Коваріація між елементами передбачає аналіз взаємозв'язку між усіма тестовими завданнями. У його межах ми також знаходимо три методи або формули, типові для психометрії:
Альфа-коефіцієнт Кроанбаха: його значення коливається від 0 до 1. Кудер-Річардсон (KR20): застосовується, коли предмети є дихотомічними (тобто, коли вони набувають лише двох значень). Гутман.
3. Інші методи
Окрім процедур, які передбачають одне або два застосування тесту для обчислення коефіцієнта надійності, Ми виявили інші методи, такі як: надійність між оцінювачами (що вимірює послідовність тесту), метод Хойта, тощо
Бібліографічні посилання:
- Kaplan, R.M., & Saccuzzo, D.P. (2010). Психологічне тестування: принципи, застосування та проблеми. (8-е видання). Белмонт, Каліфорнія: Вадсворт, Cengage Learning.
- Мартінес, М.А., Ернандес, М.Дж. та Ернандес, М.В. (2014). Психометрія. Мадрид: Альянс.
- Мартінес Аріас, Р. (2006). Психометрія. Мадрид: Аная.
- Моралес Валлехо, Педро (2007). Статистика застосовується до соціальних наук. Надійність випробувань і ваг. Мадрид: Папський університет Комільяса. стор. 8.
- Прієто, Херардо; Дельгадо, Ана Р. (2010). Надійність та обгрунтованість. Ролі психолога (Іспанія: Генеральна рада офіційних асоціацій психологів) 31 (1): 67-74.