Тест Колмогорова-Смирнова: що це таке і як використовується в статистиці
У статистиці добре відомі та використовуються параметричні та непараметричні критерії. Широко використовуваним непараметричним критерієм є критерій Колмогорова-Смирнова., що дозволяє нам перевірити, чи результати вибірки відповідають нормальному розподілу.
Він належить до групи так званих тестів відповідності. У цій статті ми дізнаємося про його характеристики, для чого він призначений і як його застосовувати.
- Пов'язана стаття: "Критерій хі-квадрат (χ²): що це таке і як він використовується в статистиці"
непараметричні тести
Тест Колмогорова-Смирнова є тип непараметричного тесту. Непараметричні тести (також звані вільним розподілом) використовуються в інференційній статистиці та мають такі характеристики:
- Вони висувають гіпотези про придатність, незалежність...
- Рівень вимірювання змінних низький (порядковий).
- Вони не мають надмірних обмежень.
- Вони застосовні до невеликих вибірок.
- Вони міцні.
Тест Колмогорова-Смирнова: характеристика
Тест Колмогорова-Смирнова належить до статистики, а саме до інференційна статистика. Інференційна статистика спрямована на отримання інформації про населення.
Це тест на придатність, тобто він використовується для перевірки того, чи бали, які ми отримали з вибірки, відповідають нормальному розподілу. Тобто це дозволяє виміряти ступінь узгодженості між розподілом набору даних і конкретним теоретичним розподілом. Його мета полягає в тому, щоб вказати, чи надходять дані з сукупності, яка має визначений теоретичний розподіл, тобто Інакше кажучи, він перевіряє, чи можуть спостереження обґрунтовано виходити з розподілу зазначено.
Тест Колмогорова-Смирнова відповідає на таке питання: Чи походять вибіркові спостереження з якогось гіпотетичного розподілу?
Нульова гіпотеза та альтернативна гіпотеза
Як тест на відповідність, він відповідає на запитання: «чи відповідає (емпіричний) розподіл вибірки (теоретичному) розподілу населення?». В цьому випадку, нульова гіпотеза (H0) встановить, що емпіричний розподіл подібний до теоретичного (Нульова гіпотеза - це та, яку не намагаються відхилити.) Іншими словами, нульова гіпотеза встановить, що спостережуваний розподіл частот узгоджується з теоретичним розподілом (і, отже, добре підходить).
На відміну від цього, альтернативна гіпотеза (H1) стверджуватиме, що спостережуваний розподіл частот не узгоджується з теоретичним розподілом (погана відповідність). Як і в інших тестах на контраст гіпотез, символ α (альфа) буде вказувати на рівень значущості тесту.
- Вас може зацікавити: "Коефіцієнт кореляції Пірсона: що це таке і як ним користуватися"
Як це розраховується?
Результат тесту Колмогорова-Смирнова позначається літерою Z. Z обчислюється з найбільшої різниці (за абсолютним значенням) між теоретичними та спостережуваними (емпіричними) кумулятивними функціями розподілу.
Припущення
Щоб правильно застосувати тест Колмогорова-Смирнова, необхідно зробити ряд припущень. По-перше, тест припускає, що параметри тестового розподілу були задані раніше. Ця процедура оцінює параметри з вибірки.
З іншого боку, вибіркове середнє та стандартне відхилення є параметрами нормального розподілу, мінімальне і максимальне значення вибірки визначають діапазон рівномірного розподілу, вибіркове середнє є параметром розподілу Пуассона, а вибіркове середнє є параметром розподілу експоненціальний.
Здатність тесту Колмогорова-Смирнова виявляти відхилення від гіпотетичного розподілу може бути значно зменшена. Щоб порівняти його з нормальним розподілом з оціненими параметрами, слід розглянути можливість використання тесту K-S Lillliefors.
застосування
Тест Колмогорова-Смирнова можна застосувати до вибірки, щоб перевірити, чи змінна (наприклад, академічні оцінки або дохід у євро) розподілена нормально. Іноді це необхідно знати, оскільки багато параметричних тестів вимагають, щоб змінні, які вони використовують, відповідали нормальному розподілу.
Переваги
Дещо з переваги тесту Колмогорова-Смирнова є:
- Він потужніший, ніж тест хі-квадрат (χ²) (також тест на відповідність).
- Його легко обчислити та використовувати, і не вимагає групування даних.
- Статистика не залежить від очікуваного частотного розподілу, вона залежить лише від розміру вибірки.
Відмінності з параметричними тестами
Параметричні тести, на відміну від непараметричних тестів, таких як тест Колмогорова-Смирнова, мають такі характеристики:
- Вони висувають гіпотези щодо параметрів.
- Рівень вимірювання змінних є принаймні кількісним.
- Існує ряд припущень, які повинні бути виконані.
- Вони не втрачають інформацію.
- Вони мають високу статистичну силу.
Деякі приклади параметричних тестів буде: t-тест для різниці в середніх значеннях або ANOVA.