Що робити, коли нормального розподілу немає?
У ситуації, коли дані розподілені ненормально, а вимірювання найкраще виражаються в порядковій шкалі, тоді обчислення стандартної описової статистики (наприклад, середнє значення, стандартне відхилення) не є найкращим способом представлення даних у сукупності.
Якщо змінна не розподілена нормально, результати деяких статистичних тестів можуть бути недійсними. Нормальний розподіл є симетричним відносно середнього. Це означає, що розподіл значень праворуч і ліворуч від середнього є дзеркальним відображенням одне одного.
Як перевірити, чи змінна нормально розподілена? Є два шляхи – через візуальний огляд, тобто інтелектуальний аналіз даних, і через формальне тестування зі статистичними тестами. Або ви можете вибрати обидва способи.
Куртоз (Курт.) – Якщо p-значення для цього тесту менше за поріг альфа (зазвичай 0,05), тобто ми маємо справу зі статистично значущим результатом, який означає, що розподіл змінної відхиляється від нормального розподілу.
Нормальний розподіл має характеризуватися нульовою асиметрією та нульовим ексцесом g2 (або b2, близьким до значення трьох). За відсутності нормальності розподілу, як визначено тестом Д'Агостіно (1973)8, можна перевірити, чи є це результатом високої асиметрії чи ексцесу через тест асиметрії та тест ексцесу.
Якщо ваші дані не відповідають нормі, ви можете спробувати трансформувати або нормалізувати їх, щоб зробити більш нормальними . Трансформація — це процес застосування математичної функції до даних, як-от логарифм, квадратний корінь або обернена функція, щоб змінити її форму та зменшити асимметрию або викиди.
Хоча ти можеш трансформуйте свої дані так, щоб розподіл нових даних/змінних виглядав нормально , а потім ви можете проаналізувати ці перетворені дані та інтерпретувати їх належним чином.Залежно від типу ненормальності ви можете зводити змінні в квадрат, логарифмічно перетворювати їх, витягувати квадратний корінь тощо.