Що робити, коли помилка не розподілена нормально?

Якщо зіткнутися з ненормальним розподілом помилок, одним із варіантів є трансформувати цільовий простір. За допомогою правильної функції f можна досягти нормальності, якщо ми замінимо вихідні цільові значення y на f(y). Специфіка проблеми іноді може призвести до природного вибору для f.12 березня 2020

Якщо розподіл помилок є ненормальним і, ймовірно, від сукупності, середнє значення якої дорівнює нулю, тоді оцінки з МНК будуть далекі від оптимальних, але принаймні мають властивість неупередженості.

Ненормальність – це спосіб життя, оскільки жодна характеристика (зріст, вага тощо) не матиме точно нормального розподілу. Однією зі стратегій, щоб зробити незвичайні дані схожими на звичайні, є за допомогою трансформації. У статистиці немає недоліку в трансформаціях; питання в тому, який з них вибрати для даної ситуації.

Якщо ваші дані справді не відповідають нормі, багато аналізів мають непараметричні альтернативи, такі як аналог одностороннього дисперсійного аналізу Краскела-Уолліса та двовибірковий аналог тесту Манна-Уітні. Ці методи не ґрунтуються на припущенні нормальності.

Ненормальні розподіли може мати брак симетрії, може мати екстремальні значення або може мати більш плоский або крутий «купол», ніж типовий дзвін. У ненормальних даних немає нічого поганого; деякі риси просто не слідують дзвоноподібній кривій. Наприклад, дані про споживання кави та алкоголю рідко мають форму дзвоника.

Облік помилок з ненормальним розподілом

  1. Перетворіть змінну відповіді, щоб зробити розподіл випадкових помилок приблизно нормальним.
  2. Перетворіть змінні предиктора, якщо необхідно, щоб отримати або відновити просту функціональну форму функції регресії.

Якщо ви знайдете докази ненормальності залишків, вам потрібно дослідити можливі причини та способи усунення. До поширених причин належать неправильно визначена модель, дані, що містять викиди або впливові точки, а також спотворені або важкі хвости відповідей або пояснювальних змінних.