нормально розподілені величини ґрунтується на центральній граничній теоремі, яка стверджує, що, якщо випадкова величина є загальним результатом взаємодії значного числа інших випадкових величин, то вона буде мати приблизно нормальний розподіл, навіть якщо окремі складові не матимуть його.
1.7. Властивості оцінок параметрів моделі парної регресії
Розрізняють точкові та інтервальні оцінки параметрів економетричної моделі.
Точковою оцінкою параметра економетричної моделі називають знайдену оцінку цього параметру.
Інтервальною оцінкою параметра економетричної моделі називають інтервал, в межах якого з певною заданою ймовірністю знаходиться істинне значення цього параметру.
Оцінки параметрів економетричної моделі мають такі властивості:
1) Незміщеність.
Вибіркова оцінка b параметра називається незміщеною, якщо вона задовольняє умову М(b)= .
2) Обґрунтованість (спроможність).
Вибіркова оцінка b параметра називається обґрунтованою (спроможною), якщо для як завгодно малого числа справджується умова
,
тобто при збільшенні об’єму вибірки до безмежності оцінка як завгодно близько наближається до істинного параметру.
Ми бачимо, що оцінка є обґрунтованою, якщо вона задовольняє закон великих чисел. Обґрунтованість помилки означає, що чим більші будуть вибірки, тим більша ймовірність того, що помилка оцінки не перевищує як завгодно малого числа .
3) Ефективність.
Вибіркова оцінка b параметра називається ефективною, якщо вона має найменшу дисперсію.
Теорема Гауса-Маркова. Якщо для залишкового члена рівняння (1.1) виконуються умови Гауса-Маркова, то оцінки а і b, розраховані за методом найменших квадратів, мають найменшу дисперсію в класі всіх лінійних незміщених оцінок.
Оцінки а і b, знайдені методом найменших квадратів є незміщеними, ефективними та спроможними.
1.8. Побудова довірчих інтервалів
Надійність оцінки визначається ймовірністю, з якою стверджується що побудований за результатами вибірки довірчий інтервал містить невідомий параметр генеральної сукупності. Ймовірність інтервальної оцінки параметра називають довірчою і позначають p. Тоді можна сподіватися, що при множині спостережень параметр генеральної сукупності буде правильно оцінений (тобто довірчий інтервал покриє дійсне значення цього параметра) приблизно у p100% випадків і лише у (100–p) % випадків оцінка буде помилковою.
Ризик помилки визначається рівнем значущості , який називається довірчим рівнем даного інтервалу.
Позначимо параметр генеральної сукупності через л, а його оцінку – м. Тоді, за означенням довірчого інтервалу, будемо мати наступну формулу:
,
де k – довірчий множник, який відображає частку стандартного відхилення, яка повинна бути врахована, щоб із заданою ймовірністю p довірчий інтервал покрив параметр л генеральної сукупності.
Перейдемо до побудови довірчих інтервалів для параметрів парної лінійної регресії. Знайдемо довірчий інтервал для оціночного рівняння. Для цього нам необхідно мати похибку оцінки, яку знайдемо за формулою: , де tp – ймовірнісний коефіцієнт, значення якого при заданому рівні ймовірності p знаходимо за таблицями нормального розподілу. Значення tp є коренем рівняння 2Ф(tp) = p, де Ф(tp) – інтегральна функція Лапласа.
Тоді довірчий інтервал для оціночного рівняння матиме вигляд:
. (1.20)
Графічно довірчий інтервал можна зобразити таким чином:
Рис. 1.7. Довірчий інтервал оціночного рівняння
Процедура побудови довірчих інтервалів для параметрів та аналогічна попередній процедурі. Спочатку знаходимо граничні похибки оцінок відповідних параметрів за формулами:
(1.21)
де – відповідно дисперсії оцінок a та b, значення яких обчислюються за формулами:
(1.22)
Отже, довірчі інтервал для параметрів та матимуть вигляд:
, (1.23)
. (1.24)
Приклад 1.3. На основі даних прикладів 1.1 та 1.2 побудувати довірчі інтервали оціночного рівняння і параметрів та економетричної моделі для ймовірності p=0,9.
Розв’язування.
Обчислимо граничну похибку . Значення tp знайдемо, розв’язавши рівняння: , де Ф(tp) - інтегральна функція Лапласа. Для р=0,9 маємо: tр=1,65. Також знайдемо
Тоді .
Довірчий інтервал матиме вигляд:
,
,
.
Для побудови оціночного рівняння, верхньої та нижньої межі довірчого інтервалу достатньо по дві точки. Обчислимо їх:
Нижня межа |
Оціночна пряма |
Верхня межа
x | y | x | y | x | y
1 | 1,65 | 1 | 3,30 | 1 | 4,95
10 | 11,82 | 10 | 13,47 | 10 | 15,12
Знайдемо довірчі інтервали для та . Почнемо із обчислення граничних похибок оцінок цих параметрів:
, .
Для цього спочатку знайдемо значення дисперсій і середніх квадратичних відхилень оцінок а та b за формулами:
.
.
Далі знайдемо
;
.
Отже, нами отримано наступні інтервали довіри для оцінки :
,
,
,
для оцінки :
,
.
Відобразимо ці довірчі інтервали графічно. Обчислимо координати двох точок для побудови нижньої та верхньої меж довірчого інтервалу для .
Нижня межа |
Оціночна пряма |
Верхня межа
x | y | x | y | x | y
1 | 2,16 | 1 | 3,30 | 1 | 4,44
10 | 12,33 | 10 | 13,47 | 10 | 14,61
Для :
Нижня межа |
Оціночна пряма |
Верхня межа
x | y | x | y | x | y
0 | 2,17 | 0 | 2,17 | 0 | 2,17
10 | 11,17 | 10 | 13,47 | 10 | 15,77
1.9. Перевірка нульових гіпотез
Оскільки статистичні дані, які ми досліджуємо, створені різними випадковими факторами, то більшість статистичних досліджень супроводжується перевіркою деяких припущень або гіпотез про джерела цих даних.
Основне припущення, яке перевіряється, називається нульовою гіпотезою і позначається Но переважно формулюється як відсутність різниць, відсутність впливу фактора, рівність нулю значень вибіркових характеристик і т.д.
Друге припущення, яке перевіряється (не завжди строго протилежне чи обернене першому), називається конкуруючою або альтернативною гіпотезою і позначається Н1.
Для статистичного висновку про наявність або відсутність кореляційного зв’язку між досліджуваними змінними необхідно провести перевірку рівня значущості вибіркового коефіцієнта кореляції. Використаний критерій для розв’язку задач даного типу ґрунтується на розподілі різних статистик і називається критерієм значущості.
Процедура перевірки значущості починається з формулювання нульової гіпотези Но. У загальному випадку вона полягає в тому, що між параметром вибірки і параметром генеральної сукупності немає ніяких суттєвих різниць. Альтернативна гіпотеза Н1