Статистична перевірка оцінок економетричної моделі
Статистична перевірка оцінок економетричної моделі.
План
Загальні відомості про статистичні оцінки.
Загальна, пояснена та непояснена дисперсії.
Стандартна похибка оцінки за рівнянням економетричної моделі.
Коефіцієнти детермінації та кореляції.
Довірчі інтервали для оціночного рівняння ЕМ та оцінок a та b.
Перевірка нульових гіпотез стосовно коефіцієнта кореляції та кутового коефіцієнта.
Перевірка моделі на адекватність.
1. Розрізняють точкові та інтервальні оцінки параметрів економетричної моделі.
Точковою оцінкою параметрівта в називають знайдені значення оцінок цих параметрів МНК, тобто a та b.
Інтервальною оцінкою називають інтервал, в межах якого може знаходитися з певною ймовірністю значення параметрів чи в.
Незміщеною оцінкою a параметру називається оцінка, математичне сподівання якої дорівнює параметру : .
Зміщеною оцінкою a параметру називається оцінка, математичне сподівання якої не дорівнює параметру для будь-якого об’єму вибірки: .
Ефективною оцінкою a параметру називають таку оцінку, яка при заданому об’ємі вибірки має найменшу дисперсію.
Спроможною оцінкою a параметру називають таку оцінку, яка при збільшенні об’єму вибірки до безмежності як завгодно близько наближається до : .
2. Загальна, пояснена та непояснена дисперсії знаходять за формулами:
- загальна дисперсія, або дисперсія ендогенної змінної;
- пояснена дисперсія, або дисперсія систематичної
складової;
- непояснена дисперсія, або дисперсія випадкової
складової, або дисперсія помилок.
Якщо загальну дисперсію вважати незмінною, то чим більша буде пояснена дисперсія, тим менша непояснена, а значить менший розкид точок на діаграмі розсіювання відносно оціночної прямої.
3. Стандартною похибкою за рівнянням економетричної моделі називається величина .
Вона може приймати значення з інтервалу:
.
Якщо , то це означає, що всі точки діаграми розсіювання лежать на оціночній прямій, а отже зв’язок між y та x функціональний.
Якщо значення близьке до нуля, то це означає, що точки діаграми розсіювання розміщені близько до оціночної прямої.
Якщо значення близьке до , то зв’язок між y та x досить слабкий.
Якщо =, то лінійного зв’язку між y та x не існує, тобто оціночна пряма має вигляд .
Стандартна похибка (непояснена дисперсія має два застосування:
для обчислення коефіцієнтів детермінації та кореляції;
для знаходження інтервальних оцінок.
4. Після побудови регресійної моделі необхідно оцінити тісноту зв’язку між результативною та факторною змінними. Для цього необхідно розрахувати коефіцієнти детермінації та кореляції. Коефіцієнт детермінації розраховується за формулою:
і показує, яку долю загальної дисперсії займає пояснена дисперсія. Коефіцієнт детермінації часом ще позначається r2. Він приймає значення з інтервалу [0;1]. Його максимальне значення рівне 1, коли точки діаграми розсіювання лежать на оціночній прямій, тобто зв’язок функціональний. Якщо d=0, то для вибірки відсутній лінійний зв’язок між змінними у та х.
Коефіцієнт кореляції знаходиться як корінь квадратний з коефіцієнта детермінації . Він характеризує якість підбору оціночного рівняння економетричної моделі. Коефіцієнт кореляції приймає значення з інтервалу [-1;1]. Додатне значення кореляції свідчить про наявність прямого зв’язку між змінними, а від’ємне – про зворотній зв’язок.
Якщо коефіцієнт кореляції:
=1, то зв’язок між змінними у та х функціональний;
1, то зв’язок тісний;
- то зв’язок середній;
- то зв’язок слабкий;
=0, то зв’язку між змінними у та х немає.
Але, якщо нами отримано, що r=0, то не треба спішити з висновками про відсутність зв’язку між змінними. Можна лише робити висновок, що відсутній лінійний зв’язок на основі даних вибірки. В той же час між вибраними змінними може існувати тісний нелінійний зв’язок. Якраз коефіцієнт кореляції дає можливість робити висновок про тісноту зв’язку тільки при наявності лінійних співвідношень між змінними.
5. Другим застосуванням стандартної похибки є побудова довірчого інтервалу для оціночного рівняння економетричної моделі. В загальному випадку довірчий інтервал має вигляд:
де - гранична похибка за рівнянням економетричної моделі, яка знаходиться за формулою: , де tp – ймовірнісний коефіцієнт, який при заданих рівнях ймовірності р знаходиться за таблицями нормального розподілу. Значення tp знаходимо з рівняння 2Ф(tp)=р, де Ф(t) – інтегральна функція Лапласа:
Тоді по таблицях функції Лапласа знаходимо значення tp.
Відобразимо довірчий інтервал графічно. Для цього запишемо довірчий інтервал в такому вигляді:
;
.
Ми бачимо, що нижня та верхня межа довірчого інтервалу будуть паралельними оціночній прямій, оскільки кутовий коефіцієнт в них однаковий і рівний b.
Процедура побудови інтервалів довіри є аналогічною попередній процедурі. Спочатку знаходимо граничні похибки оцінок відповідних параметрів за формулами:
де - дисперсії оцінок а та b, які визначаються за формулами:
Отже, довірчий інтервал для оцінки а буде:
,
Відповідно, для параметра b маємо:
Щоб відобразити графічно довірчі інтервали оцінок а та b, потрібно підставити в оціночне рівняння економетричної моделі нижні та верхні межі довірчих інтервалів цих оцінок і побудувати їх на координатній площині.
6. Побудова довірчих інтервалів для рівняння економетричної моделі та її параметрів є основними завдання економетричного аналізу, але інколи цього недостатньо, тому здійснюється перевірка нульових гіпотез.
Сформулюємо нульову гіпотезу відносно коефіцієнта кореляції Но: припускаємо, що коефіцієнт кореляції r, знайдений за даними вибірки не відповідає коефіцієнту кореляції генеральної сукупності і вважаємо, що коефіцієнт кореляції в генеральній сукупності рівний нулю R=0 (тобто в генеральній сукупності немає зв’язку між змінними y та x). Альтернативною гіпотезою до Но є гіпотеза Н1, яка полягає в тому, що R?0 і зв’язок між y та x існує.
Для оцінки значущості коефіцієнта кореляції використовуємо t-критерій Стьюдента.
Перевірка нульової гіпотези здійснюється в такому порядку:
1) Обчислюємо емпіричне значення параметру t за формулою:
;
За таблицями Стьюдента знаходимо критичне значення параметру t для певної ймовірності p та числа ступенів вільності n-2. Ймовірність p говорить про те, що в (1-р)М100 випадках ми можемо помилятися, а 1-р=б – це рівень значимості.
tемп порівнюється з tkp. Якщо
,