розсіювання – стандартне відхилення зводиться при цьому до мінімуму.
б) МНК через відхилення від середніх. Розглянемо методику оцінювання параметрів з допомогою методу відхилень від середніх арифметичних. Основу даного методу складають властивості оцінок, знайдених МНК, які полягають в тому, що лінія регресії обов’язково проходить через точку середніх значень .
Поділимо перше рівняння системи (1.4) на n:
.
У результаті отримаємо
, або
. (1.7)
Далі віднімемо від розрахункового значення змінної y (1.2) її середнє значення, знайдене за формулою (1.7):
.
Звідси . (1.8) Тоді відхилення фактичних значень змінної y від розрахункових, знайдених по формулі (1.8):
.
та – це відхилення змінних y та x від їх середніх значень. Для простоти позначимо їх та .
Дальше розглядаємо функцію, що представляє собою суму квадратів відхилень дійсних значень змінної y від розрахункових і досліджуємо її на min.
Оскільки отримана функція залежить тільки від b, то знаходимо частинну похідну цієї функції по b і прирівнюємо її до нуля.
.
.
Звідси знаходимо параметр b:
. (1.9)
Значення оцінки а знайдемо з формули (1.7):
(1.10)
Формули (1.9) та (1.10) – це формули для знаходження оцінок параметрів економетричної моделі методом найменших квадратів через відхилення від середніх.
Формулу (1.9) можна представити в іншому вигляді. Якщо розділити чисельник і знаменник на , то отримаємо:
.
Ми отримали в чисельнику коефіцієнт коваріації між змінними x та y, який обчислюється за формулою:
,
а в знаменнику маємо дисперсію змінної x, яка знаходиться за формулою:
.
Тоді формула (1.9) матиме вигляд:
.
Приклад 1.1. Для десяти підприємств регіону за умовний деякий період відомі числові значення двох економічних показників: валова продукція y (млн. грн.) і вартість основних виробничих фондів x (млн. грн.), (табл.1.1). Для дослідження характеристики впливу вартості основних виробничих фондів (x) на випуск валової продукції (y) підприємства з допомогою економетричної моделі необхідно:
Зробити специфікацію моделі.
Знайти оцінки параметрів моделі з допомогою МНК (за системою нормальних рівнянь та через відхилення від середніх).
Побудувати оціночну пряму.
Таблиця 1.1
№ підприємства | Валовий випуск продукції, млн.грн.,
уі | Основні виробничі фонди, млн.грн.,
хі
1 | 2,2 | 1,4
2 | 4,2 | 2,2
3 | 5,7 | 3,3
4 | 6,8 | 2,6
5 | 5,9 | 3,2
6 | 7,6 | 4,5
7 | 9,5 | 5,1
8 | 8,4 | 6,7
9 | 10,1 | 7,3
10 | 12,3 | 8,9
Розв’язування.
1. Побудуємо діаграму розсіювання залежності валового випуску продукції (у) від вартості основних виробничих фондів підприємства (х):
Рис.1.5. Діаграма розсіювання
Розміщення точок на діаграмі розсіювання дає можливість зробити припущення про існування лінійної форми зв’язку у вигляді функції (1.2):
y=а+bх,
де y – розрахунковий обсяг випуску валової продукції, млн. грн.; х – вартість основних виробничих фондів, млн. грн.
2. Для спрощення розрахунків при знаходженні оцінок a та b параметрів економетричної моделі побудуємо таблицю:
№ п/п | yi | xi | xi2 | xiyi | xi | ( xi)2 | yi | xi yi
1 | 2,2 | 1,4 | 1,96 | 3,08 | -3,12 | 9,73 | -5,07 | 15,82
2 | 4,2 | 2,2 | 4,84 | 9,24 | -2,32 | 5,38 | -3,07 | 7,12
3 | 5,7 | 3,3 | 10,89 | 18,81 | -1,22 | 1,49 | -1,57 | 1,92
4 | 6,8 | 2,6 | 6,76 | 17,68 | -1,92 | 3,69 | -0,47 | 0,9
5 | 5,9 | 3,2 | 10,24 | 18,88 | -1,32 | 1,74 | -1,37 | 1,81
6 | 7,6 | 4,5 | 20,25 | 34,2 | -0,02 | 0 | 0,33 | -0,01
7 | 9,5 | 5,1 | 26,01 | 48,45 | 0,58 | 0,34 | 2,23 | 1,29
8 | 8,4 | 6,7 | 44,89 | 56,28 | 2,18 | 4,75 | 1,13 | 2,46
9 | 10,1 | 7,3 | 53,29 | 73,73 | 2,78 | 7,73 | 2,83 | 7,87
10 | 12,3 | 8,9 | 79,21 | 109,47 | 4,38 | 19,18 | 5,03 | 22,03
Сума | 72,7 | 45,2 | 258,34 | 389,82 | 0 | 54,04 | 0 | 61,22
Запишемо систему нормальних рівнянь:
Розв’яжемо її:
Знайдемо ці ж оцінки за формулами відхилень від середніх (1.9) та (1.10):
; .
Отже, нами отримано оціночне рівняння економетричної моделі
.
3. Побудуємо оціночну пряму .
Рис.1.6. Діаграма розсіювання та оціночна пряма
1.5. Загальна, пояснююча та непояснююча дисперсії.
Коефіцієнти кореляції та детермінації
Побудова рівняння регресії дає нам можливість розкласти значення уі в кожному спостереженні на дві складові:
. (1.11)
Величина – розраховане за оціночним рівнянням економетричної моделі значення результативного показника в і-му випадку. Залишок еі є розбіжністю між фактичним і прогнозним значенням змінної у, тобто, та частина у, яку ми не можемо пояснити з допомогою рівняння регресії. Знайдемо
. (1.12)
Врахувавши, що , будемо мати:
. (1.13)
Дане співвідношення означає, що ми можемо розкласти загальну дисперсію var(y) на дві складові: – частина, яка пояснює рівняння регресії (пояснююча дисперсія) і var(e) – непояснююча частина (дисперсія помилок або не пояснююча дисперсія).
У лівій частині (1.13) маємо варіацію залежної змінної у навколо свого вибіркового середнього значення , а у правій – варіації розрахункових значень навколо середнього значення та фактичних значень у. За означенням дисперсії (1.13) прийме наступний вид:
,
– загальна дисперсія; (1.14)
– пояснююча дисперсія; (1.15)
– дисперсія помилок, або (1.16)
непояснююча дисперсія.
Тобто, з (1.14) маємо: .
Якщо загальну дисперсію вважати незмінною, то чим більша буде пояснююча дисперсія, тим менша непояснююча, а значить менший розкид точок на діаграмі розсіювання відносно оціночної прямої.
Далі поділимо обидві частини (1.13) на var(y)