визначене неправильно. Наприклад, фактична залежність не є лінійною, а може бути більш складною. Проте, використання рівняння регресії, яке найкраще описує залежність між змінними є деяким наближенням.
Помилки вимірювання. Якщо у вимірюваннях однієї чи більше взаємозв’язаних змінних є помилки, то знайдені значення не будуть відповідати точному співвідношенню, а існуюча розбіжність буде вносити свій вклад у структуру збуреної змінної.
Людський фактор, який неможливо математично описати і нічим, крім випадкової складової відобразити не можна. Наприклад, при встановленні залежності попиту на товар від ціни на нього це можуть бути вподобання покупця.
Отже, збурення є сумарним проявом перелічених вище факторів.
Практично побудувати економетричну модель у вигляді рівняння (1.1) неможливо через випадкову складову, тому лінійну залежність між двома змінними будують у вигляді оціночного рівняння економетричної моделі, відкинувши випадкову складову:
, (1.2)
де a та b відповідно, представляють собою оцінки параметрів та рівняння (1.1). Знак “^” над у означає оцінку залежної змінної, отриману з рівняння (1.2) при деяких усереднених умовах.
Розглянемо геометричну інтерпретацію оцінок параметрів економетричної моделі.
Рис. 1.4. Регресійна пряма та її параметри
Постійна величина а визначає точку перетину прямої регресії з віссю ординат (рис. 1.4) і є значенням у в точці х0=0.
Коефіцієнт b характеризує нахил прямої до осі абсцис. Позначимо через кут, який пряма утворює з віссю абсцис. Тоді b=tg. Він є мірою залежності змінної у від х або мірою впливу, виявленою зміною х на у. Відповідно до рівняння (1.2) b визначає середню величину зміни результативного показника при зміні пояснювальної змінної х на одиницю. Знак b визначає напрямок цієї зміни.
Після визначення числових оцінок параметрів можна за рівнянням (1.2) обрахувати значення для кожного значення пояснюючої змінної хі. Це значення називають розрахунковим.
При лінійній функції сукупність розрахункових значень утворює пряму регресії. Як відзначалося раніше, через випадковий вплив сторонніх факторів для кожного значення хі може спостерігатися декілька емпіричних значень уі, тобто кожному значенню х відповідає розподіл значень змінної у. Значення функції регресії таким чином є оцінками середніх значень змінної у для кожного фіксованого значення змінної х.
Звідси випливає економічна інтерпретація . Значення показують середнє значення залежної змінної у при заданому хі пояснюючої змінної у припущенні, що єдиною причиною зміни у є змінна х, а випадкова збурена змінна u прийняла значення, рівне нулеві. Розкид фактичних значень змінної у довкола зумовлений впливом множини неврахованих факторів. Різницею між емпіричним значенням уі і розрахунковим назвемо залишком, який дає числову оцінку значенням збуреної змінної u (рис. 1.4). Отже, числове значення е визначається як . Зрозуміло, що, чим менше значення еі, тим вдаліше вибрана пряма.
Таким чином, ми підійшли до проблеми оцінювання невідомих параметрів та .
1.4. Методи знаходження оцінок параметрів економетричної моделі з двома змінними
а) Метод найменших квадратів (МНК) за системою нормальних рівнянь. Цей метод є найточнішим методом знаходження оцінок параметрів економетричної моделі. Провівши економічний аналіз певного процесу з врахуванням характеру хмарки точок на діаграмі розсіювання, переходимо до вирівнювання дослідних даних, яке полягає у побудові гіпотетичної лінії. Основною вимогою при цьому є зведення до мінімуму помилок специфікації форм зв’язку між змінними. Ці помилки визначаються через відхилення емпіричних даних уі від значень регресії , тобто вони формують значення збуреної змінної е:
З графіка (рис. 1.4) бачимо, що еі – відхилення дослідної точки від оціночної прямої, виміряне по вертикалі. Це відхилення може бути додатнім чи від’ємним в залежності від того, по яку сторону від лінії розміщена конкретна точка.
При виборі прямої можна висунути вимогу, щоб сума відхилень всіх точок від лінії регресії була рівна нулеві, тобто
.
Ця умова означає, що сума додатних відхилень повинна бути рівною сумі від’ємних. Дотримання даної умови не дає можливості однозначно визначити розміщення вирівнюючої прямої на площині. Дану умову задовольняє нескінчена множина прямих, тобто через задану точку з координатами (хі;уі) проходить пучок прямих.
Для знаходження однозначного розв’язку використовуємо один із показників розсіювання випадкової величини – дисперсію. Якщо всі відхилення піднести до квадрату і просумувати, то результат буде безпосередньо залежати від розкиду точок довкола шуканої лінії. Із множини можливих прямих має бути вибрана така, для якої міра розсіювання дослідних точок буде мінімальною. Це можна представити наступним чином:
(1.3)
тобто сума квадратів відхилень емпіричних значень змінної у від значень, обчислених за рівнянням прямої, повинна бути мінімальною.
Метод, в основу якого покладена вимога мінімізації суми квадратів відхилень, називається методом найменших квадратів (МНК). З його допомогою знаходять такі оцінки параметрів рівняння регресії, які зводять до мінімуму вибрану міру розсіювання. При цьому проходить вирівнювання емпіричних значень в одну лінію регресії. У випадку лінійного зв’язку між змінними ця лінія є прямою.
Таким чином, проблема визначення прямої регресії зводиться до мінімізації функції (1.3). Необхідною умовою цього є перетворення в нуль перших частинних похідних цієї функції по кожній змінній а та b. Візьмемо ці частинні похідні та прирівняємо їх до нуля:
В результаті виконання перетворень отримаємо наступну систему, яка називається системою нормальних рівнянь:
(1.4)
розв’язавши яку, знаходимо a та b:
Розв’язки системи (1.4) методом Крамера можна знайти за формулами:
(1.5)
(1.6)
Значення a та b, обчислені за формулами (1.5) і (1.6), є оцінками параметрів б та в регресії, отримані МНК. Маючи значення a та b можна обрахувати значення регресії для заданої області значень пояснюючої змінної х. Ці значення представляють собою найкращу з точки зору МНК лінійну апроксимацію для емпіричних значень уі, оскільки вибрана міра