У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент



Магістерська робота - Статистика продукції
48
кожній точці інтервалу зміни факторної ознаки х Тобто лінія регресії в даному випадку безперервна і зображується у вигляді певної функції Y=f(x), яка називається рівнянням регресії, a Y - це теоретичні значення результативної ознаки.

Розглянемо парну модель, тобто з однією факторною ознакою. При виборі функціонального її виду використовують графіки, аналітичні групування, теоретичне обґрунтування. При невеликому обсязі сукупності доцільно будувати графіки у вигляді кореляційного поля, де кожному елементу сукупності відповідає точка, а всі елементи утворюють певне скупчення точок. Загальний вигляд кореляційного поля дозволяє зробити висновок щодо форми лінії регресії.

Можливий перебір функцій, коли обчислюють рівняння регресії різних видів і з них вибирають найкраще. Як правило, це рівняння з найвищим коефіцієнтом тісноти зв'язку між ознаками, що вивчають.

Серед безлічі функцій найпоширенішою в статистико-економічному аналізі є лінійна Y=a+bx. Це пояснюється, передусім її простотою та змістовністю параметрів. Крім того, факторна ознака часто варіює в невеликих межах, що дає змогу показати апроксимацію зв'язку лінійною функцією.

Параметр b лінійного рівняння називають коефіцієнтом регресії. Він показує, на скільки одиниць власного виміру в середньому змінюється значення ознаки у зі збільшенням значення ознаки х на одиницю.

Параметри обраного рівняння визначають-методом найменших квадратів, який уже розглядався в розділі 2 даної роботи. Основна умова цього методу полягає у мінімізації суми квадратів відхилень емпіричних значень у від теоретичних Y.

Це дає можливість отримати найкращі оцінки параметрів а і b. Для їх обчислення треба скласти і розв'язати систему нормальних рівнянь. Лінійній моделі відповідає система рівнянь з двома невідомими

Дослідження форми зв'язку іноді приводить до необхідності використання нелінійних рівнянь регресії. У цьому разі при визначенні параметрів методом найменших квадратів рівняння регресії слід привести до лінійного виду певними перетвореннями. При вивченні взаємозв'язків найчастіше використовують такі функції:

1) степеневу Y=axb, яка приводиться до лінійного вигляду логарифмуванням logY = loga+blogx. Подальші розрахунки аналогічні лінійній моделі;

2) гіперболу Y=a+b/x приводять до лінійного вигляду, замінивши х новою змінною (її зворотним значенням z=l/x): Y=a+bz;

3)параболу другого порядку Y=a+bx+cx2. Якщо замінити квадрат значень факторної ознаки (z=x2), то дістанемо лінійну функцію від двох змінних Y=a+bx+cz.

Визначення тісноти зв'язку в кореляційно-регресійному аналізі, як і в методі аналітичного групування, грунтується на правилі складання дисперсій. На відміну від аналітичного групування, де оцінками лінії регресії є групові середні результативної ознаки, в кореляційно-регресійному аналізі - теоретичні значення останньої. Дисперсію теоретичних значень називають факторною і обчислюють за формулою:

Як і в аналітичному групуванні вона характеризує варіацію результативної ознаки у, пов'язану з варіацією факторної ознаки х.

Замість середньої з групових дисперсій обчислюють залишкову дисперсію яка характеризує варіацію результативної ознаки у не пов'язану з варіацією факторної ознаки х. Виконується правило складання дисперсій, згідно якого загальна дисперсія розпадається на факторну та залишкову:

, де

– загальна дисперсія, яка визначається за формулою:

Мірою тісноти зв'язку в кореляційно-регресійному аналізі є коефіцієнт детермінації R2, аналогічний кореляційному відношенню

Цей коефіцієнт характеризує ту частину варіації результативної ознаки у, яка відповідає лінійному рівнянню регресії.

Коефіцієнт детермінації R приймає значення від 0 до 1. При R2=0 теоретична дисперсія дорівнює 0, всі теоретичні значення^ Y збігаються з середнім значенням у. Лінійний кореляційний зв'язок між х і у відсутній1.

При R2=l теоретична дисперсія дорівнює загальній, залишкова - нулю; емпіричні значення у і теоретичні Y збігаються, зв'язок між ознаками х та y лінійно-функціональний.

Для вимірювання тісноти зв'язку при лінійній залежності використовують лінійний коефіцієнт кореляції.

Значення r коливаються від -1 до +1 і характеризують не тільки тісноту зв'язку, але й його напрям. Додатне значення r означає прямий зв'язок між ознаками, від'ємне -зворотній. На практиці лінійний коефіцієнт кореляції визначають за формулою

Перевірка істотності відхилень групових середніх здійснюється за допомогою критеріїв математичної статистики. Вона ґрунтується на порівнянні фактичного значення R2 з так званим критичним. Останнє є тим максимально можливим значенням кореляційного відношення, яке може виникнути випадково при відсутності кореляційного зв'язку. Якщо фактичне значення R2 більше від критичного, то зв'язок між факторною і результативною ознаками вважається істотним. Якщо фактичне значення R2 менше критичного, то наявність кореляційного зв'язку між ознаками не доведена і зв'язок вважається неістотним.

Критичне значення вибирають таким чином, щоб імовірність отримання значення R2 більшого від критичного (за умови відсутності зв'язку між ознаками) була достатньо мала. Таку імовірність називають рівнем істотності а.

Найчастіше в статистико-економічних дослідженнях застосовують такі рівні істотності, як а=0,05 і а=0,01.

Для знаходження критичних значень розподілу R складено таблиці, значення R2 в них залежать, крім рівня істотності, і від числа ступенів вільності міжгрупової k1 і середньої з групових k2 дисперсій. В кореляційно-регресійному аналізі вони визначаються так:

k1 = m – 1 i k2 = n – m , де

n - кількість елементів сукупності;

m - число параметрів рівняння регресії. Критичне значення позначається R21–a (k1.k2). Для перевірки істотності зв'язку використовують також функціонально зв'язану з R2 характеристику F-критерії (критерії Фішера), який обчислюють за формулами

 

Існують таблиці критичних значень F-критерію. Перевірку істотності зв'язку за його допомогою здійснюють аналогічно описаній вище для кореляційного відношення .

У невеликих щодо обсягу сукупностях коефіцієнт регресії схильний до випадкових коливань. Тому слід визначити відповідні межі цих коливань, тобто довірчий інтервал коефіцієнта регресії. Середня помилка коефіцієнта регресії обчислюється за формулою

Величина граничної помилки залежить від імовірності Р: Дв=tмв, де t - коефіцієнт довіри.

Як правило, кореляційно-регресійний аналіз проводиться за незгрупованими даними, але вихідна інформація може бути подана у вигляді аналітичного групування або комбінаційного розподілу.

При вивченні кореляційних зв'язків у багатомірних динамічних


Сторінки: 1 2 3 4 5 6 7 8 9 10