факторів. Взаємозв’язок факторної та залишкової варіацій описується правилом декомпозиції варіації:
,
де — загальна дисперсія ознаки y; — факторна дисперсія; — залишкова дисперсія.
Очевидно, значення факторної дисперсії буде тим більшим, чим сильніший вплив фактора х на y. Відношення факторної дисперсії до загальної розглядається як міра щільності кореляційного зв’язку і називається коефіцієнтом детермінації:
.
Якщо за даними табл. 1 , , то .
Аналогічний результат дають такі обчислення:
.
Коефіцієнт детермінації становить ,
тобто 81% варіації врожайності зернових залежить від варіації кількості внесених добрив, а 19% припадає на інші фактори.
Корінь квадратний з коефіцієнта детермінації називають індексом кореляції R. Коли зв’язок лінійний, , що підтверджують обчислення: Тому за відомим лінійним коефіцієнтом кореляції r можна визначати внесок ознаки x у варіацію ознаки y. Так, при r ,6 можна сказати, що 36% варіації y залежить від варіації x.
На таких самих засадах ґрунтується оцінювання щільності зв’язку за даними аналітичного групування. Мірою щільності зв’язку є кореляційне відношення
,
де 2 — міжгрупова дисперсія, яка вимірює варіацію ознаки у під впливом фактора х, а 2 — загальна дисперсія.
Застосуємо кореляційне відношення для оцінювання щільності зв’язку між глибиною розробки вугільних пластів і фондомісткістю видобутку вугілля (див. табл. ).
Таблиця 2
КОМБІНАЦІЙНИЙ РОЗПОДІЛ ШАХТ ЗА ГЛИБИНОЮ
РОЗРОБКИ ПЛАСТІВ ТА ФОНДОМІСТКІСТЮ ВУГІЛЛЯ
Глибина розробки пласта, м | Кількість шахт з рівнем фондомісткості, грн. / т | Середній рівень фондо-місткості, грн. / т
До 20 | 20—22 | 22—24 | 24—26 | 26 і більше | Разом
До 300 | 9 | 7 | 1 | 17 | 20,0
300—500 | 8 | 27 | 5 | 40 | 22,9
500—700 | 6 | 15 | 4 | 25 | 24,8
700 і більше | 8 | 10 | 18 | 26,1
По сукупнос-ті в цілому | 9 | 15 | 34 | 28 | 14 | 100 | 23,5
Розрахунки загальної та факторної дисперсій подано в табл. та 4. Згідно з розрахунками загальна дисперсія становить 5,19, факторна — 3,86:
;
.
Кореляційне відношення
,
тобто 74,5% варіації фондомісткості вугілля на шахтах регіону пояснюється варіацією глибини розробки пластів.
Таблиця 3
ДО РОЗРАХУНКУ ЗАГАЛЬНОЇ ДИСПЕРСІЇ
ФОНДОМІСТКОСТІ ВУГІЛЛЯ ()
Фондомісткість, грн. т | 18—20 | 0—22 | 22—24 | 24—26 | 26—28 | Разом
Кількість шахт | 9 | 15 | 34 | 28 | 14 | 100
19 | 21 | 23 | 25 | 27–
4,5– | 2,5– | 0,5 | 1,5 | 3,5
182,25 | 93,75 | 8,5 | 63,0 | 171,5 | 519
Таблиця 4
ДО РОЗРАХУНКУ ФАКТОРНОЇ ДИСПЕРСІЇ
ФОНДОМІСТКОСТІ ВУГІЛЛЯ ()
Глибина розробки пластів, м
До 300 | 17 | 20,0– | 3,5 | 208,25
300 — 500 | 40 | 22,9– | 0,6 | 14,40
500 — 700 | 25 | 24,8 | 1,3 | 42,25
700 і більше | 18 | 26,1 | 2,6 | 121,68
У цілому | 100 | 23,5 | 386,58
Обчислення та інтерпретація коефіцієнта детермінації R2 і кореляційного відношення 2 показують: ці характеристики щільності зв’язку за змістом ідентичні, вони характеризують внесок фактора x у загальну варіацію результату y.
Перевірка істотності кореляційного зв’язку ґрунтується на порівнянні фактичних значень R2 і 2 з критичними, які могли б виникнути за відсутності зв’язку. Якщо фактичне значення чи 2 перевищує критичне, то зв’язок між ознаками не випадковий. Гіпотеза, що перевіряється, формулюється як нульова:
або .
Критичні значення характеристик щільності зв’язку для рівня істотності = 0,05 і відповідного числа ступенів свободи для факторної дисперсії k1 і залишкової k2 наведено в табл. .6. Ступені свободи залежать від обсягу сукупності n та числа груп або параметрів функції m, тобто k1 = m – 1, k2 = n – m.
Таблиця 5
КРИТИЧНІ ЗНАЧЕННЯ КОЕФІЦІЄНТА ДЕТЕРМІНАЦІЇ R2
І КОРЕЛЯЦІЙНОГО ВІДНОШЕННЯ 2 ДЛЯ РІВНЯ ІСТОТНОСТІ = 0,05 |
1 | 2 | 3 | 4 | 5
5 | 0,569 | 699 | 764 | 806 | 835
6 | 500 | 632 | 704 | 751 | 785
7 | 444 | 575 | 651 | 702 | 739
8 | 399 | 527 | 604 | 657 | 697
9 | 362 | 488 | 563 | 618 | 659
10 | 332 | 451 | 527 | 582 | 624
12 | 283 | 394 | 466 | 521 | 564
14 | 247 | 348 | 417 | 471 | 514
16 | 219 | 312 | 378 | 429 | 477
18 | 197 | 283 | 345 | 394 | 435
20 | 179 | 259 | 318 | 364 | 404
24 | 151 | 221 | 273 | 316 | 353
28 | 130 | 193 | 240 | 279 | 314
32 | 115 | 171 | 214 | 250 | 282
36 | 102 | 153 | 192 | 226 | 256
40 | 093 | 139 | 176 | 207 | 234
50 | 075 | 113 | 143 | 170 | 194
60 | 063 | 095 | 121 | 144 | 165
80 | 047 | 072 | 093 | 110 | 127
100 | 038 | 058 | 075 | 090 | 103
120 | 032 | 049 | 063 | 075 | 087
200 | 019 | 030 | 038 | 046 | 053
Так, критичне значення коефіцієнта детермінації для k1 = 2 – 11 і k2 = 8 – 2 = 6 становить . Обчислений за даними табл. коефіцієнт детермінації R2 = 0,81 перевищує