| Частка працюючих, % | Заробітна плата, грн. | Частка працюючих, %
До 160 | 15 | До 160 | 12
160 — 180 | 20 | 160 — 190 | 30
180 — 200 | 26 | 190 — 220 | 21
200 — 220 | 23 | 220 — 250 | 18
220 — 240 | 9 | 250 — 280 | 13
240 і більше | 7 | 280 і більше | 6
Разом | 100 | Разом | 100
Результати первинного групування безпосередньо порівняти не можна, оскільки інтервали групування різні: у галузі А ширина інтервалу 20, у галузі В — 30 грн. Перегрупуємо дані, утворивши п’ять груп з інтервалом h = 40 грн. Очевидно, інтервали поділу в галузі А потрібно об’єднати, а в галузі В — розбити. Результати вторинного групування ілюструє табл. 7.
Таблиця 7
ВТОРИННЕ ГРУПУВАННЯ ПРАЦЮЮЧИХ
ЗА РІВНЕМ СЕРЕДНЬОМІСЯЧНОЇ ЗАРОБІТНОЇ ПЛАТИ
Заробітна плата,
грн. | Частка працюючих, %
Галузь А | Галузь В
До 160 | 15 | 12
160 — 200 |
20 + 26 = 46
200 — 240 |
23 + 9 = 32
240 — 280 |
7
280 і більше— | 6
Разом | 100 | 100
Порівнявши частки вторинного групування, побачимо, що в галузі В сукупність працюючих за рівнем заробітної плати більш диференційована. Перегрупуванням даних можна перейти від структурного групування до типологічного.
7.3. Оцінка щільності та перевірка істотності кореляційного зв’язку для лінійного однофакторного рівняння залежності.
Поряд із визначенням характеру зв’язку та ефектів впливу факторів х на результат у важливе значення має оцінка щільності зв’язку, тобто оцінка узгодженості варіації взаємозв’язаних ознак. Якщо вплив факторної ознаки х на результативну у значний, це виявиться в закономірній зміні значень у зі зміною значень х, тобто фактор х своїм впливом формує варіацію у . За відсутності зв’язку варіація у не залежить від варіації х.
Для оцінювання щільності зв’язку статистика використовує низку коефіцієнтів з такими спільними властивостями:
за відсутності будь-якого зв’язку значення коефіцієнта наближається до нуля; при функціональному зв’язку — до одиниці;
за наявності кореляційного зв’язку коефіцієнт виражається дробом, який за абсолютною величиною тим більший, чим щільніший зв’язок.
Серед мір щільності зв’язку найпоширенішим є коефіцієнт кореляції Пірсона. Позначається цей коефіцієнт символом r. Оскільки сфера його використання обмежується лінійною залежністю, то і в назві фігурує слово «лінійний». Обчислення лінійного коефіцієнта кореляції r ґрунтується на відхиленнях значень взаємозв’язаних ознак x і у від середніх.
За наявності прямого кореляційного зв’язку будь-якому значенню хі > відповідає значення , а відповідає . Узгодженість варіації х і у схематично показано на рис. 1 у вигляді кореляційного поля зі зміщеною системою координат.
Рис. 1 Узгодженість варіації взаємозв’язаних ознак
Точка, координатами якої є середні і , поділяє кореляційне поле на чотири квадранти, в яких по-різному поєднуються знаки відхилень від середніх:
Квадрант | (х – ) | (у – )
I | + | +
II– | +
III––
IV | +–
Для точок, розміщених у І та ІІІ квадрантах, добуток додатний, а для точок з квадрантів ІІ і ІV — від’ємний. Чим щільніший зв’язок між ознаками х і у, тим більша алгебраїчна сума добутків відхилень . Гранична сума цих добутків дорівнює .
Коефіцієнт кореляції визначається відношенням зазначе-
них сум:
.
Очевидно, що в разі функціонального зв’язку фактична сума відхилень дорівнює граничній, а коефіцієнт кореляції r = ±1; при кореляційному зв’язку абсолютне його значення буде тим більшим, чим щільніший зв’язок.
На практиці застосовують різні модифікації наведеної формули коефіцієнта кореляції. Для оцінювання щільності зв’язку між кількістю внесених добрив та врожайністю зернових скористаємося однією з модифікацій зазначеної формули:
.
Таблиця 1
ДО РОЗРАХУНКУ ПАРАМЕТРІВ ЛІНІЙНОЇ РЕГРЕСІЇ,
ТЕОРЕТИЧНИХ РІВНІВ І ЗАЛИШКОВИХ ВЕЛИЧИН
Номер господар-
ства | Кількість внесених добрив х, д. р | Урожайність зернових у, ц/га | ху | х2 | Y | y – Y | (y – Y)2
1 | 1,1 | 23 | 25,3 | 1,21 | 24– | 1 | 1
2 | 1,4 | 25 | 35,0 | 1,96 | 27– | 2 | 4
3 | 1,2 | 26 | 31,2 | 1,44 | 25 | 1 | 1
4 | 2,0 | 33 | 66,0 | 4,00 | 33 | 0 | 0
5 | 1,5 | 27 | 40,5 | 2,25 | 28– | 1 | 1
6 | 1,3 | 2,8 | 36,4 | 1,69 | 26 | 2 | 4
7 | 1,8 | 30 | 54,0 | 3,24 | 31– | 1 | 1
8 | 1,7 | 32 | 54,4 | 2,89 | 30 | 2 | 4
Разом | 12,0 | 224 | 342,8 | 18,68 | 224 | 16
За даними табл. 1
Згідно з цими значеннями коефіцієнт кореляції становить 0,900, що свідчить про вагомий вплив кількості внесених добрив на врожайність зернових:
.
Коефіцієнт кореляції, оцінюючи щільність зв’язку, указує також на його напрям: коли зв’язок прямий, r — величина додатна, а коли він зворотний — від’ємна. Знаки коефіцієнтів кореляції і регресії однакові, величини їх взаємозв’язані функціонально:
; .
Завдяки цьому один коефіцієнт можна обчислити, знаючи інший. Наприклад:
.
Вимірювання щільності нелінійного зв’язку ґрунтується на співвідношенніваріацій теоретичних та емпіричних (фактичних) значень результативної ознаки у. Відхилення індивідуального значення ознаки у від середньої можна розкласти на дві складові. У регресійному аналізі це відхилення від лінії регресії (у – Y) та відхилення лінії регресії від середньої .
Відхилення є наслідком дії фактора х, відхилення — наслідком дії інших