нижня межа медіанного інтервалу; h - ширина медіанного інтервалу; S - кумулятивна частота інтервалу, що передує медіанному; f- частота медіанного інтервалу.
Визначити медіану і моду графічним способом, побудувавши гістограму і кумуляту.
Розмах варіації – це різниця між найбільшим і найменшим значенням ознаки . В інтервальному ряді розподілу розмах варіації визначають як різницю між верхньою межею останнього інтервалу і нижньою межею першого .
Середнє лінійне відхилення:
(1.4)
Дисперсія
(1.5)
Середнє квадратичне відхилення:
(1.6)
Лінійний коефіцієнт варіації
100%. (1.7)
1.8 Квадратичний коефіцієнт варіації
100%. (1.8)
Дані характеристик розподілу заносимо в таблицю 1.2.
Найпростішою мірою асиметрії є відхилення між середньою арифметичною і медіаною чи модою. Порівнюємо значення середньої арифметичної, моди, медіани. Якщо має місце правостороння асиметрія, якщо має місце лівостороння асиметрія.
Напрям і міру скошеності характеризують стандартизоване відхилення, яке визначається найчастіше за формулою:
, або А= (1.19)
При цьому в симетричному розподілі А=0, при правосторонній асиметрії А> 0, при лівосторонній А< 0.
Скупченість окремих значень ознаки навколо середньої називають ексцесом. Мірою ексцесу є стандартизований момент ІУ порядку
(1.20)
Де - центральний момент 4-го порядку
(1.21)
У симетричному, близькому до нормального розподілі Е=3. При гостровершинному розподілі Е> 3, плоско вершинному Е< 3.
Для порівняння ступеня скошеності (асиметрії) різних розподілів використовують стандартизований момент ІІІ порядку:
(1.22)
Де - центральний момент третього порядку
(1.23)
Вважають, що при А < 0,25 асиметрія слабка, якщо 0,25< А < 0,5 – середня і при А> 0,5 – висока.
Дані розрахунків занести в таблицю і зробити висновки про розподіл працівників за заробітною платою.
Дані розрахунків заносимо в таблицю 1. 3.
Розглянуті вище характеристики дають нам уяву про характер центру розподілу, варіації та форми розподілу. Поглиблюючи аналіз, можна описати закономірність співвідношення варіант і частот певною функцією, яку називають теоретичною кривою. Серед множини кривих розподілу найпоширенішою виявилась нормальна крива. Вона застосовується як стандарт, з яким порівнюють інші розподіли.
Частоти , які відповідають теоретичній кривій називаються теоретичними. Для нормального розподілу їх визначають за формулою:
(1.24)
де n - обсяг сукупності ;
- інтегральна функція розподілу
. (1.25)
Функція ґрунтується на стандартизованих відхиленнях :
(1.26)
де - верхня межа інтервалу.
Функція табульована. Для додатніх t значення беремо безпосередньо з таблиць . При від’ємних значеннях t функція становить . Значення функції нормального розподілу наведені в додатку А.
Між теоретичними і емпіричними частотами є певні відхилення. Вони можуть мати випадковий характер або бути наслідком невідповідності теоретичної кривої реальному характеру розподілу. Для оцінки істотності відхилень використовують критерії узгодження. Критерій Пірсона обчислюємо за формулою:
(1.27)
Значення порівнюються з критичним для імовірності 1- і числа ступенів вільності -1, де m - число груп; r - число параметрів функції.
Критичне значення - це максимально можливе . Якщо фактичне значення перевищує критичне > , то відхилення між емпіричними і теоретичними частотами слід вважати істотним. У випадку, коли < істотність відхилення вважається недоказаною. Критичні значення наведені в додатку.
Побудувати лінійну діаграму теоретичних і емпіричних частот.
Наведемо приклад аналізу ряду розподілу працівників за заробітною платою.
Дані по заробітній платі за 2003 рік
Вихідні дані Табл 1.1
Групи працюючих за розміром заробітної плати, грн. | Чисельність працюючих, осіб
Від 300 до 500 | 5
Від 500 до 600 | 3
Від 600 до 750 | 2
Від 750 до 800 | 4
Від 800 до 900 | 2
Від 900 до 1000 | 1
Понад 1000 | 2
Разом | 19
В наслідок перегрупування отримано наступні дані
Табл.1.2
Від 300 до 460 | 4
Від 460 до 620 | 4
Від 620 до 780 | 4
Від 780 до 940 | 5
Від 940 до 1100 | 2
Для визначення характеристик розподілу використаємо таблицю 1.3
Таблиця 1.3
Межі
групи | Середина
інтервалу | Групи працюючих
за розміром
з/пл. ,f | Xifi | S | | x-x|f | f
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
Продовження таблиці 1.4
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
300-460 | 380 | 4 | 1520 | -294,74 | 4 | 1178,96 | 86871,67 | 347486,7
460–620 | 540 | 4 | 2700 | -134,74 | 8 | 538,96 | 18154,87 | 72619,47
620–780 | 700 | 4 | 2100 | 25,26 | 12 | 101,04 | 638,0676 | 2552,27
780-940 | 860 | 5 | 3440 | 185,26 | 17 | 926,3 | 34321,27 | 171606,3
940–1100 | 1020 | 2 | 3060 | 345,26 | 19 | 690,52 | 119204,5 | 238408,9
Разом | 19 | 12820 | 3435,78 | 832673,7
Визначаємо середню арифметичну
==;
Медіану Me = XMe + h * =780+160=840;
моду Мо = ХМо + h *
=780+160=820;
Обчислюємо розмах варіації:
R= xmax-xmin=1100-300=800
Визначаємо моду і медіану графічним способом
Рис.1.1-Гістограма. Графічне визначення моди.
Рис .1.2- Кумулята. Графічне визначення моди
Середнє лінійне відхилення = =
Дисперсія
2 =
Середнє квадратичне відхилення
= ==209,34
Лінійний коефіцієнт варіації
= 100 %=
Квадратичний коефіцієнт варіації
= 100 %=;
Порівняємо значення , Ме, м0 ;
=674,74, м0=820; ме=840; як бачимо > Мо > ме , отже має місце правостороння асиметрія.
Стандартизоване відхилення: АS = =; так , як АS<0 асиметрія лівостороння.
Визначимо коефіцієнт асиметрії та ексцес за допомогою центральних моментів розподілу 3-го та 4-го порядку.
Таблиця 1.4
Розрахунок значень центральних моментів 3-го та 4-го порядку
Межі
групи | Середина
інтервалу | f | (x-x)3 | (x-x)3f | (x-x)4 | (x-x)4f
300-460 | 380 | 4 | -294,74 | -25604555 | -102418221 | 7546686632 | 30186746526
460–620 | 540