інтервальному ряді модальним є інтервал, який має найбільшу частоту, а мода визначається за формулою
,
де – нижня межа модального інтервалу; - ширина інтервалу; - частота модального інтервалу; - частота попереднього відносно модального інтервалу; - частота наступного відносно модального інтервалу.
Медіана – варіанта, що ділить ранжирований ряд на дві рівні за чисельністю частини.
В інтервальному ряді розподілу медіанний інтервал розраховується, використовуючи кумулятивні частоти, а конкретне значення медіани обчислюється за формулою:
,
де - нижня межа медіанного інтервалу; h - ширина медіанного інтервалу; S- кумулятивна частота інтервалу, що передує медіанному; f- частота медіанного інтервалу.
Визначити медіану і моду графічним способом, побудувавши гістограму і кумуляту.
Розмах варіації – це різниця між найбільшим і найменшим значенням ознаки. В інтервальному ряді розподілу розмах варіації визначають як різницю між верхньою межею останнього інтервалу і нижньою межею першого .
Середнє лінійне відхилення:
Дисперсія
Середнє квадратичне відхилення:
Лінійний коефіцієнт варіації 100%.
Квадратичний коефіцієнт варіації 100%.
Найпростішою мірою асиметрії є відхилення між середньою арифметичною і медіаною чи модою. Порівнюємо значення середньої арифметичної, моди, медіани. Якщо має місце правостороння асиметрія, якщо має місце лівостороння асиметрія.
Напрям і міру скошеності характеризують стандартизоване відхилення, яке визначається найчастіше за формулою:
, або А=
При цьому в симетричному розподілі А=0, при правосторонній асиметрії А> 0, при лівосторонній А< 0.
Скупченість окремих значень ознаки навколо середньої називають ексцесом. Мірою ексцесу є стандартизований
момент ІV порядку
Де - центральний момент 4-го порядку
У симетричному, близькому до нормального розподілі Е=3. При гостровершинному розподілі Е> 3, плоско вершинному Е< 3.
Для порівняння ступеня скошеності (асиметрії) різних розподілів використовують стандартизований момент ІІІ порядку:
Де - центральний момент третього порядку
Вважають, що при А < 0,25 асиметрія слабка, якщо 0,25< А < 0,5 – середня і при А> 0,5 – висока.
Дані розрахунків занести в таблицю і зробити висновки про розподіл працівників за заробітною платою.
Розглянуті вище характеристики дають нам уяву про характер центру розподілу, варіації та форми розподілу. Поглиблюючи аналіз, можна описати закономірність співвідношення варіант і частот певною функцією, яку називають теоретичною кривою. Серед множини кривих розподілу найпоширенішою виявилась нормальна крива.
Вона застосовується як стандарт, з яким порівнюють інші розподіли.
Частоти , які відповідають теоретичній кривій називаються теоретичними. Для нормального розподілу їх визначають за формулою:
де n - обсяг сукупності
- інтегральна функція розподілу .
Функція ґрунтується на стандартизованих відхиленнях :
де - верхня межа інтервалу.
Функція табульована. Для додатних t значення беремо безпосередньо з таблиць. При від’ємних значеннях t функція становить . Значення функції нормального розподілу наведені в додатку А.
Між теоретичними і емпіричними частотами є певні відхилення. Вони можуть мати випадковий характер або бути наслідком невідповідності
теоретичної кривої реальному характеру розподілу. Для оцінки істотності відхилень використовують критерії узгодження. Критерій Пірсона обчислюємо за формулою:
Значення порівнюються з критичним для імовірності 1- і числа ступенів вільності -1, де m - число груп; r - число параметрів функції.
Критичне значення - це максимально можливе . Якщо фактичне значення перевищує критичне > , то відхилення між емпіричними і теоретичними частотами слід вважати істотним. У випадку, коли < істотність відхилення вважається недоказаною. Критичні значення наведені в додатку Б.
Побудувати лінійну діаграму теоретичних і емпіричних частот.
Наведемо приклад аналізу ряду розподілу працівників за заробітною платою.
Дані по заробітній платі за 2008 рік
Таблиця 1.2.
Групи працюючих за розміром заробітної плати, грн. | Чисельність працюючих, осіб | Частка d%
до 700 | 17 | 14,29
700 – 1400 | 34 | 28,57
1400 – 2100 | 37 | 31,09
2100 – 2800 | 21 | 17,65
понад 2800 | 10 | 8,40
Разом | 119 | 100
Для визначення характеристик розподілу використаємо таблицю 1.3
Таблиця 1.3
Межі інтервалу | Середина інтервалу (варіант) x | Чисель-ність
працівни-ків (частота),
f | Добуток варіант на частоти, хf | Нагромад-жена частота (кумуля-тивна),
S | Відхи-лення варіантів від середньої | Добуток відхи-лення варіан-тів від серед-ньої на частоти | Квадрат відхилень варіантів від середньої | Добуток квадратів відхилень на частоти
до 700 | 350 | 17 | 5950 | 17 | -1241,18 | 21100 | 1540519,03 | 26188823,5
700 – 1400 | 1050 | 34 | 35700 | 51 | -541,18 | 18400 | 292871,972 | 9957647,06
1400 – 2100 | 1750 | 37 | 64750 | 88 | 158,82 | 5876,471 | 25224,9135 | 933321,799
2100 – 2800 | 2450 | 21 | 51450 | 109 | 858,82 | 18035,29 | 737577,855 | 15489134,9
понад 2800 | 3150 | 10 | 31500 | 119 | 1558,82 | 15588,24 | 2429930,8 | 24299308
Разом | 119 | 189350 | 79000 | 76868235,3
Визначаємо середню арифметичну
==грн.;
Медіану:
Me=XMe+h*=1400+700=1560,81 грн
Моду:
Мо=ХМо+h*=
=1400+700=1516,67 грн.
Обчислюємо розмах варіації:
R= xmax-xmin=3500-0=3500 грн.
Визначаємо моду і медіану графічним способом
Рисунок. 1.1 - Гістограма. Графічне визначення моди.
Рисунок 1.2. – Кумулята. Графічне визначення моди.
Середнє лінійне відхилення
= = грн.
Дисперсія
2 =
Середнє квадратичне відхилення
= ==803,71 грн.
Лінійний коефіцієнт варіації
= 100 %=
Квадратичний коефіцієнт варіації
= 100 %=;
Порівняємо значення , Ме, Мо ;
= 1591,18, Мо=1516,67, Ме=1560,81, як бачимо > Ме > Мо , отже має місце правостороння асиметрія.
Стандартизоване відхилення: АS = =; так , як АS асиметрія правостороння.
Визначимо коефіцієнт асиметрії та ексцес за допомогою центральних моментів розподілу 3-го та 4-го порядку.
Таблиця 1.4 - Розрахунок значень центральних моментів 3-го та 4-го порядку
Межі інтер-валу | Середина інтервалу
(варіант),
x | Чисельність працівників (частота),
f
до 700 | 350 | 17 | 32504951557 | 4,03444E+13
700 – 1400 | 1050 | 34 | 5388844291