Лабораторна робота №
Апроксимація закону розподілу експериментальних даних.
Мета: На основі експериментальних даних (вибірки спостережень (x1, x2, …, xn), обсяг п = 150 і є фіксований) необхідно підібрати закон розподілу (вигляд і параметри), який би в статистичному змісті відповідав наявним спостережен-ням. Для реалізації задачі використовувати засоби MS Excel і MathCad.
Завдання на лабораторну роботу.
1. Створіть у Excel за допомогою функції генерації випадкових чисел (СЛЧИС) масив даних в межах значень [45, 48.5] та їх кількістю n = 150. Поділіть сформований масив даних на розряди для отримання вибіркової таблиці цих значень (так як ви це робили раніше, виконуючи лабораторну роботу № . Як приклад, використайте файл Dodatok.xls). Ці дані використати для подальшого виконання роботи.
2. Оцініть якість апроксимації ЕД на основі ряду Грама – Шарльє (див. лекцію № , формула (5.1)). Вихідна таблиця повинна бути створена аналогічно до таблиці 2.4 (лекція №2). Перевірку узгодженості провести із використанням критерію хі-квадрат при рівні значущості a = 0,02. Як зразок, використайте приклад .1, лекція №5.
3.* Підберіть розподіл Пірсона для опису ЕД, які представлені раніше створеною вибірковою таблицею та оцініть якість апроксимації. Перевірку узгодженості провести із використанням критерію хі-квадрат при рівні значущості a ,02. Як зразок, використайте приклад .2, лекція №5.
4.** Потрібно підібрати розподіл Джонсона для опису ЕД, які представляють інтервали часу між надходженнями запитів до бази даних, (див. таблицю ). Перевірку узгодженості провести із використанням критерію Мізеса при рівні значущості a = 0,08. Як зразок, використайте приклад .3, лекція №5.
Таблиця . Інтервали часу між надходженнями запитів до бази даних
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
xi, мс | 1,27 | 2,75 | 2,99 | 4,25 | 5,19 | 8,13 | 9,11 | 10,05 | 11,25 | 16,78 | 21,45 | 33,23
5. Оформити і здати звіт по лабораторній роботі.
1. Створюємо за допомогою функції генерації випадкових чисел масив даних в межах значень [45, 48.5] та їх кількістю n=150. Ділимо сформований масив даних на розряди для отримання вибіркової таблиці цих значень.
Визначаємо кількості розрядів для статистичного ряду та його довжини.
Групування спостережень по розрядах і побудова модифікаційного статистичного ряду.
2.Оцінюємо якість апроксимації експериментальних даних на основі ряду Грама-Шарльє. Перевірку узгодженості проводимо із використанням критерію х-квадрат при рівні значості б=0,02.
Отримання незміщених оцінок.
U14=3 x 105
Знаходження теоретичного значення імовірності попадання випадкової величини в інтервал
Знаходження теоретичної частоти попадання випадкової величини в і-й інтервал.
Сума зважених квадратів відхилення:
Число ступенів вільності k:=9-1-2 k=6
Критичне значення ч2(6,0,05)=12,592
3. Підбираємо розподіл Персона для опису експериментальних даних та оцінюємо якість апроксимації. Перевірку узгодженості проводимо із використанням критерію ч-квадрат прирівні значущості б=0,05.
Корені рівняння B0 + B1 x + B2 x2 = 0
дійсні числа різних знаків. Отже, розподіл відноситься до першого типу і зосереджений на обмеженому інтервалі.
Будуємо таблицю, яка ілюструє розрахунки.
Знаходження теоретичного значення імовірності попадання випадкової величини в інтервал
Знаходження теоретичної частоти попадання випадкової величини в і-й інтервал.
Знаходження зваженого квадрату відхилення.
Сума зважених квадратів відхилення:
У порівнянні із критичним значенням ч-квадрат, апроксимація за допомогою розподілу Пірсона дає цілком допустимий результат, хоча уступає апроксимації за допомогою ряду Грамма-Шарльє.
4. Підбираємо розподіл Джонсона для опису експериментальних даних, що представляють інтервали часу між надходженням запитів до бази даних. Перевірку узгодженості провести із використанням критерію Мізеса
Обчислення значення центральних моментів по варіаційному ряду.
Отримання незміщених оцінок.
Оцінка третього моменту має додатне значення, тому густина розподілу характеризується позитивною асиметрією.
Коефіцієнт асиметрії:
Коефіцієнт ексцесу:
На основі отриманого значення величини в21 визначаємо значення допоміжного параметра:
Цьому значенню щ відповідає точка лінії із координатою:
Оскільки в2<<b2, то вибірку доцільно апроксимувати розподілом Su Джонсона. Для підбору значень параметрів розподілу Su Джонсона скористаємося методом квантилів. Візьмемо чотири кванти лі, які відповідають області максимальних значень густини розподілу, наприклад:
x4/12=5.18; x5/12=6.22; x6/12=9.14; x7/12=9.94.
Цим квантилям вихідної вибірки відповідають кванти лі стандартизованого нормального розподілу:
u4/12=-0.4307; u5/12=-0.2104; u6/12=0; u7/12=0.2104.
Порівнюючи кванти лі отримуємо систему рівнянь:
GIVEN
Перетворення Джонсона набуває вигляду:
Значення критерію Мізеса:
Критичне значення цього критерію при рівні значущості складає 0,347. Розрахункове значення менше критичного, отже, підібраний розподіл Джонсона не суперечить експериментальним даним і його можна використовувати для апроксимації.
Висновок: на даній лабораторній роботі я на основі експериментальних даних (вибірки спостережень (x1, x2, …, xn), обсяг п = 150 і є фіксований) підібрав закон розподілу (вигляд і параметри), який в статистичному змісті відповідає наявним спостережен-ням.