Лабораторна робота №
Обробка однотипних вибірок експери-ментальних даних
Мета: Навчитися перевіряти однотипність вибірок та нульову гіпотезу про рівність середніх значень по шарах декількох вибірок
Завдання на лабораторну роботу.
1. Створіть середовищі MS Excel за допомогою функції генерації випадкових чисел (СЛЧИС чи RANDOM) три масиви даних в межах значень [100*a / 110*a], де а – номер вашого варіанта, b – згенероване випадкове ціле число в межах [1…5] та їх різною кількістю n1 50, n2150, n3 . Створіть відповідно три вибірки для цих масивів (аналогічно ви це робили при виконанні лаб.роботи № і як приклад формування вибірки, використайте файл Lab_rob 2.xls). Сформовані вибірки (!) для включення їх у звіт оформіть у вигляді таблиці (аналогічно до таблиці 6.1, лекція №6).
2. Використовуючи приклад 6.1 лекції № , перевірте однорідність вибірок при значенні рівня значущості .1/b.
3. Використовуючи метод дисперсійного аналізу при тому самому рівні значущості перевірте нульову гіпотезу про рівність середніх значень по шарах (див. Приклад .2 лекції № ).
*4. Аналогічно повторіть пункти 1-3 у середовищі MathCad.
5. Оформіть звіт і здайте викладачеві.
1 . Створюємо за допомогою функції генерації випадкових чисел масив даних в межах значень [45, 48.5] та їх кількістю n=150. Ділимо сформований масив даних на розряди для отримання вибіркової таблиці цих значень.
Визначення кількості розрядів для статистичного ряду та його довжини
за результатами спостереження за пропускною здатністю каналу в різні дні випробувань сформовані упорядковані вибірки (вище), рівні значущості:
візьмемо в якості вихідної вибірки Х, що відповідає першій вибірці, і перевіримо її на однотипність із другою вибіркою. Перелічимо послідовність елементів у загальному варіаційному ряді, складеному із елементів першої і другої вибірки:
xyyxyxyxyxyyxyxy
сума порядкових номерів першої вибірки складе
кількість елементів в обох вибірках меньше 25, тому необхідно скористатися розподілом Вілкоксона для перевірки гіпотези про однорідність вибірок. Значення нижньої критичної точки для двосторонньої області при заданому рівні
кількості спостерехень:
визначимо по таблиці:
значення верхньої критичної точки:
Значення величини u перевищує u_n і менше u_v, тому немає підстав відкидати нульову гіпотезу про однорідність вибірок. Позначимо обєднану вибірку через Х.
Перевіримо однорідність обєднаної вибірки Х та результатів третього дня спостереження w. Побудуємо загальний варіаційний ряд із елементів вибірки x і вибірки w: xwxxwxxxxxwxwxwwxwxx.
ВІдповідно до обраного критерію немає підстав відкидати нулбову гіпотезу, отже всі три вибірки однорідні і їх можна обєднати в одну.
3. Методом дисперсійного аналізу при рівні значущості 0,05 перевірити нульову гіпотезу про рівність середніх значень по шарах, стосовно до результатів спостережень. Передбачається, що вибірка належить нормальному розподілу, а кожен шар відповідає деякому значенню фактора Ф.
Необхідно перевірити однорідність дисперсій, а потім безпосередньо провести дисперсійний аналіз. Перевіримо гіпотезу про однорідність дисперсій. Для цього обчислимо:
Оцінки математичного очікування
незміщені оцінки дисперсій по шарах
усереднену оцінку незміщеної дисперсії по всіх шарах
значення критерія Барлетта
Критичне значення хі-квадрат для правобічної області
Оскільки величина В менше , відкинути нульову гіпотезу про однорідність дисперсій немає основ.
Дисперсійний аналіз передбачає обчислення:
суми квадратів
оцінок дисперсій
Оцінка фактичної дисперсії є меншою, ніж оцінка залишкової дисперсії, тому можна відразу стверджувати щодо справедливості нульової гіпотези про рівність математичних очікувань по шарах вибірки. Інакше кажучи, у даному прикладі фактор Ф не робить істотного впливу на випадкову величину.
Висновок: з отриманих результатів видно, що гіпотеза про рівність математичних очікувань по шарах вибірки справджується.