Лабораторна робота
Елементи математичної статистики. Перевірка гіпотези про нормальний закон за критерієм Пірсона.
Теоретична частина.
Основною задачею математичної статистики є систематизація, обробка і використання статистичної інформації для виявлення статистичних закономірностей деякої ознаки певної сукупності елементів.
Нехай потрібно вивчити сукупність однотипних об’єктів відносно деякої кількісної чи якісної ознаки. Ця сукупність називається генеральною, а кількість її елементів називають обсягом генеральної сукупності і позначають . Як правило, досить велике і невідоме.
Оскільки обробка всіх елементів генральної сукупності практично неможлива, то із всієї сукупності вибирають скінченне число елементів, вивчають їх і роблять висновки для всієї сукупності. Множину випадково відібраних елементів називають вибірковою сукупністю або вибіркою. Кількість елементів вибірки (обсяг або об’єм вибірки) позначають за і вважають, що вона набагато менша за обсяг генеральної сукупності .
Нехай з генеральної сукупності береться вибірка обсягом і на основі неї досліджується кількісна ознака , яка є дискретною випадковою величиною. Нехай ця ознака для елементів вибірки набуває значення разів, значення разів,..., значення разів. Тоді . Значення називають варінтами, а числа - частотами варіант . Зростаючий числовий ряд варіант є варіаційним рядом. Перелік варіант і відповідних частот називається дискретним статистичним розподілом вибірки, у табличній формі він має вигляд: |
...
...
Якщо ознака генеральної сукупності є неперервною, то варіаційним рядом буде кілька часткових інтервалів, які місятяь варіанти. Такі інтервали утворюють інтервальний варіаційний ряд. Перелік часткових інтервалів і відповідних частот називають інтервальним статистичним розподілом вибірки, він має вигляд: |
...
...
Тут - це кількість варіант вибірки, які містяться на інтервалі - довжина -го інтервалу.
На практиці розглядають інтервальні варіаційні ряди з інтервалами однакової довжини, тобто
Найбільш поширеними числовими характеристиками вибірки є:
Вибіркове середнє , яке визначається формулами
для дискретного розподілу (1) і
для інтервального розподілу (2), де - середини інтервалів , тобто
2. Дисперсія вибірки , яка визначається формулами
,
відповідно для дискретного та інтервального розподілів.
Середнє квадратичне відхилення вибірки, яке дорівнює
.
Однією із задач математичної статистики є перевірка правильності гіпотези про закон розподілу ознаки генеральної сукупності на підставі обробки результатів вибірки. Розглянемо метод перевірки гіпотези про нормальний закон розподілу ознаки , який називають критерієм Пірсона.
Перевіримо, чи при заданому рівні значущості випадкова величина , що характеризує генеральну сукупність, розподілена нормально. Для цього візьмемо вибірку, задану інтервальним розподілом (2) з частковими інтервалами однакової довжини . Поряд з частотами варіант (емпіричними частотами) розглядають теоретичні частоти , які шукають за формулами
(3)
де - обсяг вибірки; - довжина часткових інтервалів; - середнє квадратичне відхилення вибірки; - функція Гаусса, для значень якої складені таблиці (див. додаток 1), .
Розглянемо випадкову величину
, (4)
яку називають критерієм згоди Пірсона. Доведено, що при закон розподілу випадкової величини (4) прямує до розподілу (читають “хі-квадрат”), який має ступенів свободи.
Підставивши у формулу (4) одержані емпіричні і теоретичні частоти, обчислюємо спостережуване значення критерію
За даним рівнем значущості і кількістю ступенів свободи знайдемо критичну точку критерію, користуючись таблицею критичних точок розподілу (див. додаток 2).
Якщо , то гіпотеза про нормальний закон розподілу ознаки відхиляється. Якщо ж , то гіпотеза приймається.
Приклад. При рівні значущості перевірити гіпотезу про нормальний розподіл ознаки за даним інтервальним розподілом |
[80,90) | [90,100) | [100,110) | [110,120) | [120,130)
2 | 14 | 60 | 20 | 4
Розв’язання.
Даний інтервальний розподіл має інтервали однакової довжини . Побудуємо відповідний дискретний статистичний розподіл, вибравши в ролі варіант середини інтервалів : |
85 | 95 | 105 | 115 | 125
2 | 14 | 60 | 20 | 4
Знайдемо вибіркове середнє і середнє квадратичне відхилення . Оскільки обсяг вибірки дорівнює , то
Для обчислення теоретичних частот за формулою (3) знайдемо спочатку величини
За таблицею значень функції Гаусса знаходимо:
Тоді теореетичні частоти знаходимо за формулою , заокруглюючи одержані значення до цілих:
Далі за формулою (4) знайдемо спостережуване значення критерію
За рівнем значущості і за кількістю ступенів свободи з таблиці додатку 2 знайдемо критичну точку
Оскільки , то гіпотеза про нормальний розподіл приймається .
Відповідь. Гіпотеза про нормальний розподіл приймається з рівнем значущості
Практична частина.
У задачах 1-33 при рівні значущості перевірити гіпотезу про нормальний розподіл генеральної сукупності на основі інтервального статистичного розподілу вибірки.
9.1. |
[0,4) | [4,8) | [8,12) | [12,16) | [16,20) | [20,24]
5 | 10 | 30 | 35 | 15 | 5
9.2. |
[0,6) | [6,12) | [12,18) | [18,24) | [24,30) | [30,36]
4 | 16 | 20 | 25 | 20 | 5
9.3. |
[1,5) | [5,9) | [9,13) | [13,17) | [17,21) | [21,25]
1 | 2 | 9 | 17 | 8 | 3
9.4. |
[1,7) | [7,13) | [13,19) | [19,25) | [25,31) | [31,37]
4 | 7 | 13 | 21 | 10 | 5
9.5. |
[0,10) | [10,20) | [20,30) | [30,40) | [40,50) | [50,60]
2 | 6 | 12 | 18 | 11 | 4
9.6. |
[2,5) | [5,8) | [8,11) | [11,14) | [14,17) | [17,20]
3 | 11 | 22 | 30 | 12 | 1
9.7. |
[10,15) | [15,20) | [20,25) | [25,30) | [30,35) | [35,40]
5 | 19 | 21 | 29 | 15 | 2
9.8. |
[2,8) | [8,14) | [14,20) | [20,26) | [26,32) | [32,38]
1 | 5 | 17 | 32 | 25 | 4
9.9. |
[0,9) | [9,18) | [18,27) | [27,36) | [36,45) |