У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент



Стаття - Статистика
13
Міністерство освіти та науки України

Контрольна робота
з предмету: „Статистика”

Зміст

1. Як визначають параметри кореляційного рівняння
прямої?

Параметри кореляційного рівняння прямої визначають у процесі регресійного аналізу, за допомогою якого кореляційну залежність між ознаками приблизно виражають у виді лінійного рівняння регресії виду  01 . Невідомі параметри a0 і a1 знаходяться методом найменших квадратів. Застосовуючи цей метод, одержуємо наступну систему нормальних рівнянь:

Вирішуючи систему, знаходимо оцінки параметрів a0 і a1. Рівняння регресії можна записати в такому виді:  – 1(x – ), де .

Параметр a1 – коефіцієнт регресії – показує, як зміниться в середньому результативну ознаку, якщо факторна ознака збільшиться на одиницю свого виміру. Рівняння регресії можна використовувати для прогнозування (пророкування).

Приклад. Вивчається залежність собівартості одного виробу (Y, р.) від величини випуску продукції (Х, тис. шт.) по групі підприємств за звітний період. Отримано наступні дані: |

Х | 2 | 3 | 4 | 5 | 6

Y | 1,9 | 1,7 | 1,8 | 1,6 | 1,4 .

Визначити параметри кореляційного рівняння в процесі кореляційного аналізу.

Рішення. Ознака Х – обсяг продукції, що випускається, тис. шт. (факторна ознака). Ознака Y – собівартість одного виробу, р. (результативна ознака). Припускаємо, що ознаки мають нормальний закон розподілу. Ознаки знаходяться в статистичній залежності, тому що собівартість одного виробу залежить не тільки від обсягу продукції, що випускається, але і від багатьох інших факторів, що у даному випадку не враховуються. Визначимо форму зв'язку. Побудуємо крапки з координатами (хi , yi) і по їх розташуванню визначимо форму зв'язку (мал. 6).

 

Рис. 6

Отже, форма зв'язку лінійна.

Проведемо кореляційний аналіз. Розрахуємо вибірковий лінійний коефіцієнт кореляції:

Розрахунки представимо в таблиці: |

хi | yi | хi yi

2

3

4

5

6 | 1,9

1,7

1,8

1,6

1,4 | 3,8

5,1

7,2

8,0

8,4 | 4

9

16

25

36 | 3,61

2,89

3,24

2,56

1,96

Разом | 20 | 8,4 | 32,5 | 90 | 14,26.

Перевіримо значимість вибіркового коефіцієнта кореляції. Для цього висуваємо гіпотези:

Н0: rген ,

Н1: rген 0. Приймемо рівень значимості .

Для перевірки нульової гіпотези використовуємо випадкову величину , що має розподіл Ст’юдента з k –  ступенями волі. По вибірковим даним знаходимо значення критерію, що спостерігається, Тнабл  3,58. По таблиці критичних крапок розподілу Ст’юдента (додаток 5) знаходимо tкрит.дв(0,05; ) ,18. Порівнюємо Тнабл і tкрит(0,05; ). Тому що Тнабл крит.дв(0,05; ), тобто Тнабл потрапило в критичну область, нульова гіпотеза відкидається, справедлива конкуруюча гіпотеза: rген  , rв значимо. Ознаки Х и Y корельовані. Тому що rв близький до одиниці, отже, собівартість одного виробу й обсяг продукції, що випускається, знаходяться в тісній кореляційній залежності.

Знайдемо коефіцієнт детермінації. Dв2   ,81, тобто варіація собівартості одиниці продукції в середньому на 81порозумівається варіацією обсягу продукції, що випускається.

Виразимо цей зв'язок аналітично приблизно у виді лінійного рівняння регресії: – 

a1(х – ),

. – 

,68 – ,11 (x – ) або  – ,11x ,12.

З рівняння випливає, що зі збільшенням випуску продукції на 1 тис. шт. собівартість одного виробу знизиться в середньому на 0,11 р.

Знайдемо по рівнянню регресії собівартість одного виробу, якщо випуск продукції складе 5,2 тис. шт. : – 

,11 5,2 ,12 ,55 (р.)

Приклад. Для нормування праці проведене статистичне дослідження зв'язку між кількістю виробів, що виготовляються, (Х, шт.) і витратами часу на обробку одного виробу (Y, хв). Зроблено вибірку обсягом n і отримані наступні дані: rв ,8 ,  , x ,2 ,  , y = . Перевірити значимість коефіцієнта кореляції при  ,02. Побудувати рівняння регресії.

Рішення. Ознака Х – кількість виробів, що виготовляються, шт. Ознака Y – витрати часу на обробку одного виробу, хв.

Припускаємо, що ознаки мають нормальний закон розподілу. Вони знаходяться в статистичній залежності, тому що витрати часу залежать не тільки від кількості виробів, що виготовляються, але і від багатьох інших факторів, що у даному випадку не враховуються. У даному випадку зв'язок лінійна, тіснота зв'язку характеризується лінійним коефіцієнтом кореляції rв ,8. Але перш ніж робити висновок про тісноту взаємозв'язку, необхідно перевірити значимість коефіцієнта кореляції. Висуваємо нульову гіпотезу і їй конкуруючу:

Н0: rген ,

Н1: rген 0.

Перевіряємо нульову гіпотезу за допомогою випадкової величини, що має розподіл Стьюдента з k –  ступенями волі: .

По вибірковим даним знайдемо значення критерію, що спостерігається, Тнабл 9,33. По таблиці критичних крапок розподілу Стьюдента (додаток 5) знаходимо tкрит.дв(,крит.дв(0,02; ) ,40. Порівнюємо Тнабл і tкрит.дв(0,02; ). Тому щоТнабл крит.дв(0,02; ), тобто значення критерію, що спостерігається, потрапило в критичну область, нульова гіпотеза відкидається, справедлива конкуруюча гіпотеза:ген0, ознаки Х и Y коррелированны, rв значимо.

D  100 , тобто варіація витрат часу на обробку одного виробу в середньому на 64порозумівається за рахунок варіації кількості виробів, що виготовляються.

Виразимо цей взаємозв'язок аналітично у виді рівняння регресії виду: – 

a1(х – ).

Коефіцієнт a1 виразимо через парний лінійний коефіцієнт кореляції:

;

Порівнюючи ці дві формули, можемо записати:

Тоді по вибірковим даним будемо мати:

a1 ,8 8/32 ;  –  2(x – ) або 24 .

З рівняння випливає, що зі збільшенням кількості виробів, що випускаються, на 1 шт., витрачене час у середньому збільшиться на 2 хв.

2. Що таке коефіцієнт кореляції і який його зміст?

Величина cov(;) залежить від одиниць виміру, у яких виражаються и . (Наприклад, нехай и — лінійні розміри деякої деталі. Якщо за одиницю виміру прийняти 1 див, то cov(;) прийме одне значення, а якщо за одиницю виміру прийняти 1 мм, то cov(;) прийме інше, більше значення (за умови cov(;)0)). Тому cov(;) незручно приймати за показник зв'язку.

Щоб мати справу з безрозмірним показником, розглянемо випадкові величини

;

Такі випадкові величини називаються нормованими відхиленнями випадкових величин і .

Кожна з випадкових


Сторінки: 1 2