Полтавський університет споживчої кооперації України
КУРСОВА РОБОТА
з дисципліни “Теорія ймовірності та математична статистика”
Застосування математичної статистики до практичних задач. Економічна інтерпритація результатів.
ЗМІСТ
1. Вступ……………………………………………………………….…….3
2. Частина 1. Первинна обробка вибірок………………………………....7
Дискретний варіаційний ряд. Інтервальний варіаційний ряд……..8
Інтервальні оцінки. Мінімальний об’єм вибірки…………………13
Перевірка статистичних гіпотез…………………………………...14
3.Частина 2. Кореляційний і регресійний аналіз…………………….....25
2.1 Парна лінійна регресія……………………………………………..25
2.2 Мултиколініарність………………………………………………...28
2.3 Прогнозування……………………………………………………...33
2.4 Надійні інтервали параметрів регресії……………………………33
2.5 Кореляційні таблиці………………………………………………..35
Додатки…………………………………………………………………..36
Література………………………………………………………………...57
Вступ
Математична статистика
Математична статистика має справу з різного роду наборами інформації, яку часто називають статистичною інформацією. Для того, щоб мати можливість застосувати статистичні методи при обробці цієї інформації, вона повинна виражатися за допомогою чисел. Отже, досліджувані об’єкти потрібно характеризувати, використовуючи числові значення. Оскільки не всяка інформація може бути виміряна безпосередньо за допомогою деяких одиниць виміру, то в математичній статистиці застосовують такі шкали вимірювань інформації:
шкала найменувань
шкала порядку
шкала інтервалів
шкала відношень
Всю сукупність об'єктів розбивають на окремі класи, в залежності від того, мають чи не мають вони властивостей. Вимірювання в шкалі найменувань є групуванням об’єктів на класи на підставі наявності в них деякої ознаки. Класам даються найменування, і присвоюються конкретні значення(числа). Номер класу нічого не говорить про властивості об’єктів, за винятком того, що вони відрізняються. Вимірювання в шкалі порядків відбувається подібно до шкали найменувань присв. числа, які відображають відповідні ознаки. Шкала інтервалів: при вимірюванні об’єктів в шкалі інтервалів їм приписують числа, які крім того, що розрізняють різні групи об’єктів, дають можливість сказати, наскільки відповідної ознаки в одного об’єкта більше, ніж у іншого. Шкала відношень – такі числа, які б характеризували крім попередніх
властивостей, також і можливість встановити скільки якоїсь ознаки в одного об’єкта більше, ніж в іншого.
Вибірка, та способи її одержання.
Оскільки множина усіх об’єктів, які підлягають обчисленню, може бути великою, вибирають якусь достатньо велику кількість об’єктів цієї множини і вимірюють характеристики за допомогою однієї із шкал. Якщо ми маємо великий, але скінчений набір об'єктів, то можемо вибрати для дослідження деякі з них таким чином: Занумеруємо усі наявні об’єкти і будемо вибирати для дослідження ті, номери яких співпадають з числами з т. зв. таблиці випадкових чисел. Таким чином, одержимо вибірку значень деяких характеристик певних об’єктів.
Перевірка статистичних гіпотез
Під статистичною гіпотезою будемо розуміти будь-яке твердження, що стосується генеральної сукупності, сформульоване на базі наявних статистичних даних. Перевірка узгодженості гіпотези з наявними даними буде називатися перевіркою статистичної гіпотези. Зауваження: прийняття чи відхилення статистичної гіпотези в результаті її перевірки не є логічними доведенням чи запереченням твердження, сформульованого в гіпотезі. Кожна перевірка гіпотези базується на тому, що розглядається деяка статистика . І за значеннями цієї статистики робимо висновок, чи гіпотеза узгоджується з вибіркою, чи не узгоджується. Така статистика називається функцією критерію, а правило, за яким робиться висновок про гіпотезу, називається
критерієм перевірки статистичної гіпотези. Критерій перевірки гіпотези визначає дві множини:
Якщо значення функції критерію попадає в множину , то гіпотеза підтверджується вибіркою. Якщо значення функції не попадає у ( попадає в ), то функція критерію не узгоджується з вибіркою. - критична множина
критерію. Оскільки всі вибіркові значення – випадкові величини, то і значення функції критерію є випадковою величиною. При умові, що сформульована гіпотеза правильна, ймовірність попадання цієї випадкової величини , називається надійністю і позначається ймовірність попадання в критичну множину називається рівнем значущості критеріїв, і позначається . Число ймовірність помилки І типу. Помилка другого типу – приймаємо неправильну гіпотезу.
Критерій Пірсона
З генеральної сукупності значень випадкової величини з певним розподілом. Якщо цей розподіл неперервний, то множину значень випадкової величини розбиваємо на якусь кількість інтервалів :. Якщо розподіл дискретний, то множину значень випадкової величини розбиваємо на груп. Нехай, - ймовірність попадання випадкової величини з гіпотетичним розподілом в . Нехай, - частота попадання вибіркових значень, є статистикою, оскільки вона залежить від вибірки і є випадковою величиною. При великих розподіл близький до розподілу Пірсона з ступенем вільності, де - кількість параметрів гіпотетичного розподілу, що були оцінені за вибіркою. є гіпотетичною частотою попадання значень випадкової величини в .
Надыйний інтервал для дисперсії нормального розподілу
Ознакою дисперсії нормального розподілу є статистика . де - середньоквадратичне відхилення нормального розподілу з генеральної сукупності якого одержана вибірка об’єму . Можна довести, що така статистика має розподіл з ступенем вільності. Функція розподілу табульована. Графік щільності розподілу
Розв’яжемо нерівність відносно .
Дисперсійний аналіз
Застосовується до задач порівняння середніх значень кількох випадкових величин. Нехай, одержано вибірок з генеральної сукупностей нормально розподілених випадкових величин з математичними сподіваннями та однаковими дисперсіями . Розглянемо гіпотезу , яка полягає у тому, що . Нехай, - -те вибіркове значення -ої вибірки. Тоді,
- вибіркове середнє -ої вибірки. - вибіркове середнє об'єднаної вибірки. - об’єм об’єднаної вибірки. Оскільки є оцінками
відповідно, , то, якщо вони мало відрізняються від середнього вибіркового об'єднаної вибірки, то можна говорити, що гіпотеза підтверджується
вибірковими даними.
Елементи кореляційного та регресійного аналізів
Кореляційний аналіз розглядає питання зв’язку між двома чи більшою кількістю випадкових величин. Нехай, задана двовимірна вибірка з генеральної сукупності значень випадкового вектора . Так як коефіцієнт кореляції , то оцінка коефіцієнта кореляції де - середнє значення добутку.
. Якщо близьке до 0, то можна говорити, що випадкові величини і є незалежними. Якщо наближається до 1 (або -1), то між і існує лінійна залежність. Будемо розуміти