У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент


якщо умови економічного чи технологічного процесу різко зміняться, то регресійна модель стає зовсім непридатною для подальшого застосування. У спеціальній літературі із статистики таке явище називають “викидом даних” (рисунок 2.1 - г), тому попередньо виконують аналіз вхідних даних на однорідність вибірки.

Реалізація у регресійному аналізі чисельних методів розв”язку, зокрема методу найменших квадратів, передбачає визначення стійкості розв”язку. Поняття стійкості розв”язку в свою чергу визначається обумовленістю системи лінійних рівнянь, яка у векторно-матричній формі запису може бути представлена такою формулою

, (2.22)

де: А – вектор-стовпець коефіцієнтів рівняння регресії , тобто шуканих значень розв”язку (попутно зауважимо, що коефіцієнт розраховується за окремо складеним рівнянням); Х, Y - відповідно матриця та вектор-стовпець відхилень значень вхідних даних xj,i та уі від їх середніх величин (для факторів впливу хj,i беруться середні величини по кожному з факторів j з масиву вхідних даних); Т – знак транспонування матриці.

Аналітичний розв”язок цієї системи має вигляд[17]

. (2.23)

Таким чином, якщо незначні зміни у правій частині системи ведуть до суттєвої зміни розв”язку А , то така система називається погано обумовленою, а сам розв”язок – нестійким. В результаті, не дивлячись на те, що розв’язок отриманий, регресійна модель буде суперечити суті економічного, фізичного, технологічного чи іншого явища. Вимога адекватності порушується і застосовувати отримане рівняння регресії не можна. В цьому плані ми як би знаходимо математичне підтвердження того факту, що підбір факторів впливу для кореляційно-регресійної залежності в першу чергу має здійснюватися на основі попереднього аналізу і дотримання економічної, фізичної, технологічної і т.п. суті (логіки) зв”язків у системі дослідження (тобто, структури системи). Щодо кількісних оцінок обумовленості системи рівнянь, то в навчальній та науковій літературі можна знайти такі рекомендації. Рекомендують, наприклад, розраховувати числа обумовленості матриці

. (2.24)

Числа обумовленості розраховують як добуток норм прямої та оберненої матриць до вказаної матриці системи рівнянь. Ці числа означають, у скільки разів може збільшитися відносна похибка в коефіцієнтах А за наявності похибки у вихідній матриці М . Для розрахунку чисел обумовленості матриці М у програмному середовищі Mathcad існують вмонтовані функції cond1(M), cond2(M), conde(M), condi(M) (від англ. сondition – умова, обумовленість). Різняться числа обумовленості несуттєво, тим більше, що за критерій обумовленості береться не саме число, а його порядок. Зустрічаються такі рекомендації : при значеннях cond , що має порядок 101 розв”язок можна вважати стійким; якщо число обумовленості сягає порядку 102 ..103 , то розв”язок системи суперечливий; при значеннях cond порядку 104 і вище система рівнянь погано обумовлена. В останньому випадку ми матимемо значну закорельованість факторів та статистичних характеристик, тому таблиця мультиколінеарності (коефіцієнтів парної кореляції між факторами) рекомендується як ще один побічний критерій, за яким можна визначити стійкість розв”язку. Бажано, щоб максимальний коефіцієнт парної кореляції між факторами не перевищував значення 0.4 , але практично витримати цю умову вдається не завжди. Якщо коефіцієнти парної кореляції між факторами приймають значення 0.8 і вище, то вірогідний висновок про наявність мультиколінеарності (недопустимої закорельованості факторів). Існує також обмеження, за яким коефіцієнти парної кореляції між факторами та показником у за модулем повинні бути суттєво більшими від значення за модулем відповідних коефіцієнтів парної кореляції між самими факторами. Необхідною умовою існування добре обумовленої матриці М є відмінність від нуля визначника цієї матриці. У випадку detM ? 0 матриця М є погано обумовленою, містить майже лінійно залежні вектори-стовпці, а тому її розв”язок буде нестійким. Зустрічається також рекомендація, щоб detM приймав значення, більші порівняно з коефіцієнтами матриці М.

Чим менш стійкий розв”язок вихідної матриці системи рівнянь, тим вужчий діапазон значень довірчих інтервалів для коефіцієнтів рівняння регресії. Довірчі інтервали визначають із застосуванням t-критеріїв Стьюдента на рівні значущості б ( б = 0.05) та при ступенях вільності n – N

, (2.25)

де - стандартне відхилення коефіцієнта регресії,

. (2.26)

У даній формулі - залишкова дисперсія, - алгебраїчні доповнення діагональних елементів матриці М . Дисперсію можна отримати, використовуючи формулу суми квадратів відхилень

, (2.27)

а із курсу вищої математики пригадуємо, що алгебраїчні доповнення визначаються як мінор матриці М , помножений на (-1)i+k , де i – кількість рядків мінора, k – кількість стовпців мінора. Оскільки у кореляційно-регресійному аналізі мають справу з квадратними матрицями М, то даний множник приймає значення 1 і його можна опускати. Під мінором матриці М розуміють визначник матриці на порядок меншої за М, яку можна отримати, “викреслюючи” (умовно) і-тий рядок та k-ий стовпець у матриці М, які на перехресті визначають один з діагональних елементів.

Процедура побудови кореляційно-регресійної моделі може бути реалізована у такій послідовності етапів розрахунку.

Попередній аналіз вхідних даних

У найпростішому випадку даний етап можна звести до побудови та візуального аналізу точкових графіків для масиву вхідних даних між функцією у та факторами xj . При цьому, якщо побудовані (за допомогою Mathcad , або ж Excel) залежності виявляться хоча би віддалено подібними до графіків, наведених на рисунку 2.1 – а та б, то можна стверджувати про наявність кореляційного зв”язку між факторами та досліджуваним показником. Такі фактори у першому наближенні безумовно доцільно включати в рівняння регресії.

Деякою мірою нелінійна форма залежності між у та xj (наприклад, рисунок 2.1 – в, г) спричинює зменшення відповідних коефіцієнтів парної кореляції,


Сторінки: 1 2 3 4 5 6