дисперсією. Друга компонента має найбільшу дисперсію серед усіх лінійних комбінацій виду (2.40) чи (2.41), які залишилися і які не корелюють з першою головною компонентою. Наступні головні компоненти вибираються аналогічно. Таким чином, для обчислення головної компоненти необхідно розв’язати таку оптимізаційну задачу:
Дана задача розв’язується методом Лагранжа. Функція Лагранжа має вигляд:
Так як ; де коваріаційна матриця, то .
Диференціюючи за компонентами вектор-стовпця , отримуємо систему рівнянь для знаходження :
(2.42)
де 0=(0,0...,0) - - мірний вектор-стовпець.
Для того, щоб існував нульовий розв’язок (2.43), матриця повинна бути виродженою, тобто
(2.43)
Рівняння (2.43) являється характеристичним відносно для матриці і має вагомих невід’ємних коренів – власних чисел матриці коваріацій. При цьому виконується відношення
Помноживши (2.42) зліва на врахувавши що , отримаємо Враховуючи, що ,отримаємо:
.
Отже, для того щоб перша головна компонента володіла максимальною дисперсією, необхідно вибрати максимальне власне число матриці . Підставляючи вибране в систему рівнянь (2.43), знаходимо компоненти вектора .
Таким чином, власний вектор матриці , який відповідає її му за величиною власному числу.
Блок-схема алгоритму методу головних компонент, який використовується для оцінки загроз економічної безпеки регіонів, представлена на рис. 2.2.
Рис. 2.1. Блок - схема алгоритму оцінки загроз економічної безпеки регіону.
Нижче наведено опис кожного блоку алгоритму.
Блок 1. Вихідні дані представлені у вигляді матриці значення го показника загроз економічної безпеки для го регіону. Так як вихідні показники представлені в різних одиницях виміру, до них застосовують процедуру нормування.
Блок 2. Процедура обчислення першопочаткових головних компонент в першу чергу припускає розрахунок власних чисел і власних векторів матриці які знаходяться з розв’язання рівняння .
Тут же визначається мінімальне число головних компонент, достатнє для відображення всіх істотних кореляційних зв’язків між вихідними показниками. Для цього використовуються різні критерії:
§ Критерій Кайзера. Так як дисперсія вихідних показників дорівнює 1, то виключаються всі головні компоненти, чиї власні числа менші 1, так як вклад таких головних компонент в загальну дисперсію менший вкладу окремих показників.
§ Із всієї сукупності факторів залишають декілька перших головних компонент, сумарна кількість яких перевищує 75%.
§ Графічний метод.
На практиці може застосовуватися будь-який із критеріїв чи їх комбінація. Кінцеве рішення обирається таким чином, щоб забезпечити найкращу інтерпретацію отриманих головних компонент.
Після цього для кожної виділеної головної компоненти розраховуються факторні навантаження за формулою:
відповідно - те власне число і - й власний вектор матриці .
Інтерпретація результатів аналізу здійснюється за значеннями факторних навантажень. Оскільки для ортогональних головних компонент коефіцієнт кореляції показника і головної компоненти рівний відповідному факторному навантаженню, то для інтерпретації кожної головної компоненти варто користуватися показниками з відносно більшим за абсолютною величиною навантаженням, так як вони най більш корельовані з цією головною компонентою.
Блок 3. Якщо початково виділені головні компоненти не вдається інтерпретувати, застосовують процедуру перебору. Сутність перебору заключається в перетворенні вихідної матриці факторних навантажень таким чином, щоб нова матриця факторних навантажень відповідала б тому ж простору головних компонент, що і початкова матриця. При цьому у кожного початкового показника максимальне по модулю факторне навантаження повинне бути тільки з однією головною компонентою. Іноді для ясності трактування отриманих головних компонент відмовляються від їх ортогональності і переходять до системи координат з косими кутами.
Блок 4. Задача визначення значень головних компонент формується як задача про знаходження найкращих в тому чи іншому значенні оцінок значень головних компонент при невідомих факторних навантаженнях і матриці вихідних показників. Оцінки значень головних компонент отримують з допомогою метода найменших квадратів, використовуючи техніку багаторегресійного аналізу
Цей алгоритм був використаний для оцінки загроз економічної безпеки 25 регіонів України, які виникали в сфері виробництва матеріальних, трудових і фінансових ресурсів. Назви регіонів і відповідні їм коди представлені в таблиці Аналіз літературних джерел за запитаннями забезпечення економічної безпеки регіонів дозволив виділити близько 60 показників, які описують загрозу економічної безпеки регіону в перелічених сферах. Однак в силу інформаційної небезпеки більшості показників їх вихідний набір був спрощений. Назви показників, що використовуються в дослідженні, подані в таблицях 2.2 – 2.4..
Таблиця 2.1. Назви регіонів і їх коди
Назва регіону | Код регіону | Назва регіону | Код регіону
Республіка Крим | 1 | Миколаївський | 14
Вінницький | 2 | Одеський | 15
Волинський | 3 | Полтавський | 16
Дніпропетровський | 4 | Рівненський | 17
Донецький | 5 | Сумський | 189
Житомирський | 6 | Тернопільський | 19
Закарпатський | 7 | Харківський | 20
Запорізький | 8 | Херсонський | 21
Івано-Франківський | 9 | Хмельницький | 22
Київський | 10 | Черкаський | 23
Кіровоградський | 11 | Чернівецький | 24
Луганський | 12 | Чернігівський | 25
Львівський | 13
При оцінці загроз в сфері виробництва матеріальних ресурсів виділено дві головних компоненти. Подані в таблиці 2 факторні навантаження отримані в результаті перебору початкової матриці факторних навантажень методом Varimax.
Таблиця 2.2. Матриця факторних навантажень.
Показники | F1 | F2
Індекс продукції промисловості | -0.22 | 0.84
Індекс продукції сільського господарства | -0.19 | -0.48
Кількість роздержавлених підприємств | 0.78 | -0.21
Кількість малих підприємств | 0.95 | 0.13
Кількість підприємств на самостійному балансі | 0.90 | 0.07
Кількість підприємств-експортерів | 0.69 | 0.53
Кількість підприємств-імпортерів | 0.78 | 0.50
Власні числа | 3.72 | 1.31
% поясненої дисперсії | 53.2 | 18.8
В результаті аналізу даних таблиці 2.2. отримані наступні рівняння головних компонент:
де - кількість роздержавлених підприємств;
кількість малих підприємств;
кількість підприємств на самостійному балансі;
кількість підприємств-експортерів;
кількість підприємств-імпортерів;
індекс продукції промисловості;
індекс продукції сільського господарства.
Аналіз розподілу початкових показників за виділеними головними компонентами дозволив припустити, що