У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





НАЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

НАЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

ПРИСТАВКА Пилип Олександрович

УДК 517.518.855:519.254

методИ ТА АЛГОРИТМи ОБРОБКИ вимірювань

з ВИКОРИСТАННЯМ ЛІНІЙНИХ КОМБІНАЦІЙ В-СПЛАЙНІВ

Спеціальність 05.13.06 – автоматизовані системи управління та

прогресивні інформаційні технології

Автореферат

дисертації на здобуття наукового ступеня

доктора технічних наук

Київ – 2005

Дисертацією є рукопис

Роботу виконано у Національному авіаційному університеті Міністерства освіти і науки України

Науковий консультант

член-кореспондент НАН України, заслужений діяч науки і техніки України, лауреат Державної премії України, доктор технічних наук, професор Бабак Віталій Павлович, ректор Національного авіаційного університету.

Офіційні опоненети:

доктор технічних наук, професор Прокопенко Ігор Григорович, завідувач кафедрою радіоелектронних комплексів Національного авіаційного університету;

доктор технічних наук, професор Мороз Борис Іванович начальник факультету організації і технології митного контролю, начальник кафедри інформаційних систем і процесів Академії митної служби України;

заслужений діяч науки і техніки, лауреат Державної премії України, доктор фізико-математичних наук, професор Лигун Анатолій Олександрович, професор кафедри прикладної математики Дніпродзержинського державного технічного університету

Провідна установа

Державний НДІ інформаційної інфраструктури Національного агентства з питань інформатизації, м. Львів

Захист дисертації відбудеться 21.06.2005 р. о 13-30 годині на засіданні спеціалізованої вченої ради Д.26.062.01 при Національному авіаційному університеті за адресою: 03058, м. Київ-58, ГСП, пр. Космонавта Комарова, 1.

З дисертацією можна ознайомитись у бібліотеці Національного авіаційного університету за адресою: 03058, м. Київ, пр. Космонавта Комарова, 1.

Автореферат розіслано 19.05.2005 року

Учений секретар

спеціалізованої вченої ради Єременко В.С.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Побудова залежностей, що відтворюються за статистичними даними, визначає головний принцип оцінювання типу залежності: віднайти найбільш адекватну та вірогідну модель процесу чи явища, які є предметом уваги дослідника. В якості такої моделі можуть бути функції розподілу ймовірностей, регресії, авторегресії, тощо, відтворення яких проводять як параметричними, так і непараметричними методами (НМ).

Параметричні методи потребують проведення ідентифікації із множини функцій, що подаються на екзамен, визначеного типу, які найбільш адекватно апроксимують статистичні дані. Тим самим, здійснюється розрахунок параметрів шуканої залежності та оцінка її якості. При непараметричному відтворенні залежностей не використовують задані типи функцій, а реалізують процедури згладжування, що базуються на НМ статистичного аналізу. Ядром таких процедур є локально-парамет-ричні моделі, які мають на меті збільшення параметра локальності, що призводить до розширення області визначення відтворюваної функції. Особливістю НМ є можливість опрацювання обмежених обсягів апостеріорної інформації, на основі якої здійснюється відтворення функцій при фіксованому наборі результатів вимірювань.

Найвірогідніші результати при проведенні статистичного аналізу отримують за наявності адекватної оцінки функції розподілу (щільності) ймовірностей, як повної характеристики ймовірнісного простору. У випадку багатовимірного простору ознак об’єкту спостережень, сучасна практика відтворення функції розподілу обмежена можливістю використання тільки багатовимірного нормального закону розподілу у випадку параметричної оцінки, або ж гістограмною та ядерною оцінками, у випадку непараметричного оцінювання. Не відкидаючи можливості застосування зазначених підходів, слід наголосити на необхідності пошуку більш адекватних та незалежних від вихідних даних методів, які б зайняли належне місце при розробці та реалізації інформаційних технологій (ІТ) у сучасному програмному забезпеченні.

Потреба в приблизному описанні фізичних об’єктів або явищ виникає при розв’язанні будь-якої прикладної задачі. Як правило, вихідні дані мають дискретний характер, а для опису вимагаються неперервні значення вихідної інформації. В середині минулого сторіччя І.Шоенберг запропонував конструкцію, яка, успадкувавши позитивні якості поліномів, виявилась вільною від їхніх недоліків – сплайни. Важливим етапом розвитку теорії сплайнів став опис К. де Бором базисних сплайнів, що дозволило спростити конструкцію сплайнів та зробило можливим появу майже інтерполяційних і майже інтерполяційних у середньому сплайнів. Майже інтерполяційні сплайни досліджувались у роботах К. де Бора, М.П.Корнійчука, А.О.Лигуна, О.І.Гребеннікова. Майже інтерполяційні в середньому ПС вперше вивчались у роботах І. Шоенберга, А.О.Лигуна. Поява останніх дозволила спростити обчислювальні сторони використання сплайнів, крім того, в силу локальності зазначених сплайнів, стало можливим суттєво покращити апроксимативні властивості сплайн-оцінок.

Синонімом інтерполяційних у середньому сплайнів є термін гістосплайни, що робить природнім їх використання для оцінки функцій щільності розподілу випадкових величин, як однієї, так і багатьох змінних, а також функцій регресії відповідних розмірностей. Слід відзначити, що задача використання багатовимірних сплайнів є трудомісткою як з точки зору алгоритмізації, так і з точки зору обчислювальної складності. За можливості слід завжди прагнути віднайти такі обчислювальні схеми, що дозволяють обійти ці труднощі та які представляють собою ефективний апарат для обробки багатовимірних даних.

Остання вимога є актуальною при розробці програмного забезпечення розв’язку задач комп’ютерного графічного моделювання (геоінформаційні системи (ГІС), цифрова обробка зображень) та при створенні автоматизованих систем (АС) обробки статистичної інформації, що працюють у режимі реального часу.

Створення ГІС картографічного моніторингу вимагає суттєвих апаратних витрат комп’ютерної техніки на візуалізацію вихідного графічного матеріалу, що вимагає швидкодії обчислювальних схем математичного забезпечення опрацювання даних. Швидкодія обчислювальних схем напряму залежить від кількості простих арифметичних операцій, що, практично, унеможливлює застосування методів обробки багатовимірних масивів спостережень, які були б і адекватними, і швидкодіючими одночасно. Вимога адекватності оцінок особливо актуальна при побудові АС медичного моніторингу пацієнтів, де високоточність методів обумовлена необхідністю діагностики захворювань. Саме тому теоретичні та практичні дослідження поліноміальних сплайнів (ПС) багатьох змінних, майже інтерполяційних у середньому, є задачею актуальною, вирішення якої має покращити конкурентну спроможність нашої держави на ринку математичного та інформаційного забезпечення програмних засобів автоматизованої обробки.

Таким чином, дану дисертаційну роботу присвячено вирішенню важливої науково-технічної проблеми створення локальних ГІС та автоматизації обробки результатів моніторингу складних систем, що вимагають високоточної адекватності прийняття рішень.

Зв’язок роботи з науковими програмами, планами, темами. Результати дисертаційної роботи одержані в період з 1999 по 2004 рр. згідно тематичного плану науково-дослідних робіт: держбюджетної теми 07-206-01 “Створення інтелектуальної системи оперативного аналізу техногенного навантаження довкілля на основі сучасних інформаційних технологій”, держреєстраційний № 0101V002954; держбюджетної теми 5-076-04 “Теоретичні основи розробки геоінформаційної технології обробки та аналізу екологічної інформації на основі сплайн-перетворень ”, держреєстраційний № 0104V000961; держбюджетної теми 277-01 “Розробка теоретичних засад інтелектуальної постійно діючої ландшафтно-геохімічної моделі техногенних регіонів”, держреєстраційний № 0101V007474; госпдоговірної теми № 6/2270, 10/293 “Дослідження розподілу важких металів та радіонуклідів у районі накопичувачів радіоактивних відходів та розробка рекомендацій по рекультивації забруднених грунтів” 2002-2003 рр.; госпдоговірної теми № 306 “Розробка систем оперативного аналізу і прогнозу розвитку середньої освіти регіону” держреєстраційний № 0103V006670; держбюджетної теми “Діагностика та лікування гіпертонічної хвороби в залежності від гіпертрофії лівого шлуночка та ремодеювання міокарда” держреєстраційний № 0102V001316.

Мета та завдання дослідження. Теоретичне обгрунтування методу, обчислювальної та інформаційної технології вирішення задачі опрацювання одно- та багатовимірних даних спостережень, які мають переваги перед існуючими як за якістю апроксимації стохастичних функцій, так і за обчислювальною складністю. Розроблена методика має бути подана у вигляді, який враховує необхідність реалізації розроблених ІТ у АС обробки даних, зокрема: прикладних програмах статистичного аналізу, системах обробки результатів моніторингу, ГІС, системах цифрової обробки зображень.

Досягнення поставленої мети передбачає вирішення таких задач:

1. Ввести та теоретично обгрунтувати ПС багатьох змінних на основі В-сплайнів, близькі до інтерполяційних у середньому.

2. Розробити методичні та практичні вказівки використання зазначених сплайнів щодо розв’язку задачі непараметричної оцінки (НО) функцій від випадкових величин.

3. Обгрунтувати необхідність та можливість застосування ІТ на основі сплайн-операторів з локальним носієм в АС обробки інформації (статистичні інформаційні системи опрацювання результатів вимірювань, ГІС, системи моніторингу, тощо).

4. Вирішити прикладні задачі геоінформаційного, екологічного та медичного моніторингу на основі розроблених автоматизованих інформаційних систем (АІС).

Об’єктом дослідження є моніторинг складних систем.

Предметом дослідження є розробка та застосування сплайн-методів автоматизації процесу обробки результатів моніторингу складних систем у вигляді локальних ГІС, АІС високоточної обробки даних та систем діагностики захворювань.

Методи дослідження. При вирішенні поставлених задач використано такі методи аналізу: теорія апроксимації, теорія ймовірностей та обчислювальні методи прикладного статистичного аналізу, методи організації обчислювальних процесів на ЕОМ, елементи комп’ютерної графіки, технологія програмування.

Наукова новизна одержаних результатів. У роботі одержано наступні нові наукові результати:

1. Вперше запропоновано застосування ПС двох та більше змінних, близьких до інтерполяційних у середньому в задачах апроксимації гладких функцій заданих значеннями на регулярних сітках вузлів.

2. Вперше отримано коефіцієнти сплайнів від двох та більшого числа змінних при мономах, що дозволило одержати прості обчислювальні схеми, які є зручними для практичної реалізації, при цьому доведено, що для сплайнів багатьох змінних, норма сплайн-оператора дорівнює добутку одновимірних аналогів, а для випадку наближення гладких функцій обчислено асимптотичні оцінки погрішності.

3. Встановлено, що у порівнянні з класичними методами, застосування розроблених ІТ на основі локальних ПС при непараметричному відтворенні розподілів неперервних n-вимірних, випадкових величин надають можливість отримання ефективної оцінки.

4. Розроблено алгоритми процесу бінарного поповнення багатовимірних послідовностей відліків гладких функцій на основі сплайнів, що забезпечує опрацювання інформації, яка зберігається у графічному вигляді.

5. Вперше запропоновано можливість імітаційного моделювання залежностей у вигляді просторових кривих на основі параметризації за ймовірнісною мірою, що надає змогу обробки масивів вимірювань обмеженого обсягу.

6. Розроблено метод відтворення регресій за даними на нерегулярних сітках вузлів, що дозволяє ліквідувати проблеми пов’язані з використанням методів триангуляції та дає можливість оцінки багатомодальних залежностей.

Практичне значення отриманих результатів. Робота спрямована на впровадження нових ІТ на основі застосування ПС при розробці локальних ГІС та АС обробки даних, що вимагають високоточної адекватності прийняття рішень, зведення зазначених технологій до рівня алгоритмів та обчислювальних схем комп’ютерного опрацювання. Наведені обчислювальні схеми та технології забезпечують швидкодію та невибагливість до апаратних ресурсів при реалізації в програмному середовищі, дозволяють отримувати адекватні оцінки за масивами спостережень. Розроблені на їх основі інформаційні засоби пройшли тестування та практичну апробацію у реальних програмних продуктах обробки статистичної інформації.

Створено методичне та алгоритмічне забезпечення, на основі якого розроблено, подано опис та функціональні можливості АС обробки даних, а саме: “Полісплайн” – для використання при НО в задачі обробки статистичної інформації про терміни активного існування космічних апаратів при визначенні показників надійності виробів ДКБ “Південне”; ГІС “Ландшафт”, “ThreeD”, призначених для аналізу техногенних навантажень у промислових регіонах; ГІС “GISThreeD” – для проведення аналізу геохімії за результатами розвідки корисних копалин; “ViStA Med”, призначеної для проведення аналізу та діагностики артеріальної гіпертензії за результатами добового моніторингу артеріального тиску. Слід відзначити, що за усіма розробленими АС обробки даних отримано відповідні практичні впровадження.

Особистий внесок здобувача. Дисертаційна робота є результатом самостійного дослідження. В роботах, виконаних разом з співавторами, автору належить: [2] – викладено матеріал зі статистичної обробки даних, складові ІТ опрацювання спостережень у автоматизованому режимі; [3] – надано вихідні форми НО багатомодальних двовимірних регресій та їх аналіз на прикладі даних моніторингу поблизу ПівнГЗК Кривбасу; [4] – запропоновано метод НО функції інтенсивностей відмов технічних систем; [5] – надано результати та аналіз НО функції інтенсивностей відмов технічних виробництва КБ “Південне”; [6] – продемонстровано складові НО функції безвідмовної роботи технічних систем, в умовах обмежених обсягів спостережень; [7] – запропоновано визначення та обчислювальна схема ПС від трьох змінних на основі В-сплайнів другого порядку; [8] – запропоновано визначення та обчислювальна схема ПС від двох змінних на основі В-сплайнів третього порядку; [9] – запропоновано ІТ побудови просторових моделей в локальних ГІС на основі сплайн-перетворень та НО двовимірних регресій; [10] – запропоновано ІТ НО одновимірної функції розподілу в умовах обмеженого обсягу спостережень; [11] – наводиться експериментальне обгрунтування НО двовимірної функції щільності за результатами моделювання; [12] – введено процедуру регуляризації за даними на нерегулярних сітках вузлів; [13] – наведено постановку задачі та аналіз, що обгрунтовують можливість застосування процедур регуляризації, на основі результатів статистичного моделювання та відтворення непараметричних регресій; [21] – запропоновано методи класифікації за мінімумом відстаней з використанням точкових оцінок, отриманих на підставі непараметричних сплайн-оцінок; [22] – подано постановку задачі на створення, з використанням введених сплайн-перетворень, локальної ГІС “ThreeD” для обробки даних моніторингу підземних вод та аналіз одержаних за її використанням результатів; [23] – подано постановку задачі на створення локальної ГІС “Ландшафт”, з використанням введених сплайн-перетворень, для обробки даних моніторингу грунтів, повітря та рослинного покрову та аналіз одержаних за її використанням результатів; [24] – запропоновано, на основі непараметричних регресійних оцінок, моделі техногенного забруднення в районі поблизу хвостосховища радіоактивних відходів; [25] – запропоновано процедуру моделювання масивів спостережень на основі НО зворотної функції розподілу ймовірностей за даними спостережень; [26] – подано опис розробленої АС зберігання та опрацювання результатів моніторингу на території коксохімічного заводу.

Апробація результатів дисертації. Результати дисертаційної роботи доповідались та обговорювались на Міжнародній конференції з автоматичного управління “Автоматика-2000” (м.Львів,2000), V Україно-Російсько-Китайскому симпозіумі по космічній науці та технології (м.Харбін,2000), Міжнародній науково-технічній конференції “АВІА 2001” (м.Київ, 2001), III Міжнародній науково-практичній конференції “Проблемы геоинформатики при комплексном освоении недр” (м. Дніпропетровськ,2001), Міжнародній конференції з автоматичного управління “Автоматика-2002” (м.Донецьк,2002.), VI міждержавній НТК “Проблеми математичного моделювання” (м.Дніпродзержинськ,2002), IV Міжнародній науково-практичній конференції “Проблемы и перспективы применения геоинформационных технологий в горном деле” (м.Дніпропетровськ,2001), ІV Міжнародній НТК “АВІА-2003” (м.Київ,2003), Міждержавній науково-методичній конференції “Проблеми математичного моделювання” (м.Дніпродзержинськ,2003), V Міжнародній НТК “АВІА-2004” (м. Київ, 2004), Міжнародній конференції з автоматичного управління “Автоматика–2004” (м. Київ), конференціях за підсумками науково-дослідної роботи Дніпропетровського національного університету (м.Дніпропетровськ, 2000-2005).

Публікації. Основні результати дисертації опубліковано в 28 роботах (в том числі 7 без співавторів), серед яких – дві монографії (одна – без співавторів).

Структура дисертації. Дисертаційна робота складається із вступу, п’яти розділів, висновків, списку літератури та додатків. Обсяг роботи складає: 300 сторінок, з яких 239 – сторінок основного тексту; робота містить 9 таблиць, 114 рисунків, 8 додатків, список літератури із 112 найменувань.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обгрунтовано актуальність роботи, поставлено мету і задачі досліджень, визначено наукову новизну і практичну цінність отриманих результатів, наведено дані про їх апробацію та впровадження.

В першому розділі розглянуто питання апроксимації гладких функцій однієї змінної з використанням сплайн-операторів з локальним носієм, висвітлено сучасні підходи до НО функцій від випадкових величин та наведено огляд АС обробки результатів вимірювань, зокрема, статистичних пакетів та ГІС.

Нехай при деякому задано рівномірне розбиття дійсної вісі точками , . Множину сплайнів порядку мінімального дефекту, визначену на позначають . Якщо то В-сплайн порядку () визначається рекурентно із співвідношення . Можна стверджувати: якщо – множина всіх сплайнів мінімального дефекту за розбиттям і , , то лінійна комбінація сплайнів також буде належати множині : . Отже, лінійна комбінація , – є сплайн мінімального дефекту. Подібні сплайни називають локальними ПС на основі В-сплайнів -го порядку.

Інтерполяційні та близькі до інтерполяційних сплайни мають сенс до застосування на разі, коли кількість вузлових точок невелика, а значення функції, що підлягає відтворенню, задані з високою точністю. Проте, в більшості задач обробки результатів вимірювань виявляється непотрібним проводити інтерполяцію. Навпаки, відтворення функцій від випадкових величин (в.в.) вимагає застосування математичного апарату, що враховував би особливості обробки статистичних даних, а саме – методів згладжування. Часто ефективними методами згладжування статистичних даних є ті, що використовують інтегральні характеристики стохастичної кривої. Будемо вважати, що інформація про функцію , яка підлягає відтворенню, задано у вузлах розбиття у вигляді інтеграла , при цьому, істинне значення функції у вузлах будемо визначати , , де – похибка.

Для апроксимації функції за значеннями типу , у вузлах розбиття , за аналогією зі сплайнами, близькими до інтерполяційних, вводяться такі лінійні комбінації В-сплайнів (не зменшуючи загальності подано тільки для ):

, ,

,

де ,

Якщо ввести заміну , , при та , , при , то сплайни , , можна навести в розгорнутому представленні, наприклад

. (1)

Простота обчислювальних схем та високі апрксимаційні властивості ПС, близьких до інтерполяційних у середньому визначили їх область застосування при опрацюванні вибірок , де – результати спостережень реалізації неперервної одновимірної в.в. , з функцією розподілу та щільністю . Існує два типи задач апроксимації розподілу . Якщо вигляд (модель) функції розподілу за всією областю визначення відомий, але не відомі її параметри, то задача апроксимації зводиться до параметричного оцінювання. При вдалому виборі моделі , де , – вектор параметрів, параметричного розподілу, апроксимація функції може бути цілком адекватною. Не вдаючись до аналізу обчислювальної складності схем параметричного відтворення, відзначимо, що подібна оцінка вимагає реалізації етапу ідентифікації моделі розподілу за вихідними даними . Останнє зауваження є суттєвим при реалізації АС обробки даних та вимагає застосування теорії перевірки статистичних гіпотез про вигляд функції розподілу ще до початку самого параметричного відтворення. Окрім того, при обмежених обсягах даних, наприклад, коли , ідентифікація не є однозначною.

В умовах невизначеності, коли про модель розподілу можна зробити лише загальні припущення, апроксимацію функції розподілу на підставі проводять НМ. Отже, задачею непараметричного відтворення є визначення оцінки функції розподілу , або еквівалентна задача оцінювання функції щільності у вигляді . Традиційно НМ реалізують для визначення останньої оцінки. Загальновідомими є три типи НО щільності : гістограмне, ядерне та проекційне.

З аналізу розглянутих в роботі методів НО функцій щільності (розподілу) в.в. можна зробити висновок, що найкращі властивості з точки зору якості апроксимації при відносній простоті обчислювальної реалізації в АС обробки даних, притаманні ядерній оцінці. З іншого боку, обчислювальна простота гістограмних оцінок, при яких отримують “якісне” наближення усереднених значень щільності (функції розподілу), надає можливість їхнього використання для подальшого оцінювання методами інтерполяції та згладжування.

Останній підхід знайшов впровадження при реалізації сплайн-методів на основі гістограмної оцінки. Проте, для більшості типів сплайнів підвищення якості апроксимації у порівнянні з простішими ядерними методами, практично нівелюється зростанням обчислювальної складності, викликаною необхідністю розв’язання систем лінійних алгебраїчних рівнянь при визначенні коефіцієнтів сплайнів та забезпечення гладкості у вузлах “склеювання”. Окремим випадком є реалізація оцінок щільності (розподілу) у вигляді ПС на основі В-сплайнів. Саме для обробки гістограм, згідно з визначенням, підходять сплайни, близькі до інтерполяційних у середньому.

Проте, аналіз сучасного програмного забезпечення обробки результатів вимірювань показав, що реалізація обчислювальних схем лінійних комбінацій В-сплайнів не має того поширення, на яке вони заслуговують, згідно своїх властивостей. Саме тому, проведений аналіз методів та засобів обробки даних стохастичної природи, дозволив визначити наступні задачі дисертаційної роботи.

1. Виходячи з існуючого стану питання апроксимації гладких функцій від однієї змінної за використання сплайн-операторів з локальним носієм, зокрема, близьких до інтерполяційних у середньому, поширити існуючі підходи поліноміальної сплайн-апроксимації на випадок функцій багатьох змінних, надати їх обгрунтування, розробити відповідні обчислювальні схеми та алгоритми.

2. Зважаючи, що сплайн-оператори, близькі до інтерполяційних у середньому, якнайкраще можуть підходити до вирішення задачі НО функцій від в.в., за умови наукового обгрунтування, розробити методичні та практичні вказівки, щодо їх використання, відносно зазначеної задачі оцінювання.

3. Обгрунтувати та показати можливість застосування розроблених ІТ, на основі сплайн-операторів з локальним носієм, в сучасних АС обробки інформації (статистичні системи обробки результатів вимірювань, ГІС, системи моніторингу, тощо).

4. Реалізувати розроблені АС обробки результатів вимірювань в задачах екологічного, медичного моніторингу, задачах, пов’язаних з оцінюванням функцій від в.в. Останнє має за мету показати універсальний, відносно практичних задач, характер ІТ, розроблених з використанням ПС на основі В-сплайнів.

В другому розділі розглянуто питання апроксимації функцій двох та більше змінних локальними ПС на основі В-сплайнів.

Розгорнуте представлення (1) дозволяє чітко простежити, що сплайни, які розглядаються, справді є поліномами. Отже, справедливе наступне представлення:

, (2)

де ; ;

;

; ; . (3)

Подання одновимірних ПС у матричному вигляді, на зразок (2), стає придатним і при побудові сплайнів більш високої розмірності.

Поняття одновимірного локального ПС на основі В-сплайнів за рівномірним розбиттям можна узагальнити на випадок двох і більшого числа змінних. В дисертації доведено, що сплайн-оператори однієї, двох і т.д. змінних є частковим випадком -вимірних операторів. Тому, нижче подано матеріал лише стосовно останніх.

Зафіксуємо розбиттів ,…, осей ,…, точками , , , …, , , , відповідно до яких задається розбиття дійсного простору . При необхідності асоціювати -у область розбиття з центральною точкою цієї області, вводиться розбиття , визначене сіткою вузлів , , , …, , , .

Сплайном порядку дефекту за кожною зі змінних , , причому, () або () при ), відносно розбиття , називають функцію , яка на кожному елементі розбиття є алгебраїчним багаточленом ступеня по кожною зі змінних . Лінійне різноманіття таких сплайнів позначимо (). Множину (або ) будемо називати множиною сплайнів мінімального дефекту від змінних.

Нехай у вузлах розбиття () для значень деякої гладкої функції від змінних виконується умова

, (4)

де , – деяка похибка, окрім того, для будь-яких фіксованих змінних у вузлах розбиття () має місце

, (5)

Розглянемо локальні ПС від змінних мінімального дефекту на основі В-сплайнів, близькі до інтерполяційних у середньому:

, при ,

та , при ,

Сплайни можна подати в загальному вигляді

. (6)

У випадку змінних при загальний вигляд сплайнів на основі В-сплайнів можна подати, згідно визначення, у вигляді полінома

,

де – визначаються із виразів, аналогічних (3); , .

Розглянемо розлого сплайни від змінних на основі В-сплайнів другого порядку. Так, при із (6), має місце

,

або, з урахуванням (4), (5),

.

При уточнюючі сплайни на основі В-сплайнів другого порядку визначаються із співвідношень:

,

,

де ,

Доведено, що норми сплайн-операторів відповідної кількості змінних, чисельно дорівнюють добутку норм одновимірних. Так для , є вірним:

, ,

.

Стосовно дослідження якості апроксимації, то, наприклад, для ПС , та 2 має місце такий наслідок з доведених теорем:

Наслідок. Для і має місце

,

для і справедливо

,

де .

Відзначимо, що на сьогоднішній день обчислювальна технологія на основі обчислювальних схем ПС, є найбільш швидкодіючою, при реалізації на ЕОМ. Зважаючи, що такі сплайни мають досить малу похибку апроксимації, їх можна рекомендувати для реалізації в обчислювальному середовищі обробки даних та при розробці різного роду ІТ. Проте, розвиток комп’ютерної техніки вимагає вдосконалення математичного апарата опрацювання дискретних даних. Порівняно громіздкі класичні методи апроксимації гладких функцій за подібними даними все менш задовольняють розробників програмного та апаратного забезпечення розв’язку задач стиснення та відтворення зображень, опрацювання сигналів, тощо. Останнім часом розвиток отримали методи, що базуються на обчислювальному аспекті, зокрема процедури, основані на бінарному поповненні послідовностей відліків деяких функцій. Щодо останніх, можна зазначити можливість їхнього одержання на підставі методів сплайн-апроксимації, а саме, з використанням ПС, визначених на локальних носіях.

В третьому розділі подано технологію статистичної оцінки за використанням сплайн-операторів однієї змінної, обгрунтовано застосування сплайнів, близьких до інтерполяційних у середньому, при НО дво- та багатовимірних функцій розподілу, наведено матеріали, стосовно вирішення задач: моделювання стохастичних залежностей на підставі експериментальних даних; показано можливість НО одно- та двовимірних регресій на підставі сплайн-оцінок функцій щільності; відтворення непараметричних залежностей на основі даних, заданих на нерегулярних сітках вузлів.

Нехай за розбиттям , , вісі реалізацій в.в. , на підставі проведено гістограмну оцінку та одержано , , – оцінки усереднених значень функцій щільності та розподілу: , , де – кількість класів при гістограмній оцінці.

Найпростішим, з точки зору реалізації у програмному забезпеченні обробки даних, при оцінюванні функції розподілу для буде застосування сплайну , при оцінюванні функції щільності для доцільним є застосування ПС основі -сплайнів другого та четвертого порядків, серед яких сплайн має найпростішу форму (1).

Порівняльний аналіз якостей апроксимації функцій розподілу (щільності) за використанням ПС та ядерних методів показує, що такі оцінки мають однаковий порядок наближення, проте, на разі використання уточнюючих сплайн-операторів, оцінка є більш адекватною. На підтвердження сказаного в роботі наводяться результати експериментів з моделювання, аналізуючи які, неважко переконатись, що при оцінюванні функцій щільності сплайн-оцінка при значно меншій обчислювальній складності, у порівнянні з ядерною, має однаковий порядок похибки, а при оцінюванні функції розподілу – надає кращі результати. Окремо слід відзначити сплайн-оцінку при відтворенні розподілів з суттєвою лівою асиметричністю функцій щільності, для яких важко провести адекватну ядерну оцінку. Величини тестових статистик на основі ПС в експериментах менші критичного значення для найбільшого відхилення емпіричного розподілу від теоретичного (критерій Колмогорова при ), що узгоджується з обгрунтованою в роботі якістю сплайн-апроксимації.

Беручи за основу статистичну оцінку реалізацій одновимірної в.в., можна узагальнити подібну оцінку на випадок обробки масивів реалізацій дво- та багатовимірних в.в. Так для реалізації двовимірного випадкового вектора з функцією розподілу , у припущенні незалежності складових та , можна розглядати одновимірні масиви: та , за кожним з яких маємо змогу провести побудову варіаційних рядів, розбитих на класи. Отже, визначаючи рівномірні розбиття , з кроками , , відповідно осям реалізацій в.в. та , автоматично задаємо рівномірне розбиття площини реалізацій двовимірної в.в. .

Якщо – центральна точка -го елементу розбиття , тоді – усереднене значення функції щільності розподілу ймовірностей у зазначеній області і має місце наступний зв’язок з частотою

.

Отже, як і у одновимірному випадку, частота є, з точністю до константи , оцінкою усередненого значення щільності для неперервної в.в. .

На підставі частот , неважко одержати на емпіричну оцінку функції розподілу : , , .

Остаточно маємо, що масиви та є оцінками усереднених значень функцій щільності та розподілу ймовірностей двовимірної в.в. на розбитті , тому для одержання неперервної оцінки зазначених функцій є підстави для використання двовимірних ПС на основі В-сплайнів. Справді, можна подати

, , .

Неважко показати, що сплайн-оцінка функції на -му елементі розбиття , еквівалентна добутку оцінок , одновимірних функцій розподілу в.в. та у вигляді одновимірних сплайнів на основі В-сплайнів -го порядку ():

.

Аналогічний вираз маємо для оцінки за значеннями . Останнє подання доводить коректність постановки задачі на використання ПС, близьких до інтерполяційних у середньому при статистичному оцінюванні за масивами реалізацій в.в., складові яких незалежні. Результати експериментів з імітаційного моделювання підтверджують достовірність відтворення розподілів за використанням ПС. Щодо апроксимативних властивостей – в дисертації подано відповідні ствердження.

В розділі подано опис та обгрунтування складових ІТ як для дво-, так і для багатовимірного випадку обробки масивів вимірювань, зокрема наводиться загальний алгоритм опрацювання масиву , реалізацій в.в. з функцією розподілу , що є результатом спостереження за деяким -вимірним об’єктом. Результатом обробки є НО функцій щільності і розподілу ймовірностей та висновки щодо доцільності проведення подальших форм аналізу (параметричне оцінювання, кластеризація, тощо).

При обробці стохастичних даних часто відчувається нестача інформативності в масивах спостережень. Це пов’язано з практичною неможливістю репрезентувати вибіркою всю генеральну сукупність. Проте, на підставі вибірки, з урахуванням розподілу в.в., завжди можна одержати вірогідний, в умовах наявних даних, набір інформації про об’єкт спостереження. Останнє у випадку одновимірних розподілів припускає можливість моделювання масивів спостережень – як зворотна задача при адекватному відтворенні закону розподілу ймовірностей, а у багатовимірному – оцінка регресійних зв’язків ознак об’єкту дослідження, як альтернатива невисокій інформативності відтворення багатовимірних функцій розподілу.

Задачу моделювання залежностей на підставі вимірювань можна вирішити або з використанням методів інтерполяції, або методів згладжування, якщо інформативна значущість осциляцій процесу не є важливою. Компромісним варіантом може бути застосування сплайн-методів.

Нехай у результаті проведення експерименту одержано масив реалізацій неперервної в.в. . Для проведення моделювання сукупності реалізацій достатньо або наперед знати аналітичний вигляд закону розподілу ймовірностей, або мати якісне неперервне наближення, отримане в результаті відтворення за . Будемо вважати, що характеризується функцією розподілу , не зменшуючи загальності припустимо, що , Тоді , розподілене за законом розподілу ймовірностей і яке відповідає ймовірності , можна отримати із співвідношення (відомий метод оберненої функції). Зважаючи на можливість отримання наближення функції розподілу у вигляді ПС та використовуючи розглянутий (підрозд.3.1 дисертації) метод визначення квантилів на підставі сплайн-оцінки, можна запропонувати наступний алгоритм генерування випадкових масивів довільного обсягу: задаючись випадковими, рівномірно розподіленими значеннями , , , знаходимо відповідні оцінки квантилів , , які і будуть визначати змодельований масив обсягу .

Наведемо простіший, з точки зору обчислювальної складності, метод генерування реалізацій , виходячи з . Додатково умовимося, що данні вибірки різняться: , , . Тоді кожній варіанті варіаційного ряду ставиться у відповідність частота, що дорівнює величини , а емпірична функція розподілу визначається із співвідношення , .

Зважаючи, що аналітичний вигляд закону розподілу не ідентифікується, моделювання проводитимемо виходячи з наближення функції , . За віссю абсцис відкладемо значення емпіричної функції розподілу ймовірностей вихідного варіаційного ряду, за віссю ординат – відповідні значення реалізацій. Маючи за віссю абсцис рівномірне розбиття інтервалу з кроком , та припустивши, що функція , , будемо шукати її наближення у вигляді локальних сплайнів. Для остаточного визначення змодельованого масиву, після побудови сплайну достатньо відібрати квантилі, згідно обсягу моделювання.

Найпростіша обчислювальна схема моделювання масиву реалізацій по заданому масиву з використанням сплайну , має вигляд:

, (8)

де , .

У випадку с-кратного збільшення кількості даних достатньо взяти значень змінної на кожному -ому проміжку розбиття : , .

Адекватність застосування зазначеного підходу було експериментально підтверджено на підставі імітаційного моделювання. Щодо теоретично обгрунтованої похибки при моделюванні, то вона дорівнює похибці апроксимації, яку визначено для відповідного локального сплайну, що використовується (при умові, що вибірку проведено якісно та її обсяг – представницький). Так, у наведеному прикладі застосування сплайну , припускаючи, що , де , відповідна похибка становить .

Проведемо моделювання реалізацій двовимірної в.в. . Результатом відбиття в є масив , що характеризується функцією розподілу . Будемо вважати, що аналітичний вигляд закону розподілу невідомий, проте , де Можна піти шляхом аналогічним одновимірному випадку, а саме: визначати місцезнаходження точок при заданому рівні випадковості із співвідношення , але подібний підхід не є тривіальним, як на разі одновимірного випадку, навіть при наявності аналітичного наближення для . Рішення може бути знайдено, якщо припустити існування залежності однієї з одновимірних в.в., що входять до вектора , від іншої. Надалі вважатимемо, що величина залежить від . Вигляд зв’язку – регресійний (хай навіть слабкий), або функціональний. Відповідно до масиву реалізацій: , або .

Проведемо ранжування вихідного масиву за незалежною змінною , поставивши у відповідність кожній двійці новоутвореного ряду частоту та значення емпіричної функції розподілу , , що є дискретним аналогом функції розподілу в.в. зі складу вектора . Далі перейдемо до розгляду двох послідовностей: та , причому, поміж та існує однозначна відповідність – як двійка реалізації . Тоді, припускаючи, що параметричне подання , , де , можемо за масивами зазначеними знайти наближення функцій , у вигляді ПС на зразок вищенаведеної обчислювальної процедури моделювання одновимірного масиву. Для остаточного визначення змодельованого масиву реалізацій в.в. , досить відібрати значення наближень функцій , при однакових значеннях аргументу.

Якщо ставиться задача знаходження значення регресії для з області визначення незалежної змінної, то в цьому разі обчислювальна процедура має наступний вигляд: визначаємо чому дорівнює при заданому ; визначаємо які та з виразу (8) відповідають даному ; підставляємо отримані та у вираз аналогічний (8) для визначення :

,

де ; , – величини, що визначаються на підставі . |

Отримана регресія (рис.1), за рахунок високої якості апроксимації локальних сплайнів, може суттєво осцилювати, залежно реалізацій у послідовності вимірювань. У цьому разі в обчислювальній процедурі відтворення регресії слід передумовити процедуру згладжування одержаної оцінки.

Відзначимо, що викладений підхід до відтворення регресій, за певних зауважень, справедливий і для відтворення функціональних залежностей , площинних та замкнених кривих.

Відтворення регресії у випадку лінійної форми зв’язку між ознаками об’єкта спостережень є класичною задачею та не викликає труднощів. На разі відтворення нелінійних залежностей, виникає проблема ідентифікації типу регресійної моделі. При оцінці дво- та багатовимірних регресій обчислювальна складність процедур ідентифікації та параметричного відтворення багатократно зростає. Одним з напрямків при вирішенні задачі оцінки функції регресії є непараметричне відтворення.

Проблемі непараметричного відтворення залежностей присвячено багато публікацій, серед яких окремо слід відзначити роботи В.М. Вапніка та В.Я. Катковніка, де, серед інших, розглянуто підхід по відтворенню одновимірних регресій на підставі оцінок функцій щільності розподілу ймовірностей за використанням ядерних оцінок. Альтернативою зазначеному підходу є використання при відтворенні регресій оцінок функцій щільності на основі ПС, близьких до інтерполяційних у середньому.

а) | б)

Рис.2. Графік відтвореної лінії регресії за використанням оцінки функцій щільності:

а) відтворена регресія; б) регресія після вилучення аномальних значень

Як видно (рис.2), зазначений підхід, окрім іншого, практично, знімає проблему відтворення регресій за неоднорідними сукупностями спостережень. Це є можливим, завдяки властивості сплайнів на основі В-сплайнів враховувати локальні “особливості” відповідних функцій щільності. Окрім того, застосування зазначених сплайнів дозволяє уникати проблем, пов’язаних з аномальними спостереженнями, що підвищує якість відтворення непараметричної регресії (рис.2.б).

В дисертації наведено результати дослідження адекватності застосування процедури регуляризації та ПС при оцінці функцій спостереження . Зазначимо, що результати суттєво не різняться залежно від кількості ітерацій процедури регуляризації, що засвідчує стійкість алгоритму. Є сенс збільшувати кількість ітерацій при суттєвій кількості даних, що відповідає логіці пов’язання кількості ітерацій та кількості класів при формуванні варіаційних рядів відповідних незалежних змінних. Величина середнього абсолютного відхилення оцінки від є прийнятною, навіть для багатомодальних функцій. Аналіз середнього відхилення показує, що це є величина близька до нуля, проте для опуклих вгору функцій будемо мати незначне “відставання” відносно , у меншій мірі це стосується й площинних функцій. Для функцій, опуклих вниз, навпаки – результат відтворення трохи перевищує істинне значення, а для багатомодальних функцій у середньому похибка статистично дорівнює нулю. Згідно -критерію слідує висновок про високу адекватність оцінки , що дає право рекомендувати зазначений підхід при розробці програмного забезпечення відтворення двовимірних регресійних залежностей.

Забезпечення режиму автоматизованої обробки статистичних даних вимагає реалізації комплексу алгоритмів з наступним аналізом результатів обробки. Для дослідника є важливим скласти уяву про об’єкт, тому й алгоритмізація має бути спрямована на те, щоб результат обробки максимально “розкривав” сутність об’єкту, впливав на прийняття рішень з обробки інформації, шляхом дії на орган зору людини, як головного засобу спілкування з зовнішнім світом. Тому необхідно на самому першому етапі аналізу даних забезпечити “візуалізацію” об’єкта після чого надати можливість при необхідності провести редагування та підготовку даних до опрацювання методами параметричних статистик. Головними графічними формами подання об’єкту є візуалізація гістограм, функцій щільності (розподілу) ймовірностей, кореляційних полів, регресій. Найбільш адекватно даним вибірки оцінку зазначених стохастичних функцій (за виключенням гістограм) можна провести на основі НМ. В розділі наводиться опис АС “Полісплайн”, яка вирішує задачу одержання непараметричних ймовірнісних оцінок на основі поліноміальних сплайнів. На прикладі даної АС запропоновано методичне забезпечення процесу автоматизації технологій НО на підставі локальних ПС, близьких до інтерполяційних у середньому. Слід відзначити, що практично всі алгоритми та обчислювальні схеми статистичної обробки даних, викладені в дисертації, були реалізовані та прошли апробацію в зазначеній АС.

В четвертому розділі розглянуто прикладні аспекти сплайн-апроксимації в ГІС, зокрема, зосереджено увагу на застосуванні технологій відтворення поверхонь, на основі лінійних комбінацій В-сплайнів, у ряді локальних ГІС картографічного моніторингу (КМ) аналізу техногенного впливу на довкілля, георозвідки в районі родовищ корисних копалин, тощо.

Складання карт техногенного забруднення регіонів техногенного впливу дозволяє провести оперативний аналіз стану та надає можливість прийняття попереджувальних чи виправних заходів. Під ІТ побудови реалістичних моделей місцевості з накладенням на них поверхонь концентрацій елементів забруднення (радіоактивне випромінювання, токсичні речовини в складі грунту, тощо) будемо розуміти низку алгоритмів які забезпечують ефективне розв’язання поставленої задачі, відповідають вимогам щодо адекватності моделі та є невибагливими при реалізації у вигляді прикладного програмного забезпечення. Розв’язання задачі побудови карт складається з чотирьох етапів: збір та підготовка даних до обробки; побудова макету місцевості (задача інтерполяції даних); побудова поверхні концентрації хімічних елементів з


Сторінки: 1 2