Автореферат моделювання багатовимірних залежностей на основі інтервальних функцій належності з врахуванням пропусків даних

Автореферат - моделювання багатовимірних залежностей на основі інтервальних функцій належності з врахуванням пропусків даних

Загрузка...

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Міністерство промислової політики України

Державне підприємство

‹‹Науково-виробнича корпорація

„Київський інститут автоматики” ››

Куземко Сергій Михайлович

УДК 681. 3.015

моделювання багатовимірних залежностей

на основі інтервальних функцій належності з врахуванням пропусків даних

Спеціальність 05.13.06 – автоматизовані системи управління та

прогресивні інформаційні технології

Автореферат

дисертації на здобуття наукового ступеня
кандидата технічних наук

Київ – 2006

Дисертацією є рукопис.

Роботу виконано у Вінницькому національному технічному університеті Міністерства освіти і науки України.

Науковий керівник – кандидат технічних наук, доцент

Кондратенко Наталія Романівна,

доцент кафедри обчислювальної техніки

Вінницького національного технічного університету.

Офіційні опоненти – заслужений діяч науки і техніки України,

доктор технічних наук, професор

Герасимов Борис Михайлович,

професор кафедри АСУ Військового

інституту Київського національного

університету імені Тараса Шевченка,

доктор технічних наук, професор

Корченко Олександр Григорович,

завідувач кафедри безпеки інформаційних

технологій Національного авіаційного університету.

Провідна установа – Національний технічний університет "Харківський політехнічний інститут", кафедра автоматизованих систем управління (АСУ).

Захист відбудеться ”27” вересня 2006 р. о 13 годині на засіданні спеціалізованої вченої ради К 26.818.01 ДП ‹‹Науково-виробнича корпорація „Київський інститут автоматики”›› за адресою: 04107, Київ-107, вул. Нагірна, 22, корп.1, к. 219.

Відгуки на автореферат у двох примірниках, засвідчені печаткою установи, просимо надсилати на адресу: 04107, Київ-107, вул. Нагірна, 22, ДП ‹‹НВК„КІА”››, вченому секретарю.

З дисертацією можна ознайомитись у бібліотеці ДП ‹‹НВК „Київський інститут автоматики”››.

Автореферат розісланий ”25”серпня 2006 р.

Вчений секретар

спеціалізованої вченої ради

кандидат технічних наук Л.П. Тронько

Загальна характеристика роботи

Актуальність теми дисертації. Зростаючі потужності сучасних обчислювальних систем постійно розширюють коло практичних задач, розв’язання яких можливе з використанням засобів штучного інтелекту. При цьому з метою опису явищ, для яких важко одержати кількісні характеристики, застосовують все більш складні моделі. Невизначеність інформації обумовлюється як неточністю вимірювальної апаратури, так і тим, що часто в якості її виступає людина, що особливо характерно для експертних систем. Невизначеність є невід'ємною характеристикою будь-якої інформації, що надходить в систему. Основні методи врахування невизначеності інформації можуть бути віднесені до наступних трьох груп: імовір-нісні, емпіричні і нечіткі.

Використання імовірнісного підходу ускладнюється тим, що вимоги, які накладаються на ознаки, часто виявляються нездійсненними. Імовірнісний простір в кінцевому випадку складається з елементарних подій, що вважаються несумісними. В реальній ситуації вони майже завжди взаємозалежні. Часто буває неможливо або дуже важко отримати вибірки достатнього обсягу, щоб статистичні оцінки були достовірними. Крім того, в рамках імовірнісного підходу дуже складно описати факт відсутності інформації.

Теорія нечітких множин, запропонована Л. Заде, є потужним засобом опису різноманітних понять природної мови, які майже завжди носять невизначений характер. Застосовуванню теорії нечітких множин для розв’язання прикладних задач присвячені роботи зарубіжних та вітчизняних дослідників, таких як Р. Беллман, Р. Ягер, М. Суджено, А. Прад, Д. Дюбуа, П. Маклін, Д. Бездек, Я. Цукомото, А. Кофман, Д. Мендель, Д.А. Поспєлов, А.М. Меліхов, А.М. Аверкін, Ю.М. Мінаєв, В.І. Архангельський, І.М. Богаєнко, Б.М. Герасимов, І.З. Батиршин, Р.А. Алієв, А.П. Ротштейн, В.П. Бочарніков та інші.

В рамках теорій нечітких множин виділяють два великих напрямки використання нечітких множин для опису дійсності. По-перше, це нечітка математика, теорія нечіткої міри, класична теорія нечітких множин і таке інше. Даний напрямок в першу чергу направлений на опис лінгвістичної невизначеності, яка присутня в думках людини. Другий напрямок пов’язують з використанням систем нечіткого логічного виводу, в яких нечіткі множини використовують для опису нечітких правил. В рамках цього підходу розв’язують задачі моделювання багатовимірних залежностей, таких як ідентифікації, прогнозування, діагностування, класифікації і таке інше.

В рамках нечіткої логіки постійно ведуться дослідження з метою розширення можливостей опису за допомогою нечітких множин не тільки лінгвістичної невизначеності, але й інших невизначеностей, наприклад, невизначеності вимірювання і таке інше. Найбільш вдалим засобом опису таких невизначеностей є використання розширених нечітких множин, коли в якості значень функцій належності виступає не число, а інтервал або нечітка множина.

Задача моделювання багатовимірних залежностей може ускладнюватися наявністю пропусків як у вхідних, так і в експериментальних даних. Така задача виникає в різноманітних практичних застосуваннях в економіці, біології, техніці, медицині, сільському господарстві, геології та інших. Як правило, проблема пропусків в експериментальних даних вирішується шляхом їх заповнення „правдоподібними” значеннями за допомогою різних методів. Успішне застосування таких методів можливе при невеликій кількості пропусків в експериментальних даних та великих обсягах навчальних вибірок. Наявність пропусків у вхідних даних при застосуванні вищенаведених підходів не враховується.

Моделювання багатовимірних залежностей в умовах невизначеностей є достатньо складною задачею, яка не розв’язується існуючими засобами при практичному застосуванню в різних галузях науки та техніки. З огляду на це, тема дисертаційних досліджень, які присвячені розробці та використанню на практиці нового підходу до розв’язання задач моделювання багатовимірних залежностей в умовах невизначеностей з використанням нечітких множин вищих типів, є актуальною.

Зв’язок роботи з науковими програмами, планами, темами. Робота виконувалась на кафедрі обчислювальної техніки Вінницького національного технічного університету згідно з договором №47/08 про творчу співдружність між Вінницьким національним технічним університетом та Українським науково-практичним центром ендокринної хірургії, трансплантації ендокринних органів та тканин МОЗ України „Розробка системи діагностування гіпотиреозу у різних вікових категорій хворих”.

Мета і задачі дослідження. Метою дослідження є розширення можливостей прийняття рішень за умов невизначеностей, включаючи пропуски у даних, на основі застосування методів моделювання багатовимірних залежностей з використанням інтервальних функцій належності.

Для досягнення цієї мети необхідно розв’язати такі задачі:

1. Аналіз методів моделювання багатовимірних залежностей за умов невизначеностей.

2. Розробка підходу до моделювання багатовимірних залежностей на основі нечітких моделей з врахуванням пропусків в експериментальних та вхідних даних.

3. Розробка показника якості нечітких моделей з використанням інтервальних функцій належності.

4. Розробка методу визначення параметрів інтервальних функцій належності.

5. Дослідження функціональних можливостей розроблених методів моделювання багатовимірних залежностей на прикладі розв’язання складної задачі медичного діагностування (гіпотиреоз).

6. Розробка генетичного алгоритму для настроювання нечітких моделей.

7. Дослідження функціональних можливостей традиційних та розроблених методів моделювання багатовимірних залежностей на прикладі задачі медичного діагностування.

Об’єктом дослідження є процес моделювання багатовимірних залежностей з використанням інтервальних функцій належності за умов невизначеностей.

Предметом дослідження є нечіткі моделі, на основі яких здійснюється моделювання багатовимірних залежностей за умов невизначеностей, включаючи пропуски у даних.

Методи дослідження базуються на основних положеннях теорії нечітких множин, теорії оптимізації, математичного моделювання аналізу і синтезу.

Наукова новизна отриманих результатів полягає в тому, що:

1. Вперше запропоновано підхід до моделювання багатовимірних залежностей, який на відміну від існуючих дає змогу отримувати нечіткі моделі з використанням інтервальних функцій належності на основі експериментальних даних за умов невизначеностей, включаючи пропуски у даних.

2. Вперше запропоновано показник якості нечітких моделей, який дає можливість оцінити середню невизначеність функціонування та адекватність нечітких моделей на основі інтервальних функцій належності.

3. Вперше запропоновано метод визначення параметрів інтервальних функцій належності, який дає можливість отримувати адекватні нечіткі моделі з використанням інтервальних функцій належності на основі експериментальних даних.

4. Удосконалено моделі, що описують операції мутації та схрещування в генетичному алгоритмі, які дозволяють розв’язувати задачу настроювання нечітких моделей з великою кількістю вхідних параметрів.

Обґрунтованість і достовірність наукових положень, висновків і рекомендацій. Наукове значення роботи полягає в тому, що вона дає можливість подальшого розвитку методів теорії прийняття рішень на основі моделювання багатовимірних залежностей в умовах невизначеностей, а практичне значення – в тому, що отримані наукові результати дозволяють на основі експериментальних даних, які містять невизначеності, будувати моделі різних предметних галузей, що особливо важливо при розробці систем підтримки прийняття рішень.

Отримані в дисертації наукові результати збагачують наукові основи теорії прийняття рішень на основі застосування методів моделювання багатовимірних залежностей при пропусках у даних.

Таким чином, розроблені методи та засоби моделювання багатовимірних залежностей на основі інтервальних функцій належності дозволяють розширити можливості прийняття рішень за умов невизначеностей, включаючи пропуски у даних.

Практичне значення отриманих результатів полягає в тому, що:

1. Запропонована методика прийняття рішень за умов невизначеностей, включаючи пропуски у даних, на основі застосування методів моделювання багатовимірних залежностей із використанням інтервальних функцій належності.

2. Побудовано автоматизовану систему діагностування гіпотиреозу, яка дає можливість за рахунок використання інтервальних функцій належності визначати діагнози для конкретних хворих при неповній вхідній інформації на основі експериментальних даних, що містять пропуски.

3. Розроблено програмний комплекс, який дає можливість розв’язувати задачу настроювання нечітких логічних моделей з великою кількістю вхідних параметрів.

4. Розроблено програмне забезпечення реалізації процесу діагностування гіпотиреозу для конкретних хворих.

Практичні результати дисертаційних досліджень впроваджені в Українському науково-практичному центрі ендокринної хірургії, трансплантації ендокринних органів та тканин. Впровадження результатів досліджень підтверджено відповідним актом. Розроблене програмне забезпечення реалізації процесу діагностування гіпотиреозу захищене деклараційним патентом на корисну модель.

Особистий внесок здобувача. Всі основні результати, викладені в даній роботі, отримані автором самостійно. У публікаціях, написаних у співавторстві, здобувачеві належать: проведення експериментів і розробка структури генетичного алгоритму [1,2]; запропоновано метод визначення параметрів інтервальних функцій належності [3]; запропоновано метод побудови нечітких моделей [4]; проведення експериментів по настроюванню функцій належності [5]; запропоновані метод побудови нечітких моделей на основі експериментальних даних, що містять пропуски, метод прийняття рішень при пропусках у вхідних даних та показник якості нечітких моделей з інтервальними функціями належності [6]; удосконалено метод обробки сигналів на основі вибірки вейвлет-коефіцієнтів з використанням інтервальних функцій належності [7]; розробка автоматизованої системи діагностування гіпотиреозу [8]; запропоновано метод визначення параметрів інтервальних функцій належності [9]; запропоновано метод діагностування ендокринних захворювань на основі інтервальних функцій належності [10]; запропоновано метод обробки сигналів на основі вибірки вейвлет-коефіцієнтів з використанням інтервальних функцій належності [15]; запропоновано генетичні операції схрещування і мутації [16]; проведення експериментів по настроюванню функцій належності [17].

Апробація результатів дисертації. Основні положення і наукові результати, викладені в роботі, пройшли апробацію на науково-технічних конференціях. Серед них: науково-технічні конференції професорсько-викладацького складу, співробітників та студентів університету за участю працівників науково-дослідних організацій та інженерно-технічних працівників підприємств м. Вінниці та галузі на протязі 2000, 2002, 2003 рр., та міжнародні конференції „Контроль і управління в складних системах”, 2003, 2005 рр. (м. Вінниця), „Інтелектуальні системи прийняття рішень та інформаційні технології”, 2004р. (м. Чернівці), „Проблеми та перспективи розвитку транспортних систем: техніка, технологія, економіка і управління”, 2004р. (м. Київ), „Сучасні проблеми радіоелектроніки, телекомунікацій та приладобудування”, 2005р. (м. Вінниця), „Системний аналіз та інформаційні технології”, 2005р. (м. Київ).

Публікації За матеріалами роботи опубліковано 17 наукових праць, з них 7 статей в наукових журналах з переліку ВАК, 9 тез доповідей на конференціях та один деклараційний патент на корисну модель.

Структура дисертації. Дисертація складається зі вступу, чотирьох розділів основної частини, висновків, списку використаної літератури із 144 найменувань, включає 109 рисунків, 20 таблиць та 5 додатків. Повний обсяг роботи викладено на 166 сторінках, з них 125 сторінок основної частини.

Основний ЗМІСТ роботи

Вступ дисертаційної роботи містить: обґрунтування актуальності теми дисертаційної роботи, зв’язок роботи з науковими програмами, планами, темами; мету і задачі дослідження; об’єкт, предмет і методи дослідження; наукову новизну і практичне значення отриманих результатів; особистий внесок здобувача; інформацію про апробацію і публікацію результатів.

В першому розділі проводиться аналіз видів невизначеностей та розглядаються основні підходи до їх опису. Розглянуто загальну характеристику основних підходів до опису невизначеностей, які наявні в предметній області, а також доцільність їх використання при розв’язанні задачі моделювання багатовимірних залежностей з врахуванням пропусків в даних. Проаналізовано основні підходи до розв’язання задачі моделювання багатовимірних залежностей на основі нечітких моделей та нейро-нечітких мереж. На основі проведеного аналізу сформульовано мету та задачі дослідження, які полягають у розробці підходу, методів та методики для розширення можливостей прийняття рішень за умов невизначеностей, включаючи пропуски у даних, на основі застосування методів моделювання багатовимірних залежностей з використанням інтервальних функцій належності.

У другому розділі дисертаційної роботи розроблено теоретичні засади моделювання багатовимірних залежностей з використанням інтервальних функцій належності за умов невизначеностей, включаючи пропуски у даних.

Запропоновано метод побудови нечітких моделей на основі експериментальних даних, що містять пропуски. Нехай є експериментальна вибірка X:

де ;

n – кількість експериментальних прикладів;

k – кількість вхідних змінних;

y – вихідна величина.

В експериментальній вибірці значення певних xij невідомі, тобто існує певна множина , така що x ijH=.

Базу правил будемо визначати таким чином:

де , i=1чn, j=1чk –нечітка множина типу 2, яка визначається інтер-вальною функцією належності;

, i=1чn – нечітка множина типу 1.

Центри нечітких множин визначаються відповідними експериментальними даними. Інші параметри обираються розробником моделі.

Метод дозволяє дуже швидко отримувати адекватні навчальним даним моделі, проте отримана модель добре запам’ятовує навчальні дані, але недостатньо їх узагальнює. Запропонований удосконалений метод побудови нечітких моделей, за допомогою якого можна визначити параметри інтервальних функцій належностей та розбиття експериментальних даних на навчальну та тестові вибірки. Він включає такі етапи – побудову моделі на основі всієї експериментальної вибірки з використанням нечітких множин типу 1, зменшення надлишковості та визначення інтервалів зміни параметрів функцій належності. Цей метод можна представити таким чином:

1. Зменшення вибірки. Побудова нечіткої моделі на всій вибірці (з використанням методу прямого генерування та звичайних функцій належності), k:=1.

2. Якщо k<>size, перейти до п.3, інакше перейти до п.4.

3. Виключення правила k з нечіткої моделі; розрахунок відгуку моделі по всій вибірці. Якщо помилка в межах допустимого, тоді size:=size-1, інакше додати в модель вилучене правило, k:= k+1 і перейти до п.2.

4. Визначення діапазону зміни параметрів. k:=1 (форму функцій належності і їх параметри, які будуть задаватися інтервалами значень, обирає експериментатор).

5. Визначення верхньої межі діапазону. Множимо параметри функцій належності на k (можна множити одночасно всі параметри моделі, а можна послідовно кожен), виконуємо розрахунок відгуку моделі на всій вибірці.

6. Якщо помилка в межах допустимого, тоді k: = k+ ( – приріст значень, вибирається експериментатором) і перейти до п.5, інакше max_р:=р*(k-), k:=1, перейти до п.7.

7. Визначення нижньої межі діапазону. Множимо параметри функцій належності на k (можна множити одночасно всі параметри моделі, а можна послідовно кожен), виконуємо розрахунок відгуку моделі по всій вибірці.

8. Якщо помилка в межах допустимого, тоді k: = k- і перейти до п.7, інакше min_р:=р*(k+).

За допомогою запропонованих автором методів можна побудувати нечіткі моделі на основі експериментальних даних, що містять пропуски. Але в рамках даних методів фактично неможливо перевірити адекватність побудованої моделі, бо існуючий механізм логічного висновку не дає можливості визначити вихідне значення нечіткої моделі при неповному вхідному векторі. Тому автор пропонує метод прийняття рішень при пропусках у вхідних даних, який поєднано з процесом побудови нечіткої моделі. Нехай відома експериментальна вибірка X (може містити пропуски, різноманітні невизначеності):

де ;

n – кількість експериментальних прикладів;

k – кількість вхідних змінних;

y – вихідна величина.

Також відомий вхідний вектор , причому існує множина U(1,…,k), така що xіU=.

Метод прийняття рішень при наявності пропусків у вхідних даних визначимо таким чином.

1. Виділяємо із експериментальної вибірки Х підвибірку D:

де ; i=1чn; p – кількість відомих значень параметрів.

Фактично з початкової вибірки виключаються стовпці, для яких невідомі вхідні значення, та формується нова експериментальна вибірка.

2. Проводимо генерування нечіткої моделі на основі експери-ментальної вибірки D. Для цього використовуємо метод прямого генерування нечітких моделей із експериментальних даних, який описано вище. Отримуємо модель, для якої значення всіх вхідних параметрів відомі.

3. Визначаємо вихідне значення.

Нарівні з проблемою опису різноманітних невизначеностей існує проблема оцінювання адекватності побудованих моделей. Відомі критерії якості функціонування нечітких моделей не враховують складний характер інтервальних функцій належності, тому автор пропонує показник якості нечітких моделей з використанням інтервальних функцій належності.

Нехай відомі:

1) множина вхідних параметрів ;

2) вихідні параметри у;

3) система правил, яка описує певну предметну галузь (для спрощення будемо вважати, що в ній немає пропусків):

де , i=1чn, j=1чk –нечітка множина типу 2, яка визначається інтегральною функцією належності;

, i=1чn – нечітка множина типу 1;

n – кількість змінних;

m – кількість правил.

На рис.1 наведений приклад інтервальної функції належності. Вона ставить у відповідність кожному значенню аргументу певний інтервал із діапазону [0,1]. Множина цих інтервалів утворює зону невизначеності. Вели-

Рис.1. Приклад інтервальної функції належності

чина площі даної зони визначає середній розкид вихідних значень. Автор пропонує використовувати площу даної зони для визначення значення показника якості нечітких моделей. Враховуючи, що в нечіткий моделі, яка описує певну предметну галузь, присутнє якнайбільше nm функцій належностей, та те, що функції належності можуть мати різні діапазони зміни, будемо використовувати нормоване значення площі зони невизначеності. Отже показник якості нечітких моделей з використанням інтервальних функцій належності має такий вигляд:

де та – верхня та нижні границі інтервальної функції належ- ності ;

та – максимальне і мінімальне значення змінної ;–

показник якості нечітких моделей.

Очевидно, що , причому значення означає повну відсутність невизначеності та однозначне відображення вхідних значень у вихідні. Значенню відповідає випадок повної невизначеності (будь-якому вхідному значенню ставиться у відповідність весь діапазон можливих вихідних значень).

За допомогою розробленого показника можна порівняти побудовані моделі з використанням інтервальних функцій належності. Найкращою буде та, яка характеризується найменшим значенням показника та функціями належності з максимальною площею зони невизначеності при умові адекватності відображення експериментальних даних.

На рис.2 наведена узагальнена структура функціонування нечіткої моделі з інтервальними функціями належності з врахуванням пропусків у вхідних та експериментальних даних.

Рис.2. Узагальнена структура функціонування нечіткої моделі з інтервальними функціями належності

Запропоновано методику моделювання багатовимірних залежностей за умов невизначеностей, включаючи пропуски в даних,на основі нечітких моделей з використанням інтервальних функцій належності. Вона включає ряд етапів: збір та попередня обробка експериментальних даних; вибір модельної структури; оцінка (оптимізація) параметрів моделі; перевірка адекватності моделі.

Третій розділ присвячений побудові автоматизованої системи медичного діагностування на основі інтервальних функцій належності із експериментальних даних в умовах невизначеностей за допомогою розроблених в розділі 2 методів.

Знання про предметну галузь діагностування гіпотиреозу характеризуються такими об’єктивними параметрами:*

44 вхідними параметрами;*

однією вихідною величиною – висновком про відсутність або наявність гіпотиреозу з визначенням його ступеня важкості;*

387 експериментальними даними про предметну галузь, які містять пропуски. Загальна кількість пропущених значень – 1205.

Для опису інтервальних функцій належності було обрано модифіковану гаусову форму:

де [min(с),max(с)] – діапазон зміни параметру с гаусової функції належності.

Побудовано з використанням інтервальних функцій належності автоматизовану систему діагностування гіпотиреозу на основі експериментальних даних, що містять пропуски, яка дозволяє враховувати наявність пропусків у вхідних значеннях та визначати вихідний діагноз або множину діагнозів для конкретного хворого. Проведено дослідження побудованої автоматизованої системи діагностування гіпотиреозу. Результати досліджень залежності кількості правил та значення показника якості від кількості відомих значень параметрів наведені на рис.3-4.

Експерименти показали, що всі системи функціонують таким чином, що в якості вихідного значення виступає діагноз, який співпадає з верифікованим, або множина діагнозів, яка включає верифікований. Причому таке відбувається на всіх вибірках: навчальній, тестовій та контрольній. Тобто не можна стверджувати, що системи помиляються, вони обережно визначають кінцевий діагноз на основі тієї інформації, яка в них є і якої може бути об’єктивно недостатньо для точного визначення вихідної величини.

Рис.3. Залежність кількості правил від кількості відомих значень параметрів

Рис.4. Залежність значення показника якості від кількості відомих значень параметрів

Результати досліджень залежності середнього розкиду вихідної величини від кількості відомих значень параметрів наведені на рис.5-7.

Рис.5. Залежність середнього розкиду вихідної величини від кількості відомих значень параметрів на навчальних вибірках

Рис.6. Залежність середнього розкиду вихідної величини від кількості відомих значень параметрів на тестових вибірках

Рис.7. Залежність середнього розкиду вихідної величини від кількості відомих значень параметрів на контрольних вибірках

Параметр Z визначає середній розкид вихідної величини і обчислюється за формулою:

де – кількість експериментів;–

кількість вихідних діагнозів, які визначила модель для - го експерименту.

Проведене дослідження впливу кількості пропусків на функціональні можливості автоматизованої системи показало, що збільшення кількості пропущених вхідних даних приводить до збільшення середньої невизначеності вихідної величини, збільшення значення показника якості та зменшення кількості правил.

Розроблено спеціалізоване програмне забезпечення, яке дозволяє реалізувати використання в клінічній практиці побудованої автоматизованої системи з метою спрощення процесу діагностування гіпотиреозу у конкретних пацієнтів.

Четвертий розділ присвячено порівняльному аналізу традиційних нечітких, нейро-нечітких та запропонованих автором підходів до побудови нечітких моделей на прикладі розв’язання задачі діагностування гіпоти-реозу.

Результати порівняльного аналізу наведені в табл.1.

Таблиця 1

Порівняльний аналіз

Підхід | Помилка на навчальних даних | Помилка на тестових даних | Час побудови системи

Підхід на основі нечітких множин типу 1 | 0% | 20% | 70 год.

Нейро-нечіткий підхід | 0% | 46% | Декілька секунд

Для системи з інтервальними функціями належності помилки на навчальних та тестових даних визначаються як непотрапляння у вихідний діапазон верифікованого діагнозу. Для побудованої системи вони становлять 0% та 0% відповідно. На 6% тестових даних система видала інтервал, який містив верифікований діагноз. Час побудови системи становить декілька секунд.

Для настроювання автоматизованої системи на основі нечітких множин типу 1 було запропоновано удосконалений генетичний алгоритм, який характеризується такими параметрами:–

Десятковим представленням хромосом.–

Схрещування реалізовано як середнє геометричне з випадковими коефіцієнтами двох обраних випадковим чином хромосом. –

Мутація реалізується додаванням в популяцію n хромосом, кожна з яких отримана випадковою зміною i-го гена в кращій хромосомі популяції, де i=1n.

– Елітним механізмом відбору.

Оцінка можливостей запропонованого алгоритму і генетичних операцій відбувалася на ряді тестових функцій високої розмірності. Перевірка показала високу ефективність даного алгоритму при розв’язанні задач оптимізації.

В результаті використання інтервальних функцій належності автором було побудовано систему, яка краще описує предметну галузь. Процес побудови автоматизованої системи відбувається в реальному часі і не вимагає розв’язання трудомісткої задачі оптимізації параметрів функцій належності за допомогою генетичного алгоритму.

ВИСНОВКИ

В дисертації наведено нове вирішення наукової задачі, яка полягає у розширенні можливостей прийняття рішень за умов невизначеностей, включаючи пропуски у даних, на основі застосування методів моделювання багатовимірних залежностей з використанням інтервальних функцій належності. Розроблено новий підхід до моделювання багатовимірних залежностей, який орієнтовано на розв’язання складних прикладних задач в різних галузях науки та техніки.

Основні наукові та практичні результати дисертаційної роботи такі:

1. Розроблено новий підхід до моделювання багатовимірних залежностей на основі експериментальних даних за умов невизначеностей, включаючи пропуски у даних, в основу якого покладено використання інтервальних функцій належності і в якому здійснюється перетворення невизначеності вхідної інформації у невизначеність вихідної величини.

2. Вперше запропоновано показник якості нечітких моделей з використанням інтервальних функцій належності, який базується на обчисленні середньої невизначеності інтервальних функцій належності, що дозволяє оцінити адекватність опису предметної галузі розробленою нечіткою моделлю.

3. Розроблено нові моделі, що описують операції мутації та схрещування в генетичному алгоритмі, які дозволяють розв’язувати задачу настроювання нечітких моделей з великою кількістю вхідних параметрів.

4. Побудована автоматизована система діагностування гіпотиреозу. Вона дає можливість за рахунок використання інтервальних функцій належності визначати діагнози для конкретних хворих при неповній вхідній інформації на основі експериментальних даних, що містять пропуски.

5. Розроблено програмний комплекс, який дає можливість розв’язувати задачу настроювання нечітких логічних моделей з великою кількістю вхідних параметрів за допомогою запропонованого генетичного алгоритму.

6. Розроблено програмне забезпечення, яке дозволяє виконувати діагностування конкретних хворих (по неповній вхідній інформації) на основі експериментальних даних, що містять пропуски.

Практичні результати дисертаційних досліджень впроваджено в Українському науково-практичному центрі ендокринної хірургії, трансплантації ендокринних органів та тканин. Впровадження результатів досліджень підтверджено відповідним актом. Розроблене програмне забезпечення реалізації процесу діагностування гіпотиреозу захищене деклараційним патентом на корисну модель.

список опублікованих праць за темою дисертації

1. Кондратенко Н.Р., Куземко С.М. Оптимізація багатоекстремальних функцій за допомогою одного генетичного алгоритму // Наукові вісті (Національний технічний університет України „Київський політехнічний інститут”). – 2002. – №1.– С. 42–47.

2. Кондратенко Н.Р., Куземко С.М. Особливості генетичної оптимізації багатоекстремальних функцій // Вісник Вінницького політехнічного інституту. – 2002. – №1. – С. – 39–42.

3. Кондратенко Н.Р., Зелінська Н.Б., Куземко С.М. Діагностика гіпотиреозу на основі нечіткої логіки з використанням інтервальних функцій належності // Наукові вісті (Національний технічний університет України „Київський політехнічний інститут”). – 2003. – №4. – С. 52–58.

4. Кондратенко Н.Р., Зелінська Н.Б., Куземко С.М. Нечіткі логічні системи з врахуванням пропусків в експериментальних даних // Наукові вісті (Національний технічний університет України „Київський політехнічний інститут”). – 2004. – №5. – С. 37-41.

5. Кондратенко Н.Р., Куземко С.М. Генетичне настроювання нечіткої моделі в задачі діагностики гіпотиреозу // Вісник Вінницького політехнічного інституту. – 2003. – №6. – С. 278-283.

6. Кондратенко Н.Р., Куземко С.М. Нечіткі логічні системи з використанням нечітких множин загального типу // Наукові вісті (Національний технічний університет України „Київський політехнічний інститут”). – 2004. – №1. – С. 16-21.

7. Кондратенко Н.Р., Куземко С.М., Ткачук О.А. Обробка сигналів за допомогою вейвлет-перетворення // Вісник Вінницького політехнічного інституту. – 2005. – №5. – С. 129-132.

8. Деклараційний патент на корисну модель № 20040806549, МПК G 06F 17/00. Спосіб діагностування гіпотиреозу / Зелінська Н.Б., Кондратенко Н.Р., Куземко С.М.; Заявл. 05.08.04; Опубл. 15.02.2005. Бюл. №2. – 3с.

9. Кондратенко Н.Р., Куземко С.М. Нечіткі логічні системи з використанням нечітких множин вищих типів // Тези доповідей сьомої міжнародної науково-технічної конференції „Системний аналіз та інформаційні технології”. – К.: НТУУ „КПІ”, 2005. – С. 43.

10. Кондратенко Н.Р., Куземко С.М., Чеборака О.М. Використання інтервальних функцій належності в задачах класифікації ендокринних захворювань // Тези доповідей восьмої міжнародної науково-технічної конференції „Контроль і управління в складних системах”. – Вінниця: „УНІВЕРСУМ-Вінниця”, 2005. – С. 233.

11. Куземко С.М. Дослідження одного генетичного алгоритму в задачах оптимізації // Тези студентських доповідей ХХХІ науково-технічної конференції професорсько-викладацького складу, співробітників та студентів університету з участю працівників науково-дослідних організацій та інженерно-технічних працівників підприємств м. Вінниці та галузі. – Вінниця: УНІВЕРСУМ-Вінниця, 2002. – С. 57.

12. Куземко С.М. Нечітка логічна система діагностування гіпотиреозу з врахуванням недовизначених експериментальних даних // Тези доповідей учасників міжнародної науково-технічної конференції „Інтелектуальні системи прийняття рішень та інформаційні технології”. – Чернівці: Рута, 2004. – С. 88-89.

13. Куземко С.М. Нечіткі логічні системи з використанням інтервальних функцій належності з урахуванням пропусків в експериментальних даних // Тези доповідей другої науково-практичної конференції ”Проблеми та перспективи розвитку транспортних систем: техніка, економіка і управління”. – К.: КУЕТТ, 2004.– С. 205-207.

14. Куземко С.М. Генетичні алгоритми та їх використання в задачах оптимізації // Тези студентських доповідей ХХІХ науково-технічної конференції професорсько-викладацького складу, співробітників та студентів університету з участю працівників науково-дослідних організацій та інженерно-технічних працівників підприємств м. Вінниці та галузі. – Вінниця: УНІВЕРСУМ-Вінниця, 2000. – С. 76.

15. Куземко С.М., Ткачук О.А. Обробка сигналів за допомогою вейвлет-перетворення // Тези доповідей першої міжнародної науково-технічної конференції „Сучасні проблеми радіоелектроніки, телекомунікацій та приладобудування”. – Вінниця: УНІВЕРСУМ-Вінниця, 2005. – С. 54.

16. Ткачук О.А., Куземко С.М., Заєць Е.Б. Про узагальнену задачу комівояжера та алгоритми її розв’язання // Тези студентських доповідей ХХХIІ науково-технічної конференції професорсько-викладацького складу, співробітників та студентів університету з участю працівників науково-дослідних організацій та інженерно-технічних працівників підприємств м. Вінниці та галузі. – Вінниця: УНІВЕРСУМ-Вінниця, 2003. – С. 62.

17. Юхимчук С.В., Кондратенко Н.Р., Куземко С.М. Генетичне настроювання нечіткої моделі в задачі діагностики гіпотиреозу // Тези доповідей сьомої міжнародної науково-технічної конференції „Контроль і управління в складних системах”. – Вінниця: УНІВЕРСУМ-Вінниця, 2003. – С. 10.

АНОТАЦІЇ

Куземко С.М. Моделювання багатовимірних залежностей на основі інтервальних функцій належності з врахуванням пропусків даних. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – автоматизовані системи управління та прогресивні інформаційні технології. – ДП ‹‹Науково-виробнича корпорація „Київський інститут автоматики”››, Київ, 2006.

Дисертаційна робота присвячена питанням розширення можливостей прийняття рішень за умов невизначеностей, включаючи пропуски у даних, на основі застосування методів моделювання багатовимірних залежностей.

Розроблено новий підхід до моделювання багатовимірних залежностей на основі експериментальних даних за умов невизначеностей, включаючи пропуски у даних. Запропоновано показник якості нечітких моделей з використанням інтервальних функцій належності.

Побудована автоматизована система діагностування гіпотиреозу. Вона дає можливість за рахунок використання інтервальних функцій належності визначати діагнози для конкретних хворих при неповній вхідній інформації на основі експериментальних даних, що містять пропуски.

Розроблено нові моделі, що описують операції мутації та схрещування в генетичному алгоритмі, які дозволяють розв’язувати задачу настроювання нечітких моделей з великою кількістю вхідних параметрів.

Ключові слова: нечіткі логічні системи, інтервальні функції належності, ідентифікація, генетичні алгоритми, пропуски в даних, невизначеність.

Куземко С. М. Моделирование многомерных зависимостей на основе интервальных функций принадлежности с учетом пропусков данных. – Рукопись.

Диссертация на соискание научной степени кандидата технических наук по специальности 05.13.06 – автоматизированные системы управления и прогрессивные информационные технологии. – ГП ‹‹Научно-производственная корпорация „Киевский институт автоматики”››, Киев, 2006.

Диссертационная работа посвящена вопросам расширения возможностей принятия решений при неопределенности, включая пропуски в данных, на основе применения методов моделирования многомерных зависимостей за счет использования интервальных функций принадлежности.

Постоянно ведутся исследования с целью расширения возможностей описания с помощью нечетких множеств не только лингвистической неопределенности, но и других неопределенностей, например, неопределенности измерения и тому подобное. Наиболее удачным средством описания таких неопределенностей является использование расширенных нечетких множеств, когда в качестве значений функций принадлежности выступает не число, а интервал или нечеткое множество.

Задача моделирования многомерных зависимостей может усложняться наличием пропусков как во входных, так и в экспериментальных данных. Такие задачи возникают в разнообразных прикладных областях экономики, биологии, технике, медицине, сельском хозяйстве, геологии и других. Как правило, проблема пропусков в экспериментальных данных решается путем их заполнения „правдоподобными” значениями с помощью разных методов. Успешное применение таких методов возможно при небольшом количестве пропусков в экспериментальных данных и больших объемах обучающих выборок. Наличие пропусков во входных данных при применении таких подходов не учитывается.

Разработан новый подход к моделированию многомерных зависимостей на основе экспериментальных данных при неопределенностях, включая пропуски в данных, который основан на использовании интервальных функций принадлежности. Основная идея подхода к построению моделей состоит в исключении пропусков во входных данных путем преобразования входного вектора и экспериментальных данных и увеличении неопределенности функций принадлежности. За счет этого неопределенность входной информации и экспериментальных данных превращается в неопределенность выходного значения. Это дает возможность получить интервальную оценку выходной величины при отсутствии части входной информации, а также повысить адекватность описания предметной области.

Предложен показатель качества функционирования нечетких моделей с использованием интервальных функций принадлежности, который базируется на вычислении средней неопределенности интервальных функций принадлежности и позволяет оценить адекватность представления предметной области разработанной нечеткой моделью.

Разработан метод определения параметров интервальных функций принадлежности, который за счет уменьшения избыточности базы правил дает возможность строить при неопределенности нечеткие модели, более адекватные предметной области.

Разработаны новые модели, которые описывают операции мутации и скрещивания в генетическом алгоритме. Были проведены их экспериментальные исследования, которые подтвердили возможность решения задач многопараметрической многоэкстремальной оптимизации и задач настраивания нечетких моделей с большим количеством входных параметров.

Разработан программный комплекс, который дает возможность решать задачу настраивания нечетких логических моделей с большим количеством входных параметров с помощью предложенного генетического алгоритма.

Проведено настраивание с помощью разработанного генетического алгоритма автоматизированной системы медицинского диагностирования с использованием нечетких множеств типа 1.

Доказана лучшая адекватность описания предметной области разработанным подходом к моделированию многомерных зависимостей при неопределенности, чем при использовании классических подходов, а именно нейро-нечеткой сети и системы на основе нечетких множеств типа 1 с генетической настройкой.

Построена автоматизированная система диагностирования гипотиреоза. Она дает возможность за счет использования интервальных функций принадлежности определять диагнозы для конкретных больных при неполной входной информации на основе экспериментальных данных, которые содержат пропуски.

Ключевые слова: нечеткие логические системы, интервальные функции принадлежности, идентификация, генетические алгоритмы, пропуски в данных, неопределенность.

Kuzemko S. M. Modeling of multivariate dependences with sparse date basic of interval membership functions - Hand writing.

The thesis is presented for obtaining the candidate in technical science on speciality 05.13.06. – automatic systems of management and progressive informational technologies. – Research-and-production corporation “Kyiv institute of automation”, Kyiv, 2006.

Thesis is devoted by a question enhancement of decision-making in uncertainty, including sparse data basic application methods of modeling multivariate dependences with use of interval membership functions.

The new approach to modeling multivariate dependences basic of experimental data in uncertainty, including sparse data with use interval membership functions is developed. The parameter of quality functioning build models with use of interval membership functions is developed.

The automated system of diagnosing hypothyroidism is constructed. It enables, due to uses of interval membership functions to define diagnoses for concrete patients at the incomplete input information on the basis of experimental data which contain sparse.

New models operations of a mutation and crossing in genetic algorithm which allow to solve a learning models with a lot of parameters are developed.

Keywords: fuzzy logic systems, interval membership functions, identification, genetic algorithms, sparse in data, uncertainty.

��
��...

Наступні 7 робіт по вашій темі:

▪ Удосконалення технологічних процесів підготовки металургійної сировини з метою утилізації замасленої прокатної окалини - Автореферат - 30 Стр.
▪ ДИСКУРСНИЙ АНАЛІЗ ПРОПОВІДІ ЯК МОРАЛЬНО-ДУХОВНОГО ЖАНРУ СЛОВЕСНОСТІ (на матеріалі православної Різдвяної проповіді) - Автореферат - 30 Стр.
▪ ІНТЕРПРЕТАЦІЯ МУЗИКИ БАРОКО НА БАЯНІ (ТЕОРЕТИКО-ВИКОНАВСЬКИЙ АСПЕКТ) - Автореферат - 27 Стр.
▪ ФІНАНСОВО-ЕКОНОМІЧНІ ЗАСАДИ ФОРМУВАННЯ ТА ФУНКЦІОНУВАННЯ НОВИХ ВИРОБНИЧИХ СИСТЕМ (КЛАСТЕРІВ) - Автореферат - 33 Стр.
▪ КОМПЛЕКСИ ACAROIDEA АНТРОПОГЕННИХ ТА НАПІВПРИРОДНИХ БІОТОПІВ ПРАВОБЕРЕЖНОГО ЦЕНТРАЛЬНОГО ЛІСОСТЕПУ УКРАЇНИ - Автореферат - 28 Стр.
▪ особливості діагностики та лікування гастроезофагеальної рефлюксної хвороби з атиповими проявами - Автореферат - 30 Стр.
▪ ОБЛІК І АНАЛІЗ МАТЕРІАЛЬНИХ СИРОВИННИХ РЕСУРСІВ (на прикладі плодоовочевої консервної промисловості) - Автореферат - 32 Стр.