У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ

Національний аерокосмічний університет ім. М.Є. Жуковського“

Харківський авіаційний інститут”

ФІЛІПКОВСЬКА Лариса Олексіївна

УДК 658.012.011.56:681.327.12

СТРУКТУРНО-АНАЛІТИЧНІ МОДЕЛІ,
АЛГОРИТМИ І ПРОГРАМНІ ЗАСОБИ
ДЛЯ РОЗПІЗНАВАННЯ ВИРОБНИЧИХ СИТУАЦІЙ
ЗА РІЗНОТИПНИМИ ОЗНАКАМИ

Спеціальність 05.13.06 - автоматизовані системи управління
та прогресивні інформаційні технології

Автореферат

дисертації на здобуття наукового ступеня
кандидата технічних наук

Харків – 2002

Дисертацією є рукопис.

Робота виконана у Національному аерокосмічному університеті ім. М.Є. Жуковського “Харківський авіаційний інститут”, Міністерство освіти і науки України

Науковий керівник:

доктор технічних наук, професор

Сіроджа Ігор Борисович,

Національний аерокосмічний університет
ім. М.Є. Жуковського “Харківський авіаційний інститут”,

завідувач кафедри програмного забезпечення

Офіційні опоненти:

-

доктор технічних наук, професор Жихарев Володимир Якович, Національний аерокосмічний університет ім. М.Є. Жуковського “Харківський авіаційний інститут”, професор кафедри виробництва радіоелектронних систем літальних апаратів;

-

кандидат технічних наук, доцент Кузьменко Віктор Михайлович, Харківський національний університет радіоелектроніки, професор кафедри системотехніки.

Провідна установа: Національний технічний університет “Харківський політехнічний інститут”, кафедра автоматизованих систем управління, Міністерство освіти і науки України, м. Харків.

Захист відбудеться “ 21 ” березня 2003 р. о 14-00 годині на засіданні спеціалізованої вченої ради Д64.062.01 у Національному аерокосмічному університеті ім. М.Є. Жуковського “Харківський авіаційний інститут” за адресою: 61070, м. Харків, вул. Чкалова, 17, радіотехнічний корпус, ауд.232.

З дисертацією можна ознайомитись у бібліотеці Національного аерокосмічного університету ім. М.Є. Жуковського “Харківський авіаційний інститут” за адресою: 61070, м. Харків, вул. Чкалова, 17.

Автореферат розісланий “ 17 ” лютого 2003 р.

Вчений секретар

спеціалізованої вченої ради ______________ Чумаченко І.В.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Як відомо, необхідною умовою підвищення ефективності роботи підприємств є комплексна автоматизація виробничих процесів і удосконалення управління ними на базі широкого використання прогресивних інформаційних технологій.

Такі виробничі процеси, як пошук дефектів у цифрових устроях, технічне підготування виробництва, медична діагностика, соціальні й економічні дослідження, характеризуються багатовимірністю і різнотипністю параметрів, багатоваріантністю і багатоетапністю функціонування і пов'язані з прийняттям рішень на основі розпізнавання образів. У контурі управління відповідних систем безпосередньо використовується інтелект і досвід людини, що одночасно оперує якісними і кількісними оцінками при аналізі виробничих ситуацій і формуванні управлінських рішень, застосовуючи класифікаційну обробку даних. Це призводить до необхідності виділити клас виробничих процесів, управління якими потребує класифікацію (розпізнавання) їхніх виробничих ситуацій.

На цей час застосовуються, як правило, традиційні методи розпізнавання образів. Великий внесок у їхню розробку зробили С.О. Айвазян, М.Г. Загоруйко, Ю.М. Журавльов, Г.С. Лбов, Б.Г. Міркін, М.М. Бонгард, К.С. Фу, Л. Канал і багато інших. Реалізуючі ці методи системи класифікації виробничих ситуацій мають ряд обмежень: використання відновлення функцій розподілу імовірностей для побудови правил класифікації, застосування тільки кількісних ознак, великі обсяги навчальної вибірки для непараметричних моделей, відхід від уподобання первісної інформації до правила класифікації при перекодуванні первісних у різнотипному просторі, значна обчислювальна складність навчання.

На відміну від цих методів у роботах І.Б. Сіроджі запропоновано структурно-аналітичні (СА) моделі розпізнавання, що дозволяють будувати надійні правила класифікації за різнотипними експериментальними даними у багатокласових ситуаціях. Проте в зазначених працях не вирішені задачі мінімізації емпіричного ризику для одержання ефективних правил розпізнавання, що виконано в даній дисертаційній роботі.

У дисертаційній роботі розроблено нові моделі та інструментальні засоби аналізу різнотипних експериментальних даних для побудови правил класифікації виробничих ситуацій з метою ефективного управління ними.

Все вищеперераховане дозволяє зробити висновок, що тема дисертаційної роботи є актуальною.

Зв'язок роботи з науковими програмами, планами, темами. Роботу виконано на кафедрі економіко-математичного моделювання Національного аерокосмічного університету ім. М.Є. Жуковського “Харківський авіаційний інститут” у рамках державної науково-технічної програми №7 “Перспективні інформаційні технології, пристрої комплексної автоматизації, системи зв’язку” ДКНТПП (постанова Верховної Ради України від 16.10.1992 р. 27-05-XII “Про пріоритетні напрями розвитку науки і техніки”) відповідно до плану науково-дослідних робіт Національного аерокосмічного університету в період із 1992 р. по 2001 р., зокрема за темою Д 603-41/2000 “Створення методології штучного інтелекту для ідентифікації та управління складними системами аерокосмічного призначення” (ДР № 0100U003442) (2000-2001 рр.).

Мета і задачі досліджень. Метою роботи є підвищення ефективності управління виробничими процесами за допомогою розробки оптимальних моделей та інструментальних засобів класифікаційної обробки даних на основі структурно-аналітичного методу розпізнавання образів.

Об'єктом дослідження є різноманітні виробничі процеси, що потребують класифікаційну обробку даних у задачах управління.

Предметом дослідження є інформаційні та структурно-аналітичні моделі, алгоритми і програмні засоби для класифікації (розпізнавання) виробничих ситуацій за різнотипними ознаками.

Методи дослідження базуються на структурно-аналітичному методі розпізнавання образів, математичному статистичному аналізі даних, теорії тестів, теорії прийняття рішень, теорії графів і теорії розробки і проектування програмного забезпечення.

Для досягнення поставленої мети вироблено програму дослідження, що складається з таких задач:

- проаналізувати використання методів розпізнавання образів в управлінні виробничими процесами, провести огляд і систематизацію основних методів класифікаційної обробки даних із різнотипними ознаками у багатокласових ситуаціях;

- розробити концепцію і теоретичні основи побудови інформаційної технології автоматизованого аналізу різнотипних даних, структурно-аналітичних моделей і правил класифікації виробничих ситуацій;

- сформулювати і довести основні твердження, що обґрунтовують оптимізацію структурно-аналітичних моделей класифікаційної обробки даних за критерієм мінімізації емпіричного ризику, досліджувати задачу мінімізації синтаксичного зразка, розробити критерії якості структурно-аналітичних правил класифікації;

- реалізувати інформаційну технологію для автоматизованого аналізу різнотипних даних і синтезу правил класифікації виробничих ситуацій у вигляді інструментальних засобів формування структурно-аналітичних моделей для практичного застосування результатів.

Рішення поставлених задач забезпечує підвищення ефективності управління виділеного класу виробничих процесів за рахунок використання оптимальних структурно-аналітичних моделей аналізу і розпізнавання досліджуваних виробничих ситуацій, одержання надійних правил їхньої класифікації і скорочення витрат на підготування виробництва.

Наукова новизна отриманих результатів. У процесі вирішення задач відповідно до мети дослідження отримані такі результати:

- вперше розроблено оптимальні структурно-аналітичні моделі розпізнавання образів на основі критерію мінімізації емпіричного ризику з метою удосконалення класифікаційної обробки даних, що забезпечує підвищення адекватності моделі, достовірність результатів і найбільше ефективне розпізнавання в управлінні багатоетапними виробничими процесами;

- удосконалено модель класифікаційної обробки різнотипних даних, що дозволяє вирішувати проблему невизначеності апріорної інформації про об'єкти класифікації;

- дістало подальший розвиток структурно-аналітичний метод розпізнавання образів, що враховує структурну й аналітичну інформацію про емпіричні закономірності досліджуваної предметної області, багатокласовість ситуацій і різнотипність ознак об'єктів класифікації в управлінні виробничими ситуаціями;

- удосконалено процедуру вибору найкращого управлінського рішення шляхом формування бази правил класифікації у вигляді альтернатив управлінських стратегій і подальшого вибору варіанта управління з використанням критеріїв якості рішень і суб'єктивних оцінок особи, що приймає рішення.

Практичне значення отриманих результатів. Практичне значення отриманих результатів складається в тому, що на основі узагальнення відомих результатів і використання нових наукових дисертаційних положень запропоновано конкретні інженерні методики і розроблено інструментальні засоби інформаційної технології для автоматизації формування структурно-аналітичних моделей класифікації виробничих ситуацій в умовах апріорної непевності, різнотипності ознак і багатокласовості. Практична цінність отриманих результатів підтвердила свою ефективність при формуванні моделей штампувального виробництва і лікувального процесу, що дозволило підвищити якість прийняття управлінських рішень, знизивши матеріальні і часові витрати. Розроблений інтерактивний програмний комплекс може бути застосований у проектних і виробничих організаціях для зниження витрат на управління або прийняття управлінських рішень. Практична цінність комплексу підтверджена актами впровадження, при цьому забезпечується підвищення ефективності використання ПЕОМ за рахунок скорочення працезатрат від постановки задачі до одержання результатів, скорочення часу опрацювання інформації в 15-20 разів, підвищення якості робіт.

Достовірність результатів дисертаційних досліджень підтверджується застосуванням теоретично обґрунтованих методів та контрольних завдань, а також надійним узгодженням результатів моделювання з застосуванням експериментів. Впровадження розробленого інтерактивного програмного комплексу у Міжнародному науково-дослідному інституті нових технологій і матеріалів “МІНТ ХАІ“ виявило повну відповідність машинних результатів класифікаційним схемам процесів виготовлення листових деталей штампуванням вибухом. Основні положення дисертації використовувалися в навчальному процесі підвищення кваліфікації лікарів лікувального профілю у Харківській медичній академії післядипломної освіти та для оцінювання клінічної картини захворювань й підвищення якості лікування у міській клінічній лікарні №2 м. Харкова.

Розроблені структурно-аналітичні моделі аналізу експериментальних даних і побудови правил класифікації впроваджено у 2001 році в Міжнародному науково-дослідному інституті нових технологій і матеріалів “МІНТ ХАІ“ (акт впровадження від 18.04.2001 р.), у 1999 - 2001 рр. у лікувальному процесі у міській клінічній лікарні №2 м. Харкова (акт впровадження від 18.05.2001 р.), у 1999 - 2001 рр. у навчальному процесі в Харківській медичній академії післядипломної освіти (кафедра гастроентерології) (акт впровадження від 18.05.2001 р.).

Особистий внесок здобувача. Всі результати дисертаційної роботи отримано при особистій участі автора. В статтях, написаних у співавторстві, дисертанту належать: [1] - побудова оптимальних структурно-аналітичних моделей розпізнавання виробничих ситуацій, загальна постановка задачі; [5] - опис інтерактивного програмного комплексу автоматизованого аналізу даних й синтезу правил класифікації виробничих ситуацій, вирішення задач класифікації в штампувальному виробництві; [6] - використання інструментальних засобів автоматизації формування оптимальних структурно-аналітичних моделей в основі функціональної схеми інтелектуальної інтегрованої системи підтримки виробничих рішень.

Апробація результатів дисертації. Матеріали дисертаційних досліджень доповідались й обговорювались на міжнародних конференціях, серед них:

- Міжнародна науково-практична конференція “Перспективні технології та обладнання обробки тиском у машинобудуванні та металургії” (Краматорськ, 23 - 26 квітня 2001 р.);

- Міжнародна науково-практична конференція “Наука і соціальні проблеми суспільства: людина, техніка, технологія, довкілля” (Харків, 14 - 16 травня 2001р.);

- Міжнародна науково-технічна конференція “Інтегровані комп'ютерні технології в машинобудуванні”, ІКТМ'2001 (Харків ”ХАІ” 2001).

Публікації. За темою дисертації опубліковано 7 наукових праць, у тому числі 6 статей (у спеціалізованих наукових виданнях відповідно до переліку ВАК України) і 1 теза доповіді на міжнародній науковій конференції.

Структура роботи. Дисертаційна робота виконана на 209 сторінках, ілюстрована 26 рисунками на 14 сторінках, 7 таблицями на 7 сторінках. Робота складається зі вступу, чотирьох розділів, висновків, трьох додатків (на 30 сторінках) і списку літератури, що включає 109 найменувань, розміщених на 12 сторінках.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовано актуальність дисертаційної роботи, сформульовано мету та задачі досліджень, наукову новизну і практичну значущість отриманих результатів.

Перший розділ присвячено огляду стану питання та постановці мети і задач досліджень.

Проведено аналіз застосування методів розпізнавання образів в управлінні складними багатоетапними виробничими процесами на прикладі листового штампування вибухом, що потребує класифікаційної обробки даних для прийняття рішень на кожному етапі. Описано клас виробничих ситуацій для дослідження засобами розпізнавання образів з метою створення автоматизованої системи класифікаційної обробки даних для формування оптимальних управлінських рішень.

Загальна задача розпізнавання образів (класифікаційної обробки даних) полягає в такому:

- задано спосіб опису I(O) кожного об'єкта O із множини M на основі емпіричних вимірів його ознак (x1, x2, …, xm) = x, вибірка Z0= {x(1),…,x(m)} описів (точок) у різнотипному просторі ознак Xn, що містить неповну інформацію I(Kj) (j= ) про класи з указівками (або без них) про належність об'єктів відповідним образам;

- потрібно по опису I(O), інформації I(Kj) і вибірці Z0 визначити правило класифікації Ф(x), що відображає із заданою надійністю властивість належності всіх об'єктів із М відповідним класам Kj (j= ). Якщо апріорі відома належність елементів навчальної вибірки Z0 до образу Kj, то виникає задача розпізнавання з навчанням, у протилежному випадку - із самонавчанням.

Визначено особливості й обмеження проаналізованих виробничих ситуацій, що складаються у необхідності розпізнавання в умовах невизначеності, різнотипності шкал виміру ознак, багатокласовості станів. Утворювана модель розпізнавання повинна бути інваріантною до припустимих перетворень шкал виміру ознак, математично нескладною та технологічною у програмуванні.

У результаті виконаного огляду й аналізу використання систем розпізнавання образів в управлінні виробничими процесами установлено такі факти: складність, орієнтація більшості відомих методів розпізнавання образів на задачі з ознаками одного типу (кількісного або якісного) або на імовірнісні характеристики ознак. Виходячи з аналізу застосування систем розпізнавання складних об'єктів, виявлено актуальність розробки моделі і системи для класифікації виробничих ситуацій за різнотипними даними із прийнятною вартістю, простою архітектурою, достатнім ступенем ефективності розпізнавання за рахунок інваріантності моделі стосовно припустимих перетворень шкал виміру ознак, простоти інтерпретації при формуванні моделей досліджуваних об'єктів, попереднього аналізу даних, оцінювання інформативності ознак. Структурно-аналітичний (СА) метод розпізнавання образів може забезпечити перераховані якості моделям класифікаційної обробки даних. Тому цей підхід пропонується для використання у дисертаційній роботі.

Уточнено мету і сформульовано конкретні задачі дисертаційних досліджень, які полягають у розробці структурно-аналітичних моделей, алгоритмів і інтерактивного програмного комплексу для розпізнавання виробничих ситуацій і одержання рішень, придатних для умов сучасного виробництва, що мають прийнятну вартість і високий рівень штучної компетентності за рахунок спроможності навчатися на різнотипних даних.

Другий розділ присвячено розробкам теоретичних основ аналізу експериментальних даних за допомогою дослідження синтаксичного зразка (таблиці істинності), що визначається за цими даними, та синтезу правил класифікацій виробничих ситуацій.

Визначено структурно-аналітичні моделі, створення яких, на відміну від відомих методів розпізнавання образів, включає етапи формування основного словника граматики образів, синтаксичного зразка як таблиці істинності предикатів з обраної опорної множини для усіх об'єктів із таблиці експериментальних даних (ТЕД) і побудову граматики образів. Для адекватного опису ознакової структури образів впроваджено властивості-предикати. У рядках ТЕД розташовуються реалізації, а в стовпчиках – значення ознак з різнотипного простору для кожної реалізації; в останньому стовпчикові задається номер класу, до якого належить реалізація. Рядки синтаксичного зразка визначаються значеннями властивостей-предикатів для кожної реалізації.

Сформульовано задачу розробки оптимальних структурно-аналітичних моделей розпізнавання образів на аналітичному та структурному рівнях закономірностей у ТЕД.

Система навчання у своєму розпорядженні може мати інформацію двох видів:

1)

апріорна послідовність , яка є частиною генеральної сукупності об’єктів , , що задається в просторі ознак Xn,

2)

навчальна послідовність ,

де та змінюються від 1 до s, s - число розпізнаваних класів, - деякий вектор параметрів, , m – кількість об'єктів у послідовностях.

У СА моделі навчальна послідовність задається параметричним відображенням у вигляді ТЕД.

Необхідно побудувати таку функцію, яка б по можливості точніше апроксимувала функцію , тобто з деякою імовірністю 1-, а при збільшенні числа об'єктів - мала визначений ступінь стійкості. Отже, необхідно знайти таке правило класифікації, про яке з надійністю, не меншою 1-, можна було б стверджувати, що його якість відрізняється від дійсного значення функції належності об'єкта до визначеного класу на розмір, який не перевищує ?>0. Таке правило назвемо ефективним.

Припустимо, що - число правильно розпізнаних об'єктів xi, i=1,2,...,mk, із класу в апріорній послідовності ознакового простору Xn, mk- число об'єктів класу k , а функція має імовірнісний характер, тобто задається розподілом , де Lk - щільність розподілу.

Сформульовано Т1-задачу оптимізації СА моделей, яка зв'язується з аналітичною інформацією емпіричних закономірностей ТЕД та полягає у визначенні параметрів термінальних властивостей-предикатів структурно-повної системи ознак ТЕД для оцінки граматичного правила класифікації до його відновлення. Математична постановка Т1-задачі виглядає так:

знайти мінімум функціонала по:

. (1)

Задача Т2 пов'язана зі структурною оптимізацією СА моделей для знаходження граматичного правила класифікації найменшої структурної складності (таке правило названо ефективним).

Через те що особливість СА методу розпізнавання образів складається у двохступінчатому перетворенні початкового ознакового простору, загальна постановка оптимізації СА моделей полягає у знаходженні мінімуму цільової функції (1), заданої на граматичному правилі класифікації.

Оригінальність полягає в побудові екстремальної задачі пошуку мінімуму цільової функції у вигляді умовного математичного очікування і побудованої на граматичному правилі класифікації. Зроблено висновок про те, що аналіз різнотипних даних визначається кількісним і якісним складом навчальної послідовності (таблиці експериментальних даних) і припускає одержання правила класифікації з раціональним набором властивостей-предикатів.

З загальної постановки задачі класифікаційної обробки даних СА методом, а також постановок задач Т1 і Т2 розроблено методику розв’язання задачі оптимізації СА моделі на основі критерію мінімізації емпіричного ризику:

- визначення параметрів термінальних властивостей-предикатів за даними із різнотипними ознаками і формування синтаксичного зразка;

- дослідження властивостей синтаксичного зразка;

- пошук структурно-повних систем термінальних властивостей-предикатів з мінімальною помилкою класифікації;

- створення критерію вибору властивості-предиката у вершину граматичного вирішального правила і побудова ефективного правила класифікації.

Вирішуючи Т1-задачу, необхідно було наближатися до вибору інформативного простору ознак і спрощенню класу розв'язувальних правил. Термінальними елементами правила класифікації є властивості-предикати, через котрі і виявляються початкові ознаки. Для ознак у шкалах абсолютної, інтервальної, порядкової і відношень використано одновимірні граничні властивості-предикати, в яких параметри визначаються за допомогою оцінки по навчальній вибірці, гістограмного інтервалу або алгоритмів поділу опуклих оболонок класів, і багатовимірні властивості-предикати (для шкал інтервальної і відношень), створені на базі алгоритмів побудови лінійних дискримінантних функцій, квадратичних дискримінантних функцій, лінійного дискримінанта Фішера, рекурентного алгоритму типа Адаліна.

В СА методі визначено оцінку структурної повноти синтаксичного зразка (Сіроджа І.Б.).

На базі використання СА метода розпізнавання образів, методів математичної статистики і теорії тестів досліджено властивості синтаксичного зразку оптимальної СА моделі за критерієм мінімізації емпіричного ризику:

- наявність базового набору властивостей-предикатів, які присутні у всіх структурно-повних системах синтаксичного зразка для побудови правил класифікації;

- можливість оцінювання структурної повноти груп властивостей-предикатів;

- можливість оцінювання спроможності властивості-предиката ефективно розділити класи на дві групи для формування оптимального правила класифікації у вигляді бінарного дерева розв’язків у багатокласовій ситуації.

Сформульовано і доведено твердження, що обґрунтовують можливість ефективного розпізнавання навчальної послідовності та формування оптимальних структурно-повних систем властивостей-предикатів синтаксичного зразка.

Визначено і досліджено критерій якості властивостей-предикатів fi , , для двох груп s класів на базі оцінки структурної повноти :

(2)

де M - число властивостей-предикатів, к0 - число класів, усі фрагменти яких мають значення 0, к1 - число класів, усі фрагменти яких мають значення 1, s - число класів.

Формалізовано і досліджено критерії побудови оптимальних правил класифікації у вигляді бінарних дерев розв’язків, що враховують структуру їхніх фрагментів. Узагальнений критерій вибору властивості-предиката у вершину бінарного дерева розв’язків подано формулою

(3)

За значенням цього критерію кожної властивості-предикатові синтаксичного зразка призначається ранг, який влаштовується при побудові граматичного правила класифікації.

Оцінкою якості СА моделі класифікації є імовірнісна помилка класифікації, тобто значення емпіричного ризику при розпізнаванні образів. Розроблено алгоритми пошуку інформативних наборів ознак навчальної вибірки з заданою оцінювальною спроможністю для одержання оптимального граматичного правила класифікації, доказано збіжність алгоритмів.

У третьому розділі узагальнено результати розділу 2 для побудови технології аналізу різнотипних даних та синтезу правил класифікації: спочатку знаходяться оптимальні параметри властивостей-предикатів щодо імовірнісної помилки класифікації, а потім мінімізується довжина зовнішнього шляху граматичного правила класифікації.

У рамках загальної задачі оптимізації СА моделей за критерієм мінімізації емпіричного ризику розроблені алгоритми аналізу різнотипних даних та синтезу оптимальних правил класифікації реалізовано на семи етапах:

1) попередня обробка ТЕД (виключення з обробки реалізацій, ознак чи класів за потребою);

2) автоматична генерація термінальних властивостей-предикатів безпосередньо по ТЕД;

3) формування синтаксичного зразка й оцінка його структурної повноти з припустимою помилкою класифікації;

4) визначення критеріальних оцінок ознак ТЕД;

5) визначення базового набору ознак ТЕД;

6) формування інформативної системи ознак ТЕД;

7) побудова СА правила класифікації.

Відповідно до етапів виконання алгоритмів з метою вирішення Т1- та Т2- задачі розроблено загальні методики, алгоритм ТЕСТ і загальну схему системної реалізації автоматизованого аналізу різнотипних даних і побудови структурно-аналітичних правил класифікації, де запрограмовано чотири режими роботи:

-

оцінка структурної повноти ознак ТЕД;

-

визначення критеріальних оцінок ознак ТЕД (результати розподілу класів на дві групи за кожною ознакою);

-

визначення базового набору ознак ТЕД;

-

формування інформативної системи ознак ТЕД і побудова оптимального правила класифікації.

Досліджено алгоритми обробки таблиці експериментальних даних з метою обґрунтування простоти технічної реалізації й інтерпретації розв’язувального правила. Отримана оцінка завищена, але конструктивна у розумінні значення попереднього аналізу таблиці експериментальних даних для одержання оптимального граматичного правила класифікації.

Розроблені алгоритми відповідають таким вимогам: швидкодія обчислювального процесу, економія пам'яті за рахунок контролювання вимірності моделі за заданими граничними умовами, інваріантність алгоритмів стосовно припустимих перетворень шкал виміру ознак.

Визначено перспективу використання розроблених алгоритмів. При вирішенні реальних задач правила класифікації можна зберегти в базі для теоретичних експериментів і практичного застосування. Це приведе до можливості моделювання спеціалізованого розпізнавального пристрою.

У четвертому розділі вирішено задачу створення інформаційної технології класифікаційної обробки даних з метою управління реальними виробничими процесами. Ідентифікація стана виробничого процесу зводиться до аналізу його параметрів і побудові правила класифікації в режимі навчання за ТЕД, а виробітка управлінського рішення базується на використанні правила класифікації й оцінці його ефективності

Сформульовано конструктивну задачу розробки інструментального засобу автоматизації формування оптимальних СА моделей у виді інтерактивного програмного комплексу КОД-Т. Підвищення ефективності управління виробничими процесами гарантовано використанням таких СА моделей аналізу і розпізнавання виробничих ситуацій, одержанням надійних правил їхньої класифікації і скороченням витрат на підготування виробництва.

Для розробки зазначеного комплексу створено інтерактивну програмну систему, придатну для експлуатації у виробничих умовах і реалізуючу рішення сформульованих у розділі 2 Т1-задачі та Т2-задачі оптимізації СА моделей розпізнавання образів за критерієм мінімізації емпіричного ризику.

Подано технічне завдання на розробку інтерактивного програмного комплексу КОД-Т, його структуру та режими роботи. Загальну структуру інтерактивного програмного комплексу КОД-Т для автоматизованого аналізу різнотипних даних та побудови правил класифікації виробничих ситуацій подано на рис.1.

Рис.1. Загальна структура інтерактивного програмного комплексу КОД-Т
для аналізу різнотипних даних і побудови правил класифікації

Для практичного застосування комплексу КОД-Т досліджено залежності між обсягом навчальної вибірки і якістю структурно-аналітичних правил класифікації на основі статистичного аналізу (див. діаграми на рис.2 - 4).

Рис. 2. Залежність імовірнісної помилки класифікації Р від обсягу ТЕД m

Рис. 3. Залежність імовірнісної помилки класифікації Р від обсягу ТЕД m
при кількості класів s=2, Nн – число гілок граматичного правила класифікації

Рис. 4. Залежність імовірнісної помилки класифікації Р від обсягу ТЕД m
при кількості класів s=3, Nн – число гілок граматичного правила класифікації

Для дослідження вибрано прості властивості-предикати типа Байєса, “Минимакс”, які використовуються у інтерактивному програмному комплексі КОД-Т. Для порівняння вибрано класичний розв’язувач Фішера з теоретичною імовірнісною помилкою класифікації 0,286 (для ТЕД з m=150 у п’ятивимірному ознаковому просторі). Приведені факти дозволяють зробити висновки для побудови правил класифікації:

- для малих вибірок реальних задач обґрунтовано застосування простих у реалізації й інтерпретації розв’язувальних правил із достатнім рівнем імовірнісної помилки класифікації;

- через те що число властивостей-предикатів прямо пропорційно числу гілок граматичного правила класифікації Nv , то з усіх структурно-повних систем для побудови правила класифікації треба вибирати ту, що має найменше число властивостей-предикатів.

Розроблено реальні структурно-аналітичні моделі класифікації виробничих ситуацій, що відрізняються від традиційних моделей підвищеним ступенем адекватності за рахунок адаптації до конкретної предметної області. Проаналізовано причини, що впливають на достовірність ситуації, тобто вирішені запропоновані Т1 та Т2 задачі. Розглянуто шляхи практичного застосування алгоритмів і методик для підвищення вірогідності розв’язку.

Викладено методику застосування інтерактивного програмного комплексу КОД-Т для класифікаційної обробки конструкторської і технологічної інформації листових деталей в управлінні процесом штампування вибухом. Результати опрацювання дозволили зробити висновок, що розроблена інформаційна технологія аналізу даних та синтезу правил класифікації з припустимою якістю (помилкою класифікації) задовольнила поставленим вимогам та дозволила підвищити ефективність управління виробничими ситуаціями. Ефективність управління охарактерізовано інтегрованим показником рівня параметрів проектованої листової деталі, приведеним до витрат на організацію її виробництва, та опосередковано пов'язано з оцінкою якості правил класифікації. Прийняття управлінського рішення здійснено вибором правил класифікації з найкращою оцінкою якості. Підвищення ефективності управління штампувального виробництва забезпечено за рахунок зменшення трудомісткості на підготування виробництва в 15-20 разів, підвищення якості листових деталей та стійкості штампового оснащення, зниження матеріальних витрат на штампувальне виробництво та вартості листових деталей.

На базі використання ІПК КОД-Т синтезовано ефективні правила класифікації для діагностування хронічних захворювань печінки і перевірки ступеня активності процесів у ній, що свідчить про універсальність застосування розроблених оптимальних структурно-аналітичних моделей у різноманітних предметних областях. Максимальна помилка класифікації склала 6%. Отримані результати впроваджено в лікувальні процеси.

Підвищення ефективності управління приведених виробничих процесів забезпечено побудовою оптимальних за мінімумом ризику структурно-аналітичних моделей аналізу і розпізнавання різнотипних виробничих ситуацій, одержанням надійних правил їхньої класифікації і скороченням витрат на підготування виробництва. Вибір найкращого управлінського рішення відбувається шляхом формування бази правил класифікації у вигляді альтернатив управлінських стратегій і подальшого вибору варіанта управління з використанням критеріїв якості рішень і суб'єктивних оцінок особи, що приймає рішення

У додатку наведено вихідні тексти основних програмних модулів інтерактивного програмного комплексу КОД-Т, опис функцій системи меню, вхідної і вихідної інформації, а також акти впровадження результатів дисертаційної роботи. Як засвідчують дослідні випробування, результати запропонованої інформаційної технології забезпечують підвищення ефективності використання обчислювальної техніки за рахунок скорочення працезатрат від постановки задачі до одержання результатів, скорочення часу обробки інформації, підвищення якості робіт.

ВИСНОВКИ

У дисертації викладено теоретичне узагальнення задачі розпізнавання образів на випадок структурного образу у просторі різнотипних ознак та нове вирішення наукової задачі створення структурно-аналітичних моделей, алгоритмів і інтерактивного програмного комплексу для класифікаційної обробки різнотипних даних з метою підвищення ефективності управління виробничими процесами.

У ході дослідження отримано такі результати:

1. Проведено аналіз використання класифікаційної обробки різнотипних даних в управлінні складними виробничими процесами, виділено клас виробничих ситуацій для дослідження засобами розпізнавання образів, визначені їхні особливості й обмеження, обґрунтовано використання структурно-аналітичного методу класифікаційної обробки різнотипних даних для ідентифікації виробничих ситуацій.

2. На основі сформульованої концепції структурного образу вперше виконано оптимізацію структурно-аналітичної моделі за критерієм мінімізації емпіричного ризику для аналізу експериментальних даних і побудови правил класифікації, що дозволяє описувати і реалізовувати механізми породження образів у просторі різнотипних ознак об'єктів і багатокласовості ситуацій, а також враховувати структурну й аналітичну інформацію про емпіричні закономірності досліджуваної предметної області.

3. Удосконалено розв’язок задачі побудови оптимальної структурно-аналітичної моделі розпізнавання образів як екстремальної задачі пошуку мінімуму цільової функції, поданої умовним математичним очікуванням і заданої на граматичному правилі класифікації, що забезпечило визначення попередньої оцінки якості побудованого правила класифікації на етапі формування синтаксичного зразка.

4. Запропоновано принципи і доведено твердження, що встановлюють зв'язок оцінки структурної повноти синтаксичного зразка з якістю правила класифікації на основі критерію мінімізації емпіричного ризику, що забезпечує найбільш ефективне розпізнавання, тобто досягнення заданої величини оцінки структурної повноти, як частоти правильно розпізнаваних об'єктів навчальної вибірки.

5. Вперше вирішено двохетапну задачу оптимізації структурно-аналітичної моделі за критерієм мінімізації емпіричного ризику: на першому етапі знаходяться оптимальні параметри властивостей-предикатів, що описують підобрази структурного образа, на другому – мінімізується довжина зовнішнього шляху граматичної структури правила класифікації. Це забезпечує підвищення адекватності моделі, зниження часу виконання аналізу й обсягу пам'яті збереження інформації.

6. Розроблено, досліджено методи і реалізовано алгоритми інформаційної технології для створення оптимальних структурно-аналітичних моделей класифікації виробничих ситуацій. Останні рекомендується використовувати як основу системи опрацювання знань для технічного підготування виробництва.

7. Розроблено структуру і визначено характеристики інструментального засобу автоматизації формування структурно-аналітичних моделей у виді інтерактивного програмного комплексу (ІПК) КОД-Т для ідентифікації виробничих ситуацій. Показано, що ІПК КОД-Т використовується як ядро підсистеми підтримки прийняття рішень.

8. Вирішено задачі класифікаційної обробки даних листового штампування вибухом. Підвищення ефективності управління штампувального виробництва забезпечено за рахунок зручного інтерфейсу ІПК КОД-Т, зменшення помилки класифікації, одержання надійних правил класифікації, скорочення часу на підготування виробництва в 15-20 разів, підвищення якості деталі і стійкості штампової оснастки, а також зниження матеріальних витрат на виробництво.

Методику проектування листового штампування вибухом із застосуванням ІПК КОД-Т може бути використано підприємствами, що освоюють методи вибухового штампування, і є незамінним засобом при виробництві деталей без досвідченого відпрацювання технології.

9. Для демонстрації універсальності застосування розроблених оптимальних структурно-аналітичних моделей в інших предметних областях на базі використання ІПК КОД-Т синтезовано ефективні правила класифікації для діагностування хронічних захворювань печінки і перевірки ступеня активності процесів у ній. Максимальна помилка класифікації склала 6%. Отримані результати впроваджено в лікувальний процес.

10. Удосконалено процедуру вибору найкращого управлінського рішення шляхом формування бази правил класифікації у вигляді альтернатив управлінських стратегій і подальшого вибору варіанта управління з використанням критеріїв якості рішень і суб'єктивних оцінок особи, що приймає рішення.

СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ

1. Дейнеко Н.Ф., Сироджа И.Б., Звягинцева Т.Д., Филипковская Л.А. Критерии оценки нахождения правила принятия решений в диагностике хронических заболеваний печени на основе СА-метода распознавания образов // Вестн. Харьк. ун-та. - Харьков, 1989. – Вып.336. Радиофизика и электроника. – С.74–76.

2. Филипковская Л.А. Структурно–аналитическая модель распознавания образов в управлении производственными процессами // Вестн. нац. техн. ун-та “Харьковский политехнический институт”. – Харьков: НТУ “ХПИ”. - 2001. - №6. - С.279 – 283.

3. Филипковская Л.А. Исследование структурно–аналитической модели распознавания образов при разработке технологических процессов // Проблемы машиностроения. – Харьков, 2000. – Т. 3, №3-4. - С.106 – 111.

4. Филипковская Л.А. Исследование структурно–аналитической модели распознавания образов в задачах управления и диагностики // Проблемы бионики.–Харьков, 2000. - Вып.53. - С.51-53.

5. Зорик В.Я., Филипковская Л.А., Третьяк В.В. Информационная технология классификационной обработки данных в проектировании техпроцессов листовой штамповки взрывом // Удосконалення процесів та обладнання обробки тиском у металургії і машинобудуванні: Зб. наук. пр. – Краматорськ, 2001. - С.286–289.

6. Филипковская Л.А., Шостак И.В. Интеллектуальная интегрированная система автоматизированной обработки производственных ситуаций структурно–аналитическим методом распознавания образов // Автоматизированные системы управления и приборы автоматики. – Харьков, 2001. - Вып.115. - С.65 – 69.

7. Філіпковська Л.О. Комп’ютерна технологія класифікаційної обробки даних для розпізнавання виробничих ситуацій // Тез. доп. Міжнар. наук.-техн. конф. Інтегровані комп’ютерні технології в машинобудуванні, ІКТМ’2001. – Харків “ХАІ”, 2001. – С.121.

АНОТАЦІЯ

Філіпковська Л.О. Структурно-аналітичні моделі, алгоритми і програмні засоби для розпізнавання виробничих ситуацій за різнотипними ознаками. - Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 - Автоматизовані системи управління і прогресивні інформаційні технології. - Національний аерокосмічний університет ім. М.Є. Жуковського “Харківський авіаційний інститут”, Харків, 2002.

Дисертацію присвячено підвищенню ефективності управління виробничими процесами за допомогою розробки оптимальних моделей та інструментальних засобів класифікаційної обробки даних на основі структурно-аналітичного методу розпізнавання образів. Виконано й обґрунтовано оптимізацію структурно-аналітичних моделей для аналізу різнотипних даних і синтезу правил класифікації на основі критерію мінімізації емпіричного ризику. Розроблено структуру інструментального засобу автоматизації формування таких моделей у вигляді інтерактивного програмного комплексу. Вирішено задачі класифікаційної обробки конструкторської і технологічної інформації про листові деталі в управлінні процесом штампування вибухом. Синтезовано структурно-аналітичні моделі медичної діагностики для підвищення ефективності управління лікувальним процесом.

Ключові слова: структурно-аналітична модель, розпізнавання образів, правила класифікації, виробнича ситуація.

АННОТАЦИЯ

Филипковская Л.А. Структурно-аналитические модели, алгоритмы и программные средства для распознавания производственных ситуаций по разнотипным признакам. – Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06 – Автоматизированные системы управления и прогрессивные информационные технологии. - Национальный аэрокосмический университет им. Н.Е. Жуковского “Харьковский авиационный институт”, Харьков, 2002.

Диссертация посвящена повышению эффективности управления производственными процессами посредством разработки оптимальных моделей и инструментальных средств классификационной обработки данных на основе структурно-аналитического метода распознавания образов.

В первом разделе показана необходимость применения методов распознавания образов для управления сложными многоэтапными производственными процессами на примере подготовки листовой штамповки взрывом, которая требует классификационной обработки данных для принятия решений на каждом этапе. Выделен класс процессов, для управления которыми необходима классификация (распознавание) рассматриваемых в них производственных ситуаций. Определены их особенности: распознавание выполняется в условиях априорной неопределенности, разнотипности шкал измерения признаков, многоклассовости состояний. Поставлены задачи создания таких моделей классификационной обработки данных, которые будут инвариантными к допустимым преобразованиям шкал измерения признаков, математически несложными и технологичными в программировании. Определена структурно-аналитическая (СА) модель распознавания образов, отвечающая этим требованиям. Для применения распознавания образов в управлении производственными процессами ставится задача оптимизации СА модели. Оптимизация заключается в разработке методики анализа данных с целью получения оптимального правила классификации. Для решения практических задач необходимо создать инструментальные средства формирования оптимальных СА моделей классификации производственных ситуаций.

Во втором разделе на основе сформулированной концепции структурного образа выполнена оптимизация СА модели по критерию минимизации эмпирического риска с учетом аналитической и структурной информации о закономерностях разнотипных данных. Усовершенствовано решение задачи синтеза оптимальной СА модели как экстремальной задачи поиска минимума целевой функции, представленной условным математическим ожиданием и заданной на грамматическом правиле классификации. Формализованы и исследованы критерии синтеза оптимальных правил классификации в виде бинарных деревьев решений. Разработаны и исследованы алгоритмы поиска информативных наборов признаков обучающей выборки с допустимой ошибкой классификации для получения оптимального решающего правила.

В третьем разделе разработаны, исследованы методы и реализованы алгоритмы информационной технологии автоматизированного анализа разнотипных данных и синтеза оптимальных правил классификации производственных ситуаций. Предусмотрены четыре режима работы: оценка структурной полноты признаков данных, выдача результатов разделения классов на две группы по каждому признаку, определение базового и информативного наборов признаков, построение правила классификации. Алгоритмы анализа данных исследованы с целью обоснования простоты технической реализации и интерпретации правила классификации. Определена перспектива использования алгоритмов анализа данных и синтеза правил классификации при моделировании специализируемого распознающего устройства.

В четвертом разделе представлена разработка интерактивного программного комплекса КОД-Т для автоматизации анализа разнотипных данных и построения правил классификации производственных ситуаций на базе предложенных СА моделей и алгоритмов. Комплекс КОД-Т используется как ядро подсистемы поддержки принятия решений. Предложены методики применения комплекса для классификационной обработки конструкторской и технологической информации о листовых деталях в управлении процессом штамповки взрывом. Синтезированы структурно-аналитические модели диагностирования заболеваний печени и выявления их информативных признаков для повышения эффективности лечебного процесса.

В приложениях приведены исходные тексты основных программных модулей комплекса КОД-Т, описание функций системы меню, входной и выходной информации, а также акты внедрения результатов диссертации.

Результаты разработанных оптимальных СА моделей и инструментальных средств классификационной обработки разнотипных данных обеспечивают совершенствование управления производственными процессами за счет сокращения трудозатрат и повышения качества работ.

Ключевые слова: структурно-аналитическая модель, распознавание образов, правила классификации, производственная ситуация.

ABSTRACT

Philipkovskaya L.A. Structural - analytical models, algorithms and software for recognition of industrial situations to varied tags. - Manuscript.

Thesis for a candidate of technical science degree by speciality 05.13.06 – Computer aided systems and progressive information technologies. - National Aerospace University by name N.Y. Zhukovskiy “Kharkov aviation institute”, Kharkov, 2002.

The dissertation is devoted to rise of a management efficiency by productions by means of optimum models and tools of classification data processing on the basis of a structural - analytical method of pattern recognition. The optimization of structural - analytical models for the analysis of experimental data and the synthesis of classification rules on the basis of criterion of empirical risk minimization is fulfilled and grounded. The frame of the automation tool of creation of such models in the form of on-line program complex the DPC-Т is designed. The tasks of classification processing of the designer and technological information about leaf details in process control of an explosive forming are resolved. The structural - analytical models of medical diagnostic for rise of control efficiency of the medical process are synthesized.

Keywords: structural - analytical model, pattern recognition, classification rule, industrial situation.

Формат 6084 1/16. Бум. офс. №2. Офс. друк.

Облік.-вид. арк. 1,0. Т. 100 прим. Замовлення 57.

____________________________________________________________

Національний аерокосмічний університет ім. М.Є. Жуковського“

Харківський авіаційний інститут”

61070, Харків-70, вул. Чкалова, 17






Наступні 7 робіт по вашій темі:

МІСЦЕВА ТЕРАПІЯ РАН СЛИЗОВОЇ ОБОЛОНКИ РОТА З ЗАСТОСУВАННЯМ ВОСКІВ КРИМСЬКОЇ ТРОЯНДИ, ЛАВАНДИ І ШАВЛІЇ - Автореферат - 23 Стр.
ВПЛИВ СТРУКТУРНИХ ПЕРЕБУДОВ НА НИЗЬКОТЕМПЕРАТУРНУ ПЛАСТИЧНІСТЬ НОВИХ КРИСТАЛІЧНИХ МАТЕРІАЛІВ: НАДПРУЖНІ СПЛАВИ, МЕТАЛОКСИДНІ ВТНП, ФУЛЕРИТИ - Автореферат - 44 Стр.
СТЕРЕОХІМІЯ ПРИЄДНАННЯ БРОМУ ДО АЦЕНАФТИЛЕНУ ТА ЙОГО ПОХІДНИХ - Автореферат - 21 Стр.
ПІДГОТОВКА МАЙБУТНІХ УЧИТЕЛІВ ПОЧАТКОВИХ КЛАСІВ ДО ОРГАНІЗАЦІЇ СПІЛКУВАННЯ УЧНІВ У ПРОЦЕСІ РОЗВИВАЮЧИХ ІГОР - Автореферат - 25 Стр.
Луцька “Просвіта” (1918 – 1935 роки) - Автореферат - 35 Стр.
МІЦНІСТЬ, ТРІЩИНОСТІЙКІСТЬ ТА ДЕФОРМАТИВНІСТЬ ЗАЛІЗОБЕТОННИХ ПЛИТ, ПОПЕРЕДНЬО НАПРУЖЕНИХ В ДВОХ НАПРЯМКАХ - Автореферат - 23 Стр.
СПОСТЕРЕЖЕННЯ І СПОСТЕРЕЖЛИВІСТЬ ЯК УМОВИ ФОРМУВАННЯ ЕКОЛОГІЧНОГО МИСЛЕННЯ МОЛОДШИХ ШКОЛЯРІВ - Автореферат - 32 Стр.