У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Харківський національний університет радіоелектроніки

Ульяновська Юлія Вікторівна

УДК 004.048

УДК 681.012

МОДЕЛІ ТА МЕТОДИ ОБРОБКИ ДАНИХ В ЄДИНІЙ АВТОМАТИЗОВАНІЙ ІНФОРМАЦІЙНІЙ СИСТЕМІ МИТНОЇ СЛУЖБИ

05.13.06 – автоматизовані системи управління

та прогресивні інформаційні технології

Автореферат дисертації на здобуття наукового ступеня

кандидата технічних наук

Харків – 2005

Дисертацією є рукопис.

Робота виконана в Академії митної служби України, Державна митна служба України.

Науковий керівник – доктор технічних наук, професор Мороз Борис Іванович, Академія митної служби України, начальник факультету організації та технології митного контролю, начальник кафедри інформаційних систем та технологій.

Офіційні опоненти:

- доктор технічних наук, професор Левикін Віктор Макарович, Харківський національний університет радіоелектроніки, директор Інституту комп’ютерних та інформаційних технологій, завідувач кафедри інформаційних управляючих систем;

- кандидат технічних наук, доцент Дерев’янко Олександр Іванович, Дніпропетровський національний університет, доцент кафедри автоматизованих систем обробки інформації.

Провідна установа:

- Національний аерокосмічний університет ім. М.Є. Жуковського “Харківський авіаційний інститут”, м. Харків.

Захист відбудеться 13.04.2005 р. о 13-30 годині на засіданні спеціалізованої вченої ради Д 64.052.01 у Харківському національному університеті радіоелектроніки за адресою: 61166, м. Харків, пр. Леніна, 14, тел.: (057) 702-14-51.

Із дисертацією можна ознайомитися у бібліотеці Харківського національного університету радіоелектроніки за адресою: 61166, м. Харків, пр. Леніна, 14.

Автореферат розіслано 12.03.2005 р.

Вчений секретар

спеціалізованої вченої ради С.Ф. Чалий

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Необхідною умовою ефективного функціонування Державної митної служби України є організація автоматизованого інформаційного обміну як у межах Державної митної служби України так і з іншими міністерствами та відомствами України. Для досягнення цієї мети створена Єдина автоматизована інформаційна система (ЄАІС) митної служби, призначення якої полягає у вирішенні функціональних завдань митної служби з використанням передових інформаційних технологій. Важливим напрямком розвитку інформаційних технологій є розробка систем, призначених для підтримки процесів прийняття рішення, зокрема дорадчих і експертних систем. Конкретне застосування даних систем актуально під час вирішення широкого кола завдань, пов’язаних із творами мистецтва. До таких завдань належить пошук і збереження інформації про вироби мистецтва, ідентифікація, оцінка й експертиза виробів мистецтва та історичних цінностей. Зазначені завдання мають особливу актуальність для митної служби України, однією з основних функцій якої є збереження культурної та історичної спадщини держави. Перед співробітниками митних органів при здійсненні митної процедури огляду ставиться завдання визначення культурної або історичної цінності виробів мистецтва.

Для вирішення цієї проблеми в Державній митній службі України передбачено наявність фахівця-мистецтвознавця в пунктах митного контролю. Однак з огляду на велику розмаїтість типів виробів мистецтва і специфіку кожного типу для кваліфікованої експертизи необхідний фахівець-мистецтвознавець з кожного виду цінностей, що в рамках митної служби не є можливим. Велику практичну допомогу у вирішенні цієї проблеми надало б створення експертної системи ідентифікації творів мистецтва, яка б містила в собі не тільки базу даних з відмітною атрибутикою предметів мистецтва, але й могла б робити висновки про ступінь культурної й історичної цінності досліджуваного об’єкта.

Проблемам розробки експертних систем присвячені роботи Поспєлова Д.А., Попова Е.В., Заде Л., Уотермена Д.Р., Бакаєва А.А. та інших авторів. Проведений аналіз робіт з даного напрямку дозволяє зробити висновок, що в галузі мистецтвознавства експертні системи застосовуються не досить широко. Існуючі інформаційні системи, застосовувані в цій галузі, є інформаційно-пошуковими системами і не надають підтримки у прийнятті експертних рішень. Важливим аспектом під час розробки експертних систем є розробка інформаційної моделі предметної області і розробка методів обробки нечітких і неповних даних. Оскільки вироби мистецтва є новою предметною областю, застосовність існуючих інформаційних моделей та методів обробки нечітких даних раніше не досліджувалось. У звязку з цим тема дисертаційної роботи має важливе наукове значення і практичну цінність.

Зв’язок роботи з науковими програмами, планами, темами. Результати, що розроблялись, застосовані в межах держбюджетної науково-дослідної теми “Розробка та дослідження методів та засобів обробки інформації в автоматизованих системах митної служби України з урахуванням якісно-кількісних характеристик інформації” (№ держреєстрації 0104U008458) на кафедрі інформаційних систем та технологій Академії митної служби України. Особистий внесок автора у зазначеній НДР як співвиконавця полягає в розробці інформаційної моделі нової предметної області, удосконалених методів визначення найбільш подібних об’єктів і нових методів аналізу можливості прийняття рішення.

Мета і задачі дослідження. Метою дисертаційної роботи є розробка і дослідження моделей та методів обробки даних в автоматизованих системах ідентифікації об’єктів з урахуванням нечіткого або неповного характеру даних і властивостей предметної області.

Для досягнення поставленої мети в дисертаційній роботі необхідно вирішити такі задачі:

ѕ дослідити характеристики виробів мистецтва й історичних цінностей, що проходять через митний контроль, як предметної області експертної системи ідентифікації об’єктів;

ѕ на основі дослідження існуючих моделей подання знань розробити модель подання предметної області;

ѕ розробити метод обробки інформації з урахуванням нечітких і неповних характеристик даних і фактора старіння інформації;

ѕ розробити алгоритм ідентифікації об’єктів на основі запропонованих моделей і методів обробки даних;

ѕ програмно реалізувати отримані моделі, методи та алгоритми і побудувати дослідницький прототип експертної системи ідентифікації виробів мистецтва на прикладі обраного типу виробів мистецтва.

Об'єкт дослідження – процес розробки Єдиної автоматизованої інформаційної системи митної служби України.

Предмет дослідження – моделі та методи обробки нечітких, неповних даних в автоматизованих системах ідентифікації об’єктів.

Методи дослідження. Для досягнення поставленої мети використовувались методи теорії штучного інтелекту, теорії графів, теорії нечітких множин, теорії оптимізації, математичної статистики.

Наукова новизна результатів дисертаційної роботи. У процесі вирішення поставлених задач особисто автором отримані такі результати:

- отримали подальший розвиток моделі подання предметної області шляхом об'єднання принципів розробки фреймової моделі з методологією створення реляційної і продукційної моделей, що дало можливість реалізувати в рамках однієї моделі властивості ієрархічності, наслідування ознак, однорідності структури даних і забезпечити простоту редагування та обробки даних;

- удосконалено метод визначення ступеня нечіткої близькості об’єктів за ступенем нечіткої рівності, нечіткого включення і нечіткої спільності ознак через урахування фактора старіння інформації, що забезпечило більш точне визначення найбільш близьких об’єктів до об’єкта ідентифікації;

- уперше розроблено метод визначення коефіцієнта можливості прийняття рішення при неповних вхідних даних на основі залежності правомірності прийняття рішення від кількості і важливості невизначеної інформації, що дозволило чисельно оцінити можливість прийняття рішення в умовах невизначеності.

Практичне значення отриманих результатів. Розроблені в дисертаційній роботі моделі подання предметної області і методи обробки даних можуть бути використані під час розробки експертних систем для предметних областей, які мають характеристики, подібні до характеристик виробів мистецтва. Запропонований метод визначення чисельного коефіцієнта, що характеризує можливість приймати рішення в умовах невизначеності може бути використано для будь-якої системи підтримки прийняття рішення, для якої вхідна інформація може бути неповною. Запропоновані автором методи визначення подібності об’єктів з урахуванням фактора старіння інформації можуть бути застосовані в пошукових системах, системах підтримки прийняття рішень, для яких методи обробки інформації побудовані на базі нечіткої логіки.

Результати дисертаційних досліджень упроваджені при створенні експертної системи ідентифікації ікон, яка була розроблена на кафедрі інформаційних систем та технологій і експлуатується на митному посту “Аеропорт-Дніпропетровськ” Дніпровської регіональної митниці, що засвідчено актом впровадження від 22.10.2004.

Теоретичні результати дисертаційної роботи у вигляді інформаційних моделей і методів обробки даних упроваджено в навчальний процес АМСУ на кафедрі інформаційних систем та технологій в дисципліні “Основи проектування систем штучного інтелекту”, що засвідчено актом впровадження від 30.11.2004.

Особистий внесок здобувача. Усі результати дисертаційної роботи отримані автором самостійно. У наукових працях, опублікованих у співавторстві, з питань, що стосуються даного дослідження, авторові належить: у роботі [1] автором проаналізовано можливість використання розроблених раніше методів оцінки якісно-кількісних характеристик інформації для захисту інформації; у роботі [5] автором на основі аналізу формальних способів подання і форм опису предметної області, обрано подання у вигляді дерева, а формою опису обрано n – вимірний вектор, проведено аналіз процесу пошуку рішення, описано початковий і цільовий стан, описано оператори, що відображають перехід одного стану в інший; у роботі [6] автором запропоновано метод визначення коефіцієнта можливості прийняття рішення в експертних системах за неповної вхідної інформації, який пов’язує можливість прийняття рішення з кількістю і важливістю невизначеної інформації. Розроблена система нечітких правил і побудовано функції належності, які використовуються під час фазифікації і дефазифікації; у роботі [7] автором розглядається метод визначення ступеня нечіткої близькості об’єктів за ступенем нечіткої рівності, нечіткого включення і нечіткої спільності з урахуванням фактора старіння інформації, що дозволяє більш точно визначати найбільш близькі об’єкти-прототипи з базі знань до об’єкта ідентифікації; у роботах [8, 9] автором розглядаються шляхи вирішення поставленого завдання створення експертної системи ідентифікації виробів мистецтва; у роботі [10] авторові належить аналіз особливості використання експертної системи в митній службі України.

Апробація результатів дисертації. Основні результати дисертаційної роботи доповідалися й обговорювалися на таких наукових конференціях: ІІ національній конференції студентів, аспірантів і молодих вчених "Системний аналіз та інформаційні технології" (Київ, 2000 р.); науково–методичній конференції "Актуальні проблеми підготовки фахівців з митної справи" (Дніпропетровськ, 2001 р.); ІІІ науково-технічній конференції „Правове, нормативне та метрологічне забезпечення системи захисту інформації в Україні” (Київ, 2001 р.); міждержавній науково-методичній конференції "Проблеми математичного моделювання" (Дніпродзержинськ, 2002 р. ); V і VI міжнародній конференції по математичному моделюванню (МКММ’ 2002, МКММ’2003) (Херсон, 2002, 2003 р.); 1-му Міжнародному радіоелектронному форумі “Прикладная радиоэлектроника. Состояние и перспективы развития” МРФ-2002 (Харків, 2002 р.), 7-му міжнародному молодіжному форумі “Радиоэлектроника и молодежь в ХХІ веке” (Харків, 2003р.).

Публікації. Основні результати дисертаційної роботи опубліковані в 7 публікаціях і 6 тезах наукових конференцій.

Структура дисертації. Дисертація складається з вступу, 4 розділів, висновків, списку використаних джерел, що включає 97 найменувань, 5 додатків на 33 сторінках, 31 малюнку і 10 таблиць. Повний обсяг дисертації складає 183 сторінки.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі відзначено актуальність дисертаційної роботи, сформульовано мету і задачі дослідження. Дано стислу анотацію отриманих у дисертації результатів, визначено їх наукову новизну і практичне значення. Показано особистий внесок здобувача, наведено публікації та апробації за темою роботи. Наведено дані про впровадження результатів проведених досліджень.

У першому розділі розглянуто основні підходи до методів розробки експертних систем, проведено огляд інструментальних засобів розробки експертних систем. Основну увагу приділено питанням розробки моделей представлення предметних областей та методам обробки нечітких та неповних даних.

Існуючи на сьогодні інструментальні засоби розробки експертних систем спрямовані в основному на автоматизацію окремих етапів задачі проектування ЕС, і, як правило, накладають певні обмеження на структуру та властивості предметної області. Таке обмеження не забезпечує комплексного вирішення задачі розробки ЕС для будь якої предметної області. Найдоцільніше при створенні експертної системи використовувати мови програмування високого рівня як безпосередньо розроблених для експертних систем, так і об’єктно-орієнтованих мов.

Існуючі засоби подання знань, за допомогою яких розробляються інформаційні моделі предметних областей, не в повній мірі відображають усі характеристики ПрО. Існуючі моделі подання знань можуть бути прокласифіковані за основними чотирма типами: продукційні моделі, семантичні мережі, фрейми, формальні логічні моделі. Аналіз зазначених моделей показав, що кожна з них має як позитивні характеристики, так і недоліки. Серед розглянутих моделей найбільш придатною для подання знань є фреймова модель, але виникає потреба в її удосконаленні для використання до нової предметної області, якою є вироби мистецтва.

Серед існуючих методів обробки нечітких даних адекватним є апарат нечіткої логіки. Він дозволяє обробляти дані числового, булевого і нечіткого типу. Використання цього апарату зводиться до застосування методів фазифікації і дефазифікації. При цьому алгоритми вибору зазначених методів практично відсутні. В основу методів фазифікації і дефазифікації покладено поняття функції належності, для побудови якої запропоновано використання методів нечітких множин у поєднанні з методами теорії оптимізації.

Було розглянуто основні методи дефазифікації, а саме метод дефазифікації за центром ваги, за методом медіани і за методом центра максимумів. Аналіз літературних джерел, що використані для дослідження цього питання показав, що найбільш точним є метод центра ваги.

Згідно з отриманими під час аналізу результатами автором було сформульовано основні задачі дослідження.

Другий розділ присвячено опису структури та функцій ЄАІС, формалізованому опису ПрО, дослідженню характеристик ознак об’єктів ПрО, формулюванню вимог до моделі подання знань у базі знань і розробці моделі подання досліджуваної ПрО. Відповідно до функціональних завдань, що вирішуються в ЄАІС, у структурі системи виділяють автоматизовану підсистему митного оформлення; митну адміністративно-правову підсистему; митну підсистему інформаційної безпеки; митну зовнішню інформаційну підсистему; митну телекомунікаційну підсистему.

За своїми функціональними завданнями експертна система ідентифікації виробів мистецтва є інструментальним засобом автоматизованої підсистеми митного оформлення і митної адміністративно-правової підсистеми.

Аналіз ПрО, позначимо її ?, показав, що ознаки i, які описують об’єкти ПрО хХ, ХЩ, ?алежать до одного з трьох типів: числового, булевого та лінгвістичного. Як було зазначено вище, апаратом для формального опису предметної області є апарат нечітких множин. Відповідно до нього кожна лінгвістична ознака i(iI={1,…,N}) описується відповідною лінгвістичною змінною , де --– терми-безліч лінгвістичної змінної i (набір лінгвістичних значень ознаки), mi – число значень ознаки, Di – базова множина ознаки i. Для опису термів ij (j L={1, 2,…mi}) ознаки i використовуються нечіткі змінні , тобто значення i описується нечіткою множиною у базовій множині Di: .

Такий підхід дозволяє розглядати об’єкти ПрО xX як нечіткі об’єкти:

x={x(i)/i}, i, (1)

де

, jL, iI. (2)

Для ознак ?і булевого типу x(i){0; 1}.

Запропоновано розбити всю множину ознак ={1, 2,…, n}, якою характеризуються об’єкти хХ, на дві непересічні множини:

S={1, 2,…, s}, U={s+1, s+2,…, n}, ОSОU=. (3)

Множина ?S задає сукупність ознак, за якими проводиться розбиття вихідного класу х на підмножини, а множина ?U задає сукупність індивідуальних ознак об’єктів, за якими об’єкти розрізняються в підмножині.

Для класифікації ознак, що описують об’єкти ПрО введено такі числові характеристики, які визначаються експертами:

- x(ij){0; 1} – функція належності, значення ?іj ознаки ?і до об’єкту x;

- ці – важливість ознаки ?і для ідентифікації, ?і ;

- ti – потенціальна можливість зміни в часі значення ?і ознаки, ti.

Для ознак ?іОS, i=1,2,…,s повинні виконуватися умови:

оiОS ti=0, (4)

S={i:i={0;1}, або (i={i1,i2,…,is} и іj={0;1}, jL)}. (5)

Крім того, вважатимемо що значення ознак ?іОS можуть бути визначені експертом візуально без використання спеціального обладнання.

Запропоновані способи класифікації ознак дозволили подати ПрО у вигляді ієрархічної структури, на нижніх рівнях ієрархії якої знаходяться непересічні підмножини заданого типу культурних цінностей ХЩ. ?тримана ієрархія для деякого типу творів мистецтва Х наведена на рис. 1.

Відповідно до проведеного аналізу ПрО було сформульовано вимоги до інформаційної моделі ПрО у базі знань експертної системи ідентифікації творів мистецтва. Проведений аналіз дозволив зробити висновки про те, що, з одного боку, більшість характеристик ПрО обумовлюють використання фреймової моделі для подання ПрО, а з другого – існують характеристики ПрО, які не можуть бути адекватно відображені у фреймовій моделі і адекватно відображуються за допомогою реляційної і продукційної моделі. З огляду на зазначені особливості в дисертаційній роботі запропоновано підхід до побудови моделей подання знань, в основу якого покладено об’єднання методології фреймової моделі з методологією створення реляційної і продукційної моделей. На основі запропонованого підходу розроблена нова модель подання Про.

Перший рівень ієрархії в запропонованій моделі є фреймом класу і відповідає типу творів мистецтва ХЩ. ?лоти відповідають ознакам множини ?S. За значеннями ознаки о1={о1j}nj=1 фрейм класу утворює n фреймів другого рівня ієрархії. При цьому інформація про значення ознаки ?1 кодується в імені фрейму, а кількість слотів зменшується на один. Повторивши процес для усіх ознак ?S={1, 2,…, s}, отримаємо s рівнів ієрархії, які містять фрейми з ознаками множини ?S. На s+1-му рівні в запропонованій структурі містяться таблиці, побудовані за методологією реляційних баз даних. Вони несуть інформацію про об’єкти хХ, які згруповані по підмножинам відповідно до значень ознак множини ?S. При цьому рядки відповідають елементам класу, а стовпці – ознакам множини ?U. База правил для описаної структури формується так. Нехай для деякого i-го рівня ієрархії можна сформувати групу правил PRХі. Тоді разом зі значеннями ознак таблиці нижчого рівня ієрархії наслідуватимуть і сформовану групу правил. Структуру запропонованої моделі ПрО наведено на рис. 2.

В розробленій моделі фреймова модель подання знань забезпечує виконання властивостей ієрархічності, успадкування ознак від об’єктів вищого рівня ієрархії до об’єктів нижніх рівнів, можливість використання значень за замовчуванням. Використання продукційної моделі подання знань забезпечує простоту поповнення і модифікації правил, простоту механізмів логічного висновку. Реляційна модель даних забезпечує однорідність структури даних і дозволяє використовувати для зберігання даних таблиці, що забезпечує простоту редагування й обробки досить великого обсягу інформації.

Відповідно до запропонованої моделі, ПрО формально подається у вигляді дерева (рис. 1), формою опису є n- вимірний вектор , пошук є комбінованим пошуком розбиття вихідної задачі на підзадачі і потім пошуку в глибину і в ширину.

Третій розділ присвячено розробці методів і алгоритмів обробки даних про об’єкти ідентифікації з урахуванням характеристик нечіткості і неповноти даних. Нижче наведено основні положення запропонованих підходів.

Нехай на вхід системи подається інформація про об’єкт у, що належить деякому типу творів мистецтва ХЩ. ?оді об’єкт у і об’єкти хX описуються однаковою сукупністю ознак ?={о1,о2,…,оn}, кількість яких дорівнює n. При цьому кількість ознак множини ?S дорівнює s, кількість ознак множини ?U дорівнює p=n-s, де n- загальна кількість ознак, що описують об’єкти множини ХЩ, s- ?ількість ознак множини ?S. Якщо при ідентифікації значення деяких ознак не визначено, позначимо їх кількість k. Відповідно до запропонованої інформаційної моделі (рис. 2) автором було запропоновано метод ідентифікації об’єктів, який складається з трьох етапів і базується на існуючих способах визначення нечіткої близькості: нечіткій рівності (х, у), нечіткому включенні ?(х, у) та нечіткій спільності kp-q(х, у).

На першому етапі визначаємо значення ознак ?іОS об’єкта ідентифікації у і відповідно до них визначаємо підмножину Хij…kX, до якої належить об’єкт у Хij…k. Ураховуючи обмеження (4), (5) на ознаки множини ?S, об’єкт у буде належати такій підмножині Хij…k, що х Хij…k виконується

мS(х, у)=1, (6)

де ?S(х, у) – нечітка рівність об’єктів х і у за ознаками ?іОS м(x,y) ?изначається як

, (7)

(8)

і обчислюється для ?іОS.

На другому етапі визначаємо значення ознак ?іОU об’єкта ідентифікації у і відповідно до них здійснюємо пошук найбільш близьких до об’єкта у прототипів серед елементів визначеної на першому етапі підмножини Xij…k.

При цьому значення деяких ознак множини ?іОU може бути не визначено. Якщо усі ознаки оіОU, які необхідні для ідентифікації об’єкта у визначені, близькість об’єктів визначаємо за допомогою нечіткої рівності.

Ураховуючи (6), маємо

(х, у)=S(х, у)&U(х, у)=U(х, у), (9)

де U(х, у) визначається за виразами (7), (8) і застосовується для атрибутів iU, i=s+1,..., n.

Якщо для кожного хXij…k <*, то значення деяких ознак чітко або нечітко не співпадають. Позначимо кількість таких ознак через q. У цьому випадку ступінь близькості об’єктів х і y визначаємо за допомогою нечіткої спільності

kp-q(х, у)=S (х, у)kUp-q (х, у), (10)

де kUp-q (х, у) визначається виразом

kUp-q(х, у)=, (11)

|Q|q, kQ (x(k),y(k))R, де R – деяке граничне значення R[0;1] і обчислюється для iU, i=s+1,..., n, (x(k),y(k)) обчислюється за виразом (8).

При існуванні невизначених атрибутів ступінь близькості визначаємо за допомогою поняття нечіткого включення y в x:

(у, х)=S(у, х)&U(у, х)=U(у, х), (12)

де U(у, х) визначається виразом

U(у, х)=, (13)

(14)

і обчислюється для iU, i=[s+1, n].

Таким чином, розв’язання задачі ідентифікації зводиться до обчислення залежно від ситуації ступеня нечіткої рівності, нечіткого включення або нечіткої спільності за атрибутами множини ?U.

Наведені способи визначення нечіткої близькості (вирази (8), (14)) не враховують фактора старіння інформації. Тому при застосуванні описаних способів до ПрО, що розглядається, вони повинні бути удосконалені. З урахуванням характеристики ti зміни у часі значення ознаки ?і, за якими характеризуються об’єкти хХ, ХЩ, ?апропоновано вдосконалені способи визначення нечіткої близькості. А саме:

( х, у)=, (15)

(16)

Нечітку (p-q) спільність kp-q(x,y) запропоновано визначати як:

. (17)

Нечітке включення y в x визначається відповідно за виразом:

, (18)

(19)

Після визначення підмножини і обчислення за відповідним виразом ступеня спільності найбільш близький до об’єкта ідентифікації у об’єкт-прототип х визначається таким способом.

Серед усіх xXij…k оберемо ті х, , для яких відповідно виконується , ,

Якщо серед обраних х, х, х об’єкт у не знайдено, система переходить до третього етапу.

На третьому етапі до об’єкта у застосовуються правила PRij…k, що відповідають підмножині Xij…k, визначеній на першому етапі ідентифікації. Правила PRij…k формуються у відповідності до способу побудови інформаційної моделі (рис. 2).

У другій частині третього розділу розглянуто метод обробки вхідних даних у разі їх неповноти. Неповнота інформації обумовлюється специфікою об’єктів ПрО, яка полягає в тому, що для визначення значення деяких ознак необхідне спеціальне обладнання. Неповнота інформації обмежує можливість експертної системи в прийнятті рішення. У зв’язку з цим розроблено метод визначення коефіцієнта можливості прийняття рішення (КВ) при неповній вхідній інформації на основі залежності правомірності прийняття рішення від кількості і важливості невизначених ознак.

Розроблений метод базується на положеннях теорії нечітких множин і теорії оптимізації і полягає в наступному. На першому етапі обчислюється кількість невизначених ознак k. Після цього обчислюється середня важливість невизначених ознак і відношення кількості невизначених ознак до загальної кількості необхідних ознак m=k/p. Для визначення показника КB сформульована нечітка система правил, наведена на рис. 3.

Оскільки для змінних m, , і КB співпадає базова множина і терм-множина, для фазифікації змінних m і ? і дефазифікації змінної КB були побудовані функції належності з використанням методу побудови функцій належності лінгвістичних термів на основі статистичних даних. За отриманими точковими значеннями функції належності за допомогою методів теорії оптимізації було обрано аналітичний вигляд функції належності для кожного з лінгвістичних термів. Побудовані функції приналежності ?М лінгвістичного терму “мале”, ?ДМ терму “достатньо мале”, ?С терму “середнє”, ?ДБ терму “достатньо велике” і ?Б терму “велике” мають вигляд:

(20)

(21)

(22)

(23)

(24)

Дослідження побудованих функцій (20)–(24) показало, що вони відповідають умовам, що ставляться до функцій належності і відповідають умовам адекватності.

Для дефазифікації КB було використано метод дефазифікації за центром ваги. Отримана числова характеристика, яка характеризує впевненості системи в адекватності прийнятого рішення за неповної вихідної інформації.

На основі запропонованої моделі подання ПрО, яка наведена на рис. 2, та методів обробки нечітких та неповних даних розроблено алгоритм ідентифікації виробів мистецтва.

Нехай ідентифікації підлягає деякий об’єкт уХ. Об'єкт у, як і всі елементи х множини Х, описується сукупністю ознак ?= ОSОU. Алгоритм ідентифікації має вигляд.

Крок 1. Визначити значення ознак ?i об'єкта у.

Крок 2. Відповідно до значень ознак множини ?S ={1, 2,…n} визначити підмножину Хij…k типу культурних цінностей ХЩ, ?о якої належить об’єкт у: Хij…k.

Крок 3. Проаналізувати ознаки U={s+1, s+2,…n}. Якщо всі ознаки визначено, то перейти до 4-го кроку алгоритму, якщо значення деяких ознак не визначено, то перейти до кроку 8 алгоритму.

Крок 4. Використовуючи атрибути множини ?U за формулою (15) визначити ступінь нечіткої рівності U(х, у) об'єктів х та у, де хХij…k.

Крок 5. Порівняти U(х, у) з деяким граничним µ*. Якщо для всіх хХij…k виконується нерівність U(х, у)<µ*, то серед ознак ?U={1, 2,…, n}, що описують об’єкт у, є чітко або нечітко нерівні ознаки з відповідними ознаками об’єкта х і, отже, перейти до кроку 6. В іншому випадку перейти до кроку 12.

Крок 6. Серед елементів вибрати ті х*, для яких q мінімальне, де q – кількість нечітко або чітко нерівних ознак

Крок 7. Обчислити, застосовуючи формулу (17) kp-q(х*, у), де p– кількість ознак множини ?U, p=n-s і перейти до кроку 12.

Крок 8. Обчислити m=k/p, і , – важливість ?i невизначеної ознаки, ?i ОU. Порівняти m і ц з деякими граничними m*, ц*. Якщо m>m* або ?>ц*, то переходимо до кроку 11.

Крок 9. Визначаємо КВ і порівнюємо його з деяким граничним КВ*. Якщо КВ>КВ*, переходимо до кроку 11.

Крок 10. За формулою (18) визначаємо ступінь нечіткого включення ?(у, х), після чого переходимо до кроку 13.

Крок 11. У даній ситуації недостатньо інформації для прийняття рішень, переходимо до кроку 15.

Крок 12. З усіх елементів х множини Хij…k обираємо ті х', для яких виконується умова або х'', для яких . Порівнюємо обрані х' і х'' з об’єктом у. Якщо серед них є об’єкт, ідентичний з об’єктом у, інформація про нього надається для прийняття рішення. Процес ідентифікації зупиняється. В іншому випадку переходимо до кроку 14.

Крок 13. З усіх елементів х множини Хij…k обираємо ті х''', для яких . Порівнюємо обрані х''' з об’єктом у. Якщо об’єкт у ідентичний деякому з них, інформація про нього надається для прийняття рішення і процес ідентифікації зупиняється. В іншому випадку переходимо до кроку 14.

Крок 14. До об’єкта у застосовується група правил PRij…k, яка відповідає підмножині Хij…k.

Крок 15. Результат дії правил видається користувачеві для прийняття рішення.

Четвертий розділ присвячено питанням програмної реалізації розроблених автором інформаційних моделей і методів обробки неповних або нечітких даних. Для реалізації запропонованих методів та моделей було розроблено дослідницький прототип експертної системи. У якості предметної області були обрані ікони як один з найбільш поширених типів виробів мистецтва, що є об’єктом контрабанди. У процесі розробки експертної системи автор орієнтувався на використання системи в органах Держаної митної служби України.

Експертна система пройшла апробацію дослідницьких прототипах, які попередньо були оцінені експертами. Висновки, які було зроблено системою визнані експертами цілком задовільними.

У процесі розробки було виділено ознаки об’єктів ПрО. Множина ознак була подана згідно з (1) у вигляді двох непересічних множин. Сформульована нечітка база правил для визначення культурної або історичної цінності досліджуваного об’єкта. Для аналізу вхідної інформації реалізована нечітка система правил, що наведена на рис. 3. Реалізовані функції належності, що фазифікують дані про об’єкт ідентифікації для обробки їх нечіткою базою правил.

У додатках наведено акти впровадження результатів дисертаційної роботи, допоміжні таблиці для розрахунків адекватності побудованих в дисертації функцій належності, елементи бази правил, основні екранні форми експертної системи ідентифікації ікон.

ВИСНОВКИ

У дисертаційній роботі наведено результати, що, відповідно до мети дослідження, у сукупності є вирішенням актуального наукового і практичного задачі пошуку, ідентифікації і аналізу об’єктів, які підлягають митному контролю. Вирішення цієї проблеми отримано на основі застосування розроблених моделей та методів обробки даних в автоматизованих системах ідентифікації об’єктів. У результаті вирішення сформульованого завдання:

1. Досліджені існуючі способи подання знань для побудови інформаційної моделі предметної області в експертних системах, показано відсутність моделі подання знань, що враховує всі характеристики виробів мистецтва як предметної області експертної системи, обґрунтована необхідність розробки інформаційної моделі предметної області на основі удосконалення існуючих моделей подання знань.

2. Розроблено модель подання предметної області на основі фреймової моделі подання знань, удосконаленої шляхом об’єднання принципів розробки фреймової моделі з методологією створення реляційної і продукційної моделей. Запропонована модель реалізує такі властивості предметної області як ієрархічність, успадкування ознак і забезпечує відносно просту процедуру поповнення і редагування бази знань, контроль за цілісністю і несуперечністю знань.

3. Відповідно до розробленої інформаційної моделі предметної області формальним способом подання ПрО обрано подання у вигляді дерева. Формою опису обрано n – вимірний вектор. Показано адекватність обраних способів до предметної області, що розглядається. Проведено аналіз процесу пошуку рішення. Показано що процес пошуку є комбінованим пошуком розбиття вихідної задачі на складові задачі і потім пошуку в глибину й у ширину. Описано початковий і цільовий стан. Описано оператори, що відображають перехід одного стану в інший.

4. Проаналізовано процес ідентифікації об’єкта в експертній системі. Запропоновано розглядати об’єкти ПрО як нечіткі об’єкти. Проведено аналіз існуючих методів визначення ступеня близькості об’єктів, а саме ступеня нечіткої рівності, нечіткого включення і нечіткої спільності. Показано, що вони не враховують усіх характеристик ПрО, що розглядається. У зв’язку з цим удосконалено метод визначення ступеня нечіткої близькості об’єктів за ступенем нечіткої рівності, нечіткого включення і нечіткої спільності через урахування фактора старіння інформації, що забезпечило більш точне визначення найбільш близьких об’єктів до об’єкта ідентифікації.

5. Розроблено метод, що дозволяє системі аналізувати ситуацію і визначати можливість прийняття рішення за неповних вихідних даних. Неповнота інформації обумовлюється тим, що деякі ознаки, необхідні для ідентифікації об’єкта, не можуть бути визначені без спеціального устаткування. Це обмежує можливості системи в прийнятті рішення. З огляду на це запропоновано метод визначення коефіцієнта можливості прийняття рішення, що залежить від кількості і важливості невизначених ознак. Розроблено і реалізовано механізм нечіткого виводу „MinMax” в експертній системі, що складається в комбінації композиції Max і мінімізуючого виводу для нечіткої бази правил, яка побудована як система нечітких логічних операцій. Запропонований підхід дозволяє чисельно оцінити достовірність результату ідентифікації об’єктів експертною системою в умовах невизначеності.

6. Побудовано функції належності лінгвістичних термів у вигляді кусково-лінійних і гаусівських функцій на основі статистичних даних, отриманих під час експертного опитування з послідуючим вибором аналітичного виду функції і обчислення параметрів методом найменших квадратів. Для здійснення переходу від нечіткої множини, яка є результатом дії системи правил, до чисельної оцінки обрано метод фазифікації за центром ваги.

7. На підставі запропонованих підходів розроблено алгоритм ідентифікації об’єктів.

8. Розроблено і реалізовано структуру експертної системи ідентифікації об’єктів, що базується на розроблених в дисертаційній роботі інформаційній моделі подання ПрО, методі визначення найбільш близьких об’єктів до заданого, методі визначення можливості прийняття рішення і алгоритмі ідентифікації об’єктів. Дослідницький прототип експертної системи ідентифікації ікон розроблено з урахуванням застосування даної системи в митній службі України з урахуванням вимог до системи за умови її використанні в митних органах України.

СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ

1. Мороз Б.І., Молотков О.Н., Ульяновська Ю.В. Методи визначення цінності інформації для організації її захисту // Правове, нормативне та метрологічне забезпечення системи захисту інформації в Україні. – 2001. – № 2 – С. 46 –53.

2. Ульяновська Ю.В. Аналіз основних аспектів побудови інтелектуальної автоматизованої системи ідентифікації творів мистецтва. // Вісник Академії митної служби України. – 2002. – №1(13). – С. 70–74.

3. Ульяновська Ю.В. Аналіз проблеми представлення знань для експертної системи ідентифікації творів мистецтв // Вестник ХГТУ. – 2002.–Вып. 2(15). – С. 477–478.

4. Ульяновська Ю.В. Модель представлення знань в базі знань експертної системи ідентифікації творів мистецтва // Вестник ХГТУ.–2003.–Вып. 3(19). – С. 428–432.

5. Мороз Б.И. Ульяновская Ю.В. Форма и способ представления задачи в экспертной системе идентификации предметов искусства // Автоматизированные системы управления и приборы автоматики. – 2003. – Вып. 125. – С. 128–132.

6. Мороз Б.І., Ульяновська Ю.В. Метод визначення коефіцієнта можливості прийняття рішення в експертних системах при неповних вхідних даних // Вісник Академії митної служби України. – 2002. – № 4. – С. 45–51.

7. Мороз Б.И., Акуловский В.Г., Ульяновская Ю.В. Определение меры сходства объектов в экспертных системах с учетом фактора старения информации // Автоматизированные системы управления и приборы автоматики. – 2004.–Вып.127. – С. 53–60.

8. Мороз Б.І., Ульяновская Ю.В. Создание экспертной системы для проведения гуманитарной экспертизы // Праці ІІ націон. конф. Студентів, аспірантів та молодих учених „Системный анализ и информационные технологи”. – К.: КПУ, 2000. – С. 193–194.

9. Мороз Б.І. Ульяновська Ю.В. Створення експертної системи для ідентифікації культурних та історичних цінностей // Тези науково-методичної конф. “Актуальні проблеми підготовки фахівців з митної справи”. Дніпропетровськ: Академія митної служби України, 2001. – С. 215–216.

10. Мороз Б.І. Ульяновська Ю.В. Захист інформації як одна з ключових проблем при створенні експертної системи ідентифікації творів мистецтв // Тези ІІІ науково-практичної конференції “Правове, нормативне та метрологічне забезпечення систем захисту інформації в Україні”. – К.: ІВЧ “Політехніка”, 2001. – С. 39.

11. Ульяновська Ю.В. Проблема нечіткості в проектуванні експертної системи ідентифікації творів мистецтва // Тези міждержавної науково-методичної конф. “Проблеми математичного моделювання”. Дніпродзержинськ. – 2002. – С. 42 – 43.

12. Ульяновская Ю.В. Основные требования организации базы знаний в интеллектуальной автоматизированной системе идентификации предметов искусств // Труды 1-го Международного радиоэлектронного форума „Прикладная радиоэлектроника. Состояние и перспективы развития” МРФ – 2002. – Часть 2. – Харьков: АН ПРЭ, ХНУРЕ, – 2002. – С. 38–39.

13. Ульяновская Ю.В. Применение теории нечетких множеств для формализации знаний в экспертной системе идентификации предметов искусств // Материалы 7-го международного молодежного форума „Радиоэлектроника и молодежь в ХХІ веке”.–Харьков: ХНУРЭ,–2003.–С. 427.

АНОТАЦІЯ

Ульяновська Юлія Вікторівна. Моделі та методи обробки даних в Єдиній автоматизованій інформаційній системі митної служби. – Рукопис.

Дисертація на здобуття вченого ступеня кандидата технічних наук за спеціальністю 05.13.06 – автоматизовані системи управління та прогресивні інформаційні технології. – Харківський національний університет радіоелектроніки, Харків, 2004.

Дисертація присвячена питанням розробки інформаційних моделей предметних областей та методів обробки нечітких та неповних даних в Єдиній автоматизованій інформаційній системі митної служби.

Запропоновані в роботі моделі, методи та розроблені на їх основі алгоритми обробки даних можуть бути використані в експертних системах ідентифікації об’єктів. Розроблені методи визначення найбільш близьких об’єктів дозволяють виконувати більш точну ідентифікацію об’єктів. Розроблений метод визначення можливості прийняття рішення на основі якісно-кількісних характеристик вхідної інформації дозволяє системам підтримки прийняття рішення чисельно оцінити можливість прийняття рішення в умовах невизначеності незалежно від предметної області.

Ключові слова: автоматизовані інформаційні системи ідентифікації об’єктів, інформаційна модель, обробка нечітких і неповних даних, експертні системи.

АННОТАЦИЯ

Ульяновская Юлия Викторовна. Модели и методы обработки данных в Единой автоматизированной информационной системе таможенной службы. – Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06 – автоматизированные системы управления и прогрессивные информационные технологии. – Харьковский национальный университет радиоэлектроники, Харьков, 2005.

Диссертация посвящена вопросам разработки информационных моделей, методов и алгоритмов обработки нечетких или неполных данных в автоматизированных системах таможенной службы, в частности в экспертных системах (ЭС) идентификации объектов. Одним из актуальных для таможенной службы Украины является вопрос идентификации предметов искусства и определения их культурной и исторической ценности. В соответствии с этим в первом разделе проведен анализ методов, средств и технологий проектирования ЭС, а также средств построения информационных моделей предметной области и методов обработки нечетких или неполных данных, применяемых в ЭС. В результате такого анализа определены основные задачи исследования: разработать модель представления предметной области в базе знаний ЭС, которая отражала бы все характеристики ПрО; исследовать существующие методы обработки нечетких данных, а именно: способы определения степени близости объектов, методы фаззификации и дефаззификации; разработать и реализовать исследовательский вариант экспертной системы идентификации объектов как инструментального средства подсистемы таможенного оформления и таможенной административно-правовой подсистемы.

Второй раздел посвящен формальному описанию предметной области и формулированию требований к информационной модели предметной области в базе знаний, а также анализу существующих алгоритмов поиска объектов в базе знаний. Основой для разработки модели предметной области и методов обработки данных является информация о ПрО, которая зачастую является неполной, при описании объектов ПрО используются как числовые характеристики, так и сформулированные на естественном языке и носящие нечеткий характер. Поэтому в качестве математического аппарата для формального описания ПрО выбран аппарат теории нечетких множеств. При этом объекты ПрО предложено рассматривать как нечеткие объекты.

Разработана информационная модель предметной области в базе знаний экспертной системы идентификации предметов искусства. В основу модели положена фреймовая модель представления знаний, усовершенствованная добавлением элементов реляционной и продукционной модели. Разработанная модель реализовывает такие свойства предметной области как иерархичность, наследование атрибутов и обеспечивает относительно простую процедуру пополнения и редактирования базы знаний, контроль за целостностью и непротиворечивостью


Сторінки: 1 2