У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





Харківський національний університет радіоелектроніки

Харківський національний університет радіоелектроніки

Ворочек Ольга Григорівна

УДК 681.3.016:658.512

МЕТОДИ ТА МОДЕЛІ МЕТАКОНТЕКСТНОГО ОБМІНУ ДАНИМИ В ІНФОРМАЦІЙНИХ СИСТЕМАХ

05.13.06 – автоматизовані системи управління та прогресивні

інформаційні технології

Автореферат дисертації на здобуття наукового ступеня

кандидата технічних наук

Харків - 2002

Дисертацією є рукопис.

Робота виконана в Харківському національному університеті радіоелектроніки Міністерства освіти і науки України.

Науковий керівник кандидат технічних наук, доцент Дудар Зоя Володимирівна, Харківський національний університет радіоелектроніки, професор кафедри ПЗЕОМ

Офіційні опоненти:

- доктор технічних наук, професор Сіроджа Ігор Борисович, Національний аерокосмічний університет ім. М.Є. Жуковського “ХАІ”, завідувач кафедри програмного забезпечення автоматизованих систем.

- кандидат технічних наук, доцент Петров Костянтин Едуардович, Університет внутрішніх справ, доцент кафедри прикладної математики.

Провідна установа

Національний технічний університет України „КПІ”, кафедра автоматики та управління в технічних системах

Захист відбудеться “19” червня 2002 р. о 13.00 годині на засіданні спеціалізованої вченої ради Д 64.052.01 в Харківському національному університеті радіоелектроніки, за адресою 61166, м.Харків, просп. Леніна, 14; т. 433-053.

З дисертацією можна ознайомитись у бібліотеці Харківського національного університету радіоелектроніки, просп. Леніна, 14.

Автореферат розісланий “ 16 ” травня 2002 р.

Вчений секретар

спеціалізованої вченої ради Саєнко В.І

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. В умовах сучасного динамічного розвитку суспільства, ускладнення технічної і соціальної інфраструктури інформація стає повноцінним ресурсом таким, як традиційні матеріальні та енергетичні ресурси. Сучасні інформаційні технології (ІТ), які дозволяють створювати, зберігати, обробляти та забезпечувати ефективне представлення даних споживачу, є важливим фактором життя суспільства і засобом підвищення якості управління усіма галузями діяльності людини. Найбільший соціальний та економічний успіх гарантується інформаційно розвинутим державам. У зв'язку з цим в Україні прийнята Національна Програма інформатизації, у відповідності до якої необхідно створити умови для забезпечення суб'єктів інформаційних відношень своєчасною, достовірною, адекватною та ефективною інформацією.

Глобалізація інформаційного простору, яка обумовлює використання великої кількості інформаційних ресурсів, реалізованих з використанням різних технологій, в різних програмно-апаратних середовищах, виводить на перший план проблеми інтеграції. Особливої актуальності набувають питання створення інфраструктури багаторівневої інтеграції даних і розробки автоматизованих інформаційних систем, як засобів усунення технічних, технологічних, лінгвістичних та семантичних проблем, зведення до мінімуму інформаційного шуму, забезпечення прямої взаємодії користувачів із інформаційними масивами. В останні роки особлива увага приділяється розвитку великомасштабних розподілених систем баз даних як засобу створення гнучкої, однорідної, інформаційної системи (ІС), що забезпечує одночасну роботу великої кількості користувачів, та яка вільна від дублювання даних, узгоджена та ефективна і гарантує одержання найбільш коректної, своєчасної і достовірної інформації. Проектування, розробка і супроводження засобів підтримки таких ІС пов'язані з чергою проблем, які обумовлюються різнорідністю джерел інформації, що підключаються, а також динамічністю середовища, в якому вони функціонують.

За цими умовами традиційні підходи до інтеграції із слабким та міцним зв'язком взаємодіючих баз даних приводять до стрімкого зниження ефективності систем обробки інформації. Має місце підвищена потреба у розробці нових інформаційних технологій автоматизованої семантичної обробки баз даних, використання яких в процесі інтеграції забезпечує необхідний баланс між якістю інформації та технічними властивостями систем інформаційної взаємодії. Дослідження у цій галузі спрямовані на розробку „контекстного посередника” з метою отримання, обробки та маніпулювання контекстними та онтологічними знаннями про джерела інформації, що дозволяє динамічно і ефективно розв'язувати конфлікти та уникати зайвих перетворень вхідних та вихідних даних, які значно ускладнюють процес інтеграції. Підвищена увага приділяється питанням розробки методів оцінки якості даних як критерію можливості проведення процесу обміну даними та відповідності отриманого результату до потреб користувачів.

Особливий внесок у розвиток теоретичних та практичних питань моделювання семантики даних, а саме контексту та онтологій, внесли Е.В. Попов, М.Ш. Цаленко, Т. Виноград, М.Ф. Бондаренко, Ю.П Шабанов-Кушнаренко, К.О. Соловйова, Ст. Меднік, М. Сігел, Р. Ванг, Т. Грубер, Дж. Сова та ін.

Дослідження, що проведені у даній дисертаційній роботі, спрямовані на розвиток теорії побудови контекстуалізованих онтологічних структур баз даних та розробку інформаційної технології, яка шляхом використання онтологічних та контекстних знань, дозволяє користувачеві працювати з розподіленими базами даних як з простим семантично і схематично однорідним джерелом інформації.

Зв'язок роботи з науковими програмами, планами, темами. Робота виконувалася на кафедрі програмного забезпечення ЕОМ Харківського національного університету радіоелектроніки відповідно до плану науково-дослідної роботи, в рамках держбюджетних тем № 022 “Розробка комплексу засобів інформаційної підтримки моделей соціально-економічного розвитку регіону” (№ ДР 0197U012128) та № 107-2 “Розробка принципів проектування систем, підтримуючих контекстну обробку інформації, з метою їх використання при створенні інформаційно-аналітичної системи прийняття рішень при управлінні соціально-економічним розвитком регіону” (№ ДР 0100U001342), на якій Ворочек О.Г. працює як виконавець.

Метою роботи є нова інформаційна технологія, яка базується на методах та моделях метаконтекстного обміну даними, та її реалізація у вигляді програмної системи.

Поставлена мета обґрунтувала такі задачі дослідження:

- Розробити модель представлення знань системи метаконтекстної інтеграції семантично та схематично різнорідних баз даних.

- Розробити принцип формування контекстно-значимих онтологічних ланцюжків взаємодії, який є необхідним для визначення контекстно-онтологічних співвідношень знань системи МКОД при інтеграції даних різних предметних галузей.

- Розробити спосіб поетапного визначення якості даних зв'язків системи метаконтекстного обміну даними при інтеграції семантично та схематично різнорідних баз даних.

- Розробити методи та алгоритми метаконтекстного обміну даними: метод формування концептуальної онтологічної структури, метод контекстуалізації онтологічної структури, метод генетичного пошуку онтологічних ланцюжків взаємодії, кількісної оцінки відносних показників якості даних.

- Розробити інформаційну технологію, яка використовує методи, моделі та алгоритми метаконтекстного обміну даними.

- Реалізувати інформаційну технологію метаконтекстного обміну даними у вигляді програмної системи для вирішення практичної задачі інтеграції різнорідних баз даних.

Об'єктом дослідження є розподілені великомасштабні системи баз даних.

Предметом дослідження є методи, моделі та алгоритми метаконтекстного обміну даними у семантично різнорідних базах даних.

Методи дослідження базуються на ідеях та принципах штучного інтелекту, теорії графів, теорії реляційних баз даних, еволюційних методів.

Наукова новизна одержаних результатів. У ході вирішення поставлених задач були отримані такі результати:

1. Вперше розроблено модель представлення контекстно-онтологічних знань про джерела даних у вигляді онтологічного графу та генетичну модель представлення нормалізованих онтологічних структур, які дозволили автоматизувати процес визначення та обробки семантики даних в процесі інтеграції на підставі їх концептуальних структур, схем даних та інформаційного наповнення, а також спростити визначення зв'язків між структурами даних, які належать до різних предметних галузей, та підвищити ефективність інформаційних систем метаконтекстного обміну даними.

2. Вперше розроблено нові принципи формування контекстно-онтологічних відношень в базі знань системи метаконтекстного обміну даними, що дозволило найбільш повно описувати властивості об'єктів онтологічної структури під впливом контекстів інформаційних джерел та розв'язувати семантичні і схематичні конфлікти даних з метою забезпечення взаємодії інформаційних масивів, які належать до суміжних та різних предметних галузей.

3. Вперше розроблено нові методи метаконтекстного обміну даними, які базуються на моделюванні контекстних та онтологічних знань засобами теорії графів та генетичної обробки інформації та дають підставу для створення ядра нової інформаційної технології метаконтекстного обміну даними: метод формування концептуальної структури бази даних; метод контекстуалізації бази даних; метод генетичного пошуку онтологічних ланцюжків взаємодії; метод кількісної оцінки показників якості зв'язків онтоструктури.

Практичне значення одержаних результатів. Розроблена нова інформаційна технологія, яка базується на методах, моделях та алгоритмах метаконтекстного обміну даними і використовується для побудови системи метаконтекстного обміну даними як засобу інтеграції великомасштабних розподілених різнорідних баз даних з метою їх коректної взаємодії. Ця система програмно реалізована у вигляді підсистеми метаконтекстного обміну даними програмного комплексу інформаційної підтримки інтеграції різнорідних баз даних, які містять дані про нозологічні одиниці, що впроваджений у відділу медичної статистики Другої обласної психіатричної лікарні Сумського УОЗ (акт впровадження від 02.10.2001), „OntoSearch” метаконтекстного пошуку та інтеграції, що впроваджено у ТОВ „Белый город – ПРОФИ” (акт впровадження від 12.09.2001) та інформаційної підтримки технологічного процесу, який впроваджено на ДП „Завод ім. Малишева”(акт впровадження від 16.01.02).

Використання комплексів дозволяє за рахунок автоматизації визначення семантичних властивостей інформаційних джерел значно покращити якість обробки інформації, скоротити час, який витрачається на обробку даних та забезпечити інтегрований автоматизований доступ до баз даних, які внаслідок різнорідності не підлягають одночасній обробці з використанням традиційних методів управління системами баз даних, але містять великі об'єми цінної та актуальної інформації.

Основні положення, висновки та рекомендації, які викладені в дисертаційної роботі, використані в учбовому процесі при підготовці курсів "Математичні моделі інформаційних процесів та управління динамічними об'єктами" та “Інтелектуальні технології в мовних системах” на кафедрі програмного забезпечення ЕОМ Харківського національного університету радіоелектроніки.

Особистий внесок здобувача. Всі результати дисертації отримані автором самостійно.

В роботі [1] досліджено принципи формування контекстно-онтологічних відношень в базі знань систем, які розроблені у рамках підходу контекстного обміну даними; у роботі [2,3] автором розглянуто шляхи удосконалення підходу контекстного обміну даними, розроблено методи метаконтекстної інтеграції баз даних та запропоновано моделі систем МКОД; у роботі [3,6] – досліджено питання розробки алгоритмів семантичної обробки інформації для побудови інтелектуальних інформаційних систем мета контекстної взаємодії; у роботі [4] проведено аналіз використання онтологій інформаційними системами; в [5] розроблено модель процесу інтеграції, що базується на контекстному обміні даними – базового для технології метаконтекстної взаємодії; у роботі [7] досліджено питання використання технологій сімейства контекстного обміну даними.

Апробація результатів дисертації. Основні результати дисертаційної роботи були апробовані на конференціях: II молодіжному форумі „Радиоэлектроника и молодежь в ХХI веке”, Харків, 1998 р.;Міжнародній конференції „Информационные технологии: наука, техника, технология, образование, здоровье”, Харків, 1999 р.; 2 науково-методичної конференції „Использование компьютерных технологий в учебном процессе”, Харьков, 1998 г.; 6-й Міжнародній конференції “Теория и техника передачи, приема и обработки информации” (“Новые информационные технологии”), Туапсе, 2000 р.; Міжнародної науково-технічної конференції „Сучасні проблеми радіоелектроніки, телекомунікацій та комп'ютерної інженерії” TCSET'2002, 2002.

Публікації. За результатами дисертаційної роботи опубліковано 7 робіт, з них 3 статті у наукових фахових виданнях згідно з переліком ВАК наукових фахових видань України, 2 доповіді та 2 тез доповідей конференцій.

Структура та об'єм роботи. Дисертація складається з вступу, чотирьох розділів і висновків, і має загальний об'єм 150 сторінок. Містить 33 рисунка, 5 додатків на 15 сторінках, 7 таблиць, список використаних літературних джерел, що включає 143 найменування на 14 сторінках.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовано актуальність дисертаційної роботи, сформульовані основна мета і завдання досліджень, наведені відомості про зв'язки обраного напрямку досліджень із планами організації, де виконана робота. Дано стислу анотацію отриманих у дисертації рішень, відзначена їх практична цінність, приведені дані про використання результатів проведених досліджень у народному господарстві.

У першому розділі дисертаційної роботи досліджено підходи до забезпечення взаємодії великомасштабних інформаційних систем. Зокрема досліджено підходи до забезпечення взаємодії гетерогенних розподілених баз даних у динамічному оточенні.

Досліджено причини з'явлення семантичної та схематичної різнорідності інформації.

Проведено аналіз методів інтеграції різнорідних баз даних: із сильним зв'язком, із слабим зв'язком та контекстної інтеграції. Зроблено висновок про необхідність застосування методів семантичної інтеграції та удосконалення концепції контекстного обміну даними.

Проведено аналіз методів представлення та інтеграції онтологій. Виявлена необхідність інтеграції онтологічних специфікацій, а не контексту або даних, як вважалось раніше. Обґрунтовано вибір представлення на підставі графів, як базової моделі знань для побудови онтологічної структури бази даних.

На основі проведених досліджень сформульовані мета та задачі дисертаційної роботи.

У другому розділі досліджуються теоретичні основи контекстно-онтологічної (метаконтекстної) взаємодії.

Розроблено теоретичні основи представлення системи знань метаконтекстного обміну даними на підставі графів. Підґрунтям вибору даного математичного апарату є ствердження того, що властивості онтологічного об'єкту визначаються його зв'язками з іншими онтологічними об'єктами.

Введено модель представлення онтологічних знань у вигляді онтологічного графу (онтографу), який визначається як Go=(Vo,Eo), де Vo – множина вершин, що відповідають множині концептів онтології, Eo – множина ребер, що описують зв'язки між концептами. Для онтографу будується відповідна матриця суміжності A = (aij), i, j =, розміру |Vo| х |Vo|, де

. (1)

В цьому виразі SEoij – семантика зв'язку, а Kdoij – показник якості даних зв'язку.

Онтологічний граф є багаторівневим, що обумовлено наявністю стійких асоціацій онтологічних концептів, які на даному рівні інтеграції однозначно визначають властивості деякого об'єкту або сукупність об'єктів.

Задача визначення семантики концепту онтології розглянута як задача пошуку ланцюжків взаємодії у рамках контексту взаємодії. Розроблено принцип формування контекстно-значимих онтологічних ланцюжків. Загальним формулюванням цього принципу є „зв'язки даних системи метаконтекстного обміну даними мають бути сформовані таким чином, щоб кількість явних контекстних перетворень була зведена до мінімально можливої. При цьому кількість неявних онтологічних зв'язків суттєво не впливає ні на якість роботи системи, ні на її складність”.

Введені поняття базової онтології, інтегрованої онтології, стійко асоційованої онтології, контекстуалізованої онтології, ключового і концептуального контекстів. Розроблено контекстно-онтологічні відношення між цими видами контекстів та онтологій в базі знань системи метаконтекстної взаємодії, на підставі яких запропоновано схему формування інтегрованої онтології як результату інтеграційного процесу у вигляді:

ІО=(БО1–(БО1уч.ас.+СО))*КонцК+(БО2–(БО2уч.ас.+СО))*КонцК+SКонцК,

де ІО-інтегрована онтологія, КонцК- концептуальний контекст, СО- стійко асоційована онтологія, БО-базова онтологія, БОуч.ас.-базова онтологія, складова частина СО.

У якості моделі представлення онтологічної структури для забезпечення пошуку на графі у даній роботі пропонується використати генетичну структуру, в яку легко конвертується онтограф. Генетична структура визначається простором онтооб'єктів О, простором представлень S, множиною представлень е: О®S, функцією мети L(oi) – найбільша довжина путі між відповідними об'єктами, фітнес-функція m, m: S®R, яка є характеристикою якості даних. При використанні такого підходу задача пошуку відповідного об'єкту може бути вирішена як

, (2)

де О*-найкращій об'єкт; f:O®R-цільова функція; L(oi)=m(s)=f(dk(s))- довжина путі між об'єктами, dk(s) – функція декодування s в О.

Розв'язання цієї задачі здійснюється пошуком в просторі S оптимального представлення s*

, (3)

де - характеристика якості даних онтологічного ланцюжка.

Досліджено допоміжні питання застосування генетичної теорії для формування генетичної структури онтографів. Розроблено теоретичні основи оцінки якості зв'язків інформаційної системи метаконтекстної взаємодії. Доведено необхідність застосування ієрархічного підходу до оцінки якості, що дозволяє розосередити оцінки по рівням інтеграції ( рис. 1).

Введено основні категорії (характеристична, контекстна та описуюча) та напрямки (повнота, зв'язність, нормалізація, контекстуалізації, відповідність представлень, нормалізація, своєчасність, функціональність, можливість інтерпретації) якості даних.

Розроблені у другому розділу теоретичні висновки є базою для створення методів метаконтекстного обміну даними.

Третій розділ дисертаційної роботи присвячений розробці методів метаконтекстного обміну даними, що базуються на теоретичних положеннях, які були розроблені у другому розділі. Цими методами є формування концептуальної онтологічної структури бази даних, контекстуалізація бази даних, генетичний пошук онтологічних ланцюжків взаємодії, чисельна оцінка показників якості зв'язків онтоструктури.

Рис. 1. Схема визначення якості даних

Концептуальна онтологічна структура агента взаємодії (бази даних) є абстрактна форма представлення предметної галузі як об'єктів та відношень між ними. Метод формування концептуальної онтологічної структури використовується для побудови первинних онтологічних графів та полягає в наступному. Для формування онтологічної структури визначається множина онтологій О, що тотожна множини таблиць агентів взаємодії. Оагента1 є {Т1}, Оагента2 є {Т2}, де - {Т1}, {Т2} – множини таблиць.

Здійснюється аналіз відношення множин онтологій об'єктів, якщо Оагента1”Оагента2, то формуються зв'язки відповідностей таблиць {Т1}®{Т2}. У цьому випадку має місце часткова чи повна Т-взаємодія. Формується граф G(V,E), де V = {{T1},{T2}}, а E = {Тсв1, Тсв2, Тзв.вз.}

Якщо зв'язки Т-взаємодії не знайдені, то можна вважати що {Т1}№абсолютно{Т2}, а онтології мають назву Т-несумісних. Частково Т-сумісні та Т-несумісні онтології аналізуються детальніше. Для кожної множини {Т} формується множина {А}, що описує атрибути об'єктів. Визначається відображення {А1i}®{A2i}. Робиться висновок про {A}-сумісність. У випадку її наявності будується граф G(V,E), де V = {А|Oаг1} + {А|Оаг2}, а E = {Асв|О1} + {Асв|О2} + {Азв.вз.}. Ребрам графу присвоюються чисельні значення якості. Якщо має місце повна Т-, А-несумісність, має бути проведена повна контекстуалізація (даних, і лише потім онтологій).

Контекстуалізація – є процес виявлення прихованих зв'язків а також аналіз явних, що було виявлено на попередньому етапі. Метою контекстуалізації є отримання онтоструктури, що виключає наявність конфліктного опису інформації та визначає семантику галузі найточніше. Конфлікти, що розглядаються на цьому етапі зведено у таблицю 1.

Таблиця 1

Конфлікти онтологічних структур

Тип конфлікту Характеристика

Конфлікти імен онтологій Виникають внаслідок синонімічного чи омонімічного описання онтологій.

Конфлікти зв'язків онтологій Виникають внаслідок часткового збігу наборів зв'язків аналогічних онтологічних об'єктів

Конфлікти узагальнення онтологій Виникають якщо онтології з деяким набором зв'язків одного агента реально відповідає сукупність онтологій другого агента взаємодії.

Концептуальний контекст онтології (для атрибута) ККО = {name, scale, type}, де name – ім'я об'єкту, scale – діапазон значень; type – тип даних. Концептуальний контекст таблиці ККО = {name, {name_attr}}, де name – ім'я об'єкту, name_attr – множина імен атрибутів даної таблиці.

Метод контекстуалізації передбачає присвоювання онтологічному об'єкту його концептуального контексту; дослідження ймовірності виникнення конфлікту; реструктуризація онтологічного графу у разі виявлення конфлікту.

Результатом є нормалізована онтологічна структура, на підставі якої здійснюється пошук ланцюжків взаємодії з використанням методу генетичного пошуку, який полягає у наступному.

Задача пошуку трактується як пошук такого онтологічного ланцюжка О1i ®O1i+n, що O1i+n є O2j+n, причому l(О1i®O1i+n) – довжина онтоланцюжка має бути максимально близькою до бажаної якості даних результату. Отримана таким чином довжина путі приймається як мінімально допустима для інтеграції даного об'єкту, при цьому

l(О2j+n®O2j) і l(О1i®O1i+n), (4)

де О2j+n є O1i+n, а O2j”О1i.

Генетичний пошук здійснюється за допомогою таких дій:

Ініціювання початкової популяції B(О1i)=(A1(О1i)…An(О1i)). Для кожної хромосоми Ai(О1i) обчислюється показник якості зв'язку m(Ai(О1i)).

Кожну хромосому перевіряємо на наявність гену, який встановлено в 1 та локус якого відповідає об'єкту, що має відповідність. Якщо такий ген виявлений, хромосома вважається кандидатом онтоланцюжка інтеграції, а її показник якості даних – потенційною якістю зв'язку взаємодії. Формуємо популяція кандидатів взаємодії.

B(О1i) піддаємо мутації, отримуємо популяцію Bў(О1i)=(A1ў(О1i)…Ai-1ў(О1i), Ai+1ў(О1i), … Anў(О1i)). Для популяції Bў(О1i) проводимо аналіз наявності гена взаємодії.

Повторяємо до тих пір, доки B(m)(О1i)№(0), або доки має значення проводити мутацію. Слід зазначити, що деяку хромосому можна включити в популяцію кандидатів лише у тому випадку, коли m(Ai+1(О1i))іm(Ai(О1i)), інакше вона просто виключається із розгляду.

З популяції Bк(О1i) вибираємо хромосому, для якої maxm(Ai(О1i)). Ген взаємодії, який є властивим для цієї хромосоми, визначає об'єкт O1i+n”О2j+n.

Визначаємо число мутацій Ni, необхідних для отримання ланцюжку О1i®O1i+n. У зв'язку з тим, що О1i®O1i+n”О2j+n®O2j, вважається, що кількість мутацій Nj Ј Ni+1. Формуємо популяцію B(О2j).

Робимо схрещення кандидату с кожною хромосомою B(О2j). Якщо схрещення приводе до з'явлення нащадку с набором генів, який відрізняється від батьківського тільки станом одного немаскованого локусу, причому m нащадку вище, ніж m(Aj(О2j)), вважаємо, що знайдено потенційне рішення.

Отриманий нащадок, який описує потенційне рішення і кандидата на схрещення декодуємо. Формуємо фрагмент онтологічної структури взаємодії, який описує онтологічний ланцюжок.

У роботі розроблено метод визначення відносних оцінок якості зв'язків онтоструктури, який полягає у визначенні якості даних деякого онтологічного об'єкту відносно якості даних конкретної галузі інтеграції. Розроблено формули оцінювання значень атрибутів (табл. 2).

Таблиця 2

Атрибутивні оцінки якості даних

Атрибут Формула

Точність ;

Повнота ;

Узгодженість ;

Однозначність

Впливовість

Кількісна оцінка атрибутів своєчасності и достовірності проводиться експертом на етапі підключення агентів до системи. Слід зазначити, що при застосуванні цих оцінок можливо спростити формули, якщо є впевненість в не впливовості деяких показників на процес інтеграції в цілому.

На підставі атрибутів обчислюються оцінки напрямків та категорій якості даних згідно схеми визначення якості даних (рис. 1).

У четвертому розділі розроблені алгоритми, які базуються на методах метаконтекстного обміну даними та визначення якості даних, розроблених у третьому розділі. Дані алгоритми, а також методи та моделі, запропоновані вище, сформували ядро інформаційної технології, яка є базою для побудови системи метаконтекстного обміну даними (СМКОД), узагальнена структура СМКОД представлена на рис. 2.

Рис.2. Структура системи МКОД

Ця система складається з п'яти підсистем: підсистеми маніпулювання даними, підсистеми перетворення та обробки контекстних знань, підсистеми обробки якості даних об'єктів, підсистеми перетворення та обробки онтологій та підсистеми формування онтологічних ланцюжків взаємодії.

У залежності від умов функціонування системи структура підсистем може бути змінена шляхом вилучення деяких блоків, що призначені, наприклад, для обробки динамічної інформації.

Діаграма потоків даних системи метаконтекстного обміну даними у нотації Чена представлена на рис. 3.

Рис. 3. Діаграма потоків даних

На діаграмі зображено зовнішні сутності: DS - джерело даних, DR  одержувач даних; Expert - експерт; процеси: 1 - визначення базової якості даних системи на підставі своєчасності и функціональності джерел даних, 2 - формування ключових контекстів с уточненням базового ЯД, 3 - формування концептуальних представлень; 4 - формування базової онтоструктури об'єктів, які інтегруються, 5 – формування робочих оцінок ЯД, 6 - формування концептуальних контекстів об'єктів, що інтегруються, с послідуючим уточненням робочих оцінок ЯД, 7 - формування контекстуалізованих онтологій; уточнення робочих оцінок ЯД, 8 - аналіз необхідності пошуку онтологічних ланцюжків взаємодії, 9 - формування генетичної структури онтологічних об'єктів, 10 – пошук зв'язків взаємодії, 11 - формування підсумкової оцінки якості даних системи та результату взаємодії, 12 - видача відповіді на запит; сховища даних: T - таблиці, A - атрибути, Q - запити, Qch - оцінки якості даних, links - ланцюжки взаємодії.

На підставі отриманих теоретичних результатів розроблено інтерактивний програмний комплекс інтеграції даних статистичного обліку, який призначено для забезпечення формування і обслуговування бази даних статистичних карт на підставі БД медичних карт. Основною метою застосування цього комплексу є забезпечення одночасного доступу до баз даних відділу медичної статистики, що було сформовано як розподілені джерела інформації. Також розроблено програмні комплекси „OntoSearch” та інформаційної підтримки ТП. Проведено дослідження ефективності інформаційних систем метаконтекстного обміну даних щодо вирішення проблеми інтеграції семантично та схематично різнорідних джерел даних.

У додатках наведено формули оцінки категоріальних показників якості, блок-схеми алгоритмів метаконтекстного обміну даними, архітектура комплексу „OntoSearch”, ієрархії екранних форм, акти впровадження.

ВИСНОВКИ

У дисертації наведене теоретичне узагальнення і нове вирішення наукової задачі, яка полягає в розробці ядра нової інформаційної технології метаконтекстного обміну даними в рамках інформаційного забезпечення ІУС. Розв'язання даної задачі полягає в застосуванні розроблених методів метаконтекстної взаємодії до онтологічних знань про джерела даних, що дозволяє автоматизувати процедуру визначення семантики інформації на підставі концептуальних структур, схем даних та інформаційного наповнення джерел даних, і як результат скасувати обмеження щодо інтеграції даних різних предметних галузей, обсягів даних, та підвисити якість результату інформаційної взаємодії. Ці результати мають важливе наукове і практичне значення для забезпечення коректної взаємодії семантично та схематично різнорідних баз даних автоматизованих систем обробки інформації та управління. У зв'язку з цим у дисертаційній роботі:

1. Проаналізовані сучасні підходи до забезпечення інтероперабельности джерел інформації, теоретично обґрунтовано доцільність удосконалення підходу контекстного обміну даними з метою підвищення ефективності взаємодії великих об'ємів різнорідних даних за рахунок контекстної обробки онтологічних знань.

2. Розроблено модель онтологічних знань у вигляді онтологічного графу, яка відповідає багаторівневій онтологічній структурі джерел даних, визначає взаємовідносини онтологічних об'єктів і їх властивості, враховує якість зв'язків між ними. Використання запропонованої моделі дозволило забезпечити повноту опису онтологічних галузей та їх семантичних і схематичних характеристик. Розроблено генетичну модель онтологічної структури, що дозволило здійснювати перехід від контекстуалізованої онтологічної структури до множини представлень об'єктів і як результат спростити пошук ланцюжків взаємодії шляхом конкретизації та звуження простору пошуку відображень об'єктів.

3. Розроблено нові принципи формування контекстно-онтологічних відношень в базі знань системи метаконтекстного обміну даними шляхом реструктуризації бази знань метаконтекстного з метою спрощення процедури визначення та розв'язування конфліктів. Це дозволило найбільш повно описувати властивості об'єктів онтологічної структури під впливом контекстів інформаційних джерел та розв'язувати семантичні і схематичні конфлікти даних з метою забезпечення взаємодії інформаційних масивів, які належать до суміжних та різних предметних галузей.

4. Розроблено методи метаконтекстної взаємодії: метод формування концептуальної онтологічної структури, який формує первинну багаторівневу онтологічну структуру; метод контекстуалізації онтологічної структури, який визначає наявність конфліктів даних шляхом аналізу явних та знаходження прихованих зв'язків онтоструктур і розв'язує їх; метод генетичного пошуку контекстно-значимих ланцюжків взаємодії, який здійснює вибір оптимального відображення об'єктів з множини можливих онтологічних ланцюжків; метод відносного оцінювання ієрархічних показників якості даних, який визначає критерій відповідності результату взаємодії до потреб користувача.

5. Розроблено ядро нової інформаційної технології метаконтекстного обміну даними, що дозволило розробити структуру системи МКОД.

6. Проведено дослідження ефективності інформаційних систем, які розроблено на підставі технології метаконтекстного обміну даними.

7. На основі інформаційної технології метаконтекстного обміну даними розроблено підсистему метаконтекстної інтеграції програмних комплексів інтеграції даних відділу медичної статистики (акт впровадження від 02.10.2001), корпоративної системи пошуку та інтеграції інформації в мережі Internet (акт впровадження від 12.09.2001) та комплексу інформаційної підтримки технологічного процесу (акт впровадження від 16.01.02).

СПИСОК ОПУБЛІКОВАНИХ АВТОРОМ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ

1. Бондаренко М.Ф., Дударь З.В., Белецкий Е.В., Байгозина О.Г. Структура системы контекстного обмена данными. // Проблемы бионики. –Х., 1999. –Вып.50.– С. 18-24.

2. Ворочек О.Г. О методах метаконтекстной интеграции крупномасштабных разнородных баз данных// Сборник научных трудов “Вестник национального технического университета “ХПИ”. -Вып.15- 2001. – С. 42-48.

3. Ворочек О.Г. Про застосування алгоритмів семантичної обробки інформації для побудови інтелектуальних інформаційних систем метаконтекстної взаємодії // Збірка наукових праць „Вісник Національного університету „Львівська політехніка” Сер. “Радіоелектроніка та телекомунікації”. Вип. 443-2002. – С. 175 – 179.

4. Байгозина О.Г. Онтологии и их использование во взаимодействующих информационных системах.// Информационные технологии: наука, техника, технология, образование, здоровье: Сборник научных трудов ХГПУ. Вып. 7.Ч. 1: - ХГПУ, 1999. – С. 12-14.

5. Байгозина О.Г. О модели процесса интеграции крупномасштабных гетерогенных баз данных в системах поддерживающих контекстный обмен данными.// 2 научно-методическая конференция “Использование компьютерных технологий в учебном процессе”.Научн. труды – ХТУРЭ, Харьков, 1998. - С.55-59.

6. Vorochek O.G. About using of the Information's Semantic Prosessing Algorithms for the Metacontext Interactions' Intellectual Information Systems Desighning// Тез. доп. Міжнародної науково-технічної конференції „Сучасні проблеми радіоелектроніки, телекомунікацій та комп'ютерної інженерії” TCSET'2002. – 2002. – С.176-177.

7. Baygozina O.G. “Using ontology in the context mediator system”// 6-я Международная конференция “Теория и техника передачи, приема и обработки информации” (“Новые информационные технологии”): Сб. научных трудов. – Харьков: ХТУРЭ, 2000. - С. 20-21.

АНОТАЦІЯ

Ворочек О.Г. Методи та моделі метаконтекстного обміну даними в інформаційних системах. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 - автоматизовані системи управління та прогресивні інформаційні технології - Харківський національний університет радіоелектроніки, Харків, 2002.

Дисертація присвячена питанням розробки інформаційної технології метаконтекстного обміну даними. В роботі вперше введено поняття онтологічного графу як засобу моделювання знань системи метаконтекстної взаємодії. Розроблено відносний метод оцінки якості даних системи, що базується на ієрархічному підході оцінювання якості даних, та значно спрощує чисельну оцінку показників. Розроблено методи та алгоритми метаконтекстного обміну даними: формування концептуальної онтологічної структури бази даних, контекстуалізація бази даних, генетичний пошук онтологічних ланцюжків взаємодії. Розроблено нову інформаційну технологію, що базується на методах та алгоритмах метаконтекстного обміну даними. Розроблено підсистему метаконтекстної інтеграції програмних комплексів інтеграції статистичних даних, що впроваджено у Другій психіатричній лікарні Сумського УОЗ, „OntoSearch” пошуку та інтеграції інформації в мережі Internet, що впроваджено у ТОВ „Белый Город - ПРОФИ”, комплексу інформаційної підтримки технологічного процесу, який застосовано на ДП „Завод ім.Малишева”.. Проведено дослідження ефективності застосування систем метаконтекстної взаємодії.

Ключові слова: різнорідні бази даних, метаконтекстний обмін даними, онтологічний граф, концептуалізація, контекстуалізація, генетичний пошук, якість даних, онтологія.

АННОТАЦИЯ

Ворочек О.Г. Методы и модели метаконтекстного обмена данными в информационных системах. – Рукопись.

Диссертация на соискание научной степени кандидата технических наук по специальности 05.13.06 – автоматизированные системы управления и прогрессивные информационные технологии – Харьковский национальный университет радиоэлектроники, Харьков 2002г.

Диссертация посвящена вопросам разработки информационной технологии метаконтекстного обмена данными. Направление исследований данной работы – развитие теории создания онтологии и контекста, позволяющих обрабатывать крупномасштабные разнородные базы данных как простой однородный источник информации на основании их онтологических и контекстных спецификаций. В работе исследованы подходы к интеграции разнородных источников информации, в частности, подход с сильной связью, слабой связью и контекстный обмен данными. Сделан вывод о необходимости усовершенствования подхода контекстного взаимодействия интеграции данных. Предложена технология метаконтекстного обмена данными, осуществляющая интеграцию онтологических знаний системы. Исследуются теоретические основы построения систем метаконтекстного обмена данными. В работе впервые введено понятие онтологического графа как средства моделирования знаний системы метаконтекстного взаимодействия. Разработаны новые принципы формирования контекстно-онтологических отношений в базе знаний системы метаконтекстного обмена данными, позволяющие наиболее точно описывать объекты онтологической структуры, а следовательно, упрощающие процедуру взаимодействия. Предложен генетический аппарат для описания онтологической структуры и принцип его использования для нахождения адекватных соответствий интегрируемых объектов. Разработан относительный метод оценки качества данных системы, который основывается на иерархическом подходе оценивания качества данных, значительно упрощающем численную оценку показателей. Введены понятия атрибутов, направлений и категорий качества данных системы метаконтекстного обмена данными. Разработаны методы метаконтекстного обмена данными: формирование концептуальной онтологической структуры базы данных, контекстуализации, генетического поиска онтологических цепочек взаимодействия.

Разработано ядро новой информационной технологии, базирующейся на методах и алгоритмах метаконтекстного обмена данными. Предложены алгоритмы: первичной интеграции источников данных, контекстуализации онтологической структуры, алгоритм генетического поиска контекстно-значимых онтологических цепочек, вспомогательный алгоритм оценки КД объектов интеграции. Предложена структура системы МКОД, включающая подсистемы манипулирования данными, преобразования и обработки контекстных знаний, обработки КД объектов, преобразования и обработки онтологий, формирования онтоцепочек взаимодействия.

На основании предложенной технологии разработана подсистема метаконтекстной интеграции программных комплексов интеграции данных по пациентам, внедренного во 2-й психиатрической больнице Сумского УОЗ, и “OntoSearch” поиска и интеграции информации в сети Интернет, внедренного в ООО “Белый город - ПРОФИ”, и комплекса информационной поддержки технологического процесса, внедренного на ГП „Завод им. Малышева” Проведено исследование эффективности использования систем метаконтекстного взаимодействия.

Ключевые слова: разнородные базы данных, метаконтекстный обмен данными, онтологический граф, генетический поиск, концептуализация, контекстуализация, качество данных, онтология.

ABSTRACT

Vorochek O.G. Metacontext Data Exchange's Methods and Models in the Information Systems. - Manuscript.

Thesis for a scientific degree of Cand.Tech.Sci. on a specialty 05.13.06 - the Automated Control Systems and Progressive Information Technologies - the Kharkov National University of Radioelectronics, Kharkiv 2002.

The thesis is devoted to development of metacontext data exchange information technology. Ontological graph as means of knowledge model for metacontext interactions system is introduced for the first time. The relative method of a rating of system data quality which is based on the hierarchical approach to qualities of the data, thus considerably simplifying a numerical rating of parameters is developed. Methods and algorithms for metacontext data exchange are developed: formation of conceptual ontological structure of a database, contextualization, genetic search of ontological chains of interaction. The new information technology which is based on metacontext data exchange methods and algorithms is developed. The subsystem of metacontext integration for program complexes for statistical data integration, is implemented in the Second psychiatric hospital Sumy DHP, and "OntoSearch" (search and integration of the information in a the Internet), is implemented in "Beliy Gorod - PROFI" Company is developed. Research of metacontext interactions systems using efficiency is done.

Keywords: heterogeneous databases, metacontext data exchange, ontological graph, genetic search, conceptualization, contextualization, data quality, ontology.

Підписано до друку 14.05.2002

Формат 60х84 1/16 Папір друк. офсетний

Умов.друк.арк. 1,2 Облік.вид.арк 1,0

Зам. № 2-521. Тираж 100 прим. Ціна договірна.

Надруковано в учбово-виробничому видавнично-поліграфічному центрі Харківського національного університету радіоелектроніки.

Україна, 61166, м.Харків, пр.Леніна, 14