Автореферат ДОСЛІДЖЕННЯ ІНФОРМАЦІЙНИХ ІНФРАСТРУКТУР ПІДГОТОВКИ ДАНИХ ДЛЯ ПРИЙНЯТТЯ РІШЕНЬ

Автореферат - ДОСЛІДЖЕННЯ ІНФОРМАЦІЙНИХ ІНФРАСТРУКТУР ПІДГОТОВКИ ДАНИХ ДЛЯ ПРИЙНЯТТЯ РІШЕНЬ

Загрузка...

НАЦІОНАЛЬНА АКАДЕМІЯ НАУК УКРАЇНИ

ІНСТИТУТ ПРОБЛЕМ МОДЕЛЮВАННЯ В ЕНЕРГЕТИЦІ ІМ. Г.Є. ПУХОВА

Храмова Ірина Олександрівна

УДК 004.622

ДОСЛІДЖЕННЯ ІНФОРМАЦІЙНИХ ІНФРАСТРУКТУР ПІДГОТОВКИ ДАНИХ ДЛЯ ПРИЙНЯТТЯ РІШЕНЬ

05.13.06 - автоматизовані системи управління та прогресивні інформаційні технології

Автореферат дисертації на здобуття наукового ступеня кандидата технічних наук

Київ — 2007

Дисертацією є рукопис.

Робота виконана в Інституті проблем реєстрації інформації НАН України.

Науковий керівник | доктор технічних наук, професор,

Заслужений діяч науки і техніки України,

Матов Олександр Якович

Офіційні опоненти: | доктор технічних наук, професор Мохор Володимир Володимирович, завідувач кафедри Інституту спеціального зв’язку та захисту інформації Національного технічного університету України "Київський політехнічний інститут";

кандидат технічних наук, старший науковий співробітник Костенко Леонід Йосипович, керівник Центру бібліотечно-інформаційних технологій Національної бібліотеки України ім. В.І.Вернадського, м.Київ.

Провідна установа | Інститут космічних досліджень НАН України та Національного космічного агентства України,

м. Київ.

Захист відбудеться “ 21 ” червня 2007 р. о 12 годині на засіданні
спеціалізованої вченої ради Д 26.185.01 Інституту проблем моделювання в енергетиці
ім. Г.Є.Пухова НАН України за адресою: 03164, м. Київ, вул. Генерала Наумова, 15.

З дисертацією можна ознайомитись у бібліотеці Інституту проблем моделювання в енергетиці ім. Г.Є.Пухова НАН України за адресою: 03164, м. Київ, вул. Генерала Наумова, 15.

Автореферат розісланий “ 17 ” травня 2007 р.

Вчений секретар спеціалізованої вченої ради Д 26.185.01, канд. техн. наук |

Семагіна Е.П.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Вступ.

Особливої складності організаційне управління набуває під час вирішення складних проблем у горизонтальних міжорганізаційних (міжвідомчих) структурах, коли вимоги взаємної координації цілей, діяльності та ресурсів потребують актуалізованої й достовірної інформаційної підтримки в реальному часі. Подібні організаційні структури існують у таких складних предметних областях як: попередження та ліквідація наслідків надзвичайних ситуацій, загальнонаціональні та міжнаціональні ринки ресурсів (енергетика, сільське господарство, фінанси), управління розробкою складних високотехнологічних об’єктів і т. ін.

Протягом останнього десятиріччя з’явилося достатньо нових категорій систем підтримки прийняття рішень (СППР), які стали можливими завдяки новим технологіям, на зразок сховищ даних (CД), та Інтернету. Впровадження відкритих сервіс-орієнтованих архітектур, як відбиття переходу складних організаційних структур до процесного підходу в організаційному управлінні, вже створило і надалі сприятиме створенню багатьох нових типів міжорганізаційних зв’язків між інформаційними системами та виникненню нових типів інформаційних процесів, що мають перейти до сфери напівавтоматичного та автоматичного управління.

Актуальність теми.

У будь-якій організаційній структурі дані, що визначають поточний стан об’єктів управління, мають бути визначені, зібрані, перетворені, використані, підсумовані, та надані у певному вигляді для найдальшого використання. Цінність таких даних залежна від кількості інформаційних ресурсів (ІР), які були вжиті для їх визначення, збору, і використання. З позиції використання даних у процесах прийняття рішень в організаційному управлінні, чим вищий рівень управління, на якому вони застосовуються, тим більшою є частка “інтелектуальної” складової, і тим складнішими технологіями підготовки даних повинна бути оснащена СППР. Наслідком проектування корпоративних СД за принципом передбачення всіх можливих запитів користувачів стала надмірна кількість зайвої інформації, яка часом поглинає ефективне рішення. З’явилася необхідність вирішити разом із завданням задовольняння нагальних інформаційних потреб користувачів такі питання, як фільтрація непотрібних первинних даних ще на стадії їх завантаження в систему та виключення з обігу тих інформаційних процесів між окремими системами, що генерують надлишкову інформацію, яка не використовується під час прийняття рішень. Отже, стало потрібним налаштування інформаційного середовища загального використання на актуальну специфіку кола діяльності конкретної організаційної структури. Це вимагає концептуального визначення складу інформації загального використання, необхідної для прийняття рішень та відомостей про її розміщення в середовищі наявних ІР. Але не менш важливим є визначення додаткових інформаційних структур і процесів, необхідних для взаємного узгодження спільної інформації, яка походить зі слабозв’язаних інформаційних джерел, що мають роздільне управління.

З появою нових типів організації обчислень у глобально розподіленому середовищі (SOA, GRID) виникла нагальна потреба у розробці адекватних математичних моделей, що дозволять вивчати, а надалі аналізувати, прогнозувати та адаптувати до вимог основні характеристики інформаційно-обчислювальних процесів таких динамічно змінюваних середовищ в режимі реального часу.

Все це обумовило необхідність дослідження інформаційної інфраструктури підготовки даних в корпоративних СППР як на концептуальному, так і на технологічному рівні. Наразі різні аспекти цих питань розглядаються та досліджуються значним колом фахівців. Проте велика частина питань все ще залишається поза увагою або розвинута у недостатньо повному обсязі.

Зважуючи на викладене, дослідження процесів та методів побудови інформаційних інфраструктур (ІнІ) підготовки даних з різнорідних за ступенем структурованості та типом даних автономних ІР у сервіс-орієнтованому розподіленому середовищі, а також розробка математичних моделей аналізу режимів функціонування операційних компонентів для таких інфраструктур є актуальною та має теоретичне й практичне значення для якісного розвитку підтримки процесів прийняття рішень інформаційними системами в державному та корпоративному організаційному управлінні.

Зв’язок з науковими програмами, планами, темами.

Дослідження виконувались відповідно до планів науково-дослідних робіт Інституту проблем реєстрації інформації НАН України у відділі проблемно-орієнтованих обчислювальних систем в рамках держбюджетних тем:“

Дослідження та розробка методів і технологій побудови корпоративних інформаційних систем” (Державний реєстраційний номер 0100U000244);“

Дослідження, розробка і моделювання основних процесів життєвого циклу інформаційних систем, орієнтованих на підтримку прийняття рішень” (Державний реєстраційний номер 0101U000832);“

Розвиток теорії живучості комп’ютерних систем і методологічних основ розробки захищених інформаційних технологій для систем підтримки прийняття рішень” (Державний реєстраційний номер 0102U003589).

Мета і задачі дослідження.

Метою дисертаційної роботи є розробка інформаційних структур та процесів управління інтеграцією неоднорідних за типом та ступенем структурованості інформаційних сховищ для підтримки процесів прийняття рішень у міжвідомчих організаційних структурах. Досягнення мети забезпечувалось постановкою та вирішенням наступних задач:

· дослідження способів побудови ІнІ, сучасних інформаційних технологій та їх застосування при створенні корпоративної ІнІ підтримки прийняття рішень;

· дослідження об’єктів та функцій управління корпоративної ІнІ підтримки прийняття рішень;

· створення інформаційної і функціональної структур управління ситуативним поєднанням ІР різних інформаційних систем у корпоративну ІнІ підтримки прийняття рішень на базі узагальнення сучасних технологічних підходів;

· розробка концепції і високорівневих специфікацій інформаційної структури та програмних засобів управління семантичним узгодженням у корпоративній ІнІ підтримки прийняття рішень;

· розробка моделі для дослідження та аналізу способів організації обчислювальних процесів в операційних вузлах корпоративної ІнІ підтримки прийняття рішень.

Об’єктом дослідження є інформаційні структури та процеси підготовки даних для підтримки прийняття рішень в корпоративних та міжвідомчих організаційних структурах.

Предметом дослідження є технології створення інформаційних структур та процесів, що призначені для інтеграції ІР функціонально різнорідних інформаційних систем під час підготовки інформації для прийняття рішень.

Методами дослідження є системний аналіз, методи синтезу інформаційних структур та процесів управління, аналітичне моделювання режимів функціонування інформаційних систем підготовки інформації для прийняття рішень у корпоративних та міжвідомчих організаційних структурах.

Наукова новизна отриманих результатів

В результаті проведеного дослідження отримані такі нові положення та результати:

1) встановлені наступні положення:

· необхідною умовою створення корпоративної ІнІ СППР є структурування та стандартизація кола понять проблеми в термінах стандартизованих понять предметних областей;

· існуючі інформаційні структури зберігання метаданих ІР вимагають розширення шляхом включення додаткового інформаційного компонента, в якому б утримувались семантичні метадані всіх наявних моделей даних та процесів (послуг) пошуку знань;

· традиційна архітектура СППР розширюється до корпоративної шляхом додавання проміжної інформаційно-обчислювальної структури, що відповідає за збір, аналіз, узгодження та управління семантичними метаданими задіяних ІР;

2) Розроблено інформаційну структуру метамоделі для динамічно створюваних конфігурацій ІР корпоративних СППР з урахуванням розподіленого характеру формування, збереження та управління метаданими цих ІР.

3) Сформульовано функціональні задачі, що охоплюють всі аспекти динамічного формування узагальненої корпоративної системи семантичних метаданих.

4) Обґрунтовано доцільність використання єдиної семантичної моделі корпоративної ІнІ для управління системою розподілених семантичних метаданих; визначено процеси управління такою моделлю.

5) Розроблено математичні моделі способів організації обчислювальних процесів операційних вузлів ІнІ корпоративної СППР, та запропоновано модель процесу формування базових інформаційних структур для сервіс-орієнтованих моделей обчислень.

Практичне значення отриманих результатів.

Теоретична значимість дисертаційної роботи полягає в створенні наукових засад структурування динамічно створюваних інформаційних середовищ підтримки процесів прийняття рішень в складних міжорганізаційних структурах та вивчення характеристик функціонування операційних вузлів таких середовищ.

Практична цінність дослідження полягає в розробці інформаційної технології підготовки та отримання спеціальної інформації, яка містить впорядковані семантично узгоджені актуальні відомості про наявне інформаційне середовище підтримки процесу прийняття рішень.

Реалізація результатів дисертації.

Теоретичні та практичні результати були використані: при розробці репозиторія веб-орієнтованої корпоративної системи управління версіями проектів спеціалізованого програмного забезпечення; при створенні інформаційного сховища електронних документів у складі інформаційно-аналітичної системи Рахункової палати України; при створенні дослідного зразка підсистеми підтримки прийняття рішень під час планування та контролю заходів з попередження та ліквідації наслідків надзвичайних ситуацій для Урядової інформаційно-аналітичної системи з надзвичайних ситуацій України.

Особистий внесок здобувача.

Особисто автором були виконані: аналіз проблеми, всі постановки завдань, обґрунтування та розробка підходів до їх розв’язання. Наукові результати, наведені в дисертації, одержані здобувачем особисто в частині визначення проблем, постановки задач, вибору методів дослідження, апарату моделювання компонентів ІнІ, концепції реалізації та розробки дослідних зразків запропонованих підходів до побудови корпоративної ІнІ СППР з децентралізованим управлінням її компонентами або при його безпосередній участі в частині інтерпретації та виведення моделей, отримання практичних результатів та висновків. В роботах у співавторстві, опублікованих по матеріалах дисертації, здобувачу належить: в роботах [], [], [] надано опис розроблених безпосередньо автором концепцій ключових інформаційних компонентів, алгоритмів та програм вводу, очистки, перетворення та управління даними інформаційних структур корпоративних систем в сфері управління проектами надскладних систем, управління людськими та технічними мобілізаційними ресурсами, створення та управління документальною базою знань в державних установах відповідно; в роботах [], [], [], [], [], [] автору належать аналіз проблеми, постановки завдань, концепція отримання ефективних рішень окреслених проблем, вибір та інтерпретація наданих моделей.

Апробація результатів дисертації.

Основні положення проведених досліджень обговорено на 4 міжнародній науково-практичній конференції “Функціонування і розвиток ринків електроенергії та газу”, м. Партеніт (АР Крим, Україна), червень 2006 р., 2 міжнародній науково-практичній конференції “Технології інформаційного суспільства” м. Партеніт (АР Крим, Україна), червень 2006 р., 5 науково-практичній конференції “Інформаційні технології в енергетиці” м. Партеніт (АР Крим, Україна), жовтень 2006 р., а також на робочих семінарах відділу проблемно-орієнтованих інформаційно-обчислювальних систем ІПРІ НАН України 2004-2006 рр.

Публікації.

Автор має 31 наукову публікацію, за матеріалами дисертації у фахових виданнях опубліковано 8 наукових робіт, з них 1 монографія.

Обсяг і структура дисертаційної роботи.

Дисертаційна робота складається з вступу, чотирьох розділів, висновків та додатку. Основна частина складає 148 сторінок друкованого тексту з 23 рисунками, 4 таблицями, списком використаних джерел з 69 найменувань та додатку.

В першому розділі СППР розглядається як сукупність двох взаємозалежних, але функціонально розрізнених частин: інструментарію підготовки даних для прийняття рішень та інструментарію вироблення рекомендацій для особи, що приймає рішення. Така точка зору робить наочним те, що для класу інформаційних систем, який досліджується в роботі, саме перший з інструментаріїв функціонує у середовищі, яке окрім таких відомих властивостей корпоративних систем як багатопредметна орієнтація, розподілений відкритий характер архітектури має також ряд специфічних властивостей, обумовлених колективним характером процедури прийняття рішень. Це - несталий характер організаційної структури колективного суб’єкту управління; численність та різнорідність ІР, кількість яких змінюється; високий рівень автономності окремо взятого ІР; нечисленні метадані, що характеризують зміст окремо взятого ІР; значний ступінь семантичної неузгодженості подібних даних в ІР різного адміністративного підпорядкування. Згадані властивості викликають значні утруднення в інтеграції інформації з різних ІР. Для корпоративних інформаційних середовищ сталих організаційних структур вертикального типу ці складнощі переважно відсутні або порівняно легко вирішуються за допомогою організаційно-технологічних підходів, що базуються на злитті даних.

Застосування згаданих підходів для побудови ІнІ, де переважають інформаційні зв’язки горизонтального типу, в більшості випадків є неефективним. По-перше, з причини значних вартості і тривалості проекту, в той час як сама ІнІ часто потрібна лише на обмежений період часу, доки не буде розв’язана відповідна проблема. По-друге, з причин запобігливо закладеної надмірності інформаційного простору спільної діяльності і, як наслідок, неминучої складності узгодження при внесенні будь-яких змін в структуру та/або номенклатуру задіяних ІР та здійснення істотних переробок ІнІ.

Інший підхід - федерація ІР (віртуальне об’єднання даних) - позбавлений більшості з наведених недоліків, але також не може застосовуватись без застережень. Проведений аналіз особливостей застосування організаційно-технологічних та федеративного підходів для створення ІнІ досліджуваного типу дозволив розробити комбінований підхід, що поєднав в собі здатність адаптуватися до змін у складі доступних ІР, притаманну федеративному підходу, та можливість задовольнити вимоги до зниження складності ІнІ та питомої ваги непродуктивних інформаційних процесів.

Запропонований підхід полягає у наступному: 1) посиленні інформаційного наповнення взаємодіючих ІС в частині метаданих додатковою семантичною складовою, що визначає систему понять, використану під час створення ІР, аналітичних моделей тощо; 2) застосуванні технологій віртуалізації корпоративної ІнІ; 3) обмеженні кола інформаційних структур, що підлягають інтеграції, виключно тими, що несуть метадані (в тому числі семантичні) задіяних ІР (рис. 1).

Рис. 1. Створення ІнІ корпоратитвної СППР шляхом об’єднання метаданих ІР. | Стандартними інформаційними структурами, що зберігають метадані ІР, є репозиторії і реєстри. Критичним компонентом при цьому стають заходи і засоби семантичного узгодження запитів, даних, та метаданих ІР різних інформаційних систем. Показано, що вимоги до корпоративної ІнІ СППР в частині побудови репозиторія ІР, істотно відрізняються від традиційних: а) він повинен будуватися на сталих проектних принципах і бути спрямованим на дослідження корисності або ступеню використання компонентів у спільному середовищі; б) структура складається з одного або кількох традиційних репозиторіїв, та процесів і застосувань; в) до звичайної функціональності диспетчерського типу додаються такі функції, як механізм стандартизації предметної області, управління словниками, утворення нових понять предметної області, механізм обмежень щодо застосування поняття або поєднання понять між собою; необхідно забезпечити гнучкий механізм встановлення відповідностей і технологічної сумісності.

Архітектура та властивості інформаційних компонентів ІС, що входять до ІнІ, можуть бути ефективно використані за умови введення в структуру ІнІ узагальненої інформаційної моделі у вигляді онтології загального використання (ОЗВ), що складається зі: словника понять, який використовується для опису характеристик об’єктів, та процесів, що мають відношення до цієї системи; визначень всіх понять цього словника, що не допускають багатозначного тлумачення; класифікації логічних зв’язків між цими поняттями. З них складається динамічне середовище в якому створюються метадані корпоративної СППР і яке дозволяє визначити необхідні локальні стандарти корпоративних словників та схем даних, що нададуть можливість автоматичної організації корпоративних інформаційних процесів у сервіс-орієнтованому середовищі. Життєвий цикл загальної інформаційної моделі складається з таких основних процесів: збір вимог; збір метаданих; розробка ОЗВ; відбиття схем даних на ОЗВ; публікація/розгортання ОЗВ; використання ОЗВ. Застосування розробленого підходу до створення корпоративних ІнІ підготовки даних для прийняття рішень дозволяє досягти:

· зменшення витрат на досягнення семантичної інтероперабельності складових ІР (часу, фінансів, праці);

· вирішення специфічних задач управління різнорідними ІР (забезпечення можливостей розшуку задовільних за контекстом та рівнем якості даних ІР, пошуку і запиту даних по різнорідних ІР; дотримання правил, обмежень цілісності, угод про іменування; відстеження походження даних; забезпечення доступності, відновлення і контроль доступу за контекстом; керований розвиток спільних даних і метаданих);

· вирішення задачі зменшення питомої ваги непродуктивних обчислювальних процесів (значне зменшення кількості ІР, що скануються за кожним запитом; зменшення питомої ваги “інформаційного шуму” в вихідних даних, що підлягають фільтрації та очищенню).

Кількісно ефективність ІнІ може бути оцінена показниками ефективності, що базуються на оцінці середнього чи максимального часу перебування (затримки щодо припустимих термінів) завдань на формування у середовищі наявних ІР ІнІ базової інформаційної структури, потрібної для підтримки певного процесу прийняття рішень або забезпечення відповідних аналітичних програмних додатків.

Один з ряду наведених в роботі показників ефективності обчислюється за таким принципом: |

() | де - штраф за одиницю часу перебування завдання i-го типу у системі і його втрату внаслідок перевищення допустимого директивного часу TДi; - інтенсивність i-го потоку завдань; – середнє значення відносної затримки завдань i-го типу у системі; - час перебування завдання i-го типу у системі; - допустимий час перебування завдання i-го типу в системі, при якій його цінність не знижується; - час, після закінчення якого завдання i-го типу цілком знецінюється; - кількість завдань i-го типу, що надійшли у систему за час T.

В основі показника ефективності лежить припущення про те, що цінність результату виконання завдання, що надійшло до системи, до деякого директивного часу залишається постійною, а з моменту його перевищення з часом лінійно знижується до повного знецінювання в момент часу .

В роботі розроблено модель для дослідження характеристик процесу підготовки в ІнІ базових інформаційних структур, який є найбільш “важким” для прогнозування. В основі цього процесу лежить сукупність C сценаріїв формування. Окремий сценарій визначається множиною M джерел (ІР) постачання інформації, кожен з яких характеризується множиною запитів на витяг або перетворення інформації Qm, що мають бути виконаними операційним вузлом . Тривалість виконання запитів сценарію vc є залежною від логіки послідовності виконання, продуктивності серверів (операційних вузлів) відповідних додатків (файл-серверів, серверів БД, серверів веб-послуг) та способу організації в них обчислювального процесу. За основу взято сітьову модель, яка дозволяє відбивати як послідовність виконання запитів сценарію, так і задавати середні тривалості процесів, пов’язаних із витягом та перетворенням інформації. Сітьова модель дозволяє також проводити імітаційне моделювання впливу різних способів організації обчислювального процесу в окремому операційному вузлі на основний показник - час виконання сценарію (пакету завдань), в тому числі, при наявності відмов, які мають місце у операційних середовищах розподілених обчислювальних архітектур. Тоді,

, | ()

де - середній очікуваний час виконання запиту qi операційним вузлом m, з урахуванням впливу потоку відмов, значення якого обчислюється в залежності від способу організації обчислень у операційному вузлі за одним з отриманих у роботі кінцевих співвідношень щодо середнього часу перебування заявки у вузлі; qi - елементи можливих послідовностей виконання запитів; q – логічна послідовність виконання запитів в одному сценарії.

Маючи на увазі, що одним з чинників якості інформаційної послуги ІнІ є час отримання результату, умовою прийнятності результату роботи сценарію формування базової інформаційної структури є завершення сценарію протягом часу, який не перевищує часу прийнятності інформаційних послуг у підмножині послуг СППР (тут L - множина послуг, що залежні від отриманих результатів, S - множина інформаційних послуг, що надаються ІнІ). Тоді:

. | ()

Отже, оцінюючи ефективність ІнІ як функцію часу надання нею деякої інформаційної послуги, можна отримати обмеження та , що застосовуються у обраних загальних показниках ефективності процесу функціонування ІнІ СППР.

В другому розділі розглянуті сучасні технології інтелектуального аналізу даних та розкриття знань (ІАД) як складові процесу підготовки даних для прийняття рішень.

Ключовою потребою при прийнятті рішень в організаційному управлінні є не стільки дані, скільки знання. Важливу роль в виявленні нового знання в даних організаційних систем відіграють методи ІАД. В роботі показано, що вирішення завдання побудови ІнІ має декілька важливих процесів, у технології яких також вживаються засоби ІАД ():

Показано, що в залежності від типу даних (структурованих, текстових, мультимедіа, веб-даних, інші), визначилася своя група задач аналізу, які використовуються для підвищення рівня структурованості даних та надання їм необхідних для сумісного використання семантичних ознак. Визначено типові задачі аналізу, для рішення яких використовуються переважно методи розкриття даних (розкриття текстів): класифікації; прогнозування; кластеризації; знаходження виключень; асоціювання або аналіз споживчого кошика. Визначено перелік задач аналізу відповідно до типу даних.

Таблиця

Процес | Технології

Ідентифікація даних | розпізнавання формату даних

Семантичний аналіз та категоризація | створення семантичних метаданих; генерація таксономій; управління конвентом; каталогізація; індексація

Перетворення та інтеграція | нормалізація; створення багаторівневих каталогів; перетворення до форматів БД (XML, об’єктні, реляційні)

Обробка запитів, формування надання, інше використання | повнотекстовий пошук; нечіткий пошук; розкриття даних; розкриття текстів; розпізнавання шаблонів.

До найбільш поширених задач аналізу текстів відносяться: побудова семантичної сітки; побудова тематичної структури текстів; реферування текстів; гіпертекстова розмітка текстів; понятійний пошук інформації. В інтелектуальному аналізі веб-даних відокремилися два напрямки: аналіз контенту веб-ресурсів та аналіз поведінки відвідувачів веб-ресурсів. Функціональність процесу пошуку інформації розширюється за рахунок інтелектуального пошуку, фільтрування інформації (категоризації), персоналізації контенту.

В роботі визначено місце процесів вирішення задач класифікації, кластеризації, інтелектуального пошуку та персоналізації контенту для побудови та утримання в актуальному стані корпоративної ІнІ підтримки прийняття рішень (рис. 2).

Рис. 2. Структура взаємодії компонентів ІАД в ІнІ СППР

Проведений аналіз функціональності наявних програмних засобів ІАД з одного боку, та рівня зрілості сучасних технологій розподілених обчислень дозволяє стверджувати про наявність сприятливих передумов для побудови самостійних застосувань ІАД у вигляді веб-сервісів, здатних до поєднання у складних сценаріях пошуку нових знань у гетерогенному інформаційному середовищі.

Базовими поняттями сучасного архітектурного підходу до побудови ІнІ постають сервіс–орієнтована модель обчислень та проміжний рівень архітектури обчислень, для яких розглянуті напівавтоматичний та автоматичний режими вирішення задач управління ІнІ. Необхідним компонентом тут є корпоративна семантична модель, яка уможливлює створення механізму, що трансформуватиме поняття предметної області у виклики механізмів доступу до ІР. Для застосування різних підходів бажано, щоб цей механізм був єдиним для всіх застосувань аналізу.

Третій розділ дисертаційної роботи присвячено розробці інформаційних технологій управління ІнІ підготовки даних для прийняття рішень.

Корпоративна ІнІ інформаційної підтримки прийняття рішень концептуально може бути надана сукупністю 3 шарів: апаратних засобів обчислювальних машин та мереж передачі даних, на яких, власне, й виконується завдання користувача; інформаційних БД, до яких звертатимуться апаратні засоби та системи для операцій над даними; метаданих корпоративних ресурсів, де високорівневі аналітичні додатки мають вишукувати метадані для формального опису проблемної області та підтримувати процеси семантичного узгодження понять та отримання знань, що надалі ляжуть в основу процесів прийняття рішень.

В розподіленому середовищі, де системи, які генерують дані, просторово відділені від систем, що здійснюють категоризацію (розпізнавання) та каталогізацію чи використання даних, повинні виконуватись наступні вимоги для управління даними: автоматичне породження хоча б мінімальних метаданих; автоматична каталогізація даних і метаданих негайно після отримання даних (чи наскільки є можливим близько до реального часу); прозоре управління зовнішніми системами збереження, де є архівованими вихідні (первинні) дані; механізми організації кооперативних обчислень, шляхом надання зазначеним локальним і віддаленим користувачам як негайного, так і довгострокового доступу до метаданих; включення метаданих в інші бази даних чи документи.

Можливість виконувати широкомасштабне розподілення динамічної за складом сукупності ІР (аналітичні додатки, бази даних, СД) з використанням суттєво нових програмних компонентів, орієнтованих на швидкісні обчислення, є головною рисою корпоративної ІнІ. Це висуває в якості кандидата для застосування новий клас обчислювальних моделей (SOA, GRID), що здатні розв’язати висунуті вимоги. Проте повинні бути вивченими додаткові питання: обліку поточного стану ресурсів (можливостей та ступеню завантаженості); організації процесів управління ресурсами та завданнями; забезпечення інформації про те, яким чином завдання повинні передавати дані та як вони можуть отримати доступ до розподілених пристроїв збереження інформації; доставки результатів виконаних завдань; розшуку семантично адекватних запиту ІР у динамічно змінюваному операційному оточенні і т.ін. Необхідна для цього інформація розміщується і підтримується у спеціалізованій інформаційній структурі управління метаданими корпоративної ІнІ. Запорукою сервіс-орієнтованих обчислень є програмне забезпечення, що здатне організувати та інтегрувати роздрібнені несумісні обчислювальні потужності у єдине ціле, автоматично підтримуючи ті зв’язки, що потрібні для створення з різнорідних ІР прозорого персонального “механізму”, необхідного і достатнього для виконання нагального завдання, а також надання користувачеві або порталу безпечного доступу до цього “механізму”.

Центральним елементом у взаємодії трьох ключових взаємодіючих сутностей СППР - користувачів, даних та аналітичних додатків - є систематизовані метадані, що описують ці сутності та роблять можливою автоматичну їх взаємодію. Структурно метадані розділяються на розділи, кожний з яких описує специфічний аспект ресурсу.

Метадані надаються індивідуальними “агентами” кожної з сутностей, в той час, як процесами взаємодії, семантичного порозуміння та підтримки домовленостей між окремими сутностями керують спеціалізовані додатки, які відіграють в ІнІ роль посередників.

Основними функціями управління метаданими ІнІ СППР є: синхронізація моделей даних різних СД і інструментальних засобів аналізу даних; усунення ручного перекодування метаданих у корпоративній мережі гетерогенних додатків; спрощення обслуговування метаданих і моделей даних. Повинна забезпечуватись можливість подальшого нарощування функціональності у напрямку ускладнення.

Пошук і семантичне узгодження інформації в розподіленому шарі метаданих в ряді випадків є більш доцільним, аніж дослідження безпосередньо ІР. Запропонований підхід до побудови ОЗВ, що базується на процесі відбиття онтології задіяних інформаційних компонентів ІнІ на окрему високорівневу онтологію, яка є загальнодоступним корпоративним ІР і може слугувати за підґрунтя управління шаром метаданих ІнІ СППР. Властивістю такої моделі є відмова від фіксації сталого стану - вона має змінюватися кожен раз із додаванням до ІнІ нового компоненту. Найбільш впливовим чинником змін у метамоделі є додавання до ІнІ нових аналітичних моделей дослідження даних. Процес відбиття має бути ініційованим автоматично або напівавтоматично у разі додавання нового поняття до метаданих того чи іншого інформаційного або аналітичного компоненту. Розроблений механізм управління ОЗВ використовує трирівневу модель управління (рис. 3). Запропоноване рішення доповнює мережу ІР веб-службою каталогізації (реєстрації) компонентів ІнІ, забезпечивши механізмом узгодження понять кожну успадковану систему чи службу реєстрації.

Рис. 3. Схема обміну метаданими між компонентами ІнІ

Системи реєстрації формують представлення об'єктів у термінології предметної області в репозиторіях СД та реєстрах (UDDI). Служби реєстрації збирають метадані й анотації на інформаційні об'єкти, що включаються користувачами, у спеціалізовані локальні репозиторії. Джерелами метаданих можуть служити і засоби моделювання, спеціалізовані додатки й інші корпоративні інформаційно-аналітичні ресурси. Тип додатків, що розглядається, хоча і реалізується деякими функціональними режимами різних спеціалізованих систем, є екземпляром більш загального, широко розповсюдженого типу додатків реєстрації, що має власний реєстр об'єктів і дозволяє спільно використовувати посилання на ці об'єкти.

Основні функціональні завдання спеціально розроблених програмних компонентів полягають у тому, щоб дати можливість динамічно “вирівнювати” (співвідносити семантично) реєстри (каталоги, репозиторії) і підтримувати розподілене об'єднання метаданих, створених зв'язаними в рамках корпоративної мережі додатками. Розроблені компоненти архітектурно реалізуються на основі обчислювальної моделі веб-служби та включають такі складові: сервер застосувань, що представляє розглянутий узагальнюючий тип системи реєстрації компонентів ІнІ; веб-служба ТРАНСЛЯТОР - модуль, відповідальний за здійснення функціональних можливостей з'єднання частин у загальний словник та його використання; служба РЕЄСТРАТОР, що реалізує функцію формування тезауруса та взаємного узгодження реєстрів.

Четвертий розділ присвячено розробці аналітичних моделей аналізу режимів функціонування операційних вузлів ІнІ у відкритих розподілених архітектурах, побудованих на основі веб-послуг. Декомпозиція монолітних застосувань в систему роздільних сервісів дозволяє використовувати більш гнучкі схеми розміщення необхідних веб-послуг в середовищі наявних серверів. Водночас застосування згаданої моделі обчислень має високий рівень стохастичності як середовища, так і характеристик обчислювальних процесів (ОП), що в ньому відбуваються.

Важливим засобом зниження впливу випадковості на ефективність процесів функціонування ІнІ є самоадаптація операційних вузлів до поточного стану обчислювального середовища. В роботі проведений аналіз випадків виникнення відмов внаслідок необґрунтованого вибору способу організації обчислювального процесу, характеру впливу непродуктивних відволікань обчислювальних ресурсів на характеристики функціонування ІнІ.

Розроблена в роботі модель дозволяє дослідити різні режими організації обчислень в операційних вузлах. Для цього було виконано моделювання роботи операційних вузлів, на яких розміщуються компоненти ІнІ, з урахуванням впливу непродуктивних відволікань обчислювальних ресурсів.

Кожен операційний вузол ІнІ моделюється системою масового обслуговування (СМО).

На рис. 4 наведено структуру СМО, основними елементами якої є: вхідний потік заявок А; черга Q; дисципліна пріоритетного обслуговування ДО, що визначає порядок вибору заявок з черги; обслуговуючий пристрій П. До функцій системи входить: постановка заявок у чергу, вибір з черги заявки, що підлягає першочерговому обслуговуванню, і її обслуговування. На виході пристрою П утворюється вихідний потік В.

Рис. 4. Структура СМО, що моделює обчислювальний ресурс вузла

Для операційних вузлів ІнІ характерні непродуктивні витрати обчислювальних ресурсів. Ці відволікання ресурсів у загальному випадку носять випадковий характер і в рамках теорії масового обслуговування, що вивчає системи і мережі масового обслуговування, їх можна інтерпретувати потоком відмов ПВ обслуговуючого пристрою, а їхню тривалість - часом його відновлення. Після відновлення обслуговуючого пристрою, що відмовив, обслуговування заявок починається відповідно до дисципліни відновлення ДВ.

Відмови обслуговуючого пристрою викликають збільшення кількості необслугованих заявок, зростання черги заявок і додаткові затримки у їхньому обслуговуванні. У силу випадкового характеру процесу обслуговування заявок ці часові затримки для певних видів процесів можуть виявитися дуже значними, що матиме істотний вплив на ефективність організації обчислювального процесу. Один з можливих способів адаптації системи до непродуктивних витрат обчислювальних ресурсів є впровадження відповідної дисципліни пріоритетного прийому заявок в чергу (ДПВ) від різних процесів на час відволікання ресурсів. Таке регулювання надходженням потоків може бути досягнуте за рахунок зворотного зв'язку ресурсу з джерелами заявок або шляхом закриття черги.

Задачу аналізу для обраної моделі було сформульовано наступним чином.

На вхід одноканальної СМО з очікуванням надходять N пуасонівських потоків різнотипних заявок з інтенсивністю . Потоки перенумеровані в порядку зменшення важливості заявок, тобто заявки i-го потоку володіють i-м пріоритетом в обслуговуванні. Час обслуговування заявок є випадковою величиною з функцією розподілу і двома скінченими моментами і .

Обслуговуючий пристрій ненадійний і може виходити з ладу за законом Пуасона з параметром . Час відновлення пристрою - випадкова величина з функцією розподілу і двома скінченими моментами і . Пристрій може вийти з ладу як під час обслуговування заявок (при цьому можливі два випадки: заявки повертаються в чергу; заявки губляться), так і у вільному стані. У період відновлення обслуговуючого пристрою заявки одних потоків у чергу приймаються, а інші – не приймаються. Ця умова задається матрицею - рядком коефіцієнтів , де в тому випадку, якщо заявки i-го потоку в чергу приймаються, і , якщо заявки одержують відмову в обслуговуванні.

Після відновлення обслуговуючого пристрою можливі дві дисципліни поновлення обслуговування: із заявок старшого пріоритету і з заявок, обслуговування яких було перервано відмовою пристрою (за умови, що вони не втрачаються протягом відмови).

Потрібно визначити наступні характеристики обслуговування заявок: - середній час чекання початку обслуговування заявок i-го потоку в i-й черзі; - середній час перебування заявок i-го потоку в системі; - середнє число заявок i-го потоку в i-й черзі; - середнє число заявок i-го потоку в системі.

Моделювання виконувалось для різних дисциплін обслуговування процесів операційними вузлами ІнІ. Сполучення дисципліни обслуговування з однією з дисциплін відновлення обслуговування після відновлення пристрою, що відмовив, і поведінкою заявки, обслуговування якої було перервано відмовою, визначило умови 10 окремих задач для пріоритетних СМО. Розроблені аналітичні моделі для відносних, абсолютних, змішаних та комбінованих пріоритетних дисциплін дозволили отримати кінцеві вирази для шуканих характеристик обслуговування заявок. Характеристики обслуговування заявок у сталому режимі зв'язані між собою формулами Літтла, що для систем із пріоритетним прийомом заявок до черги під час відновлення приладу, що відмовив, мають наступний вигляд:

, , | ()

де - інтенсивність надходження заявок i-го потоку в СМО з урахуванням дисципліни прийому до черги під час відновлення приладу; - ймовірність того, що обслуговуючий прилад знаходиться в справному стані; - "завантаження" системи відмовленнями.

Умовою сталого режиму в системах даного класу без втрат є , де - ймовірність зайнятості приладу обслуговуванням заявки i-го потоку.

Наведемо отримані вирази для обчислення середнього часу очікування початку обслуговування для деякої заявки, що надходить у систему j-го потоку, в явному вигляді для різних типів СМО, з яких неважко виводяться інші характеристики.

Система з відносними пріоритетами і поновленням обслуговування з заявок, обслуговування яких було перервано відмовленнями |

()

Система з відносними пріоритетами і поновленням обслуговування з заявок систем старшого пріоритету

, | ()

де ; ; - середній час до відновлення пристрою, що відмовив; - середній час дообслуговування заявки i-го потоку без обліку відмов обслуговуючого пристрою; - середній час зайнятості приладу дообслуговування заявки i-го потоку і відновленням після відмовлення, що наступило під час дообслуговування цієї заявки; .

Система з абсолютними пріоритетами

. | ()

У системах зі змішаними пріоритетами сусідні потоки заявок поєднані у М груп, між якими діє абсолютний, а усередині кожної - відносний пріоритет в обслуговуванні. При цьому кожна m-та група потоків заявок містить у собі потоки з номерами від до . На відміну від систем з абсолютними пріоритетами, заявка j-го потоку m-ї групи, що надходить на вхід системи, повинна очікувати в черзі дообслуговування заявок з потоків з номерами від 1 до , і її обслуговування може бути перервано надходженням заявок старших пріоритетів у тому випадку, якщо (при цьому сумарний потік заявок, що перериває її обслуговування, включає потоки з номерами від 1 до ).

Тому для системи зі змішаними пріоритетами і поновленням обслуговування з заявок, обслуговування яких було перервано відмовленнями, рівняння для середнього часу чекання початку обслуговування набуде вигляд: |

()

Так само зміниться вираз і для системи зі змішаними пріоритетами і поновленням обслуговування з заявок систем старшого пріоритету.

У системі з комбінованими пріоритетами час обслуговування всіх заявок, крім заявок першого потоку, розбито на два відрізки (етапи): на першому діє абсолютний пріоритет, на другому – відносний. Отже, тривалість першого етапу обслуговування заявки k-го потоку – постійна величина, а на другому етапі тривалість обслуговування заявок залежить від дисципліни поновлення обслуговування. Так, для системи з комбінованими пріоритетами і поновленням обслуговування з заявок, обслуговування яких було перервано відмовленням, виразом для в явному вигляді буде:

. | ()

За тим же принципом в роботі виведено рівняння для систем з комбінованими пріоритетами і поновленням обслуговування з заявок старшого пріоритету.

Відмінною рисою пріоритетних систем із втратами заявок є втрата заявок, обслуговування яких було перервано відмовою приладу. Тому імовірність зайнятості приладу обслуговуванням заявки i-го потоку, де визначається за виразом: , де - ймовірність того, що за час t заявка j-го потоку не буде обслугована пристроєм; а - ймовірність того, що за час t не відбудеться жодної відмови. За аналогією із пріоритетними системами без втрат в роботі отримані в явному вигляді: вирази для в системах із втратами заявок з відносними, абсолютними і змішаними пріоритетами в обслуговуванні.

Рис. 5. Залежність довжини черг заявок (q’) від інтенсивності відмов (). | На рис. 5 для двопріоритетної системи з відносними пріоритетами і режимом безперервного поповнення черги заявками вищого пріоритету протягом періоду відновлення пристрою проілюстровано залежність довжини черг заявок з нижчим (крива 1) та вищим (крива 2) пріоритетами від інтенсивності відмов обслуговуючого пристрою . Розрахунок проводився для таких значень параметрів: ==0,4; ==4,44; =0,1 (=/=44,4; =/=0,0225). | ВИСНОВКИ

1. В дисертаційній роботі вирішене актуальне завдання – розробка процесів та методів побудови ІнІ підготовки даних для прийняття рішень у міжвідомчих організаційних структурах з різнорідних ІР з роздільним управлінням. Вирішеним є також завдання створення математичних моделей для аналізу функціонування операційних компонентів таких інфраструктур у сервіс-орієнтованому розподіленому середовищі. Сукупність наукових результатів дослідження дозволяє впровадити цілісний підхід до синтезу ІнІ корпоративних СППР на основі технологій СД, можливість інтеграції в яких досягається шляхом додавання семантичної складової до структури метаданих окремих ІС, виділення в окрему інформаційно-обчислювальну складову спеціалізованих інформаційних структур та процесів управління розподіленими метаданими, запровадження механізму семантичного узгодження інформаційних ресурсів, що долучаються до ІнІ СППР. Запропоновані аналітичні моделі дозволяють дослідити характеристики продуктивності операційних вузлів, на яких функціонують компоненти ІнІ, та проводити оцінку і співставлення різних підходів до організації в них обчислювальних процесів на пріоритетній основі.

2. Проведеним дослідженням технологій СД та їх застосування для створення ІнІ підтримки прийняття рішень виявлено, що хоча й

Сторінки: 1 2

��
��...

Наступні 7 робіт по вашій темі:

▪ МОРАЛЬ ТА ПРАВО ЯК РЕГУЛЯТОРИ ВІДНОСИН У СУЧАСНОМУ УКРАЇНСЬКОМУ СОЦІУМІ - Автореферат - 25 Стр.
▪ РЕСУРСНЕ ЗАБЕЗПЕЧЕННЯ ВІДТВОРЕННЯ У СІЛЬСЬКОГОСПОДАРСЬКИХ ПІДПРИЄМСТВАХ - Автореферат - 31 Стр.
▪ Розробка зміцнених наральникових сошників СІВАЛОК для ТЕХНОЛОГій МІНІМАЛЬНого ОБРОБІТКУ ҐРУНТУ - Автореферат - 23 Стр.
▪ РОСІЙСЬКА ЖІНОЧА ДРАМАТУРГІЯ ДРУГОЇ ПОЛОВИНИ 80-Х – 90-Х РОКІВ ХХ СТОЛІТТЯ (ГЕРОЙ, КОНФЛІКТ, ХРОНОТОП) - Автореферат - 29 Стр.
▪ ДВОВИМІРНІ ЗАДАЧІ ТЕРМОЕЛЕКТРО- ТА ТЕРМОМАГНІТОПРУЖНОСТІ - Автореферат - 25 Стр.
▪ МОДЕЛІ ТА МЕТОДИ АПАРАТНОГО МОДЕЛЮВАННЯ НЕСПРАВНОСТЕЙ ЦИФРОВИХ СИСТЕМ НА КРИСТАЛАХ - Автореферат - 27 Стр.
▪ МЕТОДИКА ВИБОРУ РАЦІОНАЛЬНИХ ПАРАМЕТРІВ ЛОПАТКОВИХ ВІНЦІВ ВиСОКонавантажених ступенів ОСЬОВОГО КОМПРЕСОРА ГАЗОТУРБІННОГО ДВИГУНА - Автореферат - 13 Стр.