У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Міністерство транспорту та зв’язку України

Національна академія наук України

Державний науково-дослідний інститут інформаційної інфраструктури

 

камінський роман миколайович

УДК 004.81:159.953;004.032.2;004.93'1

Моделювання інтелектуальної ДІЯЛЬНОСТІ

людини-оператора як системи

Опрацювання зображень

Спеціальність 05.13.23 – системи та засоби штучного інтелекту

Автореферат

дисертації на здобуття наукового ступеня

доктора технічних наук

Львів - 2007

Дисертацією є рукопис.

Робота виконана в Державному науково-дослідному інституті інформаційної інфраструктури Міністерства транспорту та зв’язку України і Національної академії наук України та Національному університеті "Львівська політехніка" Міністерства освіти і науки України.

Науковий консультант: | чл.-кор. НАН України, доктор технічних наук, професор Грицик Володимир Володимирович

Державний науково-дослідний інститут інформаційної інфраструктури, директор

Офіційні опоненти: | доктор технічних наук, професор

Василенко Юрій Андрійович

Закарпатський державний університет МОН України завідувач кафедри інформаційних управляючих систем та технологій

доктор технічних наук, професор

Тимченко Леонід Іванович

Київський університет економіки і технологій транспорту Міністерства транспорту та зв’язку України, завідувач кафедри телекомунікаційних технологій і автоматики

доктор технічних наук, професор

Сопрунюк Петро Маркіянович

Фізико-механічний інститут ім. Г.В.Карпенка НАН України, завідувач відділу електричних вимірювань фізичних величин

Провідна установа: | Одеський національний політехнічний університет, інститут комп’ютерних систем, кафедра інформаційних систем

Захист відбудеться "24" квітня 2007 р. о 14 годині на засіданні спеціалізованої ради Д 35.813.01 при Державному науково-дослідному інституті інформаційної інфраструктури (79000 МСП, м. Львів, вул. Тролейбусна, 11).

 

З дисертацією можна ознайомитись у бібліотеці Державного науково-дослідного інституту інформаційної інфраструктури (79000 МСП, м. Львів, вул. Тролейбусна, 11).

Автореферат розісланий "21" березня 2007 р.

Вчений секретар

спеціалізованої вченої ради Опотяк Ю. В.

Загальна характеристика роботи

Актуальність теми. Базою створення систем та засобів штучного інтелекту за теперішнього стану комп’ютерних технологій є такі моделі інтелектуальної діяльності людини, які для даної задачі імітують ті функції її мозку, технічна реалізація яких дає результати, аналогічні результатам цієї діяльності. В цьому плані актуальність дисертаційного дослідження визначається такими обставинами.

По-перше, створення сучасних високопродуктивних та ефективних систем і засобів штучного інтелекту, зокрема для опрацювання зображень в будь-якій конкретній предметній області, базується на імітації і реалізації алгоритмів, що розроблені для відповідної інтелектуальної діяльності на підставі сучасних представлень про неї і, які є апріорно аналогічні з алгоритмами, що їх використовує людина-оператор. Суть проблеми в тому, що такі „інтелектуальні” алгоритми надзвичайно складно зафіксувати в процесі діяльності оператора, зрозуміти, дослідити, структурувати та формалізувати, оскільки, навіть високо кваліфіковані оператори не можуть точно, чітко і однозначно їх описати. Крім того, використання середньостатистичних даних та апріорних описів процесів сприйняття візуальної інформації, наведених у довідниках та відповідних публікаціях, мають переважно локальний, специфічний та різноплановий характер, визначений конкретними постановками задач. Це зосереджує увагу власне на необхідності розробки відповідних засобів і методів експериментального дослідження та моделювання індивідуальної інтелектуальної операторської діяльності, розглядаючи її з позиції системного підходу, тобто як систему опрацювання зображень.

По-друге, відомі підходи в психофізиці сприйняття, ергономіці та кібернетиці не забезпечують відповідними даними розробників алгоритмів систем штучного інтелекту в основному через відсутність методів оцінювання розпізнавальної складності зображень, зокрема їх семантичної складової, для встановлення чітких системних залежностей "вхід - стан" і "вхід – стан – вихід" в сенсі математичної теорії систем М. Месаровича і Я. Такагари. Спроби використання шуму для зміни величини семантичної складової, здійснені Дж. Ллойдом та Н.Н. Красільніковим, показали дуже загальну якісну картину її збіднення. В цьому плані необхідно приділити увагу дослідженню впливу шуму на об’єкти заданих класів, результати якого б розширили емпіричні знання в окресленій предметній області й узагальнили експериментальну феноменологію на основі єдиної методології.

По-третє, використання фізіологічних (контактних) та психологічних (тестувальних) методів визначення функціонального стану людини-оператора не допустиме під час проведення такого типу експериментальних досліджень, оскільки усвідомлення та звертання на них уваги реципієнтом може погіршити результати. Тому, дослідження динаміки функціонального стану оператора за даними опрацювання послідовності спеціальних тестових зображень в рамках поставленої задачі, є актуальним для вирішення цього питання.

По-четверте, наші знання про психофізичні закономірності сприйняття конкретного зображення, зокрема щодо часу його опрацювання, вплив семантики зображення, стосовно даної задачі, на психологічний стан, зв’язки семантики з емоціями є ще дуже недосконалі. Тому організація і забезпечення відповідних експериментальних досліджень для цих питань має важливе значення.

По-п’яте, розробка критеріїв оцінювання характеристик людини-оператора, зокрема вдосконалення системи індивідуальних показників інтелектуальної діяльності та оцінки її функціональної ефективності, що фігурують в розроблюваних моделях та алгоритмах мають базуватися на експериментальних даних.

Саме відсутність на даний час адекватних математичних моделей реальних робочих ситуацій у формі послідовності зображень, градуйованих за певною шкалою їх розпізнавальної складності, методів визначення функціонального стану оператора та об’єктивних критеріїв оцінювання індивідуальних показників не дає можливості визначати функціональні залежності „вхід – стан” та „вхід – стан – вихід” і, на підставі них, вивчати основні закономірності інтелектуальної діяльності та будувати її моделі, зокрема відповідні алгоритми опрацювання зображень для систем та засобів штучного інтелекту.

Внесок у розвиток теоретичних та практичних основ моделювання процесів опрацювання та розпізнавання зорових образів з точки зору психофізики сприйняття належить Фехнеру Г.Т., Стівенсу С.С., Бардіну К.В., Забродіну Ю.М., Марру Д., використання шуму з метою ускладнення розпізнавання – Ллойду Дж., Бахманну Т., Красільнікову Н.Н., Свенсону О.М., моделювання шумових полів – Палагіну Ю.І., Гимельфарбу Г.Л., Залєсному А.В., теоретичним засадам моделювання систем штучного інтелекту – Глушкову В.М., Івахненку О.Г., Шибанову-Кушнаренку Ю.П., Поспєлову Г.С., процеси розпізнавання – Журавльову Ю.И., Грицику В.В., Василенку Ю.А., Кожем’яко В.П., Русину Б.П. та іншим.

За усієї важливості відомих результатів, теоретичні та експериментальні дослідження повинні бути продовжені в напрямку: розроблення ефективних засобів градуювання розпізнавальної складності зображень, зокрема, за допомогою відповідних шумових полів, об’єктивних методів визначення рівня і фази функціонального стану оператора на підставі аналізу тренду індивідуальних показників та вироблення засад і критеріїв оцінювання індивідуальних показників ефективності інтелектуальної діяльності на основі закону розподілу їх експериментальних значень.

Тому, подальший розвиток принципів організації та проведення системних теоретичних і експериментальних досліджень в напрямку розроблення ефективних засобів та методів забезпечення якості побудови математичних моделей інтелектуальної діяльності людини-оператора в системах опрацювання зображень на основі отриманих даних, зокрема, розпізнавання малорозмірних зображень об’єктів уваги, має важливе значення для створення систем та засобів штучного інтелекту і є актуальною проблемою.

Зв’язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконувалась в рамках планових науково-дослідних робіт з пріоритетних напрямків розвитку науки і техніки згідно з програмами Державного комітету України з питань науки і технологій 06.02.02:

„Створення математичних моделей людино-машинного інтерфейсу і розробка рекомендацій по організації інтерактивного режиму та критеріїв оцінки якості роботи оператора в дисплейних системах обробки інформації”, держреєстраційний №0193U037171, 1992 – 1994 рр., (моделювання роботи людини-оператора з наданими на моніторі зображеннями);

„Розробка та впровадження інформаційної технології і системи медико-біологічних та психо-ергономічних досліджень”, держреєстраційний №0193U037172, 1992 – 1994 рр., (відбір, адаптація та розробка методів аналізу і моделювання експериментальних даних);

Дослідно-конструкторської роботи за контрактом № ОК-2003-8-ЦЕНТР-ДНДІІІ „Розробити високоефективну систему аналізу, розпізнавання та сприйняття аудіо-відеоінформації з високою роздільною здатністю та чутливістю для образного комп’ютера”, держреєстраційний №0103U006336 (розробка високо-роздільних методів аналізу зображень та побудови тестових зображень), 2003 рік.

Теми ФМІ НАНУ, НД-26/260, „Розробка методів і засобів контролю енергії адгезійних зв’язків”, держреєстраційний №0103U003352 (розробка методів опрацювання малорозмірних зображень об’єктів), 2003 – 2004 рр.

Держбюджетної теми ДБ/Ізоморф „Розробка методів і засобів побудови інтелектуальних інформаційних систем на основі часових реляційних баз даних”, держреєстраційний №0104U002299 згідно наказу МОН України від 07.11.2003, №746, (розробка математичних моделей часових характеристик надання інформації користувачу), 2004 р.

Мета та задачі дослідження. Метою дисертаційної роботи є розробка теоретичних основ методології побудови, на основі експериментальних даних розпізнавання зображень людиною-оператором, математичних моделей його інтелектуальної діяльності, яку розглядають як систему опрацювання зображень.

Для досягнення поставленої мети необхідно вирішити такі задачі.

1. Розробити на підставі існуючої концепції процесів зорового сприйняття математичні моделі інтелектуальної діяльності оператора в системах розпізнавання зорових образів;

2. Розробити методи побудови спеціальних тестових зображень, розпізнавальна складність яких градуйована за шкалою інтенсивності шуму у відповідності з результатами досліджень специфіки та характеристик впливу завад на об’єкти уваги.

3. Виробити і обґрунтувати означення поняття малорозмірного зображення об’єкта уваги для використання його в тестових зображеннях.

4. Розробити математичну модель принципу розгортки та обґрунтувати його використання для реалізації афінних перетворень, стиску й кількісного оцінювання основних характеристик зображень об’єктів уваги.

5. Розробити лабораторний стенд-тренажер для проведення експериментальних досліджень та методику побудови і надання операторові тестових зображень.

6. Вдосконалити і адаптувати методи обробки експериментальних даних для моделювання трендів індивідуальних часових рядів за значної дисперсії та асиметричного розподілу рівнів, для оцінювання функціонального стану оператора та його поведінки за екстремальних ситуацій.

7. Розробити метод оцінювання функціональної ефективності інтелектуальної діяльності оператора та вдосконалити і доповнити систему індивідуальних показників оперативності.

Об’єкт дослідження – інтелектуальна діяльність людини-оператора в процесі опрацювання зображень, трактована в сенсі теорії систем.

Предмет дослідження – вплив шуму і завад як засіб градуювання розпізнавальної складності спеціалізованих тестових зображень, часові ряди значень часу розпізнавання тестових зображень для визначення функціонального стану та розподіли їх рівнів для оцінювання індивідуальних показників функціональної ефективності інтелектуальної операторської діяльності.

Методи дослідження. Для розв’язання поставлених у роботі задач використані: методи теорії множин для розробки математичних моделей інтелектуальної діяльності, теорії ймовірності, випадкових процесів та математичної статистики для обробки експериментальних даних та моделювання шумових полів, операційного числення для формалізації принципу розгортки, а також методи математичного та комп’ютерного моделювання і натурного експерименту.

Наукова новизна одержаних результатів. Розв’язана проблема створення теоретичних засад і розвитку концепції моделювання інтелектуальної діяльності як системи опрацювання зображень людиною-оператором. Для підвищення адекватності таких моделей створено методи: побудови тестових зображень, градуювання їхньої розпізнавальної складності, врахування стану системи як відображення функціонального стану оператора та запропоновано критерії оцінювання індивідуальних показників. Дана концепція відрізняється від існуючих дослідженням системних залежностей „вхід – стан” та „вхід – стан – вихід”. При цьому новими є такі результати:

1. Розроблені, на основі апріорних даних і виражені за допомогою апарату теорії множин, математичні моделі інтелектуальної діяльності, яку представлено як систему опрацювання зображень, і які відрізняються від існуючих орієнтацією на організацію експериментальних досліджень, що дало можливість виділити суттєві елементи такої системи, показати зв’язки між ними, організувати її дослідження та адаптувати засоби і методи обробки результатів експериментів.

2. Вперше розроблено принцип виділення фізично змістовних, практично важливих і математично конструктивних класів шумових полів, який на відміну існуючих, повністю визначає теоретичні засади та практичну реалізацію процедури створення різних за видом та з заданими характеристиками шумових полів і на цій підставі, на основі введеного означення поняття інформативної області ознаки, розроблено метод градуювання розпізнавальної складності тестових зображень в сенсі побудови шкали "інтенсивність шуму – тривалість розпізнання".

3. Вперше розроблено математичні моделі взаємодії шумового поля з ознаками зображень об’єктів, а саме: "налипання" та "вибивання", які на відміну від її алгоритмічного опису, представляють експериментально виявлені закономірності: втрату ознак, зміну площі і периметру, дисперсність та зрізаність контуру від інтенсивності та розміру елементів шуму, що дає додаткові значення для оцінювання якісних та кількісних характеристик структури тестових зображень.

4. Вперше розроблено алгоритм створення об’єктів випадкової форми, який відрізняється від аналогічних тим, що властивості і характеристики створених об’єктів визначаються значеннями керуючих параметрів, що дозволило моделювати фрагменти випадкових фонів з заданими кількісними та якісними показниками і розробити методологію побудови спеціалізованих тестових зображень з бінарними, псевдорельєфними та кольоровими текстурованими фонами.

5. Вперше розроблено поняття малорозмірного зображення об’єкта уваги, що на відміну від існуючих понять обмежило довільне його трактування; властивості таких об’єктів, визначені на основі аналізу їх форми, показали специфіку та особливості використання їх в тестових зображеннях, реалізацію для них афінних перетворень, а також визначення їх кількісних та якісних характеристик протягом одного такту розгортки.

6. Вперше графо-аналітично відображено зв’язок фаз функціонального стану людини-оператора з формальними рівнями працездатності, що на відміну від існуючих підходів визначення стану оператора, які основані на медичних та психологічних методиках, відображає характер його діяльності як динаміку рівня працездатності і на цій підставі розроблена модель індивідуальної динаміки оперативності, а також моделі накопичення втоми, зумовленої екстремальними ситуаціями.

7. Розроблено методику моделювання динаміки функціонального стану оператора, яка відрізняється від використовуваних в інженерній психології тим, що для моделювання динаміки показника, з метою виключення суб’єктивності в застосуванні методів обробки даних, виділяють її тренд; вибір методу згладжування тренду є обґрунтований порівняльним аналізом методів: ковзного середнього, експоненціального згладжування та медіанної фільтрації, використовуючи розроблений критерій оцінювання ступеня згладжування та запропонований метод визначення сталої експоненціального згладжування; на цій підставі розроблена модель тренду на основі поліному з мішаними цілими степенями.

8. Вперше розроблено критерій оцінювання функціональної ефективності індивідуальної інтелектуальної діяльності, який на відміну від існуючих використовує розпізнавальну складність зображень, враховує функціональний стан оператора та ймовірність допущення ним помилок, і забезпечує об’єктивну ідентифікацію операторів та доповнює систему індивідуальних показників.

9. Теоретично обґрунтовано і експериментально підтверджено відповідність розподілові Вейбула величин значень часу розпізнавання зображень оператором та запропоновано метод визначення його параметрів на підставі експериментальних даних, який на відміну від існуючих, що використовують гістограмний підхід, виключає суб’єктивізм у виборі параметрів гістограми, використовує апроксимацію емпіричної кумуляти, що дало можливість підвищити об’єктивність існуючої системи індивідуальних показників оперативності та вдосконалити її за рахунок характеристик самого розподілу.

Практично усі отримані результати є новими і вперше опублікованими. Наведені в роботі математичні моделі інтелектуальної діяльності, поняття шумових полів та їх взаємодії, означення малорозмірного зображення об’єкта уваги, спосіб врахування функціонального стану оператора та запропонований показник функціональної діяльності є новими для даної предметної області в світлі вирішуваної проблеми – моделювання інтелектуальної діяльності.

Практичне значення одержаних результатів та їх використання:

1. Розвинуті теоретичні положення, розроблені моделі та методи утворюють теоретичну базу моделювання інтелектуальної діяльності як системи опрацювання зображень і дають можливість конкретизувати, організувати та реалізувати відповідні дослідження: визначити елементи та досліджувані залежності, вибрати та створити необхідне забезпечення експериментів, зв’язати їх з класом розв’язуваних реальних задач у відповідності з потребами створення систем штучного інтелекту.

2. Принцип виділення класів шумових полів сприяє розробленню методів їх створення, дослідження, математичного моделювання та визначає специфіку, властивості і місце їх використання – градуювання розпізнавальної складності тестових зображень.

3. Тестові зображення, як моделі реальних ситуацій з малорозмірними зображеннями об’єктів уваги і накладеними шумовими полями, допомагають вивчати психофізику сприйняття зорових образів в сенсі "інтенсивність шуму – розпізнавальна складність – час розпізнавання", мають обґрунтовано визначені метрологічні параметри і забезпечують високу ефективність експериментальних досліджень інтелектуальної діяльності в сенсі розпізнавання та опрацювання зображень.

4. Моделі взаємодії шуму з ознаками об’єктів уваги обґрунтовують вибір множини розпізнавальних ознак для побудови робочих словників та описів еталонів і є базою для градуювання розпізнавальної складності.

5. Алгоритм створення випадкових текстурованих фонів є базовим для створення правдоподібних тестових зображень – моделей реальних ситуацій, чисельні характеристики яких задаються конкретними значеннями його параметрів та структурою використаних твірних елементів.

6. Розроблена методологія організації експериментальних досліджень та запропонована комп’ютерна реалізація лабораторного стенда-тренажера забезпечує високу якість та ефективність експериментальних результатів в конкретній предметній області для побудови математичних моделей інтелектуальної діяльності людини-оператора.

7. Принцип визначення функціонального стану оператора та його динаміки на основі моделі тренду дає підстави з однієї сторони виявити вплив вхідних зображень на стан оператора, а з другої – визначити саме ті відмінності в зображеннях, за яких відбувається ця зміна функціонального стану, а відтак підвищити якість самих тестових зображень та ефективність тестування.

8. Моделі перебування оператора в екстремальних ситуаціях пояснюють накопичення втоми і дають підстави для розрахунку режиму і тривалості роботи, а в поєднанні з медико-біологічними та психофізіологічними методами, оцінити величину впливу екстремальної ситуації за часом виходу з неї.

9. Критерій оцінювання функціональної ефективності доповнює систему індивідуальних показників, а також дозволяє сформувати групи реципієнтів для більш тонких експериментальних досліджень інтелектуальної діяльності в системах розпізнавання зорових образів.

Наукові положення і висновки, отримані в дисертаційній роботі, підтверджені експериментальними дослідженнями та теоретично обґрунтовані. Окремі результати роботи впроваджені в науково-дослідних темах, згаданих вище. Загалом, розроблену методологію можна застосовувати: для розв’язування широкого кола проблемних задач створення систем та засобів штучного інтелекту для розпізнавання зорових образів в різних предметних областях, а також для професійного відбору, навчання та атестації операторського персоналу, вироблення нормативних режимів, планування рекреаційних заходів та організації роботи оператора, доповнюючи засоби експериментальних досліджень та моделювання інтелектуальної діяльності, підвищуючи їх ефективність.

Апробація роботи.

Наукові результати досліджень, концепції та положення доповідались на: Першій міжнародній конференції „Інформаційні технології і системи – ІТІС-93” (м. Львів, 1993), Другій Українській конференції з автоматичного керування „Автоматика -95” (м. Львів, 1995), Третій міжнародній конференції „Розпізнавання образів та аналіз інформації” (Білорусія, м. Мінськ, 1995), Третій українській конференції „Автоматика-96”, (м. Севастополь, 1996), Міжнародній конференції „Автоматика-2000”, (м. Львів, 2000), Міжнародній конференції з індуктивного моделювання „МКІМ-2002”, (м. Львів, 2002), Дев’ятій всеукраїнській науковій конференції „Сучасні проблеми прикладної математики та інформатики”, (м. Львів, 2002), Десятій всеукраїнській науковій конференції „Сучасні проблеми прикладної математики та інформатики”, (м. Львів, 2003), Другому міжнародному конгресі „Інформатизація рекреаційної та туристичної діяльності”, (м. Трускавець, 2003).

Публікації. Основні результати дисертації опубліковані в 28 наукових працях, серед яких 25 статей у фахових виданнях та 3 у друкованих матеріалах конференцій.

Структура і обсяг роботи. Дисертаційна робота складається із вступу, п’яти розділів і висновків та списку літературних джерел і додатків. Загальний обсяг роботи становить 343 сторінки, у тому числі основного тексту 298 сторінок, ілюстрацій 84, таблиць 20, список використаних джерел із 295 назв та 20 сторінок – додатки.

Основний зміст роботи

У вступі дана загальна характеристика роботи з точки зору критеріїв дисертації та наведені короткі анотації розділів.

В першому розділі обґрунтовано доцільність розвитку нової концепції в теорії моделювання інтелектуальної діяльності на основі базового системного принципу – взаємозв’язків "вхід – стан" та "вхід – стан – вихід" та принципів сприйняття зорових образів, як центральної ідеї і вихідного моменту розробки моделей інтелектуальної діяльності в системах опрацювання зображень малорозмірних зображень об’єктів, що відповідають практично важливим задачам штучного інтелекту. Підтверджена конструктивність цієї концепції для побудови засад даної, узгодженої з нею, теорії, чим охоплено вплив шуму на зображення об’єктів уваги та часові аспекти їх розпізнавання.

Людина-оператор, перебуваючи в певному функціональному стані , опрацьовує візуально надані йому на моніторі зображення , вибирає або виробляє, приймає і реалізує рішення , у відповідності зі схемою на рис.1.

Рис.1. Людино-машинного інтерфейс обробки та розпізнавання зображень.

Погана якість або складність зображень та висока відповідальність вимагають аналізу прийнятих рішень, що спричинює затримку в часі і може суттєво впливати на функціональний стан оператора. Зовнішнє середовище також впливає на систему відображення інформації, її сприйняття оператором та на реалізовані ним рішення (ці зв’язки зображені пунктирними стрілками).

Основним завданням системної моделі даного інтерфейсу є відображення ролі оцінок вхідних зображень та стану на рішення , отримані в експерименті в моменти часу , для визначення залежностей “вхід – стан – вихід” та “вхід – стан”, як зміни стану .

Розроблені, на основі апріорних даних, математичні моделі інтелектуальної діяльності оператора: 1) загальна модель роботи оператора в сенсі постановки задачі, яка враховує класи вхідних зображень, рівні функціонального стану оператора, оперативність прийняття і реалізації відповідними командами вибраних рішень, відмінності між нормативами задачі та її реальним станом, відображені в часовому просторі, за умови: прийняти максимально достовірне рішення з мінімальними витратами часу; 2) когнітивна модель сприйняття, що відображає поетапне ітеративне візуальне опрацювання вхідного зображення, враховуючи апаратурні перетворення, вплив завад, створену в уяві модель існуючої ситуації та еталони подібних ситуацій в пам’яті; 3) модель розпізнавання зображень в класі вирішуваних задач, розв’язки яких належать відповідним множинам цільового простору, а розпізнавання об’єкта уваги здійснюється розпізнавальним алгоритмом шляхом сепарації, усіх зображень об’єктів, подібних до даного еталону, хоча б за однією ознакою, та відкидання оператором з поміж них усіх неідентичних еталону, чим обґрунтовано розподіл функцій між комп’ютером і людиною – комп’ютер відбирає подібні, а людина виділяє ідентичні.

Розмежовано і конкретизовано поняття завад і шуму, в основу якого покладено критерій збіжності за величиною площ компактної форми: завади – об’єкти, збіжні за розмірами з об’єктами уваги, їх великими фрагментами, а шуми – об’єкти збіжні з структурними елементами зображення – пікселами, зерном тощо.

Запроваджено поняття розпізнавальної інформативності ознаки форми, як мінімальної області найкращого зосередженого бачення цієї ознаки за умови, що частина цієї області належить об’єкту уваги, а частина фону, причому приймається що інформативність рівномірно розподілена на всій області. Поділ цієї області на приблизно однакових, довільної форми і близьких за розмірами з елементами шуму, елементарних ділянок, як зображено на рис.2, та випадкове закриття їх шумом так, що є найменша кількість таких ділянок закритих шумом для будь-якої їх комбінації, за якої правильне розпізнавання даної ознаки є ще можливим, вказує на природу залежності інформативності ознаки від інтенсивності шуму . |

а | б | в | Рис.2. Розпізнавальна інформативність ознаки в залежності від інтенсивності шуму: а – висока, б – допустима та в – дуже низька. | Рівномірний розподіл інформативності означає, що дана ознака є сприйнята саме такою, якщо не закритих шумом будь-яких елементів цієї області є . Це підтверджує правомірність використання шуму для градуювання розпізнавальної складності вхідних зображень.

Розроблено і використано означення шумового поля, як відповідним чином локалізованих шумових елементів, і показано, що за певних значень інтенсивності шуму, його основного параметра, виникає проблема індивідуального порогового рівня, перевищення якого гарантує не розпізнання об’єкта уваги. Значення цього рівня визначають інтервальною оцінкою в класі порядкових статистик на основі експериментальних даних.

Показано теоретично і підтверджено результатами обчислювального експерименту, що значення розпізнавальної інформативності ознаки за зміни інтенсивності шуму в межах 0 – 1, визначеної як відношення площі ознаки, закритої шумом, до її повної площі має Бета-розподіл з U - подібною за формою щільністю. В області значень від 0.2 – 0.8 вона є практично рівномірною, що дає підстави для розроблення шкали вимірювання розпізнавальної складності зображень за допомогою накладених на них шумових полів.

В другому розділі введено поняття та наведені методи створення і проаналізовано властивості шумових полів, розглянуто їх метрологічні характеристики за різних розподілів шумових елементів, а також особливості вибору та визначення основного параметра шумового поля – його інтенсивності.

Сформульовано, на основі аналізу природних та штучних чинників, що знижують якість та інформаційний зміст картини зображення, поняття шумового поля – відповідним чином локалізованих в заданих межах шумових твірних елементів, які за розмірами збігаються з фізичними структурними елементами зображення (пікселами) або близькі до них. Показано, що такі поля, накладені на реальні або синтезовані зображення робочих ситуацій, збіднюють їх семантичну складову та ускладнюють їх розпізнавання. Ця складність розпізнавання зображень об’єктів пропорційна інтенсивності шумового поля і є контрольованою величиною, а тому доцільно розрізняти такі зображення за ступенем інтенсивності шуму, як на рис.3, тобто градуювати їх за певною шкалою його інтенсивності.

 

 

а б в г | Рис.3. Градації інтенсивності впливу шуму:

а – 10%, б – 30%, в – 50%, г – 70% . | Розроблено означення шкали розпізнавальної складності зображень та метод її побудови на основі теорії вимірювань та метрологічних принципів. Суть її в тому, що за заданих розмірів і вигляду шумових елементів шумові поля є градуйовані за інтен-сивністю так, що кожній градації інтенсивності шуму відповідає значення моди часу розпізнавання цього зображення саме за такої його інтенсивності, що і зображено на рис.4., де і параметри шкали.

Рис.4. Значення мод на часовій осі. | При градуюванні шумових полів методом генерування значень координат має місце зменшення реальної інтенсивності відносно розрахованої за рахунок випадкового збігу координат деяких твірних шумових елементів. Усунення цього недоліку досить успішно досягнуто (в статистичному сенсі) експери-ментально визначеним і введеним в роботі коефіцієнтом перекриття – відношенням: отриманої сумарної площі шумових елементів до теоретично розрахованої, за допомогою якого перераховують визначену попередньо кількість шумових елементів.

Експериментально досліджено структуру шумових полів, створених методом генерування координат за рівномірного, нормального та експоненціального розподілів твірних елементів різних розмірів і встановлено, що втрати інтенсивності за рахунок збігу твірних шумових елементів лише для рівномірного розподілу є практично лінійними, тобто .

Для нормального та експоненціального розподілів центрів координат твірних елементів ця залежність є нелінійною і з ростом величин їхніх параметрів вона збільшується. Шумові поля з нормальним розподілом створені алгоритмом Муллера, а з експоненціальним – методом оберненої функції розподілу, вони досить чітко виражають вид цих розподілів, як зображено на рис.5. і можуть бути використані, коли важливим є епіцентр розвитку шуму.

Експериментально досліджено вплив шуму на розпізнавання абстрактних, симетричної форми, утвореної прямими кутами та лініями, об’єктів трьох класів, за кількістю кутових ознак (кутів) об’єкта – 24, 60 та 76. Результати, отримані для об’єкта з 60 ознаками, представлені у формі діаграми на рис.6, показують, що кількість незакритих ознак при малих градаціях інтенсивності шуму є практично постійною, але має значну дисперсію – відрізки перекриваються, а за великої інтенсивності шуму кількість ознак і їх дисперсія малі – між відрізками є значні проміжки. Це вказує на те, що зв’язок між інтенсивністю шумового поля та кількістю не закритих елементами шуму ознак є нелінійний. Форма зв’язку має вигляд , де – коефіцієнт пропорційності, а тому шкала градацій шуму має бути такою, щоб відрізки були суміжними, а їх середина відповідала конкретному значенню інтенсивності.

| Рис.5. Нормальний та експоненціальний розподіли шумових елементів | Рис.6. Дисперсія кількості ознак в залежності від інтенсивності шуму. | Розроблено і досліджено метод побудови шумових полів за принципом розгортки – шумові елементи локалізуються вздовж стрічок растру зображення, відстань між якими рівна вертикальному розміру елемента, а відстані між сусідніми елементами є випадковими величинами з заданим розподілом. Вони є однорідними за локалізацією шумових елементів, а зв’язок їх реальної інтенсивності з параметром алгоритму генерування відстані є нелінійним, як показано на рис.7. |

Рівномірний закон. | Нормальний розподіл. | Експоненціальний розподіл | Рис.7. Залежність значень інтенсивності від параметра розподілу. | Експерименти, проведені з шумовими елементами з сторонами 1, 2, ... , 10 пікселів, показали, що значення інтенсивності поля за кожного їхнього розміру добре апроксимуються логістичною кривою з показником степеня експоненти або логарифму, заданим поліномом не вище третього порядку.

Розроблено методи побудови та досліджено властивості регулярних та квазірегулярних шумових полів, тобто полів з локалізацією шумових елементів за певним порядком, визначеним двовимірною граткою в межах поля уваги розміром і кроком . В таких шумових полях твірні шумові елементи є „прив’язані” до кожного її вузла за допомогою особливих точок: центра ваги, центральної або кутової точок габаритної області, тощо. Аналітично алгоритм створення такого шумового поля описується рівнянням площини , де , , тут і кроки гратки вздовж осей, а і – номери вузлів.

Структура регулярного поля є постійною, а його вид визначається формою, величиною та точкою прив’язки шумових елементів. На рис.8. наведені зображення регулярних та квазірегулярних (регулярних за структурою, але випадковими за візуальним видом та параметрами шумових елементів) полів. |

регулярні | квазірегулярні | Рис.8. Види регулярних шумових полів. | Загальними характеристиками шумових полів є: інтенсивність, вигляд, розмір, структура та орієнтація шумових елементів та тип взаємодії з зображенням об’єкта уваги; для випадкових полів визначальним є розподіл координат центрів шумових елементів або відстаней між ними, а для регулярних – постійність та характер кроку гратки, періодичність кількості не закритих ознак за переміщення по зображенню, прив’язка до вузла гратки.

Проведені експериментальні дослідження залежності кількості незакритих ознак, як функції кроку та розмірів шумових елементів на об’єкті з 20 точковими кутовими ознаками, відстань між якими кратна 10 пікселам. Накладене регулярне поле з шумовими елементами піксели зміщували вздовж обох осей на піксел. За довільної початкової орієнтації поля після кожного такого зміщення визначено кількість не закритих шумовими елементами ознак об’єкта. Для кроків гратки в 10 і 20 пікселів усі ознаки об’єкта залишились незакритими, що вказує на існування періоду, властивого даному зображенню об’єкта, його величині і орієнтації. Послідовність значень кількості незакритих ознак в залежності від зсуву та кроку є власною характеристикою об’єкта і в межах періоду повторення є своєрідним ідентифікаційним правилом порівняння об’єкта з його еталоном.

Експерименти з регулярними шумовими полями з розмірами твірних елементів , , та пікселів і об’єктами з 60-ма ознаками підтвердили періодичність за зміни кроку поля, що відображено графіками на рис.9. Оскільки розміри контурів таких об’єктів також кратні 10 пікселам і тому для кроку гратки 10 пікселів для твірних елементів , , не закрита жодна ознака, для закриті лише декілька, а для понад 45. Для кроку 20 для елементів , , жодна з ознак не закрита. Отже, крок гратки та розміри елементів визначають період повторення та додаткові характеристики об’єктів уваги. Неплавність кривих зумовлена тим, що точкові ознаки об’єктів не утворюють регулярну гратку і представлені одним пікселом, а твірні елементи суцільною групою пікселів. Чим менші розміри твірних елементів, тим швидше зменшується ефект поля, оскільки різко падає його інтенсивність.

Рис.9. Взаємодії регулярних шумових полів. | Таким чином, під-тверджено можливість ви-користання та градуювання за інтенсивністю шумових полів для створення шкали розпізнавальної складності об’єктів уваги, що дає підстави створювати тестові зображення з кількісними характеристиками та підвищити ефективність тестування як в загальному, так і в спеціальних психофізичних та ергономічних дослідженнях.

„вибивання” | „налипання” | а | б | в | г | Рис.10. Види взаємодії шуму з об’єктами. | Розроблено методологію досліджень взаємодії зображень об’єктів і завад типу „вибивання” та „налипання”, як показано на рис.10, і проведено експерименти з шумовими полями з інтенсивністю: 15%, 30%, 45%, 60% і 75% та розмірами елементів шуму: 22, 55, 99, 1414 і 2020 пікселів з бінарними зображеннями об’єктів 24-ма та 76-ма кутовими ознаками, якими є зовнішні та внутрішні кутові точки розміром в один піксел, локалізовані на об’єкті у вершинах прямих кутів.

В результаті проведення 20 серій досліджень, кожна з яких включала 20 підготовчих, для уточнення значення інтенсивності шуму за даного розміру його елементів, та 180 основних експериментів, за даними яких визначені середні значення досліджуваних показників та розроблено математичні моделі взаємодій, наведені в табл. 1.

Таблиця 1. | Моделі взаємодії об’єктів і завад | Взаємодія типу „вибивання” | Взаємодія типу „налипання” | Втрата ознак

Втрата ознак

Незв’язані області

Площа об’єкта

Периметр

Периметр

Компактність

Компактність

Аргументами цих моделей є: – інтенсивність завад в % та – розмір завад в пікселах, , = 1, 2, ... , 6 – коефіцієнти, різні для різних моделей.

Відповідні шумові поля створювали з допомогою оператора , де – необхідна кількість завад для заданого значення інтенсивності . Опрацювання даних та побудову двовимірних моделей здійснено в середовищах Excel 2002 та Maple 7.

Третій розділ присвячений побудові зображень-тестів для вивчення систем обробки та розпізнавання візуальної інформації за основної вимоги – вони повинні бути високоякісними моделями реальних зображень ситуацій, відповідати суті, поставлених перед системою задач.

Такими можуть бути: стандартизовані або прийняті за домовленістю конкретні зображення реальних ситуацій, реальні зображення з внесеними іншими реальними або синтезованими зображеннями об’єктів уваги, повністю синтезовані зображення реальних ситуацій, а також синтезовані фони з зображеннями реальних об’єктів. Такі тестові зображення мають в кількісному та якісному аспектах встановити або оцінити порогові можливості людини-оператора та забезпечити отримання якісних даних для аналітичного представлення системних функцій та .

Тест, як специфічний вимірювальний засіб, має бути зорієнтований на конкретні задачі та умови тестування, контингент тестованих, вимагає правильної інтерпретації результатів тестування і відповідати вимогам: стандартизованості, надійності та валідності.

Показано, що розробка зображень-тестів має враховувати: поведінку оператора, як один з аспектів прояву його інтелектуальної діяльності, сформовану установками і цілями даної системи; властивості зорового аналізатора, особливо специфіку пошукових процесів та їх характеристики; моделі динаміки основних показників його роботи; особливості, форму та кількісні показники прийняття рішень; психологічні аспекти людських помилок, зокрема в опрацюванні та аналізі семантики зображень та звернути особливу увагу на суб’єктивність в методах обробки та інтерпретацію результатів експериментів.

Основною задачею побудови тестів є визначення їх кількісних показників: фізичних, статистичних, алгоритмічних, для кожного окремого зображення у відповідній шкалі їх розпізнавальної складності. Зміна на зображенні будь-якого елемента або фрагмента фону чи орієнтації, локалізації та величини об’єкта уваги фактично означає вже інше зображення з іншими характеристиками. Показано, що для складно структурованих фонів, створених на основі випадкових текстур з використанням малорозмірних зображень об’єктів уваги, звичайні повороти зображень або зміна локалізації та орієнтації об’єкта уваги, на кути кратні практично повністю виключають їх запам’ятовування оператором, а тому при таких змінах комбінаціях і орієнтаціях фону та об’єкта уваги можна отримати різні варіанти зображень тестів, відмінність між якими буде визначатися одним – двома показниками та забезпечити необхідну тривалість експерименту.

Розроблено і досліджено алгоритм побудови випадкових текстурованих фонів в якому кожен параметр є конкретним числом, що характеризує певну ознаку чи властивість моделі фрагмента синтезованого зображення. Алгоритм складається з окремих, однакових за структурою складових, які незалежно створюють текстуру загального основного фону, об’єкти та фрагменти переднього, другого і т.д. планів сцени тощо, які відрізняються лише значеннями параметрів. Кожна така складова включає блок розвитку текстурного фрагмента в заданій точці зображення та блок формування твірного елемента.

Блок розвитку забезпечує локалізацію центрів твірних елементів у відповідності з виразами

,

,

де , – радіус області можливої локалізації точок з центром в точці , а . Основними параметрами алгоритму є величина радіуса , кількість відрізків між послідовними точками ... , як довжина утвореного променя, кількість променів , що виходять з центра розвитку та тип і характеристики твірних елементів. Зміст роботи алгоритму пояснюють рис.11а і 11б. В результаті роботи алгоритму отримаємо фігури областей випадкової суцільної або дифузної форми, які зображено на рис.11в. На рис.12. зображені випадкові фони, реалізовані цим алгоритмом. |

а | б | в | Рис.11. Кроки роботи алгоритму: а – побудова променя, б – формування фрагменту, в – використання твірних елементів. Хрестики – центри розвитку. |

Рис.12. Фрагменти зображень фону: а – бінарного, б – монохромного (псевдо рельєфного) та в – кольорового. | Введено поняття твірного елемента, які за структурою є багатошаровими і показано, що саме вони визначають текстуру фону, а їх вибір, рандомізація розмірів, кольорів, форм та локалізація кожного з шарів урізноманітнює текстурні та псевдорельєфні ефекти і забезпечує ступінь адекватності синтезованого тестового зображення реальному зображенню.

Експериментально досліджені метричні характеристики створених даним алгоритмом таких текстурних фрагментів і визначені оцінки показників: повної видимої площі , периметра , параметра форми , коефіцієнта периметра і площі , подовженості фрагмента – в горизонтальному та – у вертикальному напрямках , складності контуру , компактності фігури , а показника Герста , кількості окремих елементів та площі прямокутної області покриття , утвореної фігури, як суцільної, так і у випадку окремих її фрагментів та елементів та досліджена їх поведінка в залежності від параметрів алгоритму наведених в табл. 2. Проведені експерименти, в яких параметри змінювали за п’ятьма градаціями, підтвердили ефективність алгоритму та його „керованість” цими параметрами.

Розроблено


Сторінки: 1 2 3