У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





Міністерство освіти і науки України

Харківський національний університет радіоелектроніки

Золкіна Елла Анатоліївна

УДК 004.932

МОДЕЛІ ТА МЕТОДИ ОЦІНЮВАННЯ І РОЗПІЗНАВАННЯ ДВОВИМІРНИХ ЗОБРАЖЕНЬ В ІНТЕЛЕКТУАЛЬНІЙ ДІЯЛЬНОСТІ ЛЮДИНИ

Спеціальність 05.13.23 – cистеми та засоби штучного інтелекту

Автореферат

дисертації на здобуття наукового ступеня

кандидата технічних наук

Харків – 2003

Дисертацією є рукопис.

Робота виконана в Донецькому державному інституті штучного інтелекту Міністерства освіти і науки України.

Науковий керівник д.т.н., професор

Бондаренко Михайло Федорович,

ректор Харківського національного університету радіоелектроніки

 

Офіційні опоненти:

д.т.н., професор Любчик Леонід Михайлович, Харьківський політехнічний університет технічної кібернетики

к.ф.-м.н., доцент Лепеха Микола Павлович, Київський національний університет імені Тараса Шевченка

Провідна установа

Інститут кібернетики ім. В.М. Глушкова НАН України, відділ теорії цифрових автоматичних машин і систем, м. Київ

Захист відбудеться 24.02.2003 р. о 14 годині на засіданні спеціалізованої вченої ради Д. 64.052.01 Харківського національного університету радіоелектроніки Міністерства науки і освіти України

З дисертацією можна ознайомитись в бібліотеці Харківського національного університету радіоелектроніки, бібліотеці Донець-кого державного інституту штучного інтелекту

Автореферат розісланий 22.01.2003 р.

Вчений секретар

спеціалізованої вченої ради Саєнко В.І. 

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Сучасні тенденції розвитку суспільства спираються на принципово нові системи й засоби організації та керування прогресивними технологіями. Україна, що є осередком Європи, під час зміни форми власності та пов’язаних з цим інвестиційних процесів, безумовно, повинна вирішувати задачі модернізації пострадянського виробництва. Згідно зі світовими тенденціями, сучасні технологічні рішення, особливо в таких галузях, як приладобудування, виготовлення комп’ютерів, неможливо розглядати без застосування робототехнічних комплексів і систем штучного інтелекту. Розгортання досліджень при створенні цих систем спирається на різноманітні методи та математичний апарат, що відтворюють властивості відображення зовнішнього світу людиною. Вирішення задач створення систем штучного інтелекту, що здатні використовувати формалізовані властивості людини, дозволить Україні прискорити темпи модернізації існуючих і створення нових екологічно чистих підприємств.

Значний внесок до теоретичних розробок таких систем зробили Фукушима К., Васильєв В.І, Хьюбел Д., Форрест А.К., Шабанов-Кушнаренко Ю.П., Бондаренко М.Ф., Глезер В.Д.

Однією з головних задач, поставлених перед теорією та практикою штучного інтелекту, є моделювання функцій людського інтелекту. Сучасні алгоритми робототехнічних комплексів і штучних інтелектуальних систем орієнтовані на безпосередню обробку зорової інформації з фіксованим часом реагування. Раптова зміна зовнішнього світу, що може бути представлена перешко-дами, вибухами, спалахами, потребує динамічної оцінки та вироблення рішень, швидкість яких змінна й залежить від параметрів явищ, таких, як відстань до перешкоди, яскравість, тощо. Людина динамічно реагує на ці явища, диференційно оцінюючи їх якості. Тому актуальне саме дослідження реакції людини відносно прийняття рішень при раптових змінах зорової інформації. Відомо, що обробка експериментальних досліджень має значну вартість і займає чималий час. Згідно із сучасними тенденціями шляхи зменшення цих витрат актуально вирішувати за допомогою автоматизованих систем, що базуються на комп’ютерній техніці.

Таким чином, актуальність дослідження обґрунтовується: з одного бо-ку, необхідністю створення спеціального математичного та програмного забезпечення робототехнічних систем і систем штучного інтелекту, що імітують поведінку людини відносно сенсорної інформації як відображення зовнішнього світу; а з іншого боку – застосуванням сучасних методів матема-тич-ного апарату й комп’ютерної техніки при автоматизованій обробці експери-менту, що дозволяють зменшити витрати фінансів і часу на проведення й обробку експерименту та поширюють можливості аналізу простору досліджень.

Зв'язок роботи з науковими програмами та темами. Дисертаційна робота виконувалась у Донецькому державному інституті штучного інтелекту як складова частина науково-дослідницької роботи Міністерства освіти і науки України “Дослід-ження властивостей інтелекту людини з метою створення роботів та ЕОМ нового покоління”, шифр 701-98 № 0100U002228, у якій Е.А. Золкіна була виконавцем підрозділу теми. Матеріали дисертації використано також як підрозділ Державної науково-технічної програми “Образний комп’ютер”.

Мета дослідження. Метою дослідження є розробка методів, моделей та алгоритмів зорової оцінки природних явищ і принципів їх застосування у штучних інтелектуальних системах різноманітного призначення, що підви-щують якісні показники систем керування, які діють або розробляються. Для досягнення поставленої мети необхідно було створити новий підхід до якісного та кількісного аналізу психофізичної реакції людини на динамічні зміни зовнішнього світу, що фіксуються зоровими сенсорами, дозволяючи приймати рішення з різною швидкістю. Відповідно до поставленої мети та розробленого підходу сформульовані задачі дисертаційного дослідження:

удосконалити методику визначення показників зорового розпізнавання двовимірних зображень людиною через автоматизований експеримент;

здійснити дисперсійний і кореляційний аналіз та оцінювання показників сприйняття двовимірних зображень людиною;

реалізувати перевірку критеріїв оцінки якості психофізичної реакції;

створити логіко-формальні моделі відображення зорової інформації;

синтезувати моделі прогнозу психофізичної реакції людини на динамічні зміни зорової інформації;

розробити моделі й алгоритми штучної інтелектуальної системи з комп’ютерним розпізнаванням зорових образів і двохальтернативною оцінкою рішень, що приймаються цією системою.

Об’єкт дослідження. Зорові характеристики людини у процесі розпізнавання двовимірних зображень.

Предмет дослідження. Модель, алгоритм і програми оцінки психофі-зичної реакції нервової системи людини при розпізнаванні двовимірних зобра-жень; модель, алгоритми та програмне забезпечення штучної зорової системи.

Наукова новизна отриманих результатів. У процесі вирішення поставлених задач автором отримані такі результати:

дістав подальшого розвитку метод визначення показників психо-фізичної реакції людини на двовимірні динамічні зміни навколишнього світу через автоматизовану обробку зорової інформації, що дозволяє аналізувати прийняття рішень і взаємозв’язки лівого та правого полів зору та доведена доцільність застосування цього методу;

удосконалено методологію аналізу результатів експерименту з урахуванням фізіологічних зв’язків сприйняття зорової інформації людиною, що дозволяє оцінити якість обробки зорової інформації та швидкість реагування за різних зовнішніх умов;

дістали подальшого розвитку критеріальні дослідження процесів формування зорових образів і моделювання принципів їх відтворення на основі формальних логік, що дозволяє користуватися ними при розробленні штучних інтелектуальних систем;

уперше створені моделі якісного та кількісного прогнозу й оцінки психофізичної реакції людини на нестаціонарну зорову інформацію, а також моделі оцінки переваги (асиметрії) одного з двох полів зору над іншим з виявленням рівня впливу кожного з факторів на загальну реакцію.

Практичне значення отриманих результатів. Наукові результати дисерта-ційного дослідження дозволили сформулювати та вирішити технічні задачі проектування й експлуатації робототехнічних та інтелектуальних систем:

розроблено узагальнений алгоритм штучної інтелектуальної системи, що дозволяє реагувати на несподіванки зовнішнього світу за реальним часом з різною швидкістю;

створено алгоритми та програмні інтерфейси подвійного оцінювання зорової інформації залежно від зовнішніх обставин, що дозволяє керувати швидкістю реакції мобільного робота;

створено алгоритм прийняття рішень штучною інтелектуальною системою, що імітує особливості інтелектуальної діяльності людини за оцінкою зорової інформації, який покладено в основу спеціального програмного забезпечення системи керування рухом і реагування на зміни обставин зовнішнього світу мобільного робота, що дозволяє запобігати зіткненню з раптовими перешкодами;

розроблено моделі, алгоритми та програмні засоби, призначені для використання їх при технічному проектуванні систем штучного інтелекту різноманітного призначення.

Результати дисертаційного дослідження використано на кафедрі анестезіології, інтенсивної терапії та медицини невідкладних станів факультету післядипломної освіти Донецького національного медичного університету за допомогою розроблених у дослідженні моделей і алгоритмів, що імітують зорову діяльність людини, при діагностиці нейрохірургічних захворювань. Крім того, одержано покращання показників функціонування мобільного робота, що створений в Інституті проблем штучного інтелекту. Підвищено якість розпізна-вання на 6,3та зменшено час розпізнавання на 32 % за рахунок використання логіко-формальних моделей і залежностей взаємозв’язку психофізичної реакції людини з урахуванням диференціації на ліве та праве поля зору.

Основні положення, висновки та результати дослідження також використані при викладанні таких навчальних дисциплін, як “Основи моделювання та системний аналіз”, “Інтелектуальні системи й обчислювальні мережі”, “Основи системного аналізу процесів та виробництв” на кафедрах програмного забезпечення інтелектуальних систем і технічної інформатики Донецького державного інституту штучного інтелекту та при викладанні дисциплін “Інтенсивна терапія” й “Анестезіологія” на кафедрі анестезіології, інтенсивної терапії та медицини невідкладних станів факультету післядипломної освіти Донецького національного медичного університету.

Особистий внесок здобувача. Згідно з переліком опублікованих за темою дисертації робіт усі результати дисертації отримані автором самостійно.

У роботах [1, ] наведено удосконалену методику визначення показників зорового розпізнавання двовимірних зображень людиною з урахуванням асиметрії полів зору, через автоматизований експеримент; у роботі [3] представлено алгоритм виявлення показників зорового розпізнавання та на основі отриманих експериментальних даних реалізована перевірка критеріїв оцінки якості психофізичної реакції, [4] – наведені створені логіко-формальні моделі відображення зорової інформації людиною; [5] – представлені експериментальні дані, на основі яких були здійснені дисперсійний і кореляційний аналіз та оцінювання показників сприйняття двовимірних зображень людиною; у роботі [6] наведено удосконалену методологію автома-тизованої обробки експерименту й моделі прогнозу психофізичної реакції людини на динамічні зміни зорової інформації.

Апробація результатів дисертації. Основні положення та результати дисертаційної роботи були подані й розглянуті на Міжнародній конференції “Информационные технологии в науке, образовании, телекомму-никации, бизнесе”, Україна, Крим, Гурзуф (Ялта). – 2001; Міжнародній науково-практичній конференції KDS – 2001 “Знание – Диалог – Решение”. – Санкт-Петербург. – 2001; Міжнародній науковій конференції “Интеллектуальные и многопро-цессорные системы”. – Таганрог; Донецьк. – 2001.

Публікації. За результатами дисертаційної роботи опубліковано 10 робіт, з них 6 статей у фахових виданнях.

Cтруктура й обсяг роботи. Дисертація складається зі вступу, чотирьох розділів, висновків, списку використаної літератури. Загальний обсяг дисертаційної роботи становить 186 сторінок тексту, 141 сторінка основної текстової частини, у тому числі 31 рисунок, 29 таблиць, 150 бібліографічних найменувань на 13 сторінках.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі розкриті сутність і стан проблеми, обґрунтована актуальність теми дисертації та необхідність проведення експериментальних досліджень, викладені мета роботи, особистий внесок здобувача, практичне значення отриманих результатів і наукова новизна, коротко розкритий зміст дисертаційної роботи.

У першому розділі здійснено огляд вітчизняної та зарубіжної літератури з питань, пов'язаних з темою дисертаційної роботи. Розглянуті основні принципи побудови сучасних систем розпізнавання образів. Вирішальну роль для розпізнавання в таких системах відіграє ступінь їх інтелектуальності. На даний момент цей ступінь інтелектуальності є недостатнім для розпізнавання складних образів, що превалюють у реальному світі. Водночас людина легко розпізнає ці складні образи, недоступні сучасним технічним системам розпізнавання зорових образів. Тому природним видається прагнення використовувати при побудові технічних систем розпізнавання принципи обробки людиною зорової інформації. Одним з таких принципів обробки інформації людиною є наявність двох різних механізмів обробки зорової інформації (асиметрія полів зору). Однак, як показує здійснений у роботі аналіз літературних джерел, безпосереднє використання принципів цих механізмів опрацювання інформації в технічних системах неможливе через недостатню вивченість ряду важливих моментів обробки зорової інформації людиною.

На підставі проведеного аналізу сформульовані задачі дослідження даної дисертаційної роботи та визначена його методологія, що складається з двох частин: одна відображає методологію проведення автоматизованого експерименту, що заснована на використанні приладу динамічного змінювання об’єктів зору, який скомбіновано з персональним комп’ютером; друга половина відображає методологію статистичного аналізу, результатом якого є виявлення залежностей та створення моделей прогнозу психофізичної реакції людини, алгоритму та програмного інтерфейсу штучної інтелектуальної системи. Викладення матеріалів дисертаційного дослідження підпорядковується саме цій методології, тобто другий і третій розділи роботи присвячені автоматизованому експерименту, а частина третього та четвертий розділ – статистичній обробці експериментальних даних і створенню моделей та алгоритмів для штучної інтелектуальної системи.

У другому розділі здійснюється постановка задачі розпізнавання й викладається методика проведення експериментальних досліджень. Зміст мето-дики складається з вибору засобів і технічного забезпечення експерименту, створення алгоритму та програмного інтерфейсу фіксації експериментальної інформації, саме експерименту, що здійснюється на представницькій вибірці, розподілу буферів бази даних та їх заповненню інформаційними масивами експерименту. При створенні алгоритму автоматизованого експерименту передбачено використання можливостей приладу, що використовується для вимірів психофізичної реакції людини на зорову інформацію.

Для визначення закономірностей, що виявляються при розпізнаванні зорової інформації, використано тахістоскопічний метод. Принцип тахістоскопічної подачі сигналів заснований на особливостях структурно-функціональної організації зорової системи людини: зорова інформація надходить до лівого поля зору (ЛПЗ) та праве поле зору (ППЗ). На базі алгоритму був створений програмний інтерфейс. Згідно з алгоритмом і програмами в експерименті беруть участь випробувані та людина, яка приймає рішення (ЛПР).

На початку роботи за допомогою генератора випадкових символів задаються умови проведення експерименту: час перед пред'явленням першого зображення, час експозиції зображення, розмір зображення, час між пред’явленням наступного символу. Необхідно також задати такі змінні, як відстань від точки фіксації до зображення, азимут у градусах, розмір, кут повороту зображення, що пред’являється.(рис.1)

Рис. 1 Блок-схема алгоритму автоматизованої системи експериментальних досліджень психофізичної реакції людини на зорову інформацію

Експериментальні дослідження проводилися в темному приміщенні, на екран дисплея монокулярно (спостерігач дивився одним ведучим оком), унілатерально (зображення пред'являлися в одному полі зору у випадковому порядку: то ліворуч, то праворуч від точки фіксації погляду випробуваного). Починав працювати таймер для розрахунку часу розпізнавання, коефіцієнту асиметрії. При визначеній яскравості спостерігач бачив зображення, давав вербальну відповідь і натискав клавішу "Пробіл" (фіксувався час розпізнавання). Людина, яка приймала рішення, очікувала натискання лівої клавіші миші випробуваним і вела облік правильності відповіді натисканням на клавішу "Пробіл". Далі з бази даних генератором випадкових символів (ГВC) вибиралося наступне зображення (зміна зображення) і процес продовжувався до пред’явлення останнього зображення. Після пред'явлення останнього зорового образу розраховувались показники зорового розпізнавання: час розпізнавання, коефіцієнт асиметрії, кількість правильних відповідей, і експеримент завершувався. За необхідності задавали умови для проведення наступного експерименту: кут повороту пред’явленого зображення, розмір зображення, час експозиції зображення тощо.

Серед початкових умов є кількість ступенів яскравості STEPS. Тобто якщо заданий максимальний номер градації яскравості, що можливий під час експерименту, та час відображення одного ступеня t, то легко визначити час пред'явлення образу. Номер ступеня яскравості, отриманий із досліду, лежить в інтервалі [0..STEPS], позначимо його Sзмін. Тоді час пред'явлення:

TSзмін . (1)

Зв'язок рівня яскравості образу з обраною кількістю градацій яскравості здійснюється в такий спосіб: кожна точка картинки представлена чотирма числами (рівень червоного, синього, зеленого й інтенсивність), і, пропорційно змінюючи інтенсивність, ми можемо змінювати яскравість усієї картинки. Максимальній яскравості відповідає поточна інтенсивність точки Івих, потім, залежно від обраної кількості кроків яскравості STEPS і номера поточного кроку N, інтенсивність змінюється згідно з (2):

I=(Івих/STEPS)*N . (2)

Отже, з початком експерименту для кожного образу починає працювати лічильник ступенів яскравості, відраховуючи їх від 0. Значення лічильника зростає через проміжок часу t, поки випробуваний не натисне кнопку миші (фіксується, при якій яскравості людина розпізнала зображення) чи поки яскравість зображення не стане максимальною. Після цього значення лічильника використовується для розрахунку часу розпізнавання.

У програмному інтерфейсі як вхідні параметри використовували:

тип поля зору (typefv), вектор ознак (х), кут повороту зображення (angle).

TYPE_FV = {left, right} – множина типів полів зору,

type_fv ( TYPE_FV ).

ANGLE = {00, 450, 900, 1350,1800} – множина кутів повороту зображення,

angle ANGLE.

X = { } – множина векторів ознак,

x = (distance, imagesize, brightness, image, timeexposition, placeshow),

distance – відстань випробуваного до екрану, 0 < distance <maxd,

imagesize – розмір зображення (стимулу), 0 < imagesize < maxs,

brightness – яскравість зображення, 0 < brightness < maxb,

image – зображення,

timeexposition – час експозиції зображення,

0 < timeexposition < maxte,

placeshow – місце пред’явлення зображення.

Під час автоматизованого експерименту були створені первинні інформаційні масиви, якими заповнено двадцять буферних підрозділів бази даних. Згідно з методологією дослідження проведено вибір методів аналізу інформаційних масивів.

За цією методикою створені алгоритми та програмні інтерфейси, що реалізують статистичний аналіз. Згідно з цим на першому етапі був обчислений середній час розпізнавання зображення. Нижче наводиться функція , аргументами якої є тип поля зору, кут повороту зображення й вектор ознак, а значенням – середній час розпізнавання:

(3)

, N – кількість випробуваних (4)

За результатами проведення експерименту також була обчислена середня кількість правильних відповідей. Нижче наводиться функція REPLYа, аргументами якої є тип поля зору, кут повороту зображення та вектор ознак, а значенням є обчислена середня кількість правильних відповідей

(5)

, N – кількість випробуваних, (6)

tl1, tr1 – середній час розпізнавання для ЛПЗ і ППЗ зображення з кутом
повороту 1;

tl2, tr2 – середній час розпізнавання для ЛПЗ і ППЗ зображення з кутом
повороту 2;

replyl1, replyr1 – середня кількість правильних відповідей для ЛПЗ і ППЗ зображення з кутом повороту 1;

replyl2, replyr2 – середня кількість правильних відповідей для ЛПЗ і ППЗ зображення з кутом повороту 2.

У третьому розділі наведені результати експериментальних досліджень асиметрії на прикладі розпізнавання людиною двовимірних зображень. Проводилися експериментальні дослідження з визначення часу розпізнавання, а також кількості правильних відповідей випробуваних при розпізнаванні зображень, що варіюють за ознаками.

При обробці отриманих у процесі експериментальних процедур первинних інформаційних масивів були застосовані методи, що засновані на використанні статистичного апарату. Для кожного масиву перевірена гіпотеза про нормальний розподіл і побудована гістограма перевірки нормального розподілу. У першому експерименті досліджувалися часові характеристики розпізнавання. В експерименті брало участь 106 осіб: студенти 1 – 4 курсів ДонДІШІ. Кожному випробуваному у випадковому порядку, то ліворуч, то праворуч від точки фіксації, пред'являлися плоскі зображення з кутами повороту: 0, 45, 90, 180. Набір складався з 32 зображень. Результати експериментальних даних представлені в табл. 1. У стовпцях зазначений час розпізнавання зображень, що варіюють за поворотами для кожного масиву в лівому полі зору (ЛПЗ) і правому полі зору (ППЗ). Для масивів розраховані основні статистичні оцінки при довірчій імовірності Р = 99,95у випадку розходжень між точками, а в тих випадках, коли довірчі інтервали мали близькі значення (частково перетиналися), вибирали довірчу ймо-вірність 95 Для зменшення погрішності шляхом нормування усунули ту частину варіації часу розпізнавання, що обумовлена індивідуальними розходженнями між людьми (нормування даних за вісьмома точками для лівого та правого полів зору). Далі шляхом нормування додатково усунули розходження між лівим і правим полями зору (нормування даних за чотирма точками окремо для лівого та правого полів зору). Як свідчать усереднені за допомогою статистичного аналізу експериментальні дані, для кутів повороту 450 і 900 з імовірністю 95 %, а для кута повороту 1800 з імовірністю більше 99,95 % час розпізнавання повернутих зображень для лівого поля зору менший, ніж для правого поля зору.

Час розпізнавання для лівого поля зору при розпізнаванні повернутих зображень менший у порівнянні з правим полем зору: при розпізнаванні зображень, повернутих на 45, – менший на 2,55при розпіз-наванні зображень із кутом повороту 90 – на 1,72а при розпізнаванні перевер-нутих зображень (180).

Таблиця 1

Статистичні оцінки розпізнавання двовимірних зображень

Дані екс-перимен-тальних дослід-жень | Шифр | Середній час роз-пізнаван-ня , с | Границі діапа-зону значень часу розпізна-

ванняс) при Р=99% | Диспер-сія D | Порівн. кв. відхи-лення S

Невіднор-мовані дані |

ЛПЗ-0 | 1,48 | 0,10 | 0,039 | 0,197

ті ж | ЛПЗ-45 | 1,645 | 0,08 | 0,047 | 0,216

ті ж | ЛПЗ-90 | 1,72 | 0,08 | 0,043 | 0,207

ті ж | ЛПЗ-180 | 1,51 | 0,10 | 0,059 | 0,242

ті ж | ППЗ-0 | 1,50 | 0,10 | 0,037 | 0,192

ті ж | ППЗ-45 | 1,686 | 0,08 | 0,021 | 0,145

ті ж | ППЗ-90 | 1,75 | 0,09 | 0,033 | 0,182

ті ж | ППЗ-180 | 1,67 | 0,14 | 0,069 | 0,263

Варіація (за вісь-мома точ-ками) | ЛПЗ-0 | 0,877 | 0,04 | 0,007 | 0,0819

ті ж | ЛПЗ-45 | 1,02 | 0,05 | 0,011 | 0,105

ті ж | ЛПЗ-90 | 1,07 | 0,04 | 0,006 | 0,079

ті ж | ЛПЗ-180 | 0,93 | 0,05 | 0,011 | 0,104

ті ж | ППЗ-0 | 0,93 | 0,05 | 0,01 | 0,100

ті ж | ППЗ-45 | 1,05 | 0,04 | 0,0065 | 0,081

ті ж | ППЗ-90 | 1,09 | 0,045 | 0,007 | 0,084

ті ж | ППЗ-180 | 1,04 | 0,06 | 0,017 | 0,130

Варіація (за чотир-ма точка-ми) | ЛПЗ-0 | 0,899 | 0,02 | 0,002 | 0,040

ті ж | ЛПЗ-45 | 1,049 | 0,03 | 0,004 | 0,060

ті ж | ЛПЗ-90 | 1,10 | 0,025 | 0,003 | 0,053

ті ж | ЛПЗ-180 | 0,955 | 0,032 | 0,004 | 0,064

ті ж | ППЗ-0 | 0,905 | 0,02 | 0,003 | 0,052

ті ж | ППЗ-45 | 1,025 | 0,03 | 0,004 | 0,063

ті ж | ППЗ-90 | 1,062 | 0,03 | 0,003 | 0,058

ті ж | ППЗ-180 | 1,009 | 0,035 | 0,005 | 0,074

Час розпізнавання для лівого поля зору – на 9,58менший у порівнянні з правим полем зору, розпізнавання ж неповернутих зображень здійснюється рівнозначно як у правому, так і в лівому полях зору людини, тому що ця різниця складає всього 1,33При розпізнаванні двовимірних зображень, що варіюють за поворотами, розраховувалася також середня кількість правильних відповідей випробуваних. Як свідчать експериментальні дані, кількість правильних відповідей більша в ЛПЗ у порівнянні з ППЗ. Підсумовуючи отримані результати, можна дійти висновку, що ліве поле зору має перевагу при розпізнаванні двовимірних зображень знайомих людині об’єктів (табл. 1)

Результати експериментальних досліджень часу розпізнавання двовимірних зображень для невіднормованих даних відображені на рис. 2

Рис. 2 Середній час розпізнавання двовимірних зображень, що варіюють за поворотами

У четвертому розділі на основі аналізу результатів експериментів, а також існуючих даних запропонована модель інтелектуальної діяльності нервової системи людини в процесі розпізнавання двовимірних зображень. Для створення математичних моделей прогнозу психофізичної реакції людини на динамічні зміни зорової інформації був проведений регресійний аналіз. Виді-лення факторів і відгуків та межі їх варіювання наведені в табл. 2.

Таблиця 2

Класифікація змінних експерименту

Вхідні фактори | min | max | Вихідні відгуки

Х1 – відстань до екрану | 20 см | 100 см | Y1 – узагальнений час розпізнавання

Y1Л для ЛПЗ

Y1П для ППЗ

Y2 – коефіцієнт асиметрії

Y3 – кількість правильних відповідей

Y3Л для ЛПЗ

Y3П для ППЗ

Х2 – розмір зображення | 1 см | 3 см | ті ж

Х3 – час пред'явлення | 0,2 с | 2с | ті ж

Х4 – місце пред'явлення | ЛПЗ | ППЗ | ті ж

Х5 – кількість зображень | 4 | 32 | ті ж

Х6 – час між пред'явленням чергового зображення | 1 с | 4 с | ті ж

Х7 – кут (азимут) | 0 | 12 | ті ж

Х8 – кут повороту зображення | 0 | 180 | ті ж

Х9 – тривалість спалаху | 0,1 с | 1 с | ті ж

Х10 – кількість градацій яскравості | 1 | 20 | ті ж

Х11 – колір спалаху | 1 | 7 | ті ж

Х12 – крок зростання яскравості | 0,1 с | 1 с | ті ж

Х13 – тип зображення | 1 | 16 | ті ж

Згідно з цією формалізацією створені моделі 7 – 13, що мають статистич-ні оцінки нормованої статистичної дисперсії не більше 0,06, тобто ці поліноми можна використовувати в задачах прогнозування у штучних інтелектуальних системах різноманітного призначення.

Y1 = 0,572+0,0023х1-0,14х2-1,341х3+1,091х4+0,054х5-0,0418х6+

+0,073х7+0,054х8-0,73х9-0,042х10-0,54х11+0,091х12+0,073х13 (7)

Y1л=1,415+0,0041х1-0,21х2-2,07х3+0,12х5-0,07х6+0,096х7+0,084х8-3,6х9-

-0,071х10 - 0,98х11 +0,16х12+0,19х13 (8)

Y1п = 1,843+0,0162х1-0,29х2-1,46х3+0,28х5-0,081х6-0,18х7-0,035х8-

0,7х9-0,088х10-0,03х11+0,19х12+,27х13 (9)

Y2 = 0,187+0,0019х1+0,07х2-0,03х3+0,9х4-0,0012х5-0,0081х6-0,071х7+

+0,0041х8-0,004х9-0,011х10-0,087х11-0,04х12+0,067х13 (10)

Y3=19,635-0,008х1+0,91х2+0,71х3-0,04х4-0,091х5+1,1х6-0,07х7-0,015х8-

- 0,12х9-0,033х10-0,87х11-0,14х12-0,043х13 (11)

Y3л = 15,496 - 0,0061х1 +1,61х2 +1,13х3 - 0,12х5 +1,41х6 - 0,092х7 - 0,009х8 -

- 0,09х9-0,035х10-0,19х11-0,8х12-0,004х13 (12)

Y3п =4,891- 0,0092х1 + 2,73х2 + 0,84х3 - 0,14х5 + 1,16х6 - 0,081х7 - 0,031х8 - 0,15х9 -

- 0,039х10 - 0,21х11 - 0,19х12-0,005х13 (13)

На основі отриманих моделей створено алгоритми та програмні інтерфейси штучної інтелектуальної системи, що має подвійний шлях прийняття рішень, тобто імітує психофізичну реакцію людини на сенсорну інформацію лівого чи правого полів зору.

Таблиця 3

Значимість змінних

Змінні | х1 | х2 | х3 | х4 | х5 | х6 | х7 | х8 | х9 | х10 | х11 | х12 | х13

У1 | 2,1 | -2,9 | -3,4 | 5,6 | 1,99 | -2,2 | 4,1 | 4,4 | -2,7 | -2,1 | -3,81 | 2,4 | 2,6

У2 | 2,3 | 3,6 | -2,7 | 7,3 | -2,3 | -3,0 | -5,2 | 6,4 | -2,5 | -2,2 | -4,12 | -2,1 | 3,7

У3 | -4,7 | 4,1 | 5,3 | -3,9 | -3,7 | 4,2 | -3,6 | -5,5 | -4,1 | -2,3 | -5,1 | -2,3 | -3,7

У1л | 7,4 | -6,5 | -5,9 | - | 3,4 | -2,9 | 5,5 | 8,6 | -6,1 | -3,1 | -6,4 | -2,1 | 3,6

У1п | 7,3 | -5,7 | -6,1 | - | 4,6 | -3,8 | -9,4 | -11,2 | -5,6 | -2,4 | -5,6 | -2,0 | 2,4

У3л | -5,1 | 3,6 | 3,1 | - | -2,9 | 4,4 | -3,9 | -4,6 | -3,4 | -2,6 | -4,1 | -2,1 | -4,2

У3п | -6,2 | 4,2 | 3,8 | - | -5,1 | 6,7 | -4,5 | -6,4 | -4,8 | -2,7 | -4,3 | -2 | -3,8

Відповідно до значимості змінних, що виділені в табл. 3, штучна система відносно динамічних характеристик відстані та швидкості руху зображень прогнозує час прийняття рішень згідно з поліномами 7 – 9, послідовно перевіряє перевагу згідно з поліномом 10 та перевіряє надійність прийняття рішень згідно з поліномами 11 – 13, вибираючи той прогноз, що найбільш ефективно оцінює рішення щодо керування рухом.

Ці моделі використано при створенні спеціального математичного забезпечення системи керування рухом мобільного робота, що дозволило зменшити час розпізнавання перешкоди на 32 % і підвищити якість розпізнавання зображень на 6,3 %. Графіки порівняльних дій наведені на рис. 3 і рис. 4.

Рис. 3. Реакція (час розпізнавання перешкод мобільного робота)

Рис. 4 Оцінка якості розпізнавання зображення

Це дозволяє збільшити енергетичні ресурси щодо руху робота. З метою адаптації алгоритму та програмного інтерфейсу для будь-якої штучної інтелектуальної системи створено програмний інтерфейс, що відтворює удосконалену методику.

ВИСНОВКИ

У дисертаційній роботі наведено теоретичне обґрунтування та нове вирішення наукової задачі, що полягає у створенні математичних моделей прогнозу часу реагування та якості розпізнавання зорової інформації через психофізичну реакцію людини разом з використанням методів статистичного оцінювання та моделювання, що орієнтовано на застосування в різноманітних системах штучного інтелекту, які функціонують в умовах сприйняття зорової інформації при нестаціонарних характеристиках об’єктів зовнішнього світу, домінуючими з яких є швидкість їх появи, що обумовлює диференціацію реагування системи керування та прийняття рішень. Аналіз отриманих результатів дає підставу зробити такі висновки:

1. Проаналізовано проблеми прийняття рішень у штучних інтелекту-альних системах. За результатами аналізу існуючих алгоритмів дістав подальшого розвитку метод визначення показників психо-фізичної реакції людини на двовимірні динамічні зміни навколишнього світу та доведена доцільність його застосування через автоматизовану обробку зорової інформації, що дозволяє аналізувати швидкість прийняття рішень і взаємозв’язки лівого та правого полів зору.

2. Згідно з поставленими задачами та вимогами сучасності удосконалено методологію аналізу результатів експерименту з урахуванням фізіологічних зв’язків сприйняття зорової інформації людиною, що дозволяє оцінити якість обробки зорової інформації та швидкість реагування за різних зовнішніх умов. Розроблено алгоритми та програмні інтерфейси автомати-зованої обробки результатів експерименту з виявлення психофізичної реакції людини, що дозволило створити комплексну програму моделювання принципів відтворення образів в інтелектуальній діяльності людини з метою їх використання при створенні систем штучного інтелекту різно-манітного призначення.

3. Дістали подальшого розвитку критеріальні дослідження процесів формування зорових образів і моделювання принципів їх відтворення на основі формальних логік, що дозволяє користуватися ними при розробленні штучних інтелектуальних систем. Це дозволило оцінити однорідність вибіркових масивів, їх взаємні зв’язки з різним рівнем ймовірностей.

4. Уперше створені регресійні поліноми, як моделі якісного та кількісного прогнозу й оцінки психофізичної реакції людини на нестаціонарну зорову інформацію, а також моделі оцінки переваги (асиметрії) одного з двох полів зору над іншим з виявленням рівня впливу кожного з факторів на загальну реакцію, модель оцінки переваги (асиметрії) одного з двох полів зору над іншим з виявленням рівня впливу кожного з факторів на загальну реакцію. Застосування цих моделей в системах штучного інтелекту дає можливість прогнозувати реакцію на події зовнішнього світу в алгоритмах та програмах штучних інтелектуальних систем.

5. Створено алгоритми та програмні засоби (інтерфейси) прогнозу реакції людини на зовнішні явища, що використано при технічному проектуванні спеціального програмного забезпечення підсистем керування рухом мобільного робота.

6. Створені моделі прогнозу часу реакції людини, що були використані клінікою Донецького національного медичного університету при діагностиці нейро-хірургічних захворювань. Порівняння прогнозу з вимірами реакції людини з нейрохірургічними пошкодженнями дозволяє виділити діагноз. Разом з тим використовуються моделі оцінки надійності розпізнавання в порівнянні з відповідями хворих; моделі, алгоритми та програмні інтерфейси використо-вуються в навчальному процесі в Донецькому державному інституті штучного інтелекту та Донецькому національному медичному університеті.

СПИСОК ОПУБЛІКОВАНИХ ЗА ТЕМОЮ ДИСЕРТАЦІЇ ПРАЦЬ

1.

Шульга Е.Ю., Золкина Э.А. Методика изучения сравнительных характеристик переработки зрительной информации в связи с асимметрией мозга человека // Искусственный интеллект. – 2001. – № . – С. 102-110.

2.

Золкина Э.А., Шульга Е.Ю. Опознание зрительных образов полушариями мозга // Искусственный интеллект. – 2001. – № 2. – С. .

3.

Золкина Э.А. Выявление параметров опознания зрительной информации // Математичні машини і системи. – 2001. – № . – С. 160-163.

4.

Золкіна Е.А. Формалізація результатів дослідження розпізнавання двовимірних зображень лівою та правою півкулями мозку людини // Матема-тичні машини і системи. – 2002. – № . – С. .

5.

Золкина Э.А. Временные параметры опознания двумерных изображений полушариями головного мозга человека // Искусственный интеллект. – 2000. – № 3. – С. 618-622.

6.

Золкина Э.А. Межполушарная асимметрия при распознавании зрительных образов // Проблемы бионики. – 2002. – Вып. 56. – С. 24-26.

7.

Золкина Э.А. Функциональная схема активной интеллектуальной системы распознавания зрительных образов // Труды XXVIII Междунар. конф. “Информа-ционные технологии в науке, образовании, телеком-муникации, бизнесе”, Украина, Крым, Гурзуф (Ялта). – 2001. – С. 99-101.

8.

Золкина Э.А., Шульга Е.Ю. Разработка алгоритма программы для созда-ния систем по опознанию зрительных образов // Труды Междунар. науч.-практ. конф. KDS – 2001 “Знание – Диалог – Решение”. – Т. . – СПб. – 2001. – С. 268-271.

9.

Ященко В.А., Ваврик Р.П., Золкина Э.А. Система технического зрения робота // Труды Междунар. науч.-практ. конф. KDS – 2001 “Знание – Диалог – Решение”. – Т. . – Санкт –Петербург. – 2001. – С. 669-676.

10.

Золкина Э.А. Распознавание изображений полушариями головного мозга человека // Тезисы докл. Междунар. науч. конф. “Интел-лек-туальные и многопроцессорные системы”. – Таганрог - Донецк. – 2001 – С. 28-31.

АННОТАЦИЯ

Золкина Э.А. “Модели и методы оценивания и распознавания двумерных изображений в интеллектуальной деятельности человека”.

Диссертация на соискание учёной степени кандидата технических наук по специальности 05.13.23 – системы и средства искусственного интеллекта, Харьков, 2003.

Диссертация посвящена разработке математических моделей, алго-рит-мов и специального программного обеспечения прогноза и оценивания психо-физической реакции человека на нестационарное изменение окружающего мира.

Основная часть работы методологически представлена двумя аспектами: с одной стороны – автоматизированная обработка эксперимента с собственной методологией и выделением факторов, с другой стороны – методология обработки опытной информации, заносимой в разделы базы данных при функционировании автоматизированной системы проведения эксперимента. Автоматизированная система проведения эксперимента основывается на комплексе технических средств, объединённом с известными устройствами исследования зрительной информации. Программное обеспечение системы базируется на версиях Windows. На основании анализа современных исследований осуществлена постановка рабочих гипотез относительно переработки человеком в совокупности сенсорной информации, в частности зрительной. Рабочая гипотеза основывается на отображении явлений внешнего мира, в которой нейрофизиологические связи человеческого мозга находят своё выражение в соответствующих психофизических реакциях. Психофизические реакции дифференцированы относительно полей зрения. В работе проведена классификация переменных – факторов, характеризующих явления внешнего мира, к которым относятся: расстояние до экрана, размер изображения, время предъявления, место предъявления, количество изображений, время между предъявлением очередного изображения, угол (азимут), угол поворота изображения, число градаций яркости, шаг нарастания яркости, длительность вспышки, цвет вспышки, тип изображения, а также функциональные переменные – отклики, которые характеризуют время распознавания и качество оценки явлений. Выделенные отклики дифференцированы относительно левого и правого полей зрения на основании чего возможно производить качественную оценку преобладания реакции через асимметрию. Рассмотрены вопросы влияния помех на психофизическую реакцию человека. Основной помехой восприятия зрительных образов принято считать вспышки света, препятствующие нормальному отображению зрительных образов.

Исходя из субъективных особенностей исследуемых, в методологии предусматривается выравнивание зрительной реакции через аккомодацию. Для автоматизированной системы созданы логико-формальные модели и алгоритмы, на базе которых синтезировано специальное программное обеспечение. В его основе лежит итеративное использование созданных программных функций. Пространственное ориентирование числовых значений этих функций позволяет формировать информационные массивы и на их основе информационные матрицы, необходимые для проведения статистического анализа. Проведенный статистический анализ информационных массивов включает в себя статистическую проверку гипотез при двухкритериальном оценивании. Это оценивание позволяет принять или отвергнуть рабочую гипотезу относительно дифференциации и преобладания полей зрения психофизической реакции человека. Сформированы корре-ляционные матрицы и, соответственно, формализованы парные параметрические связи факторов. Синтезированы полиномы и для них выделены оценки охвата статистического материала и уровни значимости каждого фактора. На основании методологии анализа сформировано специальное математическое и программное обеспечение, предназначенное для функционирования в системах искусственного интеллекта, а разработанные модели составили основу алгоритма и программного интерфейса движения робота. Усовершенствование методологии автоматизи-рованной технологии обработки данных, совмещённое с комплексом методов статистического анализа, позволяет применять аппаратно-программный комплекс, составля-ющий основу исследований при синтезе различных систем искусственного интеллекта.

Ключевые слова: модели, алгоритмы, анализ, психофизическая реакция, автоматизированный, оценки, критерии, статистика.

АНОТАЦІЯ

Золкіна Е.А. “Моделі та методи оцінювання і розпізнавання двовимірних зображень в інтелектуальній діяльності людини”.

У дисертації на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.23 – системи та засоби штучного інтелекту, Харків, 2003.

Дисертація присвячена розробці математичних моделей, алгоритмів і спеціального програмного забезпечення прогнозу й оцінювання психофізичної реакції людини на нестаціонарну зміну навколишнього світу. На основі методології аналізу сформоване спеціальне математичне та програмне забезпечення, призначене для функціонування в системах штучного інтелекту, а розроблені моделі склали основу алгоритму та програмного інтерфейсу руху робота. Удосконалення методології автоматизованої технології опрацювання даних, сполучене з комплексом методів статистичного аналізу, дозволяє застосовувати апаратно-програмний комплекс, що складає основу досліджень при синтезі різних систем штучного інтелекту.

Ключові слова: моделі, алгоритми, аналіз, психофізична реакція, автоматизований, оцінки, критерії, статистика.

ABSTRACT

Zolkina E.A. “Models Both Methods of an Estimation and Discernment of Two-dimensional Images in Intellectual Activity of the Person”.

In a thesis on competition of a scientific degree of the candidate of engineering science on a speciality 05.13.23 – Systems and Tools of an Artificial Intelligence, Kharkov, 2003.

The thesis is devoted to development of mathematical models, algorithms both special software of the prognosis and estimation psychophysical of a response of the person on a non-stationary modification of the enclosing world. Because of methodologies of the analysis is generated special mathematical and software intended for operation in systems of an artificial intelligence, and the developed models have made a basis of algorithm and program interface of driving of the robot. The refinement of the methodology of an automated process engineering of data processing combined with a complex of methods of a statistical analysis, allows to apply a hardware-software complex, component a basis of researches for want of synthesis of various systems of an artificial intelligence

Key words: models, algorithms, analysis, psychophysical a response automated, evaluations, criterions, statistician.