У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





ВІННИЦЬКИЙ ДЕРЖАВНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ

ВІННИЦЬКИЙ ДЕРЖАВНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ

ГЕРЦІЙ ОЛЕКСАНДР АНАТОЛІЙОВИЧ

УДК 681.32:621.38

РОЗРОБКА ОБЧИСЛЮВАЛЬНОЇ СХЕМИ ГРУБОЇ - ТОЧНОЇ ОБРОБКИ ЗОБРАЖЕНЬ ДЛЯ СИСТЕМИ РОЗПІЗНАВАННЯ ОБРАЗІВ

Спеціальність: 01.05.02 - “Математичне моделювання та обчислювальні методи”

АВТОРЕФЕРАТ

дисертації на здобуття наукового ступеня

кандидата технічних наук

Вінниця - 2001

Дисертацією є рукопис.

Робота виконана у Вінницькому державному технічному університеті Міністерства освіти і науки України

Науковий керівник: | кандидат технічних наук, cтарший науковий співробітник Тимченко Леонід Іванович, Вінницький державний технічний університет, старший викладач кафедри проектування комп’ютерної, біомедичної та телекомунікаційної апаратури.

Офіційні опоненти: | доктор технічних наук, професор Квєтний Роман Наумович, Вінницький державний технічний університет, завідувач кафедри автоматики та інформаційно-вимірювальної техніки

доктор фізико-математичних наук, професор Оганесян Альберт Георгійович, Національний університет “Львівська політехніка”, професор кафедри електронних засобів інформаційно-комп’ютерних технологій.

Провідна установа: | Державний науково-дослідний інститут інформаційної інфраструктури Державного комітету зв’язку та інформатизації і НАН України, відділ інформаційних технологій і систем (м. Львів).

Захист відбудеться “ 26 жовтня 2001 р. о 12 00 годині на засіданні спеціалізованої вченої ради Д 05.052.01 у Вінницькому державному технічному університеті за адресою: 21021, м. Вінниця, Хмельницьке шосе, 95.

З дисертацією можна ознайомитись у бібліотеці Вінницького державного технічного університету за адресою: 21021, м. Вінниця, Хмельницьке шосе, 95.

Автореферат розісланий “ 24 ” вересня 2001 р.

Вчений секретар

спеціалізованої вченої ради Захарченко С.М.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Головна мета розпiзнавання зображень полягає в отриманнi їх опису та встановлені відповідності цих описiв до моделей класiв зображень. Перед початком аналiзу часто виникає необхiдність провести попередню обробку вхiдного зображення - наприклад здiйснити корекцiю i нормалізацію шкали яскравостi, видалити розмитостi та шуми. Для порiвняння двох і бiльше зображень їх приводять у вигляд придатний для встановлення відповідності, тобто перед порiвнянням їх видозмiнюють спецiальними перетворенями. Найчастiше в описi зображення використовують його частини, а не ціле зображення, тому перед складанням опису виконується сегментацiя зображення. Описи моделей зображень визначають класифікацію зображень, тому зображення, що аналiзується, вiдноситься до такого класу до якого можна встановити вiдповiднiсть (мiж описами зображення i моделi).

Автоматична ідентифікація людських облич стала областю активного дослідження за останні 20 років. Хоча розпізнавання облич, здається, не представляє особливих труднощів для більшості людей, автоматизовані системи розпізнавання облич не спроможні забезпечити задовільну ефективність через велику кількість можливих змін у представленні зображень облич і схожості різних облич. Ця задача, отже, все ще є складною задачею і розглядається як одна з фундаментальних проблем в аналізі образів.

Окрім важливості задачі розпізнання облич із погляду дослідження, вона має ряд комерційних і юридичних застосувань. Ідентифікація людини по його обличчю виконується за допомогою неконтактного виміру, що має переваги над контактними методами. Задача розпізнавання облич може бути визначена як ідентифікація одного або більшої кількості персон із статичних або відео зображень сцени, використовуючи створену базу даних облич. Рішення задачі включає сегментацію облич із наведених сцен, відбір ознак з області обличчя, ідентифікацію і порівняння.

Для вирiшення вищезгаданих завдань видається актуальним створення єдиної системотехнічної та алгоритмiчної основи для синтезу простих обчислювальних схем, методів та алгоритмiв попередньої обробки зображень з їх сегментацiєю та формалiзованих процедур опису окремих частин з високою адаптивною здатнiстю на основi розвитку iдей алгебраїчного пiдходу до завдань розпiзнавання.

В зв'язку з цим актуальна задача розробки схеми “грубої” - “точної” обробки зображень та методiв попередньої обробки з наступним аналiзом її результатiв для компактного представлення даних з великою гнучкiстю вибору та обробки ознак за умови збереження її простоти i завадостiйкостi. В даній роботі розглянуто приклади розпізнавання обєктів на основі запропонованої схеми “грубої” - “точної” обробки зображень та методу компактного їх опису.

Зв’язок роботи з науковими програмами, планами, темами. Подані в дисертаційній роботі результати були отримані автором під час проведення досліджень в рамках виконання науково–дослідних робіт, які проводились разом із НВО “Астрофізика” м. Москва (роботи проводилися при модернізації апаратури, яка розроблялась в рамках господарчих тем “Преобразователь”, “Курд” і “Кибер” (номер держ. реєстрації 01890065739)), що виконувались СКТБ “Квантрон” ВПІ за період 1983- 1991 р. та при виконанні наукового проекту 67-Д-148 “Принцип організації комп’ютерів логіко-часового типу” (номер держ. реєстрації 0196U015323), якій виконувався у ВДТУ за рахунок коштів державного бюджету.

Мета і задачі дослідження. Метою роботи є підвищення швидкості кореляційного порівняння ознак зображень на основі їх компактного подання для задач розпізнавання образів.

Об’єктом дослідження є процес “грубої” – “точної” обробки напівтонових зображень та методи комп”ютерного розпізнавання образів.

Предметом досліджень є методи та моделі, які застосовуються в процесі “грубої” – “точної” обробки напівтонових зображень та в комп”ютерній системі розпізнавання образів.

Методи дослідження: методи математичного аналізу при створенні математичної моделі для системи компактного подання зображень; математичний апарат препарування зображень для розробки методу сегментації; теорії множин, математичної логіки, теорії алгоритмів для створення методів грубого та точного подання й аналізу напівтонових зображень; теорії штучних нейронних мереж та кореляційного аналізу; математичного та імітаційного моделювання для створення системи розпізнавання образів.

Задачі дослідження:

1. Аналіз методів розпізнавання на прикладі зображень людських облич. Аналіз взаємозв'язку відомих методів і структур розпізнавання образів, їхнє узагальнення і модифікації. Аналіз початкових теоретичних положень до розробки методів грубого подання й аналізу напівтонових зображень.

2. Розробка математичних моделей обчислювальної схеми “грубої” – “точної” обробки напівтонових зображень для їх розпізнавання, формування урівноважуючих кривих із кореляційним аналізом та мережної класифікації зображень.

3. Розробка математичних моделей точної схеми обробки для визначення координат зображень протяжних лазерних трас

4. Розробка алгоритмів і програмних моделей для компактного подання образів.

5. Порівняльний аналіз ефективності розробленої системи розпізнавання образів. Експериментальні дослідження і програмна реалізація розробленої системи розпізнавання.

Наукова новизна одержаних результатів. В роботі отримані наукові результати, які дозволяють завдяки розробленому методу компактного подання зображень розробити систему для розпізнавання образів:

·

Вдосконалено метод препарування зашумлених зображень із наступною їх сегментацією за спрощенною схемою розподілення на окремі сегменти зображення.

·

Вперше одержано метод компактного опису зображень на основі урівноважуючих кривих, що забезпечує підвищену швидкість кореляційного порівняння.

·

Вперше одержано математичну модель обчислювальної схеми “грубої” – “точної” обробки напівтонових зображень для їх розпізнавання. Яка дозволяє адаптувати поріг до аналізованого зображення та обчислювати контурні препарати із подальшим їх урівноваженням та кореляційним порівнянням.

·

Вперше одержано методи нормування препарованих зображень, що забезпечують ефективну роботу в різноманітних масштабах із 2D і 3D орієнтацією об'єктів.

Практичне значення одержаних результатів. Практична вагомість отриманих результатів роботи полягає в наступному:

- створено експериментальну базу для розробки методів компактного подання зображень і системи розпізнавання образів;

- проведені експериментальні дослідження методу компактного подання препарованих зображень при рішенні задачі швидкого їх переопису;

- для підвищення ефективності розпізнавання досліджені методи перетворення зображень, інваріантних до різних деформуючих факторів таких як зміна масштабу, умов освітленності, 2D і 3D орієнтації об’єктів.

Розроблені автором методи та програмне забезпечення, що реалізують результати дисертаційних досліджень, впроваджені та використовуються на підприємстві НВО “Астрофізика“ (м. Москва) для обробки зашумлених зображень з наступною їх сегментацією.

Окремі теоретичні результати дисертаційній роботи та програмне забезпечення впроваджено в учбовий процес по викладанню дисципліни “Оптоелектронні і інтелектуальні системи” на кафедрі лазерної та оптоелектронної техніки Вінницького державного технічного університету. Впровадження підтверджуються відповідними актами.

Особистий внесок здобувача. Всі основні результати дисертаційної роботи були отримані автором особисто. У публікаціях, написаних у співавторстві, здобувачеві належить: в роботі [1] - розроблено математичну модель визначення порогу препарування та формального опису зображень, проведено експериментальні дослідження; в роботах [2,7,8,10] запропоновано алгоритм трирівневого подання зображень, проведено експериментальні дослідження паралельно-ієрархічної мережі; в роботах [3,14] проведено дослідження пірамідальної обробки на основі операції паралельного додавання чисельної інформації та проведено моделювання; в роботах [4, 15] розроблено математичну модель визначення порогу препарування для зображень лазерних трас; в роботах [5, 11] запропоновано підхід визначення координат зображення по урівноважуючим кривим; в роботі [6] проведено моделювання методу нормалізації зображень облич; в роботі [9] проведені експериментальні дослідження щодо підходу рекурсивного контурного препарування для інваріантного подання зображень; в роботі [12] запропоновано підхід інваріантного подання зображень для мережної класифікації, проведено експериментальні дослідження; в роботі [13] запропоновано підхід обчислення просторової зв'язності елементів зображення, отримані результати досліджень.

Апробація результатів дисертації. Основні наукові і практичні результати роботи доповідались і обговорювались на: науково-технічній конференції "Приладобудування-96" (м. Судак, 1996 р.), міжнародному молодіжному форумі "Електроніка і молодь у XXI столітті" (м. Харків, 1997 р.), науково-технічних конференціях "Вимiрювальна та обчислювальна технiка в технологiчних процесах" (м. Хмельницький, 1997, 1998), міжнародних конференціях з оброблення сигналів і зображень “УкрОБРАЗ” (м. Київ, 1996, 1998), міжнародній конференції SPIE “ Machine Vision Applications, Architectures, and Systems Integration IV“ (м. Піцбург, США, 1997 р.), міжнародній конференції IAPR “Image Analysis and Processing“ (м. Флоренція, Італія, 1997 р.), міжнародній конференції SPIE “Machine Vision Systems for Inspection and Metrology“, (м. Бостон, США, 1998 р.), міжнародній конференції IEEE/IFAC “Neural Computation NC'98“ (м. Відень, Австрія, 1998 р.), міжнародному семінарі IEEE/EURASIP з обробки нелінійних сигналів та зображень “NSIP'99” (м. Анталія, Турція, 1999 р.), міжнародній конференції IAPR з розпізнавання образів і обробки зображень “PRIP'99” (м. Мінськ, Білорусь, 1999 р.), міжнародній конференції SPIE “Diagnostic Imaging Technologies & Industrial Applications” (м. Мюнхен, Німеччина, 1999 р.), міжнародній конференції SPIE “Machine Vision Systems for Inspection and Metrology VIII” (м. Бостон, США, 1999 р.), міжнародному семінарі SPIE “Optoelectronic and Hybrid Optical/Digital Systems for Image/Signal Processing” (м. Львів, 1999 р.). міжнародній конференції SPIE “Xth SPIE Conference on Laser Optics – LO’2000”, (м. Ст.-Петербург, Росія, 2000 р.) міжнародній конференції SPIE “Machine Vision and Three-Dimensional Imaging Systems for Inspection and Metrology“ (м. Бостон, США, 2000 р.).

Публікації. За матеріалами дисертації опубліковано 24 друкованих праці. З них 4 статті у наукових журналах, що входять до переліку ВАК, 16 статей у збірках праць міжнародних науково-технічних конференцій та симпозіумів, 4 у матеріалах та тезах конференцій.

Структура і об'єм дисертації. Дисертаційна робота складається з вступу, чотирьох розділів, висновку, списку використаних джерел та додатків. Робота містить 153 аркуша основного друкованого тексту, 78 рисунків, 10 таблиць. Список використаних джерел нараховує 120 найменувань.

ЗМІСТ ДИСЕРТАЦІЇ

У вступі обгрунтовано актуальність теми, визначено мету роботи, вказано задачі, які необхідно вирішити для досягнення поставленої мети, подано коротку анотацію нових наукових положень та відмінність одержаних результатів від відомих раніше, відзначена практична цінність одержаних результатів. Також у вступі подано перелік наукових конференцій, симпозіумів на яких оприлюднено результати досліджень. Вказано кількість публікацій по темі дисертаційної роботи, а також відомості про структуру роботи.

У першому розділі доведено актуальність та необхідність розробки методів і алгоритмів, що забезпечують необхідну точність розпізнавання і швидкодію, яких було б достатньо для практичних застосувань систем розпізнавання облич.

Наводиться ряд існуючих і можливих застосувань систем розпізнавання облич, ключові аспекти задачі розпізнавання і вимоги до систем розпізнавання. Проаналізовано загальні властивості зображень, як структури даних і виділена головна задача розуміння зображень. Дано аналіз обчислювальної моделі розуміння зображень, що розглядає візуальний процес як ієрархічну задачу. Розглянуто базові принципи витягу ознак і класифікації.

Досліджені ключові комп'ютерні методи, які застосовуються для розпізнавання облич із статичних напівтонових зображень. Проаналізовано методи розпізнавання, які засновані на порівнянні шаблонів і ознак, метод власних векторів для розпізнавання, підходи, що засновані на нейронних мережах, методи порівняння на основі еластичних графів, метод аналізу локальних ознак, метод подання облич у виді гнучких форм. Виділено основну сутність кожного методу з обговоренням деяких особливостей. Описані методи порівнювались один із одним, щоб визначити їх переваги і недоліки.

В другому розділі розглядається обчислювальна схема грубої - точної обробки напівтонових зображень для розпізнавання об'єктів на прикладах ідентифікації зображень обличчя і аналізу зображень деформацій лазерних трас. Приведена реалізація загальної методології ідентифікації зображень, яка спирається на схему "грубої-точної" ідентифікації. "Груба" схема ідентифікації полягає в сегментації зображення об'єкта і розподілу його на просторово-зв'язані області (сегменти). При цьому визначаються глобальні і локальні максимуми зв'язностей пікселів квантованих зображень, після чого формуються області, які прилягають до даних максимумів. Сукупність даних областей формує просторовий зліпок об'єктів. "Точна" схема ідентифікації заснована на аналізі окремих сегментів і полягає в препаруванні зображень, тобто його переописі в бінарні зображення, і наступному перетворенні шляхом формування iз бiнарних препаратiв локальної i інтегральної функцiї урiвноваження та подальшому їх кореляцiйному аналiзi.

Результатом схеми грубої обробки являються видiленi окремi сегменти, структурованi в деякi областi за їх значеннями зв'язностi. Сегменти зображення формуються iз просторово - зв'язаних пiкселiв квантованого зображення i утворюють зв'язанi областi. Цi областi у випадку грубої обробки, наприклад зображень людського обличчя, вiдображають характернi його компоненти (очі, щоки, рот тощо). Далi над окремими сегментами реалiзується “точна” схема обробки. У цьому випадку з'являється можливiсть обробки тих сегментiв, якi найменше пiддаються деформацiям, наприклад, при змiнi мiмiки обличчя.

Попередня обробка містить наступнi операцii. Вхiдне двовимiрне напiвтонове зображення подається у вигляді матриці iнтенсивностей вiдлiкiв , , - розмiр вхiдного зображення. Для матрицi А знаходиться загальне значення iнтенсивностi

. (1)

Далi визначаються масиви рiзниць елемента iз середнiм значенням зображення (або його фрагмента), в якому знаходиться елемент

. (2)

Для препарування вхiдного зображення отриманi рiзницi порiвнюються з порогом :

. (3)

В загальному випадку поріг для препарування знаходиться за допомогою функції розподілу препаратів , де F - функція, яка залежить від кількості додатніх - , відємних - та нульових - препаратів і охоплює цілу шкалу сірого t яскравості зображення. Причому ця функція розподілу препаратів для різних обєктів буде різною. Для препарування зображень обличчя та продовжених лазерних трас необхідно використовувати свої функції розподілу препаратів. Для препарування зображень обличчя найбільш доцільно використовувати таку функцію, яка рiвномірно розподіляє додатні, відємні та нульові препарати, тобто: , або

, (4)

де - кількість додатніх, відємних і нульових препаратiв при кожній яскравості (ступені сірого) - t. Це дозволяє оптимально виділяти перепади яскравості та області, де їх немає, відносно порогу, який адаптовано до самого зображення. На рис. 1 показано приклад розподілу препаратів і вибір оптимального порогу препарування.

Рис. 1. Приклад розподілу препаратів і вибір оптимального порогу препарування

Для препарування зображень продовжених лазерних трас потрібно оцінювати тільки їх форму, тому в цьому випадку вибирається така функція і той поріг, які переважно виділяють розподіл нульових препаратів відносно розподілу додатніх та відємних препаратів. Причому порiг обирається з умови [4]:

. (5)

В результатi вказаних операцій формується матриця препаратів . Для видiлення ознак визначаются значення зв'язностей препаратiв в отриманій матриці Q окремо для додатніх, відємних і нульових препаратiв. Зв'язність препарата визначається як

, (6)

, ,

де - зв’язність елемента зображення з координатами i,j.

Для аналiзу отриманого спектра зв'язностi використовується розклад на основi дихотомiї. Дихотомія проводиться за зв'язністю, тобто препароване зображення роздiляється таким чином, щоб спектр зв'язностi однiєї областi препарованого зображення дорiвнював спектру зв'язностi другої областi. Для цього знаходиться постовбцева (локальна) функцiя урiвноваження , яка задовольняє умові:

, (7)

для всіх j, .

Інтегральна функція урівноваження враховує зв'язності попередніх стовбців (рядків) зображення таким чином, щоб сумарні зв'язності областей, що урівноважуються, залишалися рівні на всіх кроках урівноваження. Тодi iнтегральна функцiя урiвноваження визначається:

, . (8)

Описанi операцiї проводяться окремо для додатніх, відємних і нульових препаратів. Далі проводять класифікаційний аналіз отриманих функцій урівноваження даних препаратів.

Третій розділ присвячений розробці методів інваріантного подання зображень до різноманітних деформуючих факторів: 2D повороту, яскравості, контрасту і масштабу із застосуванням запропонованої процедури пірамідально - контурного препарування.

Приводиться розробка алгоритмів і програмних моделей обчислювальної схеми грубої - точної обробки напівтонових зображень для розпізнавання образів. Показано ефективність використання розроблених методів компактного подання зображень із кореляційним порівнянням урівноважуючих кривих перед традиційним кореляційним порівнянням зображень.

Для формування бінаризованих препаратів використовується процедура формування додатніх, відємних і нульових препаратів. У результаті одержується трирівневе бінаризоване подання зображення. Причому, для самих темних градацій сірого зображення здійснюється кодування відємнимі препаратами, для найясніших - додатніми препаратами, а для проміжних градацій сірого - нульовими препаратами. Безпосередньо сама процедура кодування проста і полягає в поданні перетворених препаратів двома бітами інформації. Для обчислення зазначених препаратів поріг для операції препарування вибирається з умови (4), що рівномірно розподіляє контурні препарати по полю зображення, яке маскується відповідно до виразу (3) або всього зображення.

При такому поданні зображення трьома типами контурних препаратів формується достатньо грубий його опис. Це пов'язано з тим, що в зону, скажемо нульових контурних препаратів, потрапляє широкий спектр градацій за шкалою сірого зображення і всі вони кодуються однаково, тобто нульовими препаратами. У цьому випадку більш і менш темні ділянки зображення потрапляють в одну і ту ж зону для кодування, що призводить до втрати інформативних ділянок зображення. Щоб видалити цей ефект застосовується багаторівнева процедура формування контурних препаратів, яка полягає в тому, що після першого кроку контурного препарування для другого кроку виключаються пікселі перетвореного зображення, які подані негативними препаратами. Тоді на другому кроці проводиться вибір порогу для препарування відповідно до виразу (4) для тих пікселів зображення, що мають на першому кроці препарування нульові і додатні препарати. Далі операція узагальненого контурного препарування виконується аналогічно першого кроку.

Алгоритм рекурсивно-контурного препарування досліджувався для інваріантного представлення зображень до різноманітних деформуючих факторів: 2D повороту, яскравості, контрасту і масштабу. Було отримано нормовані функції розподілу препаратів для чотирьох кроків алгоритму пірамідально-контурного препарування. Отримані функції розподілу препаратів двох зображень оцінювались за мінімумом відстані.

З порівняння функцій мінімуму відстані при обробці зображень обличчя із різноманітним масштабом і функцій мінімуму відстані для різноманітних лицьових зображень випливає, що в середньому їх значення відрізняються більш ніж у 4 рази. З порівняння функцій мінімуму відстані при обробці зображень облич із різною 2D орієнтацією і функцій мінімуму відстані для різноманітних зображень облич випливає, що в середньому їх значення відрізняються більш ніж у 1,5 рази.

У табл. 1 і табл. 2 приведені відповідно оцінка часу виконання "точної" схеми обробки зображень із кореляційним порівнянням урівноважуючих кривих і оцінка часу при традиційному кореляційному порівнянні зображень.

Таблиця 1

Час виконання "точної" схеми обробки зображень із кореляційним порівнянням урівноважуючих кривих |

Час обчислень, мс

Розмір зображення | Урівноваження по горизонталі для 1 поля препаратів | Урівноваження по вертикалі і горизонталі для 1 поля препаратів | Урівноваження по вертикалі і горизонталі для 3 полів препаратів | Три кроки урівноважень по вертикалі і горизонталі для 3 полів препаратів

100Ч100 | 5 | 20 | 110 | 220

128Ч128 | 10 | 110 | 220 | 390

200Ч200 | 110 | 110 | 500 | 880

256Ч256 | 110 | 220 | 660 | 1320

Таблиця 2

Оцінка часу традиційного кореляційного порівняння зображень

Розмір зображення | Час обчислень, с

100Ч100 | 0,77

128Ч128 | 1,32

200Ч200 | 3,13

256Ч256 | 4,73

Порівняльний аналіз табл. 1 і табл. 2 показує: якщо для розпізнавання зображень використовувати одну урівноважуючу криву, то скорочення часових витрат розробленого методу в порівнянні з традиційним буде в 43 рази; якщо для розпізнавання зображень використовувати дві урівноважуючі криві, то скорочення часових витрат розробленого методу в порівнянні з традиційним буде в 22 рази; якщо для розпізнавання зображень використовувати шість урівноважуючих кривих, то скорочення часових витрат розробленого методу в порівнянні с традиційним буде в 7,2 рази; якщо для розпізнавання зображень використовувати вісімнадцять урівноважуючих кривих, то скорочення часових витрат розробленого методу в порівнянні з традиційним буде в 3,6 рази.

Представлено систему автоматичного розпізнавання облич побудовану на основі розроблених методів "грубої" і "точної" обробки зображень (рис. 2). Основу системи складає персональний комп'ютер, в який вводиться зображення обличчя за допомогою цифрової відеокамери.

Система автоматичного розпізнавання функціонує в такий спосіб. Користувач вводить свій ідентифікаційний код в систему за допомогою клавіатури 1. По введеному коду проводиться вибірка з бази даних, яка міститься в пам'яті комп’ютера, зображення обличчя користувача 2, що відповідає введеному ідентифікаційному коду і набір урівноважуючих кривих для цього обличчя 3. В той же час цифрова камера 4 автоматично фіксує зображення обличчя 5. Далі проводиться "груба" обробка отриманого зображення: визначається положення обличчя на зображенні і виділяється контур 6. Після цього виконується "точна" схема обробки зображення. В результаті чого утворюється набір урівноважуючих кривих 7, які описують поточне зображення. Далі проводиться кореляційне порівняння урівноважуючих кривих, отриманих у результаті обробки поточного зображення з урівноважуючими кривими, які відібрані з бази даних відповідно до введеного ідентифікаційного коду користувача. За результатом порівняння приймається рішення про ідентичність користувача.

Рис. 2. Структурна схема системи автоматичного розпізнавання облич

Для практичного дослідження розглянута система була реалізована в такий спосіб. У системі використовувалася цифрова відеокамера, яка підєднувалася до персонального комп'ютера через універсальний послідовний порт USB. Відеокамера дозволяє вести зйомку відеозображень і статичних зображень у наступних режимах: , , пікселів із глибиною передачі кольору в 65536 і 16 млн. кольорів. Отримані статичні зображення перетворюються в напівтонові зображення з 256 градаціями рівнів сірого, тому що наступна обробка проводиться з напівтоновими зображеннями.

У системі використовувався персональний комп'ютер на базі мікропроцесора Pentium 150 MHz із встановленою операційною системою Windows 95. Робота системи виконується під керуванням програмного забезпечення розробленого на базі методів "грубої" і "точної" обробки зображень.

Розглянута система автоматичного розпізнавання облич може бути використана для рішення наступних прикладних задач. Це порівняння фотографій, що містяться на кредитних картках, правах водія, фотографії для ідентифікації клієнтів різноманітних організацій. У застосуваннях для контролю доступу до різноманітного роду інформації, яку можна одержати при вході в комп'ютерну мережу різноманітних організацій, таких як архіви, банки, органи безпеки і т.д., а також при проведенні фінансових операцій, які здійснюються у даний час через комп'ютерну мережу Internet.

В четвертому розділі приведено комп'ютерне моделювання процесів обробки зображень і практичне застосування розробленої системи розпізнавання.

При проведенні експериментів розроблена система перевірялась на загальнодоступній Манчестерській базі даних зображень облич. База даних містить більш 600 напівтонових зображень розміром із 256 градаціями за шкалою сірого. База даних містить зображення людських облич, отриманих від людей різного віку й етнічного походження. Дані зображення подані з різноманітними змінами у вигляді облич, із різним масштабом, поворотами голови, із різноманітними умовами освітлення та ін.

Для аналізу стійкості методу “точної” схеми ідентифікації до впливу шумів були вiдiбранi два основнi розподiлення шумiв: Гаусiвське (нормальне) i рiвномiрна густина розподiлу ймовiрностi шумiв. Було сформовано 7 різних градацій за рівнями шумів: 0%, 5%, 10%, 15%, 20%, 25%, 30%.

В ході експерименту для початкового та зашумленого зображень були отримані криві горизонтального і вертикального урівноваження. Ці криві були поєднані на зведених графіках з застосуванням сталих зміщення, причому початковому зображенню відповідає максимальне зміщення. Криві урівноваження для початкового зображення і зображення з шумами подані в першому рядку табл.3.

Таблиця 3

Результати кореляційного порівняння

Для перевірки ефективності перебудови початкових зображень облич за допомогою набору кривих урівноваження був проведений експеримент над зображеннями 8-ми персон з нормальною мімікою. Результати кореляційного порівняння подані на рис. 3.

Рис. 3. Результати кореляційного порівняння зображень різних облич

З результатів кореляційного порівняння (рис. 3) видно, що зображення різних облич (кривих горизонтального урівноваження) некорелюють між собою (коефіцієнт кореляції не вище 0,45).

Для перевірки ефективності переопису початкових зображень обличчя за допомогою кривих урівноваження був зроблений експеримент над зображенням одного і того ж обличчя з 10 - ма різними міміками та 3D- поворотами.

В ході цього експерименту проводилось кореляційне порівняння наборів кривих горизонтального урівноваження для нульових препаратів зображення обличчя. Результати кореляційного порівняння подані на рис. 4.

Рис. 4. Результати кореляційного порівняння зображень обличчя з

різноманітною мімікою і 3D поворотами

Для оцінки ефективності роботи системи використовувався процент розпізнавання. Експерименти проводилися в такий спосіб. З бази даних облич були обрані зображення облич різних людей з нормальною мімікою й орієнтацією обличчя на зображенні. Ці зображення були обрані еталонними для свого класу облич. Для еталонних зображень облич були отримані криві урівноваження. Урівноваження здійснювалося за вертикальним і горизонтальним напрямками для нульових, додатніх та від’ємних препаратів. Також використовувалося кілька кроків урівноваження. Таким чином для розпізнавання використовувалися від однієї до 18 кривих урівноваження.

Далі з бази даних бралися зображення облич над якими виконувалися всі операції схеми “грубої” - “точної” обробки з одержанням кривих урівноваження. Отримані криві урівноваження порівнювалися з набором відповідних еталонних й у залежності від коефіцієнта кореляції проводилася класифікація облич. Якщо коефіцієнт кореляції перевищував значення 0.7, то обличчя відносилося до цього класу. У таблиці 4 приведені результати експериментів по розпізнаванню зображень облич.

Таблиця 4

Результати розпізнаваня зображень облич

Набір урівноважуючих кривих для порівняння | Процент розпізнавання (%)

Горизонтальна урівноважуюча крива для нульових препаратів | 61.6

Вертикальна і горизонтальна урівноважуючи криві для нульових препаратів | 67.3

Вертикальні і горизонтальні урівноважуючи криві для нульових, від’ємних та додатніх препаратів | 78.0

Вертикальні і горизонтальні урівноважуючи криві для нульових, від’ємних та додатніх препаратів, отримані після трьох кроків урівноваження | 83.2

У порівнянні з найбільш близьким методом розпізнавання зображень облич, який запропонував проф. Ланітіс на основі формування спеціальної процедури формонезалежної напівтонової моделі обличчя, процент розпізнавання з використанням якої 77,8 %, отримані результати є цілком конкурентноспроможними.

Інший приклад зображень, що досліджувались - це застосування запропонованого підходу для обробки неструктурованих зображень астрофізичних обєктів - плямових зображень характеристик атмосфери продовжених лазерних трас.

На рис. 5 а, б подані функції кореляції двох дихотомічних урівноважень для порогу виду (3). Як видно з першого дихотомічного урівноваження, коефіцієнт кореляції (рис. 5 а) не нижче ніж 0,5, а для другого (рис. 5 б) - не нижче ніж 0,93. Тому при виборі ознак для класифікації треба проводити декілька процедур урівноваження. В той же час криві урівноваження зображень різних лазерних трас абсолютно декорельовані (коефіцієнти кореляції приймають відємні значення).

Рис. 5. Функції кореляції двох дихотомічних урівноважень

ОСНОВНІ РЕЗУЛЬТАТИ РОБОТИ ТА ВИСНОВКИ

В дисертаційній роботі розроблена обчислювальна схема “точної”- “грубої” обробки й методи для розпізнавання напівтонових зображень облич і зображень протяжних лазерних трас, на основі їх створена система розпізнавання образів. Всі теоретичні й експериментальні результати роботи обгрунтовані й отримані наступні основні результати.

1. Дістали подальший розвиток основні комп'ютерні методи при їх застосовувані для розпізнавання облич із статичних напівтонових зображень. Показано, що існуючі методи мають ряд недоліків. Тому потрібне проведення подальших досліджень для покращення точності і швидкодії розпізнавання облич, особливо в широкому діапазоні зміни зовнішніх умов, що зустрічаються в реальному житті. Для ефективного розпізнавання образів подальші дослідження повинні більше керуватись загальними принципами розуміння зображень і інтегрувати корисні особливості людської зорової системи.

2. Вперше одержано математичну модель аналізу напівтонових зображень за схемою "грубої" - “точної” обробки зображень для їх розпізнавання. Перша частина обробки служить для попереднього опису, а друга - для контурного препарування, формування урівноважуючих кривих із кореляційним аналізом та мережною класифікацією зображень, це дозволяє адаптувати поріг до аналізованого зображення й адекватно обчислюваного порогу реалізувати багаторівневий процес поділу на окремі його сегменти з подальшим урівноваженням сформованих контурних препаратів виділених сегментів, кореляційним порівнянням та мережною класифікацією.

3. Вперше одержано "точну" схему обробки зображень в межах якої здійснюється переопис багатоградаційного зображення в трирівневе подання і реалізує процедуру урівноваження, що дозволяє в більш компактному виді формувати ознаки зображення і швидше обчисляти кореляційну функцію.

4. Вперше одержано математичну модель "точної" схеми обробки зображень лазерної траси для обчислення координат центру, яка випробувана на прикладах аналізу неструктурованих зображень протяжних лазерних трас та дозволяє з визначеною ймовірністю визначати область у якій знаходяться координати енергетичного центру й інваріантна до змін форми й орієнтації зображення лазерної траси.

5. Вперше одержано інтегральний показник - функції розподілу контурних препаратів дозволяє за рахунок нормування відліків критеріальної функції щодо максимального її значення домогтися інваріантного подання зображення до змін масштабу, повороту й освітленості (контрасту), а також вирішити задачу інтеграції високорівневої інформації в низькорівневе подання, що потребує менше часових витрат.

6. Вперше одержано метод урівноваження зображень в межах “точної” схеми обробки та надлишкового урівноваження по чотирьом напрямкам порівняно з традиційним методом кореляційної обробки зображень, дозволяють скоротити час розпізнавання зображень для різної кількості урівноважуючих кривих від 3,6 до 43 разів.

7. Вперше одержано метод вибору порогу для препарування зображень, в межах якого встановлено, що оптимальний поріг препарування зображень обличчя знаходиться в найближчій області критерію максимального добутку кількості препаратів, з збільшенням рiвня шумів значення оптимального порогу знижується, криві горизонтального урівноваження значно краще передають індивідуальні риси початкових зображень, тому саме їх доцільно використовувати для кореляційного порівняння в задачах розпізнавання та ідентифікації, при зростанні рiвня шумів до 30% коефіцієнт кореляції залишався на достатньо високому рівні 0,8 (Гаусiвський шум) і 0,65 (рівномірний шум), що обумовлюється використанням операцій додавання і порогової обробки.

8. Вдосконалено метод “точної” схеми обробки напівтонових зображень, випробуваний на прикладах аналізу структурованих зображень людських облич і неструктурованих зображень протяжних лазерних трас, показує достатню його універсальність застосування для різноманітних прикладних задач і гарну стійкість до різних деформуючих факторів.

9. Отримала подальший розвиток реалізація розроблених методів у вигляді системи для розпізнавання образів показала коректність її роботи при обробці напівтонових зображень облич і протяжних лазерних трас.

ПУБЛІКАЦІЇ ПО ТЕМІ ДИСЕРТАЦІЙНОЇ РОБОТИ

1. Тимченко Л.I., Чепорнюк С.В., Кутаєв Ю.Ф., Герцій О.А. Компактний опис моделей зображень для класифікації образів // Вісник ВПІ. – 1998. - №2. - C. 72-83.

2. Тимченко Л.И., Кутаев Ю.Ф., Грудин М. А. Харви Д., Герций А.А. Параллельно-иерархический подход для обработки изображений // Электронное моделирование. – 1999. – Т. 21 - №4. - C. 35-46.

3. Тимченко Л.І., Мартинюк Т.Б., Загоруйко Л.В., Герций О.А., Кожем’яко А.В. Математична модель алгоритму паралельної обробки інформації // Вимірювальна та обчислювальна техніка в технологічних процесах. – 1998. - №2. - C. 178-181.

4. Тимченко Л.И., Кутаев Ю.Ф., Жуков К.М., Герций А.А., Швейки Н.О., Байбак Ю.В. Система координатной привязки для нестационарных сигналов // Известия РАН. Серия физическая. – 2001. – Т.65 - №6. – С. 886-890.

5. Tіmchenko L., Kutaev Y., Gertsiy A., Zahoruiko L., Galchenko Y., Mansur T. An Approach to Parallel-Hierarchical Network Learning for Real-Time Image Sequences Recognition // Proc. of SPIE Symposium "Machine Vision Systems for Inspection and Metrology VIII". - Boston (USA). – 1999. - Vol. 3836.- P. 71-81.

6. Kozhemyako V.P., Kutaev Y.F, Timchenko L.I., Chepornyuk S.V., Hamdi R.R., Gertsiy A.A., Ivasyuk I.D. The Q-Transformation Method Applying to the Facial Images Normalization // Proc. of Int. ICSC/IFAC Symposium "Neural Computation - NC’98". - Vienna (Austria). - 1998. - P. 287-291.

7. Timchenko L.I., Y.F. Kutaev, S.V. Chepornyuk, M.A. Grudin, D.M. Harvey, A.A. Gertsiy. A Brain - Like Approach to Multistage Hierarchiсal Image Processing // Springer-Verlag Proc. of IAPR Conf. "Image Analysis and Processing". - Florence (Italy). 1997. - Vol. 1311. - P. 246-253.

8. L.Timchenko, S.Chepornyuk, M.Grudin, D.Harvey, Y.Kutaev, A.Gertsiy, L.Zahoruiko. Three-Dimensional Multistage Network Applying for Facial Image Decomposition // Proc. of SPIE Symposium "Machine Vision Applications, Architectures, and Systems Integration VI". - Pittsburgh (USA). – 1997. - Vol. 3205.- P. 90-95.

9. Y.Kutaev, L.Timchenko, A.Gertsiy, L. Zahoruiko. Compact representation of the facial images for identification in a parallel-hierarchical network // Proc. of SPIE Symposium "Machine Vision Systems for Inspection and Metrology VII". – Boston (USA). – 1998. – Vol. 3521.-P. 157-167.

10. L.Timchenko, Y.Kutaev, A.Gertsiy, L. Zahoruiko. Biologically Motivated Approach to Multistage Image Processing // Proc. of IAPR Conf. "Pattern recognition and information processing – PRIP'99". – Minsk (Belarus). - 1999. - P. 180-184.

11. L.I. Timchenko, Y.F. Kutaev, A.A. Gertsiy, Y.O. Galchenko, L.V. Zahoruiko, T. Mansur. Method For Image Coordinate Definition On Extended Laser Paths // Proc. of SPIE Workshop "Optoelectronic and Hybrid Optical/Digital Systems for Image and Signal Processing" - Lviv (Ukraine). - 1999. – Vol. 4148.– p. 19-26.

12. Y. Kutaev, L. Timchenko, A. Gertsiy, L. Zagoruiko. A Method of Recursive Contour Preparing of Images // Праці Всеукраїнської конф. "Оброблення сигналів і зображень та розпізнавання образів – УкрОбраз - 98". – Київ. – 1998. - С. 163-166.

13. Kozhemjako V., Timchenko L., Chepornyuk S., Kutaev Y., Pavlov S., Gertsiy A., Kuchko V., Poplavskiy A. Method of Biosignals Space-Connected Processing // Праці Всеукраїнської конф. "Оброблення сигналів і зображень та розпізнавання образів – УкрОбраз - 96". – Київ. - 1996. - С. 84-87.

14. Тимченко Л.І., Мартинюк Т.Б., Загоруйко Л.В., Герций О.А., Кожем’яко А.В. Математична модель алгоритму паралельної обробки інформації // Праці V науково-техн. конф. "Вимірювальна та обчислювальна техніка в технологічних процесах". – Хмельницький. – 1998. - C. 55-59.

15. L.I. Timchenko, Y.F. Kutaev, K.M. Zhukov, A.A. Gertsiy, N.O. Shveyki, R.M. Grinchishin. Coordinate Reference System of Nonstationary Signals // Proc. of SPIE Symposium “Machine Vision and Three-Dimensional Imaging Systems for Inspection and Metrology”. - Boston (USA). - 2000. - Vol. 4189.– р. 211-217.

АНОТАЦІЯ

Герцій О.А. Розробка обчислювальної схеми грубої - точної обробки зображень для системи розпізнавання образів. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю: 01.05.02 - Математичне моделювання та обчислювальні методи. - Вінницький державний технічний університет, Вінниця, 2001.

Дисертація присвячена розробці та дослідженню схеми “грубої” та “точної” обробки напівтонових зображень, методів та алгоритмів компактного розпізнавання зображень людських облич і астрофізичних об'єктів, а також створення комп'ютерної системи розпізнавання образів. В дисертації розглянуто теоретичні і практичні питання реалізації простих обчислювальних алгоритмів на основі контурного препарування зображень з урівноваженням контурних препаратів. “Груба” схема обробки служить для попереднього опису, а “точна“ - для контурного препарування, формування урівноважуючих кривих із кореляційним аналізом та мережною класифікацією зображень. Обгрунтовано ефективність використання запропонованих алгоритмів розпізнавання для класів об'єктів, що досліджуються. Використання запропонованих алгоритмів рекурсивного контурного препарування і формування бінаризованих препаратів з наступним їхнім урівноваженням дозволяє проводити компактне представлення зображень і наступне їх ефективне розпізнавання.

Ключові слова: контурне препарування, схема “грубої” - точної” обробки зображень, урівноважуючі криві, мережна обробка, комп'ютерна система розпізнавання образів.

АННОТАЦИЯ

Герций О.А. Разработка вычислительной схемы грубой - точной обработки изображений для системы распознавания образов. – Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по специальности: 01.05.02 - Математическое моделирование и вычислительные методы. - Винницкий государственный технический университет, Винница, 2001.

Диссертация посвящена разработке и исследованию схемы “грубой” и “точной” обработки полутоновых изображений, методов и алгоритмов компактного распознавания изображений человеческих лиц и астрофизических объектов, а также созданию компьютерной системы распознавания образов. В диссертации рассмотрены теоретические и практические вопросы реализации простых вычислительных алгоритмов на основе контурного препарирования изображений с уравновешиванием контурных препаратов. “Грубая” схема оброботки служит для предварительного описания, а “точная“ - для контурного препарирования, формирования уравновешивающих кривых с корреляционним анализом и сетевой классификацией изображений.

Приводится обоснование эффективности применения предложенных алгоритмов распознавания для исследуемых классов объектов. Использование предложенных алгоритмов рекурсивного контурного препарирования и формирования бинаризированных препаратов с последующим их уравновешиванием позволяет производить компактное представление исследуемых изображений и последующее их эффективное распознавание.

Ключевые слова: контурное препарирование, схема “грубой” - точной” обработки изображений, уравновешивающие кривые, сетевая обработка, компьютерная система распознавания образов.

ABSTRACT

Gertsiy A.А. Development of the computing scheme “rough” - “exact” image processing for the system of pattern recognition. - Manuscript.

Thesis for the candidate's degree in technical sciences on a speciality 01.05.02 – Mathematical modeling and computing


Сторінки: 1 2