Автореферат РОЗРОБКА ЗАВАДОСТІЙКИХ МЕТОДІВ ІДЕНТИФІКАЦІЇ КОЛЬОРУ ПРИ ОБРОБЦІ ЗОБРАЖЕНЬ У ВБУДОВАНИХ СИСТЕМАХ РОЗПІЗНАВАННЯ

Автореферат - РОЗРОБКА ЗАВАДОСТІЙКИХ МЕТОДІВ ІДЕНТИФІКАЦІЇ КОЛЬОРУ ПРИ ОБРОБЦІ ЗОБРАЖЕНЬ У ВБУДОВАНИХ СИСТЕМАХ РОЗПІЗНАВАННЯ

Загрузка...

ДОНЕЦКИЙ НАЦИОНАЛЬНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Державний комітет зв’язку та інформатизації України

Національна академія наук України

Державний науково-дослідний інститут інформаційної інфраструктури

Лау Габрієлє

УДК 621.382; 548.4; 53.072:681

РОЗРОБКА ЗАВАДОСТІЙКИХ МЕТОДІВ ІДЕНТИФІКАЦІЇ КОЛЬОРУ ПРИ ОБРОБЦІ ЗОБРАЖЕНЬ У ВБУДОВАНИХ СИСТЕМАХ РОЗПІЗНАВАННЯ

Спеціальність 01.05.02 - “Математичне моделювання та обчислювальні методи”

АВТОРЕФЕРАТ

дисертації на здобуття наукового ступеня

кандидата технічних наук

Львів – 2005

Дисертацією є рукопис.

Робота виконана на кафедрі Системи автоматизованого проектування Національного університету “Львівська політехніка” Міністерства освіти і науки України.

Науковий керівник:
доктор технічних наук, професор
Лобур Михайло Васильович,
Національний університет “Львівська політехніка”,
завідувач кафедри Системи автоматизованого проектування.

Офіційні опоненти:
доктор фіз.-мат. наук, професор
Яворський Ігор Миколайович,
завідувач відділу Фізико-механічного інституту ім. Г.В.Карпенка
НАН України, м. Львів;

доктор технічних наук, професор
Дивак Микола Петрович,
Тернопільська академія народного господарства
завідувач кафедри Комп’ютерних наук.

Провідна установа:
Інститут кібернетики ім. В.М.Глушкова НАН України,
м. Київ.

Захист відбудеться “12” вересня 2005 року о 15:00 год. на засіданні спеціалізованої вченої ради Д .813.01 при Державному науково-дослідному інституті інформаційної інфраструктури Міністерства транспорту та зв’язку України, Державного департаменту з питань зв’язку та інформатизації, Національної академії наук України

(79601, м. Львів, вул. Тролейбусна, 11).

З дисертацією можна ознайомитися в бібліотеці Державного науково-дослідного інституту інформаційної інфраструктури Міністерства транспорту та зв’язку України, Державного департаменту з питань зв’язку та інформатизації, Національної академії наук України

(79601, м. Львів, вул. Тролейбусна, 11).

Автореферат розісланий “11” серпня 2005 року.

Вчений секретар
спеціалізованої вченої ради,
кандидат технічних наук Пеленський О.Л.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Останнє десятиліття характеризується тісною інтеграцією технічних досягнень в області мікроелектроніки і оптики, що привело до створення напрямку оптомікроелектронних систем. На сьогоднішній день матеріальні, фінансові та інтелектуальні інвестиції в розробку і виробництво таких систем займають провідне місце в розвинутих країнах Європи, Азії та Америки. Оптомікроелектронні пристрої використовуються, в одних випадках, як елементи великих систем, а в інших - як самостійні зовнішні системи. Такі пристрої можна назвати вбудованими системами, хоча в світовій практиці існують різні назви: Microelectromechanical Systems (MEMS), Microsystems (MST), Micromachines та ін.

В свою чергу, розвиток мікроелектромеханічних систем (МЕМС), що базуються на мікромеханічній обробці та мікроелектронних технологіях, також зробив істотний ривок протягом останнього десятиліття. Зрозуміло, що мікромеханічну технологію не слід розглядати як мікро- версію звичної технології механічної обробки, а потрібно враховувати вплив і можливості сумісного функціонування механічної і електронної частин в одній системі. Очевидно, що мікромеханізми не можуть порівнятися по силі і потужності зі звичними виконуючими механічними пристроями, але вони дозволяють врахувати технологічні аспекти виконання електронної частини та створювати пристрої з новими функціональними можливостями.

Математичні методи моделювання і проектування виробів мікроелектронної техніки в даний час достатньо добре висвітлені в літературі, тоді як математичні моделі сенсорів сприйняття інформації, в тому числі, математичні моделі систем виділення та ідентифікації кольорових зображень зараз інтенсивно розробляються.

Даній проблематиці присвячено достатньо багато робіт як українських – Івахненко А.Г., Васильєв В.І., Русин Б.П., Грицик В.В., Зеленський А.А., Петренко А.І., Путятін І.В., Сироджа І.Б., Вінцюк Т.К., Киріченко Н.Ф., так і зарубіжних учених – RobertsRehrmannSmithDrummondCipolla R., Абламейко С.В., Фори А.Г. та ін.

Проведений в роботі аналіз показав, що більшість наукових досліджень в даній області не приділяють достатньо уваги створенню ефективних математичних моделей визначення кольору для підвищення інформативності і адекватності ідентифікації об’єктів. Тому, дана робота, в деякій мірі, заповнює існуючу прогалину в наукових дослідженнях. Робота присвячена розробці математичних моделей ідентифікації кольору для розпізнавання зображень в сучасних вбудованих оптоелектромеханічних системах.

Зв'язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконана відповідно до плану науково-дослідних робіт кафедри Системи автоматизованого проектування Національного університету "Львівська політехніка" в рамках міжнародних Європейських проектів REASON - REsearch and Training Action for System On Chip DESIGN (#IST-2000-30193) та INTERREG III C - An interregional approach for the stimulation of technology-oriented start-ups (#3E0052I), де учасниками та виконавцями є науковий колектив кафедри.

Мета роботи: метою дисертаційної роботи є розробка нових завадостійких та інваріантних до умов освітлення, завад і спотворень приймача математичних методів і алгоритмів ідентифікації кольору, що застосовуються при обробці зображень в об’єктно-орієнтованих вбудованих системах розпізнавання.

Для досягнення зазначеної мети в даній дисертаційній роботі слід вирішити наступні наукові завдання:

- Визначити вплив завад приймача зображення на спотворення кольорових зображень в системах обробки інформації;

- Провести аналіз сучасних систем розпізнавання кольорових зображень, які використовуються для ідентифікації об’єктів і оцінити можливість їх реалізації у вбудованих системах по технології МЕМС;

- Вивести залежності для визначення випадкових завад на кольоровому зображенні з метою вибору інформаційного критерію, який дозволить звести до мінімуму їх вплив на систему обробки зображення;

- Розробити методи виділення інформаційного фрагмента кольорового зображення з метою ефективного розпізнавання кольору в просторі кольору і двовимірній площині зображення;

- Розробити структуру об’єктно-орієнтованої вбудованої мікрооптоелектро-механічної системи розпізнавання, здатної функціонувати в реальному часі.

Об’єктом досліджень є процес формування математичних моделей розпізнавання кольору в системах обробки кольорових зображень для їх застосування в МЕМС.

Предметом досліджень є математичні моделі розпізнавання кольору, які забезпечують виділення кольорів зображення в реальних умовах з автоматичним усуненням шумів та завад приймача зображення.

Методи дослідження. Для досягнення поставленої мети, при проведенні досліджень використовувалися методи математичної фізики, металографії, диференціального числення, чисельні методи. Перевірка отриманих результатів здійснювалася шляхом проведення обчислювальних експериментів на персональному комп’ютері.

Наукова новизна одержаних результатів. У роботі одержані наступні наукові результати:

1. Показана можливість і доцільність побудови об’єктно-орієнтованих систем розпізнавання за загальною технологією МЕМС, що дозволяє створювати мініатюрні системи для роботи в реальному часі.

2. Визначено вплив завад приймача на спотворення кольорових зображень в системах обробки інформації, що дозволило створити алгоритми обробки, які не вимагають юстування приймача зображення.

3. Вперше розроблено аналітичні залежності для визначення впливу освітленості та спотворень приймача на зображення з метою вибору інформа-ційного критерію, що дозволяє звести їх вплив на систему обробки до мінімуму.

4. Розроблено новий метод визначення приналежності пікселів зображення інформаційному фрагменту кольорового зображення, описаному одночасно в площині зображення, просторі кольору та двовимірному частотному просторі кольору.

Практична цінність роботи. Розроблені методи обробки кольорових зображень послужили основою для розробки алгоритмів і програмного забез-печення для вбудованої системи розпізнавання, що дозволило проводити обробку та інтерпретацію зображень об’єктів металографії, геологічних, мікро-біологічних й інших в реальному масштабі часу. Основною відмінністю розроб-леної системи від існуючих є те, що за допомогою математичних методів і алго-ритмів мінімізовано вплив завад приймача на отримане кольорове зображення, що дозволило виключити необхідність юстування оптичної системи.

Особистий внесок здобувача. Основні наукові ідеї та положення дисертації, винесені на захист, запропоновані та розроблені автором самостійно. У роботах, написаних у співавторстві, здобувачеві належать: [1] – аналіз можли-вості застосування кольорових цифрових зображень для дослідження метало-графічних зразків та розробка алгоритму обробки металографічного зображення; [2] – розробка алгоритму визначення належності пікселів зображення інформа-ційному фрагменту; [3] – створення модифікацій алгоритму визначення пікселів кольорового зображення інформаційного фрагмента за комплексною ознакою у просторі кольору і площині зображення; [5] – застосування аналітичних виразів класифікації пікселів зображення для побудови математичної моделі оптичного сенсора кольорового зображення з автоматичним коригуванням завад; [4, 6] – застосування розроблених алгоритмів для фільтрації кольорових зображень та аналіз отриманих результатів; [7, 8, 9] – дослідження можливості та шляхів реалізації вбудованих систем розпізнавання на базі МЕМС.

Апробація роботи. Основні результати дисертаційної роботи доповідалися на науково-технічних конференціях: Міжнародній науково-технічній конференції "Сучасні проблеми радіоелектроніки, телекомунікацій і комп'ютерних наук" (лютий 2004), Славське, Україна; IV Міжнародній науково-методичній конференції “Дистанционное обучение – образовательная среда XXI века” (листопад 2004), Мінск, Білорусь; The 7-th International Conference “The experience of designing and application of CAD Systems in Microelectronics" (February 2005), Lviv-Polyana, Ukraine; 1-st International Conference of young scientists "Perspective technologies and methods in MEMS design" (May 2005), Poliyana, Ukraine.

Публікації. За результатами дисертаційної роботи видано 9 публікацій, включаючи 3 статті в журналах і збірниках, що входять у перелік видань ВАК України, та 6 доповідей у матеріалах конференцій.

Структура й обсяг роботи. Дисертація складається зі вступу, 4-х розділів, висновків та списку використаних джерел з 137 найменувань. Загальний обсяг дисертації становить 148 сторінок, у тому числі 51 малюнок, 2 таблиці.

ЗМІСТ РОБОТИ

У вступі дано загальну характеристику роботи, обгрунтовано її актуальність, сформульовано мету та основні задачі дослідження, визначено наукову новизну і практичну цінність отриманих результатів.

В першому розділі представлено аналіз літературних джерел по проблемі розпізнавання та ідентифікації об’єктів. У продовж останнього десятиліття ведуться численні розробки оптоелектронних систем (ОЕС), що будуються на біонічних (біокібернетичних) принципах. Дослідження цих принципів і створення елементної бази для їх практичної реалізації – основна тенденція розвитку сучасного оптоелектронного приладобудування. Все більше уваги надається адаптивним оптоелектронним пристроям, які реалізують зворотні зв'язки на параметричному і схемотехнічному рівні. Такі пристрої застосовують для управління чутливістю, величиною кутових полів, парамет-рами оптичних спектральних, просторових і частотно-часових фільтрів, а також іншими характеристиками ОЕС.

В сучасних системах розпізнавання, які являються класом ОЕС, використовують алгоритми порівняння відомих розподілів безлічі ознак у n-мірному просторі з розподілом, що відображає множину ознак у досліджуваній системі. Обробка ознак в системах розпізнавання найчастіше ведеться трьома способами: відбір найбільш інформативних ознак, утворення співвідношення окремих ознак і утворення лінійних комбінацій окремих ознак. Для зменшення розмірності в задачах розпізнавання використовують такий опис образів, який містить лише обмежене число “особливих” ознак. Вибір ознак, які найістотніше характеризують конкретний клас об'єктів, є найважливішим завданням при розробці інтеллектуальних ОЕС.

Окремо взяті ознаки не несуть достатньої кількості інформації про зображення, тому їх необхідно об'єднувати в групи. Найчастіше використовують такі групи ознак, як геометричні, спектральні, енергетичні й динамічні. Перш ніж використовувати ту або іншу ознаку, необхідно оцінити її інформативність. Методи оцінки інформативності можна умовно розділити на детерміновані й статистичні. У детермінованому підході інформативність ознаки визначають як різницю між значенням параметра якості, одержаним з врахуванням даної ознаки, і без нього. Хай є набір ознак Р1, Р2, Р3, …, Рn, що характеризують зображення суб'єкта, і набір параметрів якості К1, К2, К3, …, Кn. Кожен параметр може визначатися декількома ознаками, причому одна ознака може впливати на різні параметри. Завдання полягає в тому, щоб вибрати ознаки, які позитивно впливають на всі параметри, в яких вони задіяні, а саме:

(1)

де ДР - визначає вплив i-ої ознаки на якість і дорівнює “0” у разі відсутності впливу, “-1” у разі погіршення якості і “+1” у разі поліпшення якості.

Інший шлях оцінки інформативності ознаки - використання статистичних даних. Розрахувавши математичне очікування і дисперсію ознак, можна визначити ознаки з мінімальним коливанням значення у середині класу і найбільшим розкидом значень від класу до класу. Для цього використовують відомі відношення: (2)

де

Отже, 1) чим більша дисперсія величини Mi, тим ширший діапазон коливання ознаки при описі різних об'єктів, і, тим вища цінність даної ознаки для розпізнавання; 2) чим менша дисперсія Di, тим менші розкиди ознаки для одного і того ж об'єкту, тобто, тим кучніше розташовуються елементи одної групи (кластера). У граничному випадку величина F прямує до нуля.

Існує декілька основних підходів до формування ознак: статистичний, геометричний, структурний (морфологічний), лінгвістичний, нейросистемний. Головна вимога до ознаки - це інваріантність до будь-яких перетворень зображення, як наприклад, плоскопаралельному зсуві, повороті навколо осі об'єктиву, масштабуванню, перспективним перетворенням, деформації, зміні яскравості/ кольору/ контрасту. Окрім інваріантності до описаних перетворень, ознака повинна бути індивідуальною, чітко визначеною і постійною в часі.

Найбільш поширене використання сучасних систем розпізнавання – це ідентифікація особи за біометричними ознаками. Біометричні ознаки з погляду способу виділення і розпізнавання можуть бути розділені на дві групи: 1) характеристики самого об’єкту: наявність/відсутність елементів, розмір, тип, взаємне розміщення та орієнтація певних деталей, тощо (напр., міжочна відстань, форма обличчя, відношення ширини носа і рота, і т.п.); 2) параметри, що генеруються системою - значення детермінованих функцій, обчислених на зображенні (напр., кореляція області зображення з шаблоном).

Розпізнавання по IRIS - одна з біометричних технологій, яка застосовується для підтвердження особи користувача. Ця технологія побудована на аналізі зображення райдужної оболонки ока. Всі існуючі методи автоматичного розпізнавання реалізують наступну схему: 1) отримання об’єкта на зображенні; 2) нормування розмірів зображення; 3) обробка отриманого зображення; 4) обчислення ознак і формування з них коду дослідного зразка; 5) порівняння двох наборів ознак. Функція вироблення коду дослідного зразка - етап шифрування ознак об’єкта розпізнавання у визначений раніше формат для ефективного зберігання і порівняння.

Наступне застосування сучасних систем розпізнавання, яке особливо швидко розвивається у військовій сфері - це захоплення реального об’єкта, його розпізнавання та моделювання віртуальної реальності в спеціалізованих приладах. Таким типовим застосуванням є нашлемні дисплеї для створення віртуальної реальності на основі розпізнаних, оброблених і візуалізованих образів реальних об’єктів.

На закінчення приведена схема з класифікацією основних методів обробки і розпізнавання зображень: від початкового етапу отримання зображення об’єкту до кінцевого, яким є розпізнавання. В реальних системах розпізнавання застосовують, в основному, чотири підходи: 1) кореляційні; 2) засновані на прийнятті рішень по критерію близькості з еталонами; 3) ознакові; і 4) синтаксичні - найменш трудомісткі. Кожний підхід має свої конкретні алгоритми та певну область застосування, яка залежить від характеру відмінностей вхідних і еталонних зображень, наявності завад, вимог до об'ємів обчислень і швидкості ухвалення рішень, тощо. Для вирішення задач в умовах реального часу найчастіше застосовують нейронні мережі. Вони дають добрі результати при рішенні проблем, що є дуже складними для традиційних технологій (напр., проблеми, які не мають алгоритмічного рішення, або ті, для яких знаходження алгоритму є дуже складним і часто неможливим завданням).

Однак серйозною умовою, що обмежує практичне застосування нейронних мереж у вбудованих системах розпізнавання - це попередня підготовка зображень об’єктів. Справа в тому, що вбудована система передбачає використання досить простої „оптики”, що призводить до появи різного роду спотворень з боку приймача зображення. А нейронна мережа не зможе ефективно працювати, якщо зображення об’єктів матимуть нечіткі межі, значні зміни гами кольорів, спотворення сторонніми предметами, відблисками, шумами, і т.д. Для корекції таких спотворень, які зазвичай поступають з приймача зображення, у другому розділі розглянуто алгоритми ідентифікації кольору і методи усунення завад приймача.

У другому розділі представлено формальний опис і методи побудови моделей ідентифікації кольору.

Для використання зображень в системах розпізнавання необхідна попередня обробка, оскільки зазвичай одержане зображення спотворене неінформативними фрагментами і завадами, які виникають в приймачі. Реставрація зображень полягає в придушенні завад аддитивного типу різного роду фільтраціями. Основним представником таких фільтрацій є "Вінерівська фільтрація". Але до складу завад, які мають місце на кольорових зображеннях в системі обробки зображень, входять спотворення і самого приймача зображення. Такі завади з'являються внаслідок впливу параметрів джерела світла, датчиків приймача й ін. Вони погіршують якість аналізу окремих зображень і для їх зменшення треба застосовувати точнішу апаратуру (приймач зображення) та проводити відповідне її юстування, а також, необхідно провести багато експериментів для статистичної оцінки. Таким чином, необхідно аналітично визначити вплив завад на зображення і визначити критерій, який зменшує вказаний тип завад у програмах обробки.

Для зменшення завад приймача аналітично визначено їх вплив на зображення з метою корекції, подібно до того, як це робить система зору людини. Крім того, необхідно сформувати такі операції обробки, які зменшують вплив завад на результати обробки зображення. Зазвичай, система обробки зображення складається з приймача, комп'ютера і оператора (рис. ).

Рис. 1. Структура системи обробки зображення.

Вона передбачає ітераційний процес прийняття рішення, тобто багато-варіантний режим обробки і аналізу, який дозволяє врахувати досвід оператора та використати широкий набір управляючих параметрів. Оператор визначає комплекс ознак (кольори, порогові значення), які характеризують структуру зображення і його складових елементів й інтерактивно вводить їх в комп'ютер. Наступним етапом обробки є програмний аналіз зображення в комп'ютері та прийняття рішення про придатність одержаних результатів.

Початковий сигнал оптичного датчика приймача зображення має вигляд:

, (3)

де E() – спектральна густина випромінювання джерела світла; R() – коефіцієнт відбиття досліджуваного зразка; S() – спектральна чутливість датчика.

Для звичного випадку, коли спектральна густина випромінювання джерела світла постійна в робочому діапазоні хвиль E() А –, функція R() визначена в діапазоні довжини хвилі л від 400 до 700 (nm) і має обмежений спектр. Якщо перше наближення спектральної чутливості S() записати через наступну апроксимацію:

, (4)

то початковий сигнал оптичного датчика w-го кольору описується рівнянням:

. (5)

Даний вираз полягає в інтеграції функцій, які залежать від часу, а не від довжини хвилі, тому перетворимо його таким чином, що:

, (6)

де відліки робляться на довжині хвилі лw, що відповідає максимуму спектральної чутливості датчика. Отже, аналітично знайдено вплив завад приймача на зображення.

На наступному етапі роботи ці завади коригувались так, як це робиться в системі зору людини. Для зменшення впливу завад приймача було використано критерій кількості інформації (КІ). Для цього аналізувалось зображення, елементи якого заповнюють апертуру поля LxLy і Lx =y. Тоді, для випадку (де , - величини, які відповідають ширині частотної смуги коливань параметрів, які характеризують просторовий розподіл кольору зображення по осях x і у), визначимо кількість інформації в зображенні:

, (7)

де і – мінімальне і максимальне значення параметра.

Для проведення класифікації розрахуємо приріст інформації у фрагменті зображення (ФЗ) поза завадами, який і визначає КІ в інформаційному фрагменті (ІФ) зображення:

, (8)

де , , .

Нехай у нас компонента в характеризується яскравістю , тоді – поріг класифікації. Або, по іншому, можна записати: – а ця умова не залежить від параметрів датчика.

Сформуємо алгоритм класифікації, який позначимо Ал1: 1) задаємо просторові зони, в яких розміщені ІФ, що нас цікавлять - ; 2) виділяємо ІФ в частотних смугах fx1fy1, fx2fy2, …, fxkfyk fxfy...; 3) виділяємо ІФ у сферах в просторі кольору з радіусом сфери ; 4) аналізуємо кожен піксел і фільтруємо ті, для яких відносний радіус . Визначивши для кожного піксела відносний радіус с , проводимо фільтрацію і на початковому зображенні залишаемо лише ті піксели, кольори яких належать сфері з радусом сmax.

Експериментально Ал1 досліджували в умовах, коли фільтрація проводилася при малих значеннях порогу фільтрації і не враховували, що зображення може містити завади. Результат роботи програми, коли сmax = .06, представлено на рис. .

Як видно, з тестового зображення програма виділила смуги, які містять п'ять кольорів вибраних оператором (рис.4), і які належать зоні зображення.

Таким чином, розроблено алгоритм визначення приналежності пікселів зображення до ІФ, що описаний одночасно в площині зображення і в просторі кольору. Використання цього алгоритму дозволяє скоротити час обробки кольорових зображень на етапі обробки, а також, в перспективі, створити метод компактнішого опису кольорових зображень.

В третьому розділі розроблено різні модифікації алгоритму ідентифікації кольору, побудовані на відносній інформаційній оцінці фрагментів зображення. В програмах класифікації фрагментів зображення застосовують такі кількісні критерії, як функції відстані, відношення сигнал/шум, кількість інформації і т.д.

Метод класифікації по критерію функцій відстані виявився діючим лише коли його застосовують для класифікації окремо в границях площини зображення, і окремо в границях площини, утвореної просторовими частотами. У випадку використання критерію КІ, метод виявився діючим для класифікації в просторі кольору, але його застосування ще і на площину зображення в літературі не аналізувалось. Однак, в КІ фігурують переметри і простору кольору, і просторової площини, і площини просторових частот. Внаслідок цього, КІ потенційно підходить для побудови шуканої кількісної форми ознаки загального локального просторового і локального кольорового розподілу фрагмента зображення.

Щоб побудувати потрібний простір і відображення, що трансформують просторові координати, просторові частоти, координати простору кольору у шуканий простір використано дрібно-лінійні перетворення. Так, для визначення критерію відносної кількості інформації (ВКІ), розраховано приріст інформації
I wz, у фрагменті зображення поза фрагментом завад, що визначає КІ:

(9)

де сторони просторової зони Lx =x -xwz , а Ly =y -ywz; частотна смуга
(fxw) fxw - fxwz , а коефіцієнт у третій частині (9) формується як:

(10)

де w(r,g,b. Знайдемо зміну похибки (10) для випадку, коли ця зміна прямує до нуля і коли мають місце зміни границь діапазону w=wмакс, а wмін = wмін – wzмін = 0, тоді

. (11)

На наступному етапі аналізу розглянуто фрагмент ZM, що належить повному зображенню Z. Нехай цей фрагмент обмежується в площинах простору і кольору координатами M-того піксела (w, x, y), у якого параметри задовольняють умовам: w ? wмакс ; x ? Lx ; y ? Ly. (12)

Якщо і частотна смуга фіксована, тобто , тоді враховуючи, що відносну кількість інформації (ВКІ) для піксела визначаємо як:

(13)

На підставі створеного критерію ВКІ було розроблено алгоритм Ал2 для класифікації пікселів зображення по ознаці спільного локального просторового і локального кольорового розподілу фрагмента зображення.

Для визначення п'ятьох відносних похибок v , vxk,yk,crk,cgk,cbk, що є параметрами в умові, необхідно мати параметри Lx, Ly, wмакс. Для застосування цих параметрів в алгоритмі розглянемо їхнє визначення. Нехай зображення ZM, є фрагментом зображення Z і формується M-тим пікселом w(x, y), в якого параметри задовільняють (3.9). На першому етапі, всім пікселам з координатами wk(xk,yk) зображення Z, для яких справджується хоча б одна з умов (wk >, xk >yk >у фрагменті ZM присвоюємо значення wk = 0. На наступному етапі, якщо піксел wk(xk,yk) зображення Z має координати такі, що (wk <, xk <yk <тоді за формулою (13) визначаємо ВКІ (Ik). Нехай існує заданий поріг м. Якщо має місце Ik м, то це значить, що таким пікселам зображення Z, у профільтрованому зображенні Zf присвоюється значення wk = . В алгоритмі замість wk = (це чорний колір) можна застосовувати й інший колір.

Запропонований варіант алгоритму Ал2 реалізований програмно, але він має окремі недоліки: локальну анізотропну селекцію, ускладнений аналітичний аналіз та спотворення ВКІ.

Щоб розробити потрібну модифікацію алгоритму з використанням ВКІ, в роботі запропоновано використати апарат білінійних форм. Для цього у векторному просторі V5 визначено білінійну форму g (V5 ? R) таку, що:

, (14)

де G – квадратична матриця білінійної форми. Для побудови алгоритму використано найпростіші позитивно визначені форми: . (15)

Якщо a55 , а інші aij , тоді маємо позитивно визначену квадратичну форму: . А коли aij = , де i ?а aij , де i, тоді маємо ще одну позитивно визначену квадратичну форму: , (16)

корінь квадратний якої є відстань у 6-мірному векторному просторі V6 над полем R дійсних чисел. Таким чином, по (16) було визначено квадрат відстані від початку координат до точки, що належить графіку функції ВКІ (13).

Вираз (16) було покладено в основу програми класифікації пікселів зображення ІФ. Для розрахунку білінійної форми функції ВКІ (16) необхідно задати “еталон”, що має координати w(x,y), а також об'єкт класифікації, що має координати wk(xk,yk). Для кожного еталона необхідно розрахувати конкретне значення коефіцієнта sм , що визначається похибками w. Ці похибки знаходяться за формулами w /w . Далі алгоритм визначає приналежність піксела до фрагмента зображення по пороговому значенню Д?, яке обирають для класифікації і яке задають у програмі. Якщо має місце (g Др), тоді таким пікселам зображення Z, у зображенні Zf присвоюється значення wk = (чорний колір). Це є суть алгоритму Ал3.

Результати роботи програми, що реалізує алгоритми Ал2 і Ал3 представлено на рис. 6-9. На тестовому зображенні (рис. 6) інтерактивно визначено п'ять центрів ІФ, навколо яких виділялись піксели. Результати роботи програми по Ал2 для випадку, коли Д? = .1, .4, .7, .5 представлені, відповідно, зліва – варіант (а). Результати роботи програми по Ал3 для такого ж випадку, коли Д? = .1, .4, .7, .5 представлені, відповідно, справа – варіант (б). На цих рисунках чорний колір є кольором знищених пікселів.

З результатів видно, що фільтрація по Ал2 і Ал3 має анізотропний характер. Тому, для використання алгоритмів для аналізу металографічної структури їх спочатку потрібно модифікувати. В роботі запропоновано наступну трансформацію алгоритму Ал3.

Рис. 6. Фільтрація з ?p = 0,1 :

а) по Aл2;

б) по Aл3.

Рис. 7. Фільтрація з ?p = 0,4 :

а) по Aл2;

б) по Aл3.

Рис. 8. Фільтрація з ?p = 0,7 :

а) по Aл2;

б) по Aл3.

Рис. 9. Фільтрація з ?p = 1,5 :

а) по Aл2;

б) по Aл3.

Нехай визначено такий еталон, що wм(xм, yм) M, і xм ? 0, тому існує відношення qм /м. Звідси, квадратична форма (16) приймає таку форму:

(17)

де Ik2= [(dxк q + dyк )/ ym + s wck]2; dhк = hk - hm, h x, y.

Якщо зображення має однакову неізотропність по всій площині, яка при проведенні селекції пікселів може бути врахована підходящим вибором “еталона” з визначеним відношенням q, то це поліпшує якість класифікації пікселів. Однак, щоб використовувати для аналізу ізоморфних фрагментів зображення всю апертуру зображення, пропонується інший варіант адаптації функції ВКІ. На першому етапі, визначаємо декілька еталонів з різними просторовими координатами, що служать центрами ІФ. На другому етапі, виконуємо обробку зображення з використанням квадратичної форми (16) по всій апертурі зображення. Серед обраних “еталонів” візуально визначаємо еталон wм(xм, yм)Ms, що найкраще виділяє просторову форму ІФ. На третьому етапі, використовуємо цей еталон як зразок для поширення процедури обробки з окола цього еталона на всю апертуру зображення.

Цей алгоритм класифікації застосовує формулу ВКІ в якості складової

(18)

де ; а - просторові координати піксела еталона, що визначає просторову фільтрацію.

Таким чином, додатково до еталонів кольору введено еталони просторової фільтрації. Таких еталонів може бути декілька. Для компонентів , представниками яких на зображенні є пікселі з , задається еталон просторової фільтрації , а для компонентів - задається еталон просторової фільтрації , і т.д. У програмах, що реалізують зазначені алгоритми, для класифікації компоненти (в), застосовували умову , де - поріг класифікації. Цей алгоритм позначено, як Ал4.

На рис. –16 показано результати роботи програми, що реалізує Ал3 і Ал4. Тут білий колір є кольором знищених пікселів. Оператором вибрано шість центрів інформативних фрагментів, навколо яких виділялись пікселі. Вибрані кольори виділених центрів подано під віссю абсцис рис. 16. Просторове розташування виділенних центрів дає рис. 11. Найнижчий центр ІФ одночасно слугував і просторовим єталоном.

Результати роботи програми по Aл3 для Др = 0.1, 0.5, 1.4 показано на рис. 11, 13, 15. Результати роботи програми по Aл4 з визначення об’ємних часток () фазових складників в=1, 2,…, 6 для Др = 0.5, 1.4 представлено, відповідно, на рис. 12, 14. А співвідношення між фазовими складниками (в = 1, 2, …, 6) на кольоровому зображенні F представлено на рис. 16.

Гальмує безпосереднє застосування версії Aл3 для аналізу зображень металографії необхідність визначати значну кількість "еталонів", а також недостатньо повна за об'ємом обробка (по кількості пікселів) в околі окремого "еталона". Щоб усунути вказані недоліки необхідно модифікувати версію Aл3: на 1-му етапі, необхідно модифікувати визначення безлічі M "еталонів", а на 2-му етапі, необхідно модифікувати дію алгоритму Aл3 в околі "еталона" так, щоб якнайповніше класифікувати найбільшу кількість пікселів.

Детальніше ця послідовність операцій представленна на рис. 17. На 1-му етапі, оператор визначає еталони для фільтрації по Ал1, поріг фільтрації і запускає програму фільтрації по Ал1. Результати фільтрації являють собою еталони фільтрації для 2-го етапу, де оператор визначає поріг фільтрації і запускає програму фільтрації по Ал3. Для 3-го етапу обробки, оператор інтерактивно визначає орієнтацію фільтрації, поріг фільтрації і запускає програму фільтрації по модифікованому алгоритму Ал3.

Рис. 17. Структурна схема алгоритму обробки металографічного зображення.

Таким чином, загальне використання критерію кількості інформації, дрібно-лінійних перетворень, а також апарата білінійних форм дозволило створити вдосконалену версію алгоритму селекції пікселів по ознаці загального локального просторового і локального кольорового розподілу, що на етапі обробки зображень дозволяє підвищити якість обробки, скоротити час обробки і дозволяє обробляти зображення з широким спектром інформативних структур, що відрізняються розподілом в апертурі зображення й у просторі кольору.

В четвертому розділі описано об’єктно-орієнтовану вбудовану систему розпізнавання, в якій запропоновано використати алгоритми фільтрації, розроблені в попередніх розділах.

Вбудовані системи формуються шляхом об’єднання на одному кристалі класичної кремнієвої технології мікроелектроніки з технологіями механічної, оптичної та інших типів обробки. Структурно, вбудовані системи складаються з трьох складових частин : 1) засоби перетворення неелектричної інформації в електричні сигнали (датчики і сенсори); 2) мікропроцесорні системи обробки отриманої інформації; 3) виконуючі пристрої (актюатори).

Аналізуючи сучасні тенденції розвитку вбудованих систем, їх можна розділити на дві великі групи – І-ша група (мікровбудовані системи) передбачає, що сенсор, процесор і актюатор розміщені на одному напівпровідниковому кристалі і виготовлені в єдиному технологічному циклі. Розміри такого кристала не перевищують декількох квадратних сантиметрів. II-га група (макровбудовані системи) характеризується тим, що їх неможливо розмістити на одному кристалі. Окремі складові цієї системи, як правило, набагато більші за розміри напівпровідникового кристала, і, завдяки тому, дозволяють виконувати великі механічні зусилля і переміщення. Разом з тим, частини цієї макроубудованої системи, такі як сенсор і мікропроцесор або мікропроцесор і виконуючий пристрій можуть бути розміщені як на одному, так і на різних кристалах.

Кожна така система включає сенсор, що виконує роль чуттєвого елемента, і перетворює вхідні фізичні, хімічні та інші величини в електричний сигнал. Отриманий сигнал, як правило, буде аналоговим. Тому наступний модуль системи виконує функцію приведення аналогового сигналу до необхідного рівня з подальшим перетворенням його в цифрову форму, що виконує АЦП.

На підставі узагальненої схеми, у роботі розроблено і приведено різні структурні схеми мікропроцесорних вбудованих систем. Вони дозволяють створювати досить широкий спектр пристроїв – різних за можливостями і функціональним призначенням. Основний інтерес був направлений на побудову об’єктно-орієнтованої системи контролю доступу на базі гнучкої універсальної системи розпізнавання.

В загальному випадку, система контролю доступу використовує наступні етапи: 1) сканування об'єкта; 2) витяг індивідуальної інформації; 3) формування шаблона; 4) порівняння поточного шаблона з базою даних; 5) ухвалення рішення; 6) виконання рішення. А сучасні гнучкі системи розпізнавання, що використовують зазначені етапи, обовязково повинні включати модуль навчання і налаштування на об’єкт ідентифікації. Отже, такі системи можна назвати об’єктно-орієнтованими. Модуль навчання дозволяє вводити шаблони образів у БД, тим самим налаштовуючи систему на конкретний тип об’єктів. В роботі запропоновано використовувати систему, структурну схему якої зображено на рис. .

Реалізація даної структурної схеми у вигляді вбудованої мікропроцесорної системи розпізнавання представлено на рис. . В даній системі об’єктно-незалежні модулі прошиті в EPROM вбудованої системи. А функції об’єктно-залежних модулів розміщені в ПЛІС. Оперативна пам'ять системи реалізована на SDRAM, а база даних цифрових образів об’єктів розпізнавання зберігається у флеш-пам'яті.

Рис. . Структурна схема об’єктно-орієнтованої системи розпізнавання.

Рис. . Архітектура вбудованої мікропроцесорної мікрооптоелектро-механічної системи розпізнавання (МОЕМС).

Розроблену систему можна використовувати в різних областях – крім порівняння з вмістом баз даних цифрових зображень і класичного контролю доступу (верифікації), за допомогою таких систем можна безконтактно розпізнавати об’єкти (людей, автомобілі, кораблі) в негрупових сценаріях. При цьому, розпізнавання об’єктів буде неефективним тільки тоді, коли зображення неякісне або об’єкт дуже спотворено.

Спираючись на результати досліджень, процесор розпізнавання для запропонованої системи реалізовувася на основі нейронної мережі RBF - Radial Basis Function.

Рис. . Типова архітектура RBF-нейроної мережі системи розпізнавання.

Причина вибору цього типу нейронної мережі – її здатність кластеризувати подібні зображення (образи) перед їхньою класифікацією та її найбільш широким використанням в аналогічних задачах. Крім цього відомо, що RBF мережі мають високу швидкість навчання і дуже компактну топологію.

Навчання RBF мережі полягає в записі в параметричній формі невідомих параметрів для конкретно обраної архітектури нейронної мережі. Це означає необхідно визначити: 1) кількість схованих вузлів (m); 2) центри (ci) і ширини (?i) кожної базисної функції; 3) ваги рівня висновків W (і, k)) і зміщення (ВК). Для навчання необхідно мати множину оброблених об’єктів, які система зобовязана розпізнати. Для розпізнавання людей звичайно досить по 20-30 зображень для кожної людини. Для розпізнавання технічних об’єктів, наприклад кораблів і автомобілів, досить мати 10-15 зображень. Щоб сформувати стійку нейронну мережу, зразки цих об’єктів слід задавати у різних погодних умовах, різному освітленні, часі доби і т.д. При розпізнаванні людей, необхідно вводити зображення з різними елементами міміки (посмішка, смуток, хмурий погляд). Коли така база даних буде готова, можна запускати нейронну мережу на навчання.

Подальші наукові дослідження слід направити на вдосконалення алгоритмів виявлення і розпізнавання об’єктів, оптимізацію архітектури вбудованої системи розпізнавання, яка б підтримувала різні типи паралелізму, розпаралелювання обчислень на нейронній мережі і настроювання алгоритмів на обрану архітектуру. Це дозволить підвищити швидкість розпізнавання, що необхідно при аналізі великих БД з великою кількістю зразків об’єктів. Крім того, можна значно підвищити надійність розпізнавання, використовуючи 2 камери паралельно, але з різними точками огляду. Однак більшість з цих задач є чисто інженерними і вимагають великої кількості практичних експериментів.

ОСНОВНІ РЕЗУЛЬТАТИ ТА ВИСНОВКИ

В дисертаційній роботі розроблено завадостійкі математичні методи і алгоритми ідентифікації кольору, що характеризуються інваріантістю до умов освітлення об’єкта, завад та спотворень приймача зображення, і які запропоновано використати у вбудованих об’єктно-орієнтованих системах розпізнавання. Отримані методи й алгоритми являють собою новий суттєвий внесок у теорію і практику побудови вбудованих систем розпізнавання.

Основні результати дисертаційної роботи включають наступні положення:

1. Досліджено основні особливості, тенденції і перспективи розвитку об’єктно-орієнтованих систем розпізнавання. Показано, що усі компоненти існуючих систем, включаючи блок розпізнавання на базі нейронних мереж, можуть бути інтегровані в одну вбудовану систему (МОЕМС), що дозволить підвищити її ефективність, продуктивність та надійність.

2. Здійснено аналіз математичних методів у системах розпізнавання, що дозволило визначити основні задачі для побудови ознакового простору об’єктів.

3. Вперше встановлено і виведено аналітичні залежності для оцінки впливу завад приймача на зображення з метою вибору інформаційного критерію, який зводить їхній вплив на зображення до мінімуму.

4. На підставі аналітичної оцінки завад приймача зображення і запровадження механізму конкуренції для випадку приналежності піксела до декількох інформаційних фрагментів створено алгоритм кольорової селекції пікселів на площині зображення.

5. Створено програму кількісної оцінки площ кольорових металографічних зразків, що реалізує розроблений алгоритм. Результати роботи програми ілюстровані на прикладі вивчення кількісної оцінки фазового складу реальних електродугових покрить системи Fe-Cr-B-Al.

6. На основі інформаційного критерію й апарата евклідової геометрії розроблено новий метод визначення приналежності пікселів зображення інформаційному фрагментові, описаному одночасно в площині зображення й у просторі кольору. Його застосування дозволяє скоротити час обробки кольорових зображень, а в перспективі здійснити їх більш компактний опис.

7. Використання критерію відносної кількості інформації, дрібно-лінійних перетворень та апарата білінійних форм дозволило створити вдосконалену версію алгоритму селекції пікселів за ознакою спільного локального просторового і локального кольорового розподілу, що на етапі обробки дозволяє підвищити якість обробки, скоротити час обробки і дозволяє обробляти зображення із широким спектром інформативних структур.

8. Проаналізовано сфери застосування МОЕМС, визначені вимоги до анало-гічних пристроїв обробки кольорових зображень і розроблена архітектура вбудо-ваної мікропроцесорної мікро-опто-електро-механічної системи розпізнавання.

9. Розроблено програмні модулі, які реалізують створені в главах 2 і 3 алгоритми фільтрації, та нейронна мережа RBF, які можуть спільно використовуватися у вбудованій об’єктно-оріентованій системі розпізнавання.

10. Проаналізовано і сформульовано основні напрямки подальших досліджень, метою яких є підвищення продуктивності та надійності розпізнавання об’єктів.

ПУБЛІКАЦІЇ ПО ТЕМІ ДИСЕРТАЦІЇ:

Русин Б.П., Іванюк В.Г., Лау Г., Довгуник В.М., Корній В.В. Комп’ютерна кількісна оцінка фазового складу матеріалу за кольоровим металографічним зображенням. //Фіз.-хім. механіка матеріалів. – Т.40, №5, 2004. – С.77-80.

Іванюк В.Г., Капшій О.В., Косаревич Р.Я., Лау Г. Інформаційна оцінка і виділення фрагментів кольорових зображень. //Радиоэлектроника и информатика, № (28), 2004. – С. 122-125.

Іванюк В.Г., Лау Г., Лобур М.В. Розробка завадостійких алгоритмів оцінки компонентів кольорових зображень. //Вісник НУ “Львівська політехніка” „Комп’ютерні системи проектування. Теорія і практика”, № 487, 2005.– С. 22-30.

Lobur M., Ivanjuk V., Kapshiy O., Lau G. Filtration of Color Images using Distance and Corner Criteria. //Матеріали Міжнар. наук.-техн. конференції "Сучасні проблеми радіоелектроніки, телекомунікацій комп’ютерної інженерії" TCSET’2004 (лютий 2004): Львів, НУЛП, 2004. – С. 252.

Иванюк В.Г., Лобур М.В., Лау Г. Распознавание компонентного состава по изображению. //Материалы IV Междунар. научно – методической конф. “Дистанционное обучение

Сторінки: 1 2

��
��...

Наступні 7 робіт по вашій темі:

▪ РОЗРОБКА ІНСТРУМЕНТАЛЬНИХ АНАЛІТИЧНИХ БІОТЕСТІВ ТА ВИВЧЕННЯ ЇХНІХ ОСНОВНИХ ХАРАКТЕРИСТИК ПРИ ВИЗНАЧЕННІ ТОКСИЧНОСТІ ОБ’ЄКТІВ ДОВКІЛЛЯ - Автореферат - 26 Стр.
▪ АНАЛІЗ РЕЖИМІВ ФУНКЦІОНУВАННЯ СИСТЕМ ТРУБОПРОВІДНОГО ТРАНСПОРТУ ГАЗУ З УРАХУВАННЯМ ТЕХНІЧНОГО СТАНУ ОСНОВНОГО ОБЛАДНАННЯ - Автореферат - 28 Стр.
▪ Розвиток концепції національної бібліографії України у ХХ столітті - Автореферат - 28 Стр.
▪ ПРАВОСЛАВНА ЦЕРКВА НА ПІВДНІ УКРАЇНИ (1775 – рр.) - Автореферат - 48 Стр.
▪ РІВНІ ТА ФОРМИ ІСТОРИЧНОГО ПІЗНАННЯ В КОНТЕКСТІ ПОСТНЕКЛАСИЧНОЇ НАУКИ (ФІЛОСОФСЬКОІСТОРИЧНИЙ АСПЕКТ) - Автореферат - 25 Стр.
▪ ЕХО-КОРЕКЦІЯ АЛГОРИТМІВ ОТРИМАННЯ І ОБРОБКИ ВИМІРЮВАЛЬНОЇ ІНФОРМАЦІЇ ПРИ ОЦІНЦІ ПАРАМЕТРІВ АНТЕН ЛІНІЙНОЮ РЕШІТКОЮ ВИМІРЮВАЛЬНИХ ЗОНДІВ - Автореферат - 19 Стр.
▪ Температурні хвилі в ізотропних однорідних і кусково-однорідних напівпровідниках і діелектриках при об’ємному поглинанні гармонійно модульованого світла - Автореферат - 32 Стр.