У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





ОДЕСЬКИЙ НАЦІОНАЛЬНИЙ ПОЛІТЕХНІЧНИЙ УНІВЕРСИТЕТ ОДЕСЬКИЙ НАЦІОНАЛЬНИЙ ПОЛІТЕХНІЧНИЙ УНІВЕРСИТЕТ

КРИЛОВ Віктор Миколайович

УДК 681.325

СТРУКТУРНО-СТАТИСТИЧНА ІДЕНТИФІКАЦІЯ ГЕОМЕТРИЧНИХ ОБЄКТІВ ТА ТЕКСТУР В АВТОМАТИЗОВАНИХ СИСТЕМАХ УПРАВЛІННЯ ТА ПЕРЕТВОРЕННЯ ІНФОРМАЦІЇ

05.13.06- “Автоматизовані системи управління та прогресивні інформаційні технології”

А в т о р е ф е р а т

дисертації на здобуття наукового ступеня

доктора технічних наук

Одеса – 2002

Дисертацією є рукопис.

Робота виконана в Одеському національному політехнічному університеті на кафедрі прикладної математики

Науковий консультант:

доктор технічних наук, професор,

заслужений діяч науки і техніки України, лауреат Державної премії України,

АБАКУМОВ Валентин Георгійович, завідувач кафедри звукотехніки та реєстрації інформації, Київський національний політехнічний університет “КПІ”

Офіційні опоненти:

доктор технічних наук, професор Грицків Зенон Дмитрович, завідувач кафедри радіотехнічних пристроїв та систем, національний університет “Львівська політехніка”

доктор технічних наук, професор Гофайзен Олег Вікторович, завідувач кафедри телебачення та радіомовлення, Одеська національна академія звязку ім. О.С. Попова.

доктор технічних наук Козак Юрій Олександрович, завідувач кафедри прикладної математики та обчислювальної техніки, Одеська національна академія харчових технологій

Провідна організація: Інститут проблем реєстрації інформації НАН України

Захист дисертації відбудеться “24”жовтня 2002 р. о 13.30 годині на засіданні спеціалізованої ради Д 041. 052.01 в Одеському національному політехнічному університеті за адресою 270044, м. Одеса, проспект Шевченко, 1.

З дисертацією можна ознайомитися у бібліотеці Одеського національного політехнічного університету.

Автореферат розісланий “23”вересня 2002 р.

Вчений секретар ради Д.05.06.04 Ямпольский Ю.С.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

На сучасному етапі якісне зростання засобів обчислювальної техніки та зниження їхньої вартості обумовили розширення області застосування двовимірних полів даних (цифрових зображень) у різних автоматизованих системах управління та переробки інформації. Застосування такого уявлення інформації дозволяє вирішувати як традиційні задачі на якісно вищому рівні, так і принципово нові задачі. Такою принципово новою задачею, що вирішується автоматизованими цифровими відеокомплексами (ЦВК) обробки і розпізнавання зображень, є автоматичне чи автоматизоване розпізнавання зображень об’єктів і текстур. Характерні області з таким уявленням інформації: неруйнуючий контроль виробів електронної техніки; системи радіонавігації і автоматичного управління польотом; контроль якості поверхонь; екологічний моніторинг; автомати, що читають; дистанційне зондування ресурсів Землі; технічний зір роботів та ін. Різке зростання об’єму відеоінформації, яка передається через комп’ютерні мережи та інші канали зв’язку, стимульовало розвиток наукових досліджень в галузі зниження психовізуальної збитковості та застосування методів аналізу зображень при стисканні.

Основним фактором, що обмежує область використання ЦВК, недостатня ефективність процедури ідентифікації. Ефективність визначається швидкодією, завадостійкістю, розрізнювальною здібністю та вартістю. Підвищення ефективності може бути досягнуто шляхом удосконалення апаратної частини і шляхом створення більш досконалих методів обробки зображень. Перший напрямок включає в себе створення скануючих пристроїв (СП) з низьким рівнем шумів і високою розрізнювальною здібністю, забезпечення рівномірної освітленості об’єкта і використання в ЦВК високопродуктивних обчислювальних комплексів. Цей напрямок передбачає значне підвищення вартості ЦВК. У ряді випадків СП з характеристиками, що вимагаються, ще не створені чи не можуть бути створені принципово. Тому треба надати перевагу другому напрямку, що дозволяє досягнути потрібної ефективності без істотного підвищення вартості.

Існують дві основних групи методів ідентифікації. Структурні методи базуються на виявленні та аналізі геометричних ознак обєктів (контурів, характерних точок та ін.), відрізняються високою швидкодією та розрізнювальною здатністю. При високим рівні завад виявлення та аналіз цих ознак утруднене. У цьому разі використовуються статистичні методи, що базуються на безпосередньої обробці напівтонових зображень та статистичної оцінці їх характеристик (моментів, дисперсії, кореляції та ін.). Це потребує великих обчислювальних витрат, утруднює обробку у реальному масштабі часу та знижує розрізнювальну здібність чи потребує супер-ЕОМ.

На практиці зображення обєктів ідентифікації часто мають високий рівень завад. При формуванні зображень із-за просторової нерівномірності освітлення виникає мультиплікативна завада. Тому розробляються і використовуються складні і високо вартісні комплекси освітлювальної апаратури, які забезпечують рівномірне освітлення об’єкта. Якщо використовуються природне освітлення чи освітлення, що проходить через турбулентне середовище, то забезпечити його рівномірність неможливо принципово. Освітлення може бути оптичним, тепловим полем, рентгенівським, гіпер- та ультразвуковим опроміненням, потоком електронів чи іонів та ін. Тому для формування зображень використовуються датчики різної фізичної природи та дуже часто з високим рівнем внутрішніх адитивних шумів. Характерна також імпульсна завада типа “яскрава точка”. Тому розробка структурно - статистичних методів, що дозволяють виявляти та аналізувати геометричні характеристики при високому рівні завад є актуальною. Питання завадостійкого виділення геометричних характеристик є предметом активних досліджень з використанням найсучасніших методів, наприклад, інтелектуальної фільтрації і Wavelet- перетворення. Правильний вибір і завадостійке виділення геометричних ознак дозволяє істотно підвищити ефективність ЦВК.

Сучасні автоматизовані системи обробки зображень, не дивлячись на все різноманіття задач, виконують обмежений набір типових процедур. Частина процедур залежить від складу класу зображень, що розпізнається, та розробляється для кожної проблемно-орієнтованої ЦВК окремо. Друга група складається з базових процедур, які використовуються в широкому діапазоні задач, що вирішуються. До них належать попередня обробка, виділення контурів і бінарізація зображень, аналіз контурів і обчислення геометричних характеристик об’єктів розпізнавання. На підвищення ефективності базових процедур ідентифікації спрямовані зусилля численних колективів дослідників. Слід виділити класичні праці Претта, Розенфельда і Гренандера у США, праці Ярославського, Лабунца, Красильникова, Сойфера і Сергеєва у Росії, Шлезінгера, Гімельфарба, Васильєва, Абакумова, Власенко і Гофайзена в Україні, сучасні розробки Південно-Каліфорнійського університету, Массачусетського технологічного інституту, Стэндфордсікого університету.

На сучасному етапі зжимання з використанням статистичної збитковості зображень наближується до свого потенціального бар’єра. При використанні методів розпізнавання зображень виникає необхідність у підвищенні завадостійкості і швидкодії базових процедур аналізу. Для психовізуального зжимання необхідні методи реалізації алгоритмів функціонування моделей зорового аналізатора з високою обчислювальною ефективністю.

Підвищення швидкодії можливо також шляхом виділення процедур, що вимагають найбільших обчислювальних затрат, розробки і побудови спеціалізованих пристроїв, що реалізують ці процедури, та введення цих пристроїв у склад апаратно - програмних комплексів ЦВК.

Наведені вище міркування визначають актуальність обраного напрямку досліджень - розробка структурно - статистичних методів ідентифікації, що дозволять поєднати швидкодію структурних методів з завадостійкістю статистичних та підвищити ефективності автоматизованих ЦВК переробки і розпізнавання зображень.

Мета роботи. Метою дисертаційної роботи є створення основних теоретичних положень структурно - статистичної ідентифікації геометричних об’єктів та спектрів текстур для підвищення ефективності обробки та ступеню стискання інформації в автоматизованих системах управління та переробки зображень. Підвищення ефективності дозволить значно розширити область використання прикладних автоматизованих ЦВК у системах управління і переробки інформації, використовувати у існуючих системах менш складні і високо вартісні СП, освітлювальні і обчислювальні комплекси.

Досягнення вказаної мети обумовлює вирішення наступних задач:

1. Дослідження, аналіз та узагальнювання структур існуючих автоматизованих систем управління та виділення базових процедур, що визначають їхню ефективність.

2. Створення завадостійких та швидкодіючих статистичних методів виявлення та аналізу структури контурів та бінарізації зображень.

3. Створення методів підвищення завадостійкості процедур виявлення та аналізу зображень на базі рангової обробки.

4. Розробка методів ідентифікації, що інваріантні до масштабу, зсуву та ротації зображень об’єктів на однорідному та текстурованому фоні

5. Розробка методів використання властивостей та моделей ЗА для підвищення ефективності автоматизованих систем управління.

6. Створення проблемно-орієнтованих програмно-апаратних ЦВК обробки і розпізнавання зображень.

7. Апаратна реалізація підсистем обробки зображень.

Обєктом дослідження є процес розпізнавання форми геометричних обєктів та текстур в автоматизованих системах управління в умовах завад .

Предметом дослідження є ідентифікація форми геометричних обєктів та енергетичних спектрів текстур в умовах імпульсних, адитивних та мультиплікативних завад.

Методика проведення досліджень. При вирішенні задач, що поставлені в дисертаційній роботі, використовувались аналітичні і експериментальні дослідження. Аналітичні методи ґрунтуються на теорії функціональних перетворень, на теорії статистичних рішень і методах математичної статистики, на теорії розпізнавання образів, на методах моделювання. Експериментальні методи базувались на сучасних методах програмування і методах проектування і макетування спеціалізованих обчислювальних пристроїв.

Достовірність наукових результатів підтверджується високим ступенем адекватності машинного моделювання і експериментальних досліджень та практикою використання розроблених методів у прикладних задачах обробки і розпізнавання сигналів зображень.

Наукову новизну роботи визначає наступне:

1.

Вперше розроблені методи сумісного використання процедур підкреслювання контурів і багатоканального оптимального адаптивного виявлення перепадів інтенсивностей з використанням групового підхіда, що дозволило підвищити ефективність процедури виявлення контурів.

2.

Вперше розроблені методи рангової обробки в просторі оцінок і рішень, які базуються на методах теорії статистичних рішень і рангової фільтрації, що дозволило підвищити ефективність рангової обробки в умовах флуктуаційних завад.

3.

Вперше запропонований метод визначення геометричних характеристик зображень об’єктів і енергетичних спектрів текстур за характерними точками (ХТ) контурів, що дозволило підвищити ступінь стискання інформації до потенційно можливого бар’єру при високих завадостійкості і швидкодії ідентифікації.

4.

Забезпечена завадостійкість та знижена чутливість до локальних екстремумів регулярних ітераційних методів пошуку характерних фрагментів на зображенні шляхом використання часткових перетворень Гільберта замість оцінок градієнта.

5.

На базі вперше досліджених за допомогою апарата двовимірних інтегро-ступеневих рядів Вольтера-Вінера основних закономірностей перехідного режиму моделей зорового аналізатора запропоновані методи попередньої обробки зображень та розрахунку функцій просторового маскування.

6.

Вперше розроблені методи оцінки якості та розрізнювальної здібності з урахуванням перехідного режиму, що запропоновані для використання при обробці мало контрастних і високозашумлених зображень.

Вперше запропоновано виявляти ХТ контурів методом просторової віялової інтерполяції першого порядку, що дозволило проводити аналіз контурів об’єктів і енергетичних спектрів текстур з високими завадостійкістю і швидкодією.

Практична цінність. Практична цінність роботи міститься в тому, що на базі розроблених методів, алгоритмів, пристроїв і програм підвищена ефективність реально працюючих комплексів, у розроблених рекомендаціях по використанню розроблених методів і пристроїв у прикладних автоматизованих системах управління.

Реалізація результатів роботи. Результати досліджень апробовані і впроваджені в автоматизованій телевізійній системі управління машинним перевантаженням тепловиділяючих збірок на АЕС (читаючий автомат), в телевізійних системах екологічного моніторингу і використовувались в навчальнім процесі на кафедрі інформаційно-вимірювальної техніки і прикладної математики Одеського політехнічного університету.

Особистий внесок здобувача. Основні теоретичні результати, які виносяться на захист, отримані здобувачем самостійно та опубликовані особисто у роботах /2,27,28,29,33,34/ та главах 1-3 /1/. До сумісних розробок з співаторами належать: технологія використання методів, що розроблені здобувачем, у прикладних АСУ /1,3,5,7,8,10,11,15,16,19,20,22,23,26,35/ , методика програмної та апаратної реалізації методів /9, 10, 12, 13, 14, 17, 21, 25, 31/.

Апробація роботи. Наукові результати і основні положення дисертаційної роботи доповідались і обговорювались на більш ніж 20 міжнародних, всесоюзних і українських науково-технічних симпозіумах, конференціях, нарадах і семінарах, зокрема: Математичні методи розпізнавання образів-3 (м. Львів, 1987 р.), Математичні методи розпізнавання образів-4 (м. Рига, 1987 р.), Всесоюзна конференція по штучному інтелекту (м. Переславль-Залеський, 1988 р.), Х Всесоюзний симпозіум по проблемі збитковості в інформаційних системах (м. Ленінград, 1989 р.), “Автоматика-98” (м. Київ, 1998 р.), “Автоматика-99” (м. Харків, 1999 р.), “Автоматика-2001” (м. Одеса, 2001 р.), “УкрОбраз-98” (м. Київ, 1998 р.), “УкрОбраз-2000” (м. Київ, 2000 р.), “Проблеми електроніки”(м. Київ, 1999,2000,2001,2002 рр.).

Публікації. По темі дисертації опубліковано 1 монографія, 47 статей, з них 34 - в спеціальних журналах, 20 доповідей у працях всесоюзних, міжнародних і республіканських конференцій, 7 депонованих рукописів. Основні положення роботи доповідались і обговорювались на науково - технічних конференціях професорсько-викладацького складу ОНПУ, НПУ-КПІ і університету м. Лувен (Бельгія), на 20 всесоюзних, міжнародних, і республіканських конференціях.

Структура і об’єм дисертаційної роботи. Дисертація складається з вступу, шести глав, висновку і 4 додатків, містить в собі 202 сторінки машинописного тексту, 80 рисунків, 8 таблиць, список літератури з 242 назв і додатків на 30 сторінках.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтована актуальність теми дисертації, поставлена її мета і сформульовані її основні задачі.

В першому розділі проведені дослідження сучасного стану теорії і практики аналізу, ідентифікації та розпізнавання зображень. Складена узагальнена структурна схема і виділені базові процедури, що визначають ефективність ідентифікації. Проведений аналіз найбільш перспективних для підвищення ефективності ЦОК базових процедур - попередньої обробки, контурної обробки, бінарізації зображень, розрахунку геометричних характеристик. Проаналізовані особливості формування зображень і виділені найбільш характерні завади. Аналіз літератури довів, що основними статистичними моделями шумів є мультиплікативна логнормальна і адитивна гаусівська завади. Проведений аналіз існуючих методів попередньої обробки, яка має на меті зниження рівня мультиплікативної завади, поліпшення якості зображень і зменшення статистичної і психовізуальної збитковості. Зроблено висновок, що задачі попередньої обробки можуть бути вирішені на основі алгоритмів функціонування і моделей ЗА. Для подальшого використання відібрані ті моделі зорового аналізатора, в яких результати досліджень біофізиків збігаються з технічними пропозиціями спеціалістів в області обробки зображень і розпізнавання образів. Відмічено, що перехідні характеристики (ПХ) ЗА лишилися за межами уваги дослідників. При аналізі ПХ треба враховувати, що існують різні варіанти моделювання нелінійної реакції ЗА на інтенсивність; при використанні моделей ЗА в системах обробки зображень використовуються фільтри різної структури. Зроблено висновок про необхідність розробки методів аналізу ПХ моделей ЗА. Проаналізовано існуючі методи виділення і аналізу геометричних ознак при розпізнаванні об’єктів на одноріднім фоні; при розпізнаванні текстур; при розпізнаванні об’єктів на текстурованому фоні. Важливу роль для всіх цих задач грає операція виділення контурів. Розпізнавання зображень об’єктів по їхнім контурам дозволяє істотно (на кілька порядків) скоротити об’єм інформації, що обробляється і, отже, скоротити обчислювальні і апаратурні витрати, забезпечити виконання задачі розпізнавання у реальному масштабі часу. У багатьох практично важливих задачах високий рівень завад не дозволяє якісно виділити контури. Тому завадостійке виділення контурів лишається предметом активних досліджень. В роботі виділені та досліджені дві групи методів контурної обробки: диференційні і кореляційно-екстремальні. Диференційним методам властиві простота і швидкодія, але вони мають низьку завадостійкість. До диференційних методів належать, наприклад, класичні оператори Кирша і Собела та методи на базі оператора Канні, що активно розвивають. Задовільної якості виділення контурів удається досягнути при співвідношенні сигнал/завада не менш ніж 10. Кореляційно-екстремальні методи мають високу завадостійкість. Однак, при обробці протягнених (розмитих) перепадів інтенсивності потрібне використання додаткових каналів виявлення. Спостерігається погане розрізнення об’єктів різної форми зі схожими розмірами та енергією. Виникають труднощі при виборі порога виявлення. У результаті рівень обчислювальних і апаратурних витрат у 5-40 разів вище, ніж у диференційних методів. Ці недоліки не усувають і найсучасніші методи, що основані на використанні Wavelet - перетворення. Зроблений висновок про те, що для підвищення ефективності ЦОК необхідна розробка методів виділення контурів, які можна порівняти з диференційними методами по швидкодії і розрізнювальній здібності і з кореляційно - екстремальними методами по завадостійкості. Проведений аналіз існуючих методів визначення координат точок найбільшої кривизни контурів - характерних точок (ХТ). Існуючі методи виділення ХТ основані чи на диференційному аналізі, чи на різних методах апроксимації функції кривизни контурів. Перші відрізняються низькою завадостійкістю, другі - складністю і низькою швидкодією. Зроблено висновок про необхідність розробки завадостійких, швидкодіючих, точних і простих у реалізації алгоритмів виділення ХТ. Проведений аналіз існуючих методів розпізнавання зображень. Найбільш ефективною в умовах завад є статистична група методів. Виділений метод геометричних моментів-ознак (ГМО), що має високу завадостійкість і інваріантність до масштабу, повороту і зсуву у полі зору. Був указаний основний недолік - високий рівень обчислювальних витрат і поставлена задача - підвищення обчислювальної ефективності метода ГМО.

У розділі 2 розроблені методи завадостійкого і швидкодіючого перетворення напівтонового зображення в контурний препарат. Для підвищення швидкодії здійснено перехід від “плаваючої” обробки до групової. Існуючі методи для виділення контурів використовують “плаваючу” обробку, тобто після обробки поточного фрагмента здійснюється зсув на 1 піксель і обробка повторюється. У даній роботі здійснюється зсув на один фрагмент, що дозволяє підвищити швидкодію не менше, ніж у 4 рази. Замість традиційної двомірної обробки здійснюється одномірна за рядками і колонками, що також дозволяє значно підвищити продуктивність операції виділення контурів. Об’єм фрагмента, що обробляється, був обраний таким, що дорівнює 4, виходячи з вимог до розрізнювальної здібності, завадостійкості, швидкодії. Для підвищення розрізнювальної здібності підкреслюється перепад інтенсивності. При підкресленні контурів використовувалось пофрагментне дискретне перетворення Гільберта (ДПГ), тому що воно досить ефективно підкреслює контури, має високу у порівнянні з операцією диференціювання завадостійкість, не змінює закон розподілу і дисперсію шуму, зближує ідеальний і затягнений перепади. Пофрагментне ДПГ інтерпретуємо як лінійну некаузальну згортку фрагмента, що обробляється, з матрицею

,

де m=6. При схемній реалізації ця інтерпретація дозволяє замінити операції множення операціями зсуву. Для фрагмента розміром n=4 можливі наступні варіанти форми перепаду інтенсивності.

Теорія статистичних рішень дозволила одержати наступне вирішувальне правило: . Тут - енергія рядка зображення об’єкта у просторі ДПГ; , - щільність енергетичного спектра білого шуму. - ДПГ обробляємого фрагмента, - ДПГ еталонних перепадів, - коефіцієнт, що визначається критерієм виявлення. Оскільки нема апріорної інформації про ймовірність появи об’єкта у рядку і про ціну помилкової тривоги і вірного виявлення, тому в якості критерію далі буде використовуватись максимум апостеріорної ймовірності. При цьому . Вирішувальне правило приймає вигляд: . Від одного сигналу може спрацювати відразу кілька каналів виявлення. Умова вибору рішення: , де - рішення про наявність на вході сигналу , - значення порога в i - му каналі, - значення Z в i - му каналі, що настроєний на сигнал . Пристрій виділення контурів силуетних зображень працює наступним чином. У кадровий нагромаджувач КН надходить зображення. Скануючий пристрій зчитує рядки зображення, а -колонки. Фрагменти рядків (колонок) перемножуються на матрицю ДПГ. Далі сигнал надходить до достатнього приймача виявляча (ПрО), на виході якого приймається одне з рішень . Для того, щоб помістити контурний препарат до фрагмента, що обробляється, необхідно мати інформацію про форму перепаду у попередньому і наступному фрагментах. Цю процедуру здійснює кінцевий автомат формування контурного препарату (КАФ). Контурні препарати рядків і колонок складаються логічно і надходять до нового КН. Для реалізації цієї процедури необхідно провести 2 операції множення, 12 операцій додавання, 8 операцій зсуву і 5 операцій інверсії на піксель. Обчислювальна ефективність цієї процедури перевищує навіть показники операції підкреслення контурів, що використовується у диференційних методах. Основні методи підкреслення контурів (двомірне диференціювання, оператор Лапласа) зведені до згортки вихідного зображення з маскою Н(4,4)., що вимагає не менше 5 множень і 48 додавань на відлік.

При виявленні контурів напівтонових зображень об’єктів не можливо визначити апріорно енергію фону і корисного сигналу. Тому задача виявлення контурів в цьому випадку буде вирішувалась адаптивними методами, тобто проводились сумісні визначення і оцінка параметрів сигналу. Моделі еталонних фрагментів рядка зображення визначаються наступним чином: , де рівень фону; - еталонний сигнал; - коефіцієнт. Оцінка параметрів здійснюється за критерієм найменшої середньоквадратичної помилки, що приводить до системи рівнянь:

;

,

Тут - енергія одиничної функції у просторі ДПГ, - енергія сигналу у просторі ДПГ, - ДПГ одиничної функції;

При сумісному виявленні перепаду інтенсивності і оцінки параметрів виникає двоїстість при прийманні рішення про форму перепаду інтенсивності. Наприклад, при формі перепаду може бути прийнято рішення з і і рішення з і , що відповідає формі перепаду . Це створює умови для синтезу алгоритму з скороченою кількістю моделей перепаду. Виділимо наступні пари взаємно обернених моделей перепаду інтенсивності: - ; - ; - ; - . Для усунення неоднозначності при прийнятті статистичного рішення ураховується знак оцінки сигналу . Вирішувальне правило при цьому приймає вигляд . Правило вибору рішення , де - рішення про на-

явність на вході сигналу з фоном . Кількість каналів виявлення ПрО знижується з 7 до 4. Структура адаптивного достатнього ПрО фрагмента рядка сигналу зображення наведена на рис.1

Рис.1.Приймач-виявляч перепадів інтенсивності

В узгоджених фільтрах здійснюється скалярне множення фрагмента на еталони відповідно. Далі з результату віднімаються пороги . Пристрій вибору рішення (УВР) обирає максимальний з отриманих результатів і визначає рішення . Оцінка параметрів сигналу і виконується в пристрої оцінки параметрів (УОП). Розрахунок порога здійснюється в пристрої вибору порога (УВП) у відповідності з правилом вибору рішення. Запропонований алгоритм виділення контурів при паралельній структурі обчислювателя потребує не більше 6 операцій множення на піксель.

Завадостійкість операції виділення контурів визначається по критерію Претта де - число точок перепадів в ідеальному і реальному контурних перепадах, - масштабний множник відстань між точкою дійсного перепаду і лінією, що складається з точок ідеального перепаду, який вимірювався по нормалі до цієї лінії. Значення критерію нормалізовано так, що R = 1 для точно виділеного перепаду. Множник 1/I забезпечує штраф за змазані та розбиті контури.

Розроблені методи перевищують існуючі по завадостійкості в 1,3 - 2,2 рази (по критерію Претта). Особливо значний виграш у діапазоні відношень сигнал/завада 2-10 (по потужності). Швидкодія розроблених методів може бути порівняна з швидкодією диференційних контурних операторів. Метод має високу розрізнювальну здібність.

В розділі 3 розроблені методи підвищення завадостійкості ЦВК за допомогою рангової обробки в просторі оцінок і рішень. Практика використання рангових методів доводить, що вони є високоефективним апаратом у боротьбі з імпульсними завадами. При наявності флуктуаційних завад ці методи не стають у пригоді.

У результаті дії розроблених операторів виділення контурів формуються набори рішень у рядках (колонках), що складаються з нулів і одиниць. Дія флуктуаційної завади приводить до появи збійних пікселів, тобто до імпульсної завади. У даній роботі розроблені рангові методи, що дозволяють ефективно боротися не тільки з імпульсною, але і з флуктуаційною завадою. У результаті дії розроблених операторів виділення контурів формуються набори статистичних рішень про форму сигналу у рядках (колонках), що складаються із нулів і одиниць, котрі далі будемо називати простором рішень. Дія флуктуаційної завади приводить до виникнення збійних пікселів у просторі рішень, тобто до імпульсної завади. Автором запропоновано перевести реальне зображення у просторі рішень і піддати його ранговій обробці. Оскільки предметом обробки є нулі і одиниці, зникає необхідність у побудові варіаційного ряду, що різко зменшує обсяг обчислювальних витрат при реалізації рангових методів.

При обробці напівтонових зображень об’єктів внаслідок впливи завад оцінки фону сигналу у сусідніх фрагментах не збігаються. У попередніх фрагментах установлені - рівень "0" - і рівень “1” - . Для узгодження оцінок фону і сигналу проводиться операція рангового сгладжування в просторі оцінок:

Тут - околиця рівней і . На базі одержаних рішень про форму перепаду і результатів рангового згладжування здійснюється перехід у простір рішень. При цьому рядки (колонки) будуть складатися тільки з нулів та одиниць. Рангова обробка у просторі рішень здійснюється таким же чином, як і у випадку силуетного зображення.

Результати обробки реального зображення наведені на рис.2.

Рис.2. Результати обробки зображення реального напівтонового об’єкта: а)вихідне зображення; б)контур без рангової обробки; в) контур після рангової обробки.

При співвідношеннях сигнал\завада q<3 (по потужності) у контурах виникають розриви, котрі не можуть бути ліквідовані операцією простежування. В цьому випадку розпізнавання доцільно проводити у просторі рішень. Розроблені раніше процедури при цьому інтерпретуються як завадостійка бінарізація. Оцінка фону отримана з аналізу гістограми фрагмента зображення, що обробляється. Після заповнення масиву рішень використовувалась медіанна обробка. При бінарізації достатньо обробити зображення тільки по одній з осей ОХ чи OY, що скорочує обсяг обчислювальних витрат в два рази. Результати бінарізації реального зображення наведені на рис.3.

Рис.3. Результати бінарізації реального зображення

Рангова обробка в просторі оцінок і рішень не вимагає великого обсягу обчислювальних витрат і дозволяє одержати значний (до 1,5 разів) виграш по завадостійкості (по критерію Претта), особливо істотний при співвідношеннях сигнал/шум 2-5 (по потужності). Використовуючи цей метод, пощастило досягнути стійкого простежування контурів при співвідношеннях сигнал/шум 3 (по потужності) чи 1,7 (по амплітуді). Метод непридатний для обробки малорозмірних (менше 4х4 пікселів) об’єктів і деталей об’єктів.

У розділі 4 розроблені швидкодіючі методи завадостійкого розпізнавання об’єктів, текстур і об’єктів на фоні текстури. Визначаючим при розпізнаванні є вибір набору ознак форми. На практиці до ознак форми пред’являються наступні вимоги: завадостійкість, інваріантність до масштабу, інваріантність до зсуву і повороту в полі зору, висока обчислювальна ефективність в умовах обмеженого обчислювального ресурсу. Найбільш ефективною в умовах завад є статистична група методів розпізнавання. В якості базового обраний статистичний метод геометричних моментів-ознак (ГМО), що має високу завадостійкість і інваріантність до масштабу, повороту і зсуву в полі зору. Основний недолік методу - високий рівень обчислювальних витрат.

Для реалізації цього методу необхідні завадостійкі процедури виділення і простежування контурів, визначення координат ХТ. Результатом дії алгоритмів простежування є упорядкований масив координат точок контуру об’єкта. Процедура відстежування контуру в умовах завад складна, залежить від складу зображень і має евристичний характер. Алгоритм відстежування, що використовується у даній роботі, дозволяє стійко відстежувати контури об’єктів при відношенні сигнал/завада не менше 3 (по потужності).

Метод простий у реалізації, завадостійкий і має високу швидкодію. Можливо зміщення виділених ХТ усередині апертури і поява помилкових ХТ на протягнених ділянках з низькою кривизною. Ці недоліки не приводять до зниження ефективності ЦВК, що використовують метод ГМО. Дослідження властивостей вектора ознак довели:

1. Мала кількість ХТ, що обробляються, визначає скорочення обчислювальних витрат не менше, ніж на два порядки.

2. Ознаки інваріантні до паралельного переносу, оскільки нуль полярної системи координат збігається з центром ваги фігури.

3. Ознаки стійкі до змін масштабу, оскільки радіус-вектори ХТ нормуються. При змінені масштабу складові вектора ГМО змінюються в середньому на 5%.

4. Ознаки інваріантні до кута повороту об’єкта. Інваріантність забезпечується підсумовуванням по обходу контуру. При повороті вектор ГМО змінюється не більш, ніж на 3%.

5. Згладжуючи якості моментів і характеристики розроблених методів виділення і аналізу контурів визначають високу завадостійкість ознак. При спів

відношенні сигнал\завада 5 (по потужності) вектор ознак змінюється не більш, ніж на 10%.

6. Ансамбль ознак легко нарощується до отримання стійкого розпізнавання.

Результати обробки реального зображення наведені на рис.4.

 

Рис.4. Результати обробки зображення нафтової плями на водній поверхні: а)вихідне зображення; б) контур після виділення; в) контур після простежування; г) характерні точки контуру

Розглянуто важливий для практики випадок - визначення і розпізнавання об’єктів на фоні текстури. До цієї категорії відносяться, наприклад, дистанційне зондування ресурсів Землі (ДЗРЗ), визначення дефектів текстилю, визначення і розпізнавання нафтових плям на схвильованій водній поверхні і т.д. Необхідно по-перше зробити сегментацію зображення по текстурним ознакам, тобто визначити області зображення з однорідними текстурами. В цій роботі для сегментації використовувались відомі методи. Наступним етапом є розпізнавання і класифікація текстур у текстурово- одноріднім фрагменті. Автором розроблений метод розпізнавання і класифікації текстур по формі їхнього енергетичного спектра на базі розробленого апарата обчислення ГМО Процедура розпізнавання текстур у текстурно-однорідних областях складається з:

1. Обчислення енергетичного спектра текстурно-однорідної області зображення.

2. Виділення, простежування і аналіз контурів на двовимірнім енергетичнім спектрі.

3. Визначення геометричних моментів-ознак кожного з контурів, що досліджується. Центр ваги і нормовочний множник розраховувались по зовнішньому контуру енергетичного спектра.

4. Мінімізація і ортогоналізація ознакового простору.

5. Класифікація. В якості еталонів при класифікації використовувались усередненні енергетичні спектри класів текстур, що розпізнаються. У деяких випадках виявилось доцільним використовувати і ознаки другого типу, що ураховують взаємне розташування замкнених областей енергетичного спектра.

Для розпізнавання об’єкта на фоні текстури розроблена наступна процедура:

1. Сегментація зображення на текстурно-однорідні області.

2. Розпізнавання текстур у однорідних областях.

3. Спектральна щільність фрагмента ділиться поелементно на усереднений енергетичний спектр даного класу текстур.

4. Зворотне перетворення результату ділення, тобто повернення у просторову область.

5. Визначення і розпізнавання об’єкта.

Розроблена автоматизована система розпізнавання об’єктів на бінарізованих зображеннях, що призначені для роботи в умовах високого рівня мультиплікативних і адитивних завад при співвідношенні сигнал/завада менше 3. Такі умови виникають при роботі в умовах високої радіації, у турбулентному водному середовищі, у інфрачервоному діапазоні та ін. Вимоги до цієї системи: час обробки кадру має не перевищувати 60 секунд; система має бути працездатна при співвідношеннях сигнал/завада q=2-5 (по потужності); інваріантність до масштабу, інваріантність до повороту; інваріантність до зсуву у полі зору. Розроблена наступна структурателевізійної системи розпізнавання маркувальних символів. З виходу телевізійного датчика (ТВД) зображення надходить на аналогово-цифровий перетворювач (АЦП) та у цифрованому вигляді зберігається на час обробки у кадровому накопичувачі (КН). Далі відбувається виділення характерного фрагмента зображення, тобто фрагмента з написом. Попередня обробка (просторове автоматичне регулювання підсилення) знижує вплив мультиплікативних завад. Після цього проводиться бінарізація зображень символів, що дозволяє знизити обсяг відеоінформації, що обробляється, у 8 разів та забезпечити інваріантність до трансформацій яскравості. Бінарізоване зображення піддається сегментації, тобто розділенню маркувального надпису на окремі символи та розташування сегментів, що виділені, у відповідності з правилами упорядкування надпису. Після цього обчислюються ознаки геометричної форми символів на базі методу стохастичної геометрії. По цим ознакам здійснюється класифікація символів. При співвідношенні "сигнал/завада " q=2 (по потужності) вдалося досягнути ймовірності вірного розпізнавання символів 0,9 при ймовірності помилкової тривоги 0,01. При q=5 ймовірність вірного виявлення символів підвищується до 0,998.

В усіх методах, що були розроблені, для визначення ознак форми використовуються координати характерних точок, кількість яких не менше, ніж на порядок менше кількості точок контуру. Зменшення обсягу інформації, що обробляється, визначає ефективність процедури розрахунку ознак форми. Набір ознак інваріантний до масштабу, повороту і зсуву об’єкта в полі зору. Інтегральний характер ГМО визначає високу завадостійкість методу. Ступінь стискання інформації, що обробляється, близька до потенційно можливого бар’єра. Тому запропонований метод рекомендований для широкого кола задач, в яких здійснюється обробка більшої кількості зображень у реальному масштабі часу чи обробка і розпізнавання тривимірних зображень. Згладжування малорозмірних деталей об’єктів обмежує область використання методу. Для задач, у яких такі деталі є потрібними ознаками, розроблений метод непридатний.

В розділі 5 проведено математичне моделювання зорового аналізатора з урахуванням його перехідних характеристик (ПХ). У роботах Холла, Будрікіса, Претта, Фрея та ін. Моделювання ЗА проводилось на базі апарата двовимірних швидких перетворень без урахування його ПХ. Як буде показано нижче, вплив динамічних спотворень (ДС) на характеристики ЦВК дуже значний, особливо для мало контрастних високо зашумлених зображень. При аналізі ДХ ураховувалось, що: існують різні варіанти моделювання нелінійної реакції ЗА на інтенсивність; при використанні моделей ЗА у системах обробки зображень використовуються фільтри різноманітної структури. Для моделювання ЗА у просторово-часовій області автором використані інтегро-ступеневі ряди Вольтерра-Вінера (РВВ). Апарат РВВ був розвинений для обробки двовимірних полів. Стандартними тестовими сигналами є синусоїдальна та експоненціально-синусоїдальна грати. Для того, щоб забезпечити використання алгоритмів функціонування і моделей ЗА у конкретних ЦВК, передбачене використання в якості коливальних систем фільтрів з довільною структурою, с довільною нелінійною характеристикою, і визначена реакція на довільний вхідний вплив. В якості базової просторової ахроматичної моделі ЗА була обрана трьох ланкова модель Холла, тому що вона добре відбиває властивості ЗА у широкому діапазоні інтенсивностей і просторових частот. Ця модель складається з просторового фільтра нижніх частот (ПФНЧ), що моделює обмежену розрізнювальну здібність ЗА, логарифматора, що моделює нелінійну реакцію ЗА на інтенсивність, і просторового фільтра верхніх частот (ПФВЧ), моделюючого механізм латерального гальмування.

В дисертації приведені вирази для розрахунку операторів РВВ при синусоїдальній і експоненціально-синусоїдальній гратці на вході у стаціонарному і перехідному режимах. Розроблено група алгоритмів визначення відгуку моделі на випадковий вхідний вплив. Для моделювання виявилось достатньо використовувати три оператора РВВ. При реалізації моделі Холла для тестового сигналу “синусоїдальна гратка” потрібно більше ніж у 50 разів менше операцій множення і в 3 рази менше оперативної пам’яті, ніж при моделюванні звичайними методами. Це доводить високу обчислювальну ефективність методу.

При значній меж кадровій флуктуації освітленості виникає необхідність у додатковій часовій обробці. У даній роботі часова частина моделювалася системою автоматичного регулювання підсилення (АРП) “назад” с затримкою. Система АРП включає регулюючий елемент (РЕ), підсилювач (У) з коефіцієнтом підсилення і фільтром . В коло зворотного зв’язку увімкнені амплітудний детектор, фільтр кола зворотного зв’язку , схема порівняння СС.

Визначені також оператори і ядра РВВ для кольорових моделей ЗА з вирівнюванням кольорів і з механізмом кольорової адаптації.

Проведені автором дослідження довели, що протяг перехідного процесу при обробці з допомогою моделей ЗА складає не менше 0,7 градусів, залежить як від параметрів системи, так і від параметрів тестового зображення. Ланка істотних динамічних спотворень (ДС) фази складає не менше 0,25 градусів (4 пикселя). Особливо істотний перехідний процес при обробці мало контрастних малорозмірних і високозашумлених зображень. Тому ДХ моделей ЗА істотно впливає на ефективність ЦВК, на розрізнювальну здібність і завадостійкість, і мають бути враховані при проектуванні. Висока обчислювальна ефективність розроблених алгоритмів дозволяє рекомендувати їх використання у задачах стискання відео зображень.

Розроблені методи використання властивостей і динамічних моделей ЗА для підвищення ефективності ЦВК. Розглянуті: попередня обробка; розрахунок функцій просторового маскування; оцінка якості і розрізнювальної здібності з урахуванням властивостей ЗА; використання алгоритмів функціонування і моделей ЗА для обробки і розпізнавання зображень.

Доведено, що використання динамічних моделей ЗА для попередньої обробки у системах кодування зображень знижує рівень мультиплікативної завади, зжимає динамічний діапазон і діапазон просторових частот, зменшує психовізуальну збитковість і покращує якісні характеристики систем кодування. Доведено зменшення шумів квантування при введенні передобробки у системах поелементного кодування. Ефективність передобробки зростає зі зростанням динамічного діапазону сигналу, що кодується. Введення передобробки дозволяє отримати додатковий коефіцієнт зжимання при кодуванні з перетворенням. Особливо ефективна передобробка у випадку мало контрастних зображень. Вона дозволяє отримати додаткове зжимання відеоінформації до 40%.

При вирішенні задач зжимання, кодування і оцінки якості зображень широко використовуються ефекти просторового маскування (ЕПМ). Вони визначають втрати чутливості ЗА до помилок, які виникають біля перепаду інтенсивності. Для кількісної оцінки ЕПМ використовується функція просторового маскування (ФПМ). Ця функція визначається як видимість (порогова чутливість) лінії товщиною в 1 піксель у залежності від відстані між цією лінією і чорно-білим переходом. У теперішній час ФПМ розраховується на базі експертних оцінок. Автором розроблена наступна процедура визначення ФПМ. По розробленим методам розраховується динамічний контраст (співвідношення Вебера) лінії, що досліджується. По даним біофізичних досліджень ЗА реагує саме на цю величину. ФПМ розраховується як величина, яка обернено пропорційна динамічному контрасту. Розрахована ФПМ виявляється близькою до експертних оцінок при контрастах, більших 5:1. При менших контрастах працездатна тільки методика, що розроблена, тому що у цьому випадку ФПМ визначається ДХ ЗА.

Кількісні міри якості мають важливе значення для проектування кодерів. Міри якості мають бути добре узгоджені з результатами суб’єктивних оцінок для того, щоб їх можна було використовувати як критерій оптимальності при синтезі кодерів. У роботах Будрікіса, Гранрата та Гофайзена оцінка якості проводиться на виході моделей ЗА. Однак, існуючі методи оцінки якості не враховують ДХ ЗА, що визначає їх високу похибку при обробці малорозмірних і мало контрастних зображень. Використання у системі оцінки якості динамічної моделі ЗА, що розроблена у гл.2, дозволило одержати більш точну оцінку якості при обробці малорозмірних і мало контрастних зображень. Розроблена методика має високі обчислювальну ефективність і коефіцієнт кореляції між обєктивною оцінкою і результатами суб’єктивного ранжирування.

Розроблена система розпізнавання об’єктів, що використовує алгоритми функціонування і моделі ЗА. У теперішній час цей напрямок є одним з найбільш перспективних і таких, що інтенсивно розвиваються. Це пов’язано з тим, що ЗА з легкістю вирішує такі задачі розпізнавання об’єктів, які недоступні навіть для супер-ЕОМ. Визначимо основні опорні точки розробленого методу:

- модель Холла. Ефективний засіб у боротьбі з логнормальною завадою. Ця модель дозволяє істотно зжати динамічний і частотний діапазони вхідного сигналу зображення і підкреслити перепади інтенсивності.

- модель Завалішина-Мучника. Дозволяє стійко виділяти характерні фрагменти об’єкта. Це істотно скорочує обчислювальні витрати. Попередня обробка здійснюється з допомогою ДПГ. Далі у просторі ДПГ проводиться пошук характерних фрагментів. Більшість дослідників зходяться до думки, що це ланки контуру об’єкта з значними викривленнями. Крім того, градієнтний алгоритм дозволяє достатньо точно змоделювати послідовність переходу погляду від точки до точки.

-


Сторінки: 1 2