Автореферат СИНТЕЗ НЕЙРОННИХ КОНТРОЛЕРІВ ДЛЯ КЕРУВАННЯ ОБ’ЄКТАМИ ДРУГОГО ПОРЯДКУ

Автореферат - СИНТЕЗ НЕЙРОННИХ КОНТРОЛЕРІВ ДЛЯ КЕРУВАННЯ ОБ’ЄКТАМИ ДРУГОГО ПОРЯДКУ

Загрузка...

В С Т У П

НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ “ЛЬВІВСЬКА ПОЛІТЕХНІКА”

Наконечний Юрій Маркіянович

УДК 681.5.013

СИНТЕЗ НЕЙРОННИХ КОНТРОЛЕРІВ

ДЛЯ КЕРУВАННЯ ОБ’ЄКТАМИ ДРУГОГО ПОРЯДКУ

05.13.05 – елементи та пристрої обчислювальної техніки

та систем керування

Автореферат

дисертації на здобуття наукового ступеня

кандидата технічних наук

Львів - 2006

Дисертацією є рукопис

Робота виконана в Національному університеті “Львівська політехніка”

Міністерства освіти і науки України

Науковий керівник

доктор технічних наук, професор

Стадник Богдан Іванович,

Національний університет ”Львівська політехніка”, м.Львів,

завідувач кафедри “Інформаційно-вимірювальні технології”

Офіційні опоненти:

доктор технічних наук, професор

Івахів Орест Васильович,

Національний університет ”Львівська політехніка”, м.Львів,

завідувач кафедри “Прилади точної механіки”

кандидат технічних наук

Лукенюк Адольф Антонович,

Львівський центр інституту космічних досліджень НАН України, м.Львів,

заступник директора з наукової роботи

Провідна установа: Державний науково-дослідний інститут

інформаційної інфраструктури Державного департаменту з питань зв’язку

та інформатизації і Національної академії наук України,

відділ інформаційних технологій і систем, м.Львів

Захист відбудеться “30” травня 2006 р. о 16 годині на засіданні спеціалізованої вченої ради Д 35.052.08 у Національному університеті “Львівська політехніка” (79013, Львів, вул.С.Бандери, 12 ауд. 226 головного корпусу).

З дисертацією можна ознайомитись у бібліотеці Національного університету “Львівська політехніка” (79013, Львів, вул.Професорська, 1)

Автореферат розісланий “29” квітня 2006 р.

Вчений секретар спеціалізованої

вченої ради, д.т.н., професор Луцик Я.Т.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Здебільшого системи автоматичного керування складаються з нелінійних елементів, які охоплені складними оберненими зв’язками, а на роботу таких систем в реальних умовах впливають різноманітні шуми, завади та інші збурюючі фактори, що суттєво обмежують використання можливостей сучасної і класичної теорії керування при побудові контролерів. Протягом останніх десятиріч при реалізації стратегій керування використовувалися теорії, які базуються на ідеї лінеаризації системи, що не повною мірою відображають її фізичні властивості, а в ряді випадків, навіть при точному відтворенні залежностей між входами і виходами системи, їх використання неспроможне забезпечити адекватне керування об’єктом. Тому дедалі частіше при синтезуванні алгоритмів керування використовуються штучні нейронні мережі, що враховують особливості об’єкта, який повинна відтворити мережа, а її навчання проводиться на основі вхідних і вихідних даних, які характеризують процеси, що протікають в даному об’єкті. Оскільки нейронні мережі в своїй основі є нелінійними, їх можна використовувати для ідентифікації як лінійних, так і нелінійних об’єктів, а також для реалізації алгоритмів керування в таких об’єктах. Тому розробка методів побудови і алгоритмів навчання нейронних мереж для керування об’єктами автоматики є актуальною.

Зв'язок роботи з науковими програмами, планами, темами.

Основний зміст дисертаційної роботи складають результати теоретичних та практичних розробок, проведених автором при виконанні робіт згідно з галузевим тематичним планом впровадження дослідно-конструкторських робіт, розділ “Інтелект” (2001 – 2002 рік, № держ.реєстр. 0101U000876).

Мета і задачі досліджень. Метою дисертаційної роботи є побудова контролерів на базі динамічних нейронних мереж, що забезпечують керування процесами в об’єктах другого порядку та обґрунтування їх переваг у порівнянні з контролерами, які реалізовані із застосуванням методів лінійної теорії автоматичного керування.

Наукова новизна результатів дисертаційної роботи полягає в тому, що:

· вперше, виходячи з особливостей математичної моделі об’єкта, запропоновано процедуру визначення архітектури вхідних кіл скритого шару динамічної нейронної мережі, яка створюється на базі цього об’єкта, що забезпечило адекватність динамічних характеристик моделі та об’єкта;

· вперше запропоновано реалізацію законів керування на базі динамічних нейронних мереж з використанням даних, які одержані при експериментальному дослідженні або математичному моделюванні еталонів і об’єктів керування, що дало можливість синтезувати контролер без використання математичної моделі об’єкта та забезпечило одержання бажаної динамічної характеристики замкненої системи керування процесом в об’єкті;

· вперше запропоновано структуру нейронного контролера з розділеними входами, що забезпечило після його навчання можливість дослідити стійкість систем автоматичного керування із застосуванням методів теорії автоматичного керування.

Об’єкт дослідження – моделі лінійних і нелінійних об’єктів, що функціонують при дії факторів зовнішнього середовища.

Предмет дослідження – нейронні емулятори і нейронні контролери, побудовані на основі динамічних нейронних мереж.

Методи дослідження – класична і сучасна теорія керування, що дозволила обгрунтувати вибір структури вхідних кіл моделей емулятора та контролера, а також дослідити стійкість систем керування, реалізованих на базі синтезованих контролерів; теорія оптимізації, на основі якої обґрунтовано вибір алгоритму навчання динамічної нейронної мережі; теорія нейронних мереж, що дозволила синтезувати динамічні нейронні мережі з різною архітектурою і здійснювати їх навчання; візуальне моделювання в середовищі MATLAB, що дозволило оцінити якісне функціонування синтезованих нейронних контролерів і сформулювати рекомендації щодо їх практичного використання.

Практичне значення отриманих результатів. Розроблено, досліджено і експортовано в пакеті Simulink контролери для керування процесами в об’єктах другого порядку, виконані на базі динамічних нейронних мереж. Використання результатів проведених досліджень і запропонованого програмного продукту дозволяє синтезувати нейронні контролери для керування процесами у нелінійних об’єктах другого порядку, або в об’єктах, математичні моделі яких є надто складними з огляду на ефективність використання загальновідомих методів аналізу лінійної теорії автоматичного керування, а також для тих випадків, коли інформація про об’єкт керування є неповною.

Апробація результатів дисертації. Основні положення та результати, виконаних у дисертації досліджень доповідалися і обговорювалися на VІІІ Міжнародній науково-технічній конференції “Контроль і управління в складних системах” (КУСС-2005) м.Вінниця, а також на наукових семінарах кафедри інформаційно-вимірювальних технологій Національного університету “Львівська політехніка”.

Особистий внесок здобувача. Основний зміст роботи, теоретичні висновки та рекомендації, виконані та розроблені автором особисто на основі досліджень, проведених на кафедрі “Інформаційно-вимірювальні технології” Національного університету “Львівська політехніка”. В друкованих працях, опублікованих у співавторстві, автору належать: [45] – дослідження математичної моделі квадратурного керованого генератора, [53] – обґрунтування доцільності використання алгоритму Левенберга-Марквардта для навчання динамічних нейронних мереж.

Публікації. Результати дисертаційного дослідження опубліковані у восьми роботах, серед яких сім статей в наукових журналах та збірниках, одна доповідь на науково-технічній конференції.

Структура дисертації. Дисертація складається із вступу, чотирьох розділів, висновків, списку використаних джерел та додатків. Основна частина роботи викладена на 146 сторінках друкованого тексту.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовано актуальність теми дисертаційної роботи, сформульовано мету і задачі досліджень, відображені наукова новизна і практична цінність одержаних результатів.

У першому розділі наведено класифікацію електроприводів за критеріями функціонування та будови електричної машини, умовами її експлуатації, розглянуто особливості побудови математичної моделі електроприводу з врахуванням впливу різних типів навантажень, на підставі чого сформульовано та промодельовано в середовищі Simulink систему диференціальних рівнянь двигуна постійного струму при різних способах його збудження. Показано, що двигуни постійного струму без врахування змінного навантаження в першому наближенні описуються лінійними диференціальними рівняннями другого порядку, моделювання яких здійснено в пакеті Simulink. Розглянуто особливості побудови математичної моделі двигуна постійного струму з незалежним збудженням при його навантаженні моментом в’язкого тертя і позиційним моментом типу повороту руки робота й показано, що врахування впливу додаткових факторів на роботу двигуна, зокрема, дії моменту типу повороту руки робота, описується математичною моделлю електроприводу у вигляді нелінійного диференціального рівняння другого порядку. Це суттєво обмежує можливість використання методів лінійної теорії автоматичного керування при синтезуванні контролерів, функціонування яких повинно забезпечувати задані динамічні і статичні параметри процесу в електроприводі й відкриває можливості вирішення цієї актуальної задачі з використанням теорії нейронних мереж.

У другому розділі розглянуто способи побудови контролерів з використанням методу кореневого годографа і методу частотних характеристик.

У разі використання методу кореневого годографа синтез контролера здійснюється у два етапи. На першому етапі для заданих динамічних показників системи (перерегулювання і тривалість встановлення) на комплексній площині визначається область допустимого розташування коренів характеристичного рівняння замкненої лінеаризованої системи. Оскільки швидкодія системи визначається полюсами, які розташовані найближче до уявної осі (домінуючі корені), то корені характеристичного рівняння замкненої системи повинні бути лівіше від лінії, що проходить на комплексній площині паралельно до уявної осі через точку, положення якої визначається заданою тривалістю встановлення (для системи другого порядку , де - безрозмірний коефіцієнт погасання, - власна частота коливань, – коефіцієнт пропорціональності, для ланок другого порядку ). Крім того, кожна ланка виду вносить перегулювання , тому, встановлюючи обмеження на перерегулювання, необхідно задати ще й додаткове обмеження на розміщення коренів, а саме: корені повинні перебувати лівіше від ліній, що проходять через центр координат під кутами (рис.1). Отже, корені характеристичного рівняння системи повинні міститися в допустимій заштрихованій області та якомога ближче до її меж, хоча навіть і в цьому випадку в системі можуть з’являтися викиди та спотворення перехідного процесу. Якщо структура контролера задана, тоді за умови зазначеного вище розташування коренів необхідно обчислити його коефіцієнти. При цьому вибирається певний коефіцієнт, зміні якого, на комплексній площині відповідають траєкторії руху коренів характеристичного рівняння. Тобто за траєкторією руху коренів визначається, як повинен змінюватися цей коефіцієнт, щоби корені потрапили в допустиму область. Таким параметром для побудови кореневого годографа в систему вводиться додатковий коефіцієнт , у вигляді окремого структурного елемента (рис.2).

Коефіцієнт є дійсним додатнім числом, оскільки в системі використовується від’ємний обернений зв’язок. Отже, для будь-якої точки, що належить кореневому годографу справедливе дотримання співвідношення:

(1)

Вираз (1) дозволяє не тільки підбирати значення для заданої структури, але й змінювати форму та конфігурацію годографа через вплив на архітектуру контролера. Одержане значення у вигляді одного із параметрів вводиться у вираз, реалізованого в системі закону керування. Так наприклад, для передавальної функції об’єкта:

(2)

Одержано кореневі годографи, що відповідають пропорціональному, пропорціонально - диференціальному, пропорціонально - інтегрально - диференціальному законам керування (рис.3 а, б, в відповідно).

Аналіз одержаних годографів показує, що при реалізації пропорціонального способу керування навіть невелике значення обумовлює таке розташування коренів, при якому має місце значне перерегулювання, а збільшення викликає суттєве погіршення динамічних характеристик системи. Введення диференціальної складової в передавальну функцію контролера з метою покращання динамічних характеристик системи (рис.3,б) обумовлює можливість вибору коефіцієнта , при якому уявна частина коренів характеристичного рівняння є мінімальною та одночасно обидва корені максимально віддалені від уявної осі (), однак в цьому випадку система характеризується неприпустимо високою статичною похибкою, а саме: 0.625.

Реалізація пропорціонально - інтегрально - диференціального закону керування (рис.3,в) забезпечує усунення статичної похибки замкненої системи та бажану стійкість. Так, вибравши значення коефіцієнтів передавальної функції контролера за умови розширення області дійсних коренів замкненої системи, побудуємо кореневий годограф, за яким, виходячи з умов забезпечення заданих динамічних характеристик системи, можна вибрати значення (в нашому випадку ). Аналіз перехідної характеристики одержаної системи показує, що, незважаючи на те, що всі корені є від’ємними і дійсними, в системі спостерігається перерегулювання. Хоча найповільніша погасаюча складова процесу й зумовлена домінуючим коренем характеристичного рівняння, все ж на амплітуду перехідного процесу найсуттєвіше впливає не він, а найвіддаленіший від уявної осі корінь.

При використанні методу частотних характеристик вимоги щодо динамічних характеристик системи задаються в частотній області, а для визначення стійкості використовується критерій Найквіста з додатковими умовами до необхідних її запасів за модулем і фазою. Основна перевага цього методу полягає в тому, що для синтезу контролера властивості об’єкта задаються у вигляді частотних характеристик, які на реальному об’єкті можна одержати експериментально. Синтезування контролера здійснюється для вищезазначеного об’єкта, який описується передавальною функцією (2). Коефіцієнт підсилення розімкненої системи при синтезуванні пропорціонального контролера вибирається за умови забезпечення мінімального значення статичної похибки системи, тобто його значення повинні бути великими ( вибрано рівним 200). Проте, як випливає з діаграми Боде, при цьому запас стійкості за фазою для розімкненої системи є недостатнім (), а тому в замкненій системі наявне значне перерегулювання. Для забезпечення достатнього запасу стійкості за фазою в закон керування введено диференціальну ланку, значення коефіцієнту диференціювання якої не повинно бути надто великим. Так, при запас стійкості за фазою набуває більшого значення (), що однозначно покращує динаміку системи з огляду на зменшення перерегулювання. Для усунення ж статичної похибки в рівняння контролера введено інтегральну складову, значення коефіцієнта якої з огляду на забезпечення потрібної швидкодії системи з одночасним збереженням запасу стійкості за фазою вибрано рівним 1200. В цьому випадку рівняння контролера має вигляд: (30s2+200s+1200)/s, а перехідна характеристика замкненої системи з синтезованим контролером характеризується значним перерегулюванням.

Усі вище перелічені задачі оптимально виконуються з використанням нейромережевої структури контролера.

В третьому розділі на основі функціональної схеми багатошарової нейронної мережі показано, що її можна описати векторною функцією у вигляді суперпозиції лінійних комбінацій функцій активації шарів. Так, для тришарової мережі (рис.4) вона матиме вигляд:

, (4)

тут - вектор входів мережі; - вектори зміщень шарів мережі, , , - матриці вагових коефіцієнтів шарів, , , - вектори функцій активації шарів мережі; - вектор виходів мережі.

При побудові нейронної мережі щонайповніше відтворення об’єкту забезпечується правильним вибором як архітектури мережі, так і здійсненням її навчання, при якому обчислюються вагові коефіцієнти мережі. При вирішенні першої задачі з врахуванням особливостей об’єкта визначається кількість шарів мережі і зв’язки між ними, види функцій активації і кількість нейронів в кожному шарі, що дає змогу виявити всі характерні для даного об’єкта залежності. Зокрема, при навчанні порівнянням заданих і поточних виходів останнього шару обчислюються вагові коефіцієнти і зміщення у всіх шарах. Залежно від природи об’єкта-прототипу нейронна мережа може бути статичною або динамічною (для відтворення динаміки процесу використовуються елементи затримки).

Якщо об’єкт (в загальному випадку нелінійний) описується диференціальним рівнянням виду:

, (5)

то при реалізації динамічної нейронної мережі необхідно передбачити наявність блоку відтворення похідних (це динамічна частина, в якій з використанням ліній затримок на входах нейронів першого шару відтворюються вихідні рівняння) та блоку реалізації функціональних залежностей (де обчислюються вагові коефіцієнти мережі), тут nx – максимальний порядок похідних від входів; ny – максимальний порядок похідних від виходів.

Об’єкт, який описується лінійним диференціальним рівнянням із сталими коефіцієнтами:

після ряду перетворень подається рівнянням у скінчених різницях:

, (6)

за яким формується структура рекурентного цифрового фільтра і однозначно визначається схема побудови нейронної мережі на одному нейроні з лінійною функцією активації.

Якщо динаміка процесу описується нелінійним диференціальним рівнянням, то при побудові нейронної мережі необхідно враховувати не лише динаміку моделі, але й наявні в ній нелінійності, зокрема, через впровадження в нейронну мережу нелінійних функцій активації і збільшення кількості її шарів. Мінімальні вимоги відносно кількості ліній затримок на вході мережі визначаються порядками похідних правої і лівої частин диференціального рівняння.

Оскільки інформація щодо динаміки відтворюваного об’єкта, а, отже, й про диференціальне рівняння, яким вона описується є неточною, характер наявних нелінійностей невідомий, то єдиним джерелом вірогідної інформації про відтворюваний процес є навчальні послідовності, а тому доцільно спершу задатися початковою кількістю шарів і нейронів в кожному шарі, а потім, аналізуючи ефективність навчання мережі з вибраною структурою, модифікувати її.

В багатошаровій нейронній мережі для кожного окремого шару вибирається певна функція активації, через яку кожен нейрон цього шару передає зважену суму своїх входів на вихід. При використанні градієнтних та квазіньютонових методів ця функція повинна бути неперервною та диференційованою, (при методі Ньютона – навіть подвійно диференційованою). Для відтворення гладких функцій найдоцільніше застосовувати функції активації tansig і logsig. Зокрема, при відтворенні об’єкта, який описується лінійним диференціальним рівнянням другого порядку:

(7)

відповідне йому рівняння в скінчених різницях має вигляд , що, по суті, є рівнянням лінійної нейронної мережі (рис.5), вагові коефіцієнти якої визначаються із співвідношень:

, , , (8)

де – період квантування.

При відтворенні нелінійного об’єкта другого порядку першим наближенням є архітектура одношарової нейронної мережі, яка відповідає лінійному диференціальному рівнянню, а для врахування нелінійності об’єкта мережу необхідно доповнити нелінійними елементами. Цим викликана потреба використання двошарової нейронної мережі, в першому шарі якої розташовано нейрони з нелінійними функціями активації, а в другому – на базі одного нейрона з лінійною функцією активації здійснюється зважене підсумовування вихідних сигналів першого шару.

При навчанні динамічної нейронної мережі поточні значення вагових коефіцієнтів та зміщень одержуємо, опрацьовуючи сигнали, сформовані при порівнянні заданих значень вихідних сигналів із сигналами , одержаними на виході мережі при подачі на її вхід вхідних векторів . Оскільки навчання динамічної нейронної мережі по суті є процесом параметричної оптимізації, то для оцінки якості навчання з погляду реалізації алгоритму навчання найдоцільніше використовувати квадратичний критерій оптимальності

, (9)

тут Q – кількість вибірок; q – номер вибірки (від 1 до Q); SM– кількість нейронів останнього шару; ti,q – i-а компонента q-го цільового вектора; aMi,q – i-а компонента q-го вихідного вектора мережі.

При порівняльному аналізі алгоритмів навчання нейронних мереж, які базуються на використанні методів оптимізації функцій багатьох змінних встановлено, що для навчання нейронних мереж найдоцільніше використовувати градієнтні методи, як такі, що визначаються найбільшою продуктивністю. При неперервній функції мети градієнтні методи використовують інформацію про часткові похідні функції мети за настроюваними параметрами. Оскільки в динамічних нейронних мережах для керування неперервними процесами використовуються неперервні функції активації і, відповідно, функціонал функції мети є неперервним, то в подальшому зосередимось лише на градієнтних методах. В процедурі навчання нейронної мережі з використанням заданих значень її входів і виходів можна виділити дві складові – знаходження похідних функціоналу похибки за настроюваними параметрами (власне backpropagation) та процедуру оптимізації, при реалізації якої на основі одержаних числових значень функціоналу похибки здійснюється таке коригування вагових коефіцієнтів і зміщень, яке забезпечує мінімізування функціоналу похибки (9).

Коли на вхід мережі подається Q відліків, то часткові похідні функціоналу похибки за настроюваними параметрами визначаються у вигляді суми часткових похідних, які одержані для кожного окремого відліку. А саме:

тут – матриця Якобі від векторної функції на q-му відліку.

При реалізації одного з найефективніших методів навчання – алгоритму Левенберга-Марквардта використовується наближене обчислення матриці Гессе, а для обчислення градієнту (або матриці Якобі) застосовано алгоритм оберненого розповсюдження похибки (backpropagation), який легко реалізувати програмно з використанням однотипних матричних операцій. При використанні нейронних мереж з великою кількістю настроюваних коефіцієнтів навчання мережі доцільно проводити із застосуванням методів спряжених градієнтів.

В четвертому розділі розглянуто особливості ідентифікації об’єктів другого порядку, способи побудови та навчання контролерів на базі динамічних нейронних мереж.

При ідентифікації об’єктів другого порядку навчання нейронної мережі можна реалізувати із замкненим (рекурентна нейронна мережа) або із розімкненим зворотним зв’язком (нерекурентна нейронна мережа). При навчанні рекурентної мережі обчислення градієнта ускладнене тим, що на поверхні цільової функції з’являються додаткові локальні мінімуми, оскільки вхідні сигнали певного відліку залежать не тільки від поточного сигналу входів, але й від попередніх значень на виході самої мережі. Процес навчання мережі в нерекурентному вигляді значно ефективніший, оскільки при обчисленні градієнта використовується алгоритм зворотнього розповсюдження (backpropagation), який не використовує зворотнього зв’язку в мережі, а тому затримані значення входів – це окрема вхідна послідовність. Порівняння цих двох методів показало, що навчання рекурентної мережі тривало біля 30 хвилин, що відповідає проходженню тільки 27 епох і було припинене при досягненні параметром налагодження максимально допустимого значення. Середньоквадратична похибка при тому набула значення . Нерекурентна мережа навчалася протягом 10 хвилин, при цьому кількість епох складала 2019, що вказує на суттєве скорочення тривалості однієї епохи, і при тому середньоквадратична похибка зменшилася до . Результати моделювання в Simulink нейронних мереж, які навчалися в рекурентному і нерекурентному виглядах, однозначно підтвердили суттєву перевагу способу навчання мережі з розімкненим зворотним зв’язком (в нерекурентному вигляді).

Дослідження системи автоматичного керування з використанням пропорціонально-інтегрально-диференціального нейронного контролера, вхідним сигналом якого є похибка розузгодження (контролер з нерозділеними входами), показало, що така система є неефективною, оскільки не забезпечує заданих динамічних показників процесу керування.

Для покращання динаміки системи подачу сигналів на вхід нейронного контролера розділено і формування його вхідних кіл проводилось на основі виразу:

(10)

Порівняння результатів моделювання систем керування, виконаних на базі нейронних контролерів з нерозділеними і розділеними входами, показало, що використання контролера з розділеними входами суттєво покращує динамічні властивості системи, а саме: перехідна характеристика системи, керованої контролером, набуває характеру, який визначається виходом еталона.

Для аналізу системи керування, виконаної на базі нейронного контролера з розділеними входами з використанням методів лінійної теорії керування об’єкт лінеаризовано в точці найбільшого нахилу його статичної характеристики (саме тут система є найменш стійкою), а структуру контролера подано у вигляді двох лінійних нейронних мереж, які реалізовано на основі співвідношень:

, (11)

Перехід від наведених співвідношень до неперервних еквівалентів нейронних мереж і використання передавальної функції лінеаризованого об’єкта дозволили отримати вираз передавальної функції замкненої системи, за яким проаналізовано утворену систему, як неперервну. При дослідженні системи побудовано кореневий годограф, з якого випливає, що траєкторії коренів характеристичного рівняння замкненої системи лежать у лівій півплощині, а це, в свою чергу, вказує на те, що утворена замкнена система є стійкою при будь-яких змінах коефіцієнта передачі.

Аналіз частотних характеристик системи в розімкненому виді теж підтверджує, що замкнена система є стійкою (запас стійкості становить ). Вищенаведені методи досліджень систем керування з використанням лінійних нейронних контролерів можна узагальнити і на системи з нелінійними контролерами, якщо для побудови кореневого годографа або частотних характеристик системи скористатися числовими значеннями вагових коефіцієнтів навченого нелінійного нейронного контролера.

В узагальненій схемі системи автоматичного керування (рис. 6) нейронний контролер так доповнює нелінійний об’єкт, щоби при подачі будь-якої реально допустимої послідовності rk утворена система максимально відповідала еталону (в ідеалі yrk =yk). Оскільки для навчання нейронної мережі необхідно знати її вхідні та вихідні сигнали, то нейронний контролер можна навчити, якщо одночасно відомі: задаючий сигнал на вході нейронного контролера (послідовність rk); сигнал оберненого зв’язку з виходу об’єкта (послідовність yk); вихідний сигнал нейронного контролера (послідовність uk, що подається на вхід об’єкта). До початку навчання всі три вказані послідовності одночасно невідомі. Якщо задатися вхідним сигналом (послідовність rk), то в припущенні, що yk=yrk, на основі математичної моделі еталона можна знайти послідовність yk , проте тоді невідомою залишається послідовність uk. Якщо ж подати на об’єкт тестову послідовність , то на його виході одержимо yk, однак при тому невідомою залишиться послідовність rk.

Розгляд різних підходів до навчання динамічних нейронних мереж, особливостей їх застосування при реалізації нейронних контролерів та результати їх моделювання дозволили обґрунтувати ефективність використання нейронних мереж з погляду забезпечення необхідних динамічних і статичних характеристик процесу керування. Так, один із способів реалізації нейронного контролера полягає в тому, що на основі послідовностей, які виміряні на вході і виході об’єкта ( та ), через навчання нейронної мережі створюється нейронна модель об’єкта, яка доповнюється нейронним контролером і замикається оберненим зв’язком, що відповідає реальній системі. Утворена нейронна мережа відтворює модель поєднання контролера та об’єкта. Щоби ця модель була еквівалентна еталону, коефіцієнти контролера можна отримати навчанням цієї об’єднаної мережі послідовностями з входу і виходу еталона (rk та yk), при цьому значення тих коефіцієнтів мережі, які відповідають підмережі об’єкта повинні бути фіксованими, тобто в процесі навчання змінюються тільки коефіцієнти контролера. В даному випадку нейронна модель об’єкта використовується для того, щоб через неї похибка “обернено поширилась” до мережі контролера. Після навчання з об’єднаної мережі можна виділити ту частину, що відповідає контролеру і використати її для керування реальним об’єктом. Такий метод має ту перевагу, що навчання контролера відбувається тільки на вхідній і вихідній послідовностях еталона, без використання вхідної послідовності об’єкта, проте в даному випадку всередині мережі наявний обернений зв’язок, а навчання мережі утруднене через наявність додаткових мінімумів, викликаних наявністю оберненого зв’язку. Тривалість навчання мережі в залежності від початкових даних коливається в межах від 20 до 40 хвилин. Порівняння сигналів на виходах еталона і об’єкта, керованого синтезованим контролером, вказує на суттєву розбіжність між ними, і чим більше відхилення керуючого сигналу від нуля, тим більше неспівпадіння вихідних сигналів еталона та керованого об’єкта. Значення середньоквадратичної похибки при моделюванні системи склало 0,023.

Інший метод реалізації нейронного контролера базується на використанні для навчання контролера вхідної і вихідної послідовностей еталона (rk та yk) та вхідної послідовності об’єкта . При цьому вхідна послідовність об’єкта обчислюється на основі значень вихідної послідовності еталона, яка отримана при подачі на його вхід заданої числової послідовності. Фактично цей метод вимагає використання оберненої моделі, реалізація якої не завжди можлива. Тому для формування вхідної послідовності об’єкта на основі значень вихідної послідовності еталона, використовується нейронна мережа оберненого об’єкта, навчання якої здійснюється на підставі експериментально одержаних вхідної і вихідної послідовностей об’єкта.

Для порівняння побудовано два нейронні контролери: при побудові першого використовувалася двошарова нейронна мережа оберненого об’єкта з використанням 12 нейронів і функції активації tansig у першому шарі і одного нейрона з функцією активації purelin у другому шарі, а при побудові другого у першому шарі використовувалось лише 5 нейронів.

Незважаючи на задовільні показники процесу навчання в обох випадках (тривалість навчання становила приблизно 20 секунд, мала кількість ітерацій, невелике значення середньоквадратичної похибки – ), все ж нейронний контролер, виконаний із використанням нейронної мережі оберненого об’єкта за другою схемою є ефективнішим (значення середньоквадратичної похибки при використанні першого контролера складає 0,876, а другого – 0,0108). Очевидно, перша нейронна модель оберненого об’єкта і, відповідно, перший нейронний контролер не спромоглися на етапі навчання виявити специфіку нелінійного об’єкта і відповідним чином відреагувати на неї при коригуванні вагових коефіцієнтів мережі, що обумовило низьку ефективність процесу керування. В другому випадку навчання виявилося ефективнішим і різниця між значеннями сигналів керованого об’єкта та еталона не перевищує сотих часток.

Аналіз підходів до навчання нейронних контролерів показав, що одним із найперспективніших з погляду простоти одержання навчальних послідовностей є навчання з використанням оберненого еталона. В цьому випадку навчання проводиться на основі вхідної і вихідної послідовностей об’єкта, а також вхідної послідовності еталона (rk), яка одержана на виході моделі оберненого еталона, при подачі на її вхід вихідної послідовності об’єкта. Обернення еталона можна здійснювати розв’язуванням рівняння еталона відносно вхідної змінної або побудовою оберненої моделі на основі нейронної мережі. Зреалізовано ряд нейронних контролерів, для навчання яких використовувалися різні тестові послідовності вхідних сигналів (зокрема, частото-модульовані сигнали і послідовності у вигляді стрибків) та різні способи обернення еталона.

Аналіз результатів моделювання систем керування, в яких використовувалися реалізовані контролери, показав, що нейронний контролер, навчання якого здійснювалося з використанням оберненої моделі еталона на основі нейронної мережі, а в процесі навчання на вхід мережі подавалися тестові сигнали у вигляді частото-модульованої синусоїди, виявився найефективнішим. При цьому значення середньоквадратичної похибки при моделюванні системи з його використанням склало .

Для виявлення динамічних можливостей системи і покращення її швидкодії реалізація і навчання нейронних контролерів проводилося для прискорених і сповільнених варіантів еталона. Аналіз одержаних результатів показав, що в усіх випадках одержано коректні контролери, однак якість керування процесами в об’єкті за допомогою синтезованих контролерів тим гірша, чим більше ітеративно підібрані коефіцієнти рівняння еталона відрізняються від початкових.

При навчанні нейронного контролера з використанням моделі оберненого еталона для одержання послідовності, яка подається на вхід контролера (послідовність rk) можна застосувати різні засоби: неперервну чи дискретну модель оберненого еталона, або ж нейронну мережу оберненого еталона. Проте найточнішим є обернення, що здійснюється через обернену конволюцію, яка базується на тому, що вихідну послідовність оберненого еталона можна подати у вигляді зваженої суми:

, (12)

де hi= (i=1,…,N) – імпульсна характеристика еталона.

Таким чином, при заданих вихідних сигналах еталона yk і його відомій імпульсній характеристиці, можна, розв’язавши систему рівнянь, обчислити вхідну послідовність rk , тобто здійснити обернену конволюцію. Порівняння методів обернення, які реалізовані з використанням експериментально визначених вхідній і вихідній послідовностях еталона показує, що при здійсненні обернення дослідно одержаної вихідної послідовності еталона саме метод оберненої конволюції відтворює таку вхідну послідовність, що найточніше наближена до дослідно знятої вхідної послідовності еталона. Проте робота системи, реалізованої на базі нейронного контролера, навчання якого здійснювалося за допомогою оберненої конволюції виявилася неякісною (система нестійка).

Очевидно, що робота нейронного контролера буде ефективнішою, якщо при його навчанні із застосуванням розглянутих методів будуть використовуватися навчальні послідовності, які не тільки відтворюють роботу системи щодо забезпечення відповідних значень вихідної величини, але і враховують її дії, спрямовані на компенсації збурень, що виникають в реальному об’єкті. Так, порівняння виходів еталона та об’єкта, керованого нейронним контролером, який синтезовано з врахуванням впливу збурень на об’єкт показало, що навчання контролера з використанням еталона кола збурення виявилося досить успішним (значення середньоквадратичної похибки при моделюванні системи склало , та порівняно з попередніми методами навчання нейронного контролера є менш критичне до входів навчальних послідовностей).

ВИСНОВКИ

Проведені в дисертаційній роботі дослідження дозволяють зробити такі висновки:

1. На основі аналізу динамічних режимів роботи двигунів постійного струму запропоновано їх лінеаризовані моделі в системі Simulink і встановлено, що при врахуванні дії моменту повороту руки робота, двигун описується нелінійним диференціальним рівнянням другого порядку.

2. На підставі розгляду можливостей використання методів кореневого годографа і частотних характеристик для синтезування контролера системи автоматичного керування лінеаризованим об’єктом показано, що в процесі функціонування систем автоматичного керування, виконаних на базі контролерів, синтезованих вказаними методами, не забезпечується адекватність між бажаними і реальними значеннями регульованих величин.

Оскільки застосування класичних методів лінійної теорії автоматичного керування не забезпечує адекватність динамічних характеристик еталона та системи керування, то доцільне використання динамічних нейронних мереж для ідентифікації лінійних і нелінійних динамічних об’єктів, а також побудова на їх основі контролерів для керування процесами в таких об’єктах.

З метою оптимального синтезування нейронного контролера розглянуто особливості побудови, способи математичного подання і алгоритми навчання нейронних мереж і обґрунтовано доцільність використання градієнтних методів для навчання динамічних нейронних мереж, зокрема, методу оберненого розповсюдження похибки з використанням алгоритму Левенберга – Марквардта.

5. На підставі теоретично обґрунтованої процедури визначення архітектури вхідних кіл динамічної нейронної мережі доцільно синтезувати нейронні контролери з використанням даних, які одержані при експериментальних дослідженнях динамічних об’єктів і еталонів або при дослідженні їх математичних моделей.

6. На основі результатів моделювання системи автоматичного керування з лінеаризованою моделлю об’єкта із використанням контролера, що побудований на базі динамічної нейронної мережі з розділеними входами встановлено, що такий синтезований контролер забезпечує ефективне керування процесами в моделях, як лінійних, так і нелінійних об’єктів.

СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ

1. Наконечний Ю.М. Методи навчання нейронних мереж. – // Міжвідомчий науково-технічний збірник Національного університету "Львівська політехніка" "Вимірювальна техніка та метрологія". 2002. № 61 с. 114-118

2. Наконечний Ю.М. Застосування штучних нейронних мереж в задачах ідентифікації і керування // Збірник наукових праць Української академії друкарства "Комп’ютерні технології друкарства" №9, 2002 с. 150-157.

3. Наконечний Ю.М. Використання градієнтних алгоритмів для навчання нейронних мереж // Збірник наукових праць Української академії друкарства “Комп’ютерні технології друкарства”. № 10, 2003 с. 89-98.

4. Наконечний М.В., Наконечний Ю.М. Аналіз математичної моделі двофазного керованого генератора в системі регулювання швидкістю обертання вала асинхронного двофазного двигуна // Вісник НУ “Львівська політехніка” “Автоматика, вимірювання та керування” № 475, 2003 ст. 164-170.

5. Наконечний Ю.М. Способи керування асинхронним двофазним двигуном // Вісник НУ “Львівська політехніка” “Автоматика, вимірювання та керування” № 445, 2002 ст. 114-120

6. Наконечний М.В., Наконечний Ю.М. Про можливість застосування алгоритму Левенберга-Марквардта для навчання динамічних нейронних мереж // Збірник наукових праць Української Академії друкарства “Комп’ютерні технології друкарства” №14 , 2005р. 121-127c.

7. Наконечний Ю.М. Особливості використання алгоритму оберненого розповсюдження похибки для навчання динамічних нейронних мереж // Вісник “Методи та прилади контролю якості” м. Івано-Франківськ № 15 2005р. 28-31с.

8. Наконечний М.В., Муравчук П.В., Наконечний Ю.М. Аналіз шляхів побудови нейроконтролерів для систем автоматичного керування динамічними об’єктами // Збірник наукових праць VIII Міжнародної конференції “Контроль і управління в складних системах” (КУСС–2005) м. Вінниця

АНОТАЦІЯ

Наконечний Ю.М. Синтез нейронних контролерів для керування динамічними об’єктами другого порядку. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.05 – Елементи та пристрої обчислювальної техніки та систем керування. – Національний університет “Львівська політехніка”, Львів, 2006

Проведено аналіз шляхів побудови динамічних нейронних мереж і способів їх використання в системах автоматичного керування. Розглянуто принципи функціонування нейронних мереж і проаналізовано алгоритми їх навчання. Запропоновано шляхи побудови структури динамічної нейронної мережі на основі інформації про вид і порядок диференціального рівняння, розв’язання якого визначає бажані характеристики мережі. Показано спосіб переходу від лінійного диференціального рівняння до структури нейронної мережі, а також розглянуто шляхи побудови нейронної мережі для відтворення функціональних залежностей, що описуються нелінійними диференціальними рівняннями. Розглянуто архітектуру динамічної нейронної мережі, яка використовується для реалізації пропорціонально-інтегрально-диференціального закону керування, а також модифікований варіант такої мережі з розділеними входами. Вказано шляхи визначення стійкості системи автоматичного керування з використанням синтезованого нейронного контролера, проведено порівняльний аналіз системи керування, виконаної на базі нейронного контролера, з системами керування, які реалізовані методом кореневого годографа та за допомогою частотних характеристик. Розглянуто методи навчання нейронних контролерів (з використанням нейронної моделі об’єкта, нейронних моделей оберненого об’єкта та оберненого еталона, а також з використанням нейронної моделі оберненого еталона за наявності збурень) та проведено порівняння результатів їх навчання.

Ключові слова: нейронна мережа, ідентифікація об’єкта, системи керування, контролер, алгоритми навчання.

АННОТАЦИЯ

Наконечный Ю.М. Синтез нейронных контроллеров для управления объектами второго порядка. – Рукопись.

В диссертации выполнен анализ электрических приводов робототехнических систем, как динамических объектов второго порядка, предложены линеаризованные математические модели электрических двигателей постоянного тока с разными способами возбуждения и показано, что при действии определённых видов нагрузок математическая модель электропривода является нелинейной, а её линеаризация приводит к пренебрежению факторами, которые существенно влияют на динамику электропривода.

Рассмотрены особенности построения контроллеров с использованием методов корневого годографа и частотных характеристик, предусматривающих расположение доминирующих корней характеристического уравнения замкнутой системы в заданную область комплексной плоскости корней или желаемый вид частотной характеристики разомкнутой системы. Показано, что контроллеры, построенные с использованием указанных методов в процессе работы системы не обеспечивают полной адекватности между значениями заданной и реальной регулируемых величин.

В качестве альтернативы рассмотренных методов синтеза предложен новый подход, сущность которого состоит в задании эталона, к которому приводится система. Степень приближения синтезируемой системы к эталону определяется минимумом среднеквадратического отклонения между выходными величинами эталона и системы. Показано, что для реализации указанного подхода наиболее эффективно использование идеологии динамических нейронных сетей, а контроллеры, выполненные на их основе, обеспечивают высокие динамические показатели и заданную точность процесса.

В работе рассмотрены особенности построения статических и динамических нейронных сетей, приведены их математические модели, выполнен обзор функций активации нейронов и обоснована целесообразность использования градиентных алгоритмов, в частности алгоритма Левенберга-Марквардта, для обучения динамических нейронных сетей.

Исследованы возможности применения динамических нейронных сетей для идентификации объектов, описываемых линейными и нелинейными дифференциальными уравнениями второго порядка, проведён анализ способов формирования входных и выходных последовательностей, используемых при обучении динамических нейронных сетей, а также промоделированы системы управления, выполненные на базе синтезированных нейронных контроллеров.

Результаты моделирования систем управления с использованием синтезированных контроллеров свидетельствуют о целесообразности применения динамических нейронных сетей для управления процессами в линейных и нелинейных системах.

Ключевые слова: нейронная сеть, идентификация объекта, системы управления, контроллер, алгоритмы обучения.

ABSTRACT

Nakonechnyy Yu.M. The synthesis of neural controllers for directing second-order dynamic objects. – A Manuscript.

The dissertation for obtaining the scientific degree of the Candidate of Technical Sciences. Specialty 05.13.05 – Elements and Devices of Computing Technology and Control Systems – Lviv Polytechnic National University, Lviv, 2006.

The ways of building dynamic neural networks and the means of their application in the automated control systems have been analyzed. The principles of neural networks operations have been considered and algorithms of their training have been analyzed. There have been proposed the ways of building the structure of a dynamic neural network on

Сторінки: 1 2

��
��...

Наступні 7 робіт по вашій темі:

▪ Особливості церебральної гемодинаміки та біоелектричної активності головного мозку у хворих з транзиторними ішемічними нападами - Автореферат - 27 Стр.
▪ ПРАВА НА КОМЕРЦІЙНУ ТАЄМНИЦЮ В УКРАЇНІ (ЦИВІЛЬНО-ПРАВОВИЙ АСПЕКТ) - Автореферат - 25 Стр.
▪ Правове регулювання майнових відносин подружжя (порівняльно-правовий аспект) - Автореферат - 29 Стр.
▪ Створення нових засобів і технологій для забезпечення ресурсозбереження у промисловому водоспоживанні - Автореферат - 28 Стр.
▪ РОЗРОБКА МЕТОДІВ РОЗРАХУНКУ ВІБРАЦІЙНОГО СТАНУ РОТОРІВ В ШПАРИННИХ УЩІЛЬНЕННЯХ - Автореферат - 23 Стр.
▪ ХЛАМІДІОЗИ У ПІВДЕННОМУ РЕГІОНІ УКРАЇНИ (МІКРОБІОЛОГІЧНІ ТА ЕКОЛОГО-ЕПІДЕМІОЛОГІЧНІ АСПЕКТИ) - Автореферат - 66 Стр.
▪ ДЕРЖАВНЕ УПРАВЛІННЯ ЯКІСТЮ МЕДИЧНОЇ ДОПОМОГИ В СИСТЕМІ ОХОРОНИ ЗДОРОВ’Я УКРАЇНИ - Автореферат - 26 Стр.