У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





ХАРКІВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ РАДІОЕЛЕКТРОНІКИ

ХАРКІВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ РАДІОЕЛЕКТРОНІКИ

Мельнікова Роксана Валеріївна

УДК 519.7

АЛГЕБРОЛОГІЧНІ МОДЕЛІ МОРФОЛОГІЇ ТА ЇХ ЗАСТОСУВАННЯ В ЛОГІЧНИХ МЕРЕЖАХ

05. 13. 23 – Системи та засоби штучного інтелекту

А В Т О Р Е Ф Е Р А Т

дисертації на здобуття наукового ступеня

кандидата технічних наук

Харків 2006

Дисертацією є рукопис.

Роботу виконано у Харківському національному університеті радіоелектроніки, Міністерство освіти і науки України.

Науковий керівник: кандидат технічних наук, професор Дудар Зоя Володимирівна, Харківський національний університет радіоелектроніки, в. о. зав. кафедри програмного забезпечення ЕОМ.

Офіційні опоненти:

доктор технічних наук, професор Асєєв Георгій Георгійович, Харківська державна академія культури, завідувач кафедри інформаційних технологій;

кандидат технічних наук, доцент Петров Костянтин Едуардович, Харківський національний університет внутрішніх справ, доцент кафедри прикладної математики.

Провідна установа:

Національний технічний університет України “Київський політехнічний інститут”, кафедра автоматизованих систем обробки інформації та управління, м. Київ.

Захист відбудеться “ 12 ” квітня 2006 р. о 1300 годині на засіданні спеціалізованої вченої ради Д 64.052.01 в Харківському національному університеті радіоелектроніки за адресою: 61166, м. Харків, пр. Леніна, 14.

З дисертацією можна ознайомитись у бібліотеці Харківського національного університету радіоелектроніки за адресою: 61166, м. Харків, пр. Леніна, 14.

Автореферат розісланий “ 10 ” березня 2006 р.

Вчений секретар

спеціалізованої вченої ради С.Ф. Чалий

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Однією з першочергових задач інформатизації є розвиток методів створення інтелектуальних систем різного призначення, за допомогою яких здійснюється автоматизація наукових досліджень і процесів виробництва. Застосовувані зараз інформаційні технології недостатньо високоякісні, хоча інтелектуальні інформаційні системи вже здатні виконувати певні функції, які раніше вважалися виключно прерогативою людини, а саме: доведення математичних теорем, перекладання тексту з однієї мови на іншу, діагностування хвороб тощо. Тому питання розробки нових технологій, підкріплених якісно виконаним програмним забезпеченням персональних комп'ютерів, що дозволяють користувачам задовольняти свої інформаційні запити і вирішувати поставлені задачі будь-якого ступеня складності, є одним з найважливіших в області перспективних напрямів розвитку комп’ютерних наук.

Спроби вирішити задачу повноцінної обробки інформації, представленої природною мовою за допомогою спеціально призначених для цього комп'ютерних програм, стикаються зі значними труднощами. Ці спроби подовжуються понад 50 років, обсяги виконуваних і плануємих робіт катастрофічно зростають, але досягти повноцінної обробки інформації так і не вдалося, про що свідчить незадовільна якість сучасного машинного перекладу й автоматичного пошуку потрібної інформації, представленої природною мовою, у сховищах знань (наприклад, в Інтернеті). Як і раніше, можливості спілкування людини з комп'ютером природною мовою обмежені.

Широке висвітлення цієї проблеми подане в книзі В.А. Широкова "Феноменологія лексикографічних систем", де переконливо доведено, що інформатизація є магістральним напрямком розвитку людства, а штучний інтелект - головний засіб для прискорення руху в цьому напрямі. Автоматизація ж обробки текстів природної мови, у свою чергу, служить головним засобом розвитку штучного інтелекту. Автор також дає пояснення, чому так повільно просувається робота з автоматизації обробки текстів природної мови. Основний вплив на вирішення цих проблем зробили дослідження українських та зарубіжних вчених: В.М. Глушкова, Д.А. Поспєлова, Н. Хомського, Ю.П. Шабанова-Кушнаренка, М.Ф. Бондаренка, Н. Нільсона, С. Осуги, Р. Шенка.

Програмісти при розробці програм для комп'ютерної обробки текстів, стикаються з дефіцитом інформації про закони, за якими функціонує природна мова. Тому вони найчастіше діють без підтримки інших наук, методом спроб і помилок, емпірично, "силовим методом". Їм доводиться аналізувати величезну кількість випадків мовного поводження людей. Вже зараз зібрано мільйони таких випадків, але навіть цього явно недостатньо, мова йдеться вже про необхідність мати опис мільярдів випадків. Тому необхідно звернутися до вивчення законів, за якими діє мова, а для цього потрібний алгебрологічний опис механізму мови, оснований на його фізичному вивченні.

Для побудови моделей механізмів природної мови потрібні могутніший алгебрологічний апарат і досконаліші методи формального опису, ніж ті, що розроблені до цього часу. Навіть існуючі алгебрологічний апарат і методи опису найчастіше невідомі особам, які бажають спрямувати свої зусилля на природно мовне моделювання, тому в дисертаційній роботі приділена увага описові застосовуваних у ній існуючих алгебрологічних засобів і розробці нових. Головними обмежуючими факторами при моделюванні мови є: недостатній розвиток алгебрологічних засобів та методів фізичного (об'єктивного) дослідження механізмів природної мови.

Дисертаційна робота присвячена розробці методів формального опису структури природної мови за допомогою алгебри предикатів і алгебри предикатних операцій, а також апарата логічних мереж. Актуальність цієї теми визначається перспективністю застосування отриманих методів у розробці систем спілкування з комп'ютером на основі природної мови.

Зв'язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконувалася згідно з планом науково-технічних робіт Харківського державного університету радіоелектроніки в рамках держбюджетної теми: № 107-2 "Розробка принципів, методології проектування й створення інформаційно-аналітичної системи підтримки прийняття рішень при управлінні соціально-економічним розвитком регіону"(№ ДР U001545), де автор був виконавцем.

Мета і задачі дослідження. Метою дисертаційної роботи є підвищення якості розв’язання задачі формалізації природної мови за рахунок створення алгебрологічних моделей морфології та їх застосування у логічних мережах. Основні задачі дослідження:

— аналіз існуючих підходів до дослідження інтелекту, зокрема - наукових досліджень в області моделювання механізмів природної мови;

— розробка методу схемної реалізації предикатних операцій;

— розробка методу схемної реалізації відображень;

— удосконалення алгебрологічної моделі відмінювання повних неприсвійних прикметників російської мови;

— розробка алгебрологічного методу загальної роботи логічних мереж;

— побудова моделі логічної мережі звукового варіанту відмінювання повних неприсвійних прикметників російської мови.

Предмет дослідження – моделі логічних мереж та методи їх застосування для формалізації морфологічних структур.

Об'єктом дослідження є алгебрологічний апарат моделювання природної мови.

Методи дослідження. В процесі розв’язання наведених вище задач були використані логічний аналіз, алгебра скінченних предикатів, алгебра предикатних операцій. Вони є зручним засобом для розробки логіко-математичних моделей в обраній області та для створення повноцінного апарата моделювання механізмів природної мови у вигляді логічних мереж. Також використовувалися основні поняття булевої алгебри та теорії графів.

Наукова новизна отриманих результатів. В процесі вирішення поставлених задач були отримані такі наукові результати:

Уперше розроблено метод схемної реалізації предикатних операцій заміни, перестановки, підстановки і обчислення значень кванторів, який дозволяє підвищити швидкість обробки символьної інформації у логічних мережах за рахунок розпаралелювання обчислень.

Уперше розроблений метод схемної реалізації відображень, що дозволяє реалізувати паралельну потактну роботу логічної мережі за рахунок переходу від алгебрологічного запису відображень до його вигляду, придатного для апаратної реалізації.

Уперше розроблено алгебрологічний метод загальної роботи логічних мереж, заснований на послідовному виконанні паралельних обчислень, в результаті чого досягається підвищення продуктивності систем штучного інтелекту.

Удосконалена алгебрологічна модель відмінювання повних неприсвійних прикметників російської мови, яка за рахунок додатково введених фонетичних ознак словоформ та зв’язків між ними, дозволяє використовувати її для високошвидкісної обробки звукової інформації у логічних мережах.

Практичне значення отриманих результатів. Розроблені в дисертаційній роботі математична модель формалізації морфології природної мови і методи побудови логічних мереж призначені для розробки автоматизованих інформаційних систем із природно-мовним інтелектуальним інтерфейсом, для логічної підтримки проектування мозкоподібних комп'ютерів паралельної дії. Математичні і програмні результати роботи можуть бути використані в системах автоматичної обробки текстової і звукової інформації, які використовують мозкопоподібні паралельні процесори, що діють значно швидше.

Результати, отримані в ході даної дисертаційної роботи: модель та методи побудови логічних мереж, знайшли своє практичне застосування у сумісних розробках кафедри АПОТ з фірмою Aldec Inc. (USA) при апаратній реалізації логічної мережі, що моделює морфологічні зв'язки російської мови (акт впровадження від 10.06.2005 р.). Це дозволило проводити паралельну обробку символьної інформації.

Розроблена математична модель формалізації механізмів морфології були застосовані при розробці комп’ютерного комплексу по наданню послуг IP-телефонії в ТОВ „Віптел” ( акт впровадження від 17.10.2005 р.).

Теоретичні результати дисертації були використані в навчальному процесі на кафедрах „Програмного забезпечення ЕОМ” і „Прикладної математики” Харківського національного університету радіоелектроніки при підготовці курсів лекцій "Теорія інтелекту" і "Алгебраїчна логіка" (акт впровадження від 1.06.2005 р.).

Особистий внесок здобувача. Всі результати, представлені в роботі, отримані автором самостійно. Їх основний зміст викладений у роботах [1, 2, 3, 4, 5, 6, 7]. У статті [1] описані методи та програмна модель для формалізації морфологічних структур природної мови на базі принципів логічних мереж. Стаття [7] присвячена створенню формальної бази для побудови логічної мережі - структури, що дозволяє обробляти інформацію паралельно, за принципом людського мозку. Суть задачі полягає в розробці такої математичної структури, що дозволила б алгоритмічно й апаратно робити паралельну обробку текстової інформації. У [2] розвиваються ідеї, сформульовані в [7]. Метою статті є викладання методу алгебрологічної формалізації відносин на прикладі морфологічної задачі відмінювання прикметників, що необхідно при побудові логічної мережі. Стаття [3] присвячена застосуванню алгебри предикатів і предикатних операцій для формалізації різних структур природної мови у виді схемних моделей. У роботі введено низку алгебрологічних конструкцій і визначень, що дозволяють більш повно і глибоко описувати мовні структури. У роботі [4] алгебра предикатів і предикатних операцій застосовується для розробки методів схемної реалізації відображень, використання яких ілюструється на пример морфологічних структурах природної мови. У [5] представлений розвиток алгебрологічного апарату формульного опису відношень. Стаття [6] присвячена питанню розпізнавання змісту природно-мовного тексту. Пропонується системний підхід до моделювання різних структурних одиниць мови на базі застосування єдиного формального апарату алгебри скінченних предикатів. Запропоновано метод, у якому побудова синтаксичного дерева підпорядкування використовується для аналізу речення.

Апробація результатів дисертації. Основні результати дисертаційної роботи доповідалися й обговорювалися на конференціях: 1) [9] 3-я Міжнародна конференція "Теорія і техніка передачі, прийому й обробки інформації", (1997, Харків – Туапсе ); 2) [12] Міжнародна науково-практична конференція "Інформаційні технології: наука, техніка, технологія, освіта, здоров'я" (1999, Харків); 3) [8] 6-а Міжнародна конференція "Теорія і техніка передачі, прийому й обробки інформації" (Харків, 2000); 4) [10, 11] 9-й Міжнародний молодіжний форум "Радіоелектроніка і молодь у ХХI столітті" (2005, Харків).

Публікації. Основні результати роботи опубліковані в 12 наукових працях, з них: 7 - статті, опубліковані у наукових спеціалізованих виданнях, затверджених ВАК України, 5 – тези конференцій.

Структура й обсяг дисертаційної роботи. Дисертаційна робота складається з уведення, п’яти розділів, висновків, списку використаних джерел, додатків. Повний обсяг роботи - 160 сторінок, з них 143 сторінки основного тексту, 49 рисунків, 26 таблиць, 3 додатка на 3 сторінках, список використаних джерел із 159 найменувань на 14 сторінках.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтована актуальність теми, сформульовані основна мета і задачі дослідження, наведені відомості про зв’язок обраного напряму досліджень із планами організації, де виконана робота. Дано стислу анотацію отриманих в дисертації результатів, розкрито їх наукову та практичну цінність, наведено дані про використання результатів проведеного дослідження в народному господарстві.

Перший розділ присвячений аналізу основних наукових досягнень у галузі алгебрологічного аналізу та моделювання інтелектуальної діяльності людини.

Проведено огляд наукових досліджень в областях теорії інформатизації, формального опису механізмів природної мови. На основі проведеного аналізу літературних джерел показано, що, незважаючи на великі досягнення в теорії інтелектуальних інформаційних систем, багато задач у цій області ще чекають свого теоретичного і практичного рішення. Обґрунтована необхідність розробки універсального алгебрологічного апарата для опису природної мови. Сформульовані й обґрунтовані мета й задачі наукових досліджень, що були виконані в дисертаційній роботі.

Другий розділ присвячений розвитку алгебри предикатів і предикатних операцій у контексті застосування цього апарату для формалізації різних структур природної мови у вигляді логічних мереж. Уведено ряд алгебрологічних конструкцій і визначень, що дозволяє більш повно і заглиблено описувати деякі мовні структури. Проведено порівняльний аналіз існуючих алгебр предикатів, розглянуті їх переваги та недоліки з погляду на їх практичне застосування. Розроблено метод схемної реалізації предикатних операцій заміни, перестановки, підстановки і обчислення значень кванторів, який дозволяє розпаралелити обробку таких операцій під час роботи логічних мереж.

Опис понять логічної математики складає одну з найважливіших задач самої логічної математики. Формально кожне описуване поняття заміняється відповідним йому предикатом. Будь-яке поняття з математичної точки зору являє собою деякий предикат P(x), заданий на якійсь безлічі предметів M. Визначимо формальне поняття рівності двох предикатів. Рівність предикатів P=Q являє собою двомісний предикат другої ступіні =(P, Q), аргументами якого є предикати першої ступіні P і Q. Нехай P і Q - предикати P(x1, x2,..., xm) і Q(x1, x2,..., xm), що задані на Um. Скорочено записуємо (x1, x2,..., xm)=x, тоді: =(P, Q) x (P(x)~Q(x)). Або повний запис:

P=Q x1, x2,... xm(P(x1, x2,..., xm)~Q(x1, x2,..., xm)) (1)

Прямим визначенням предиката Q через предикати P1, P2,..., Pn називається зв'язок виду: x (Q(x)~F(P1(x), P2(x),..., Pn(x)))=1, (x1, x2,..., xm)=x. Тут P1, P2,..., Pn - відомі предикати, тобто такі, для яких визначення вже маємо. Вони називаються параметрами логічного рівняння (умови). Q - визначуваний предикат; F - деяка предикатна операція. Рівняння (1) має єдине рішення, і воно вирішується в явному виді: предикат Q виражається безпосередньо через предикати P1, P2,…, Pn: Q=F(P1, P2,…, Pn), або повний запис: Q(x)F(P1(x), P2(x),…, Pn(x)) ( знак означає рівність предикатів; значення предикатів рівні при всіх наборах значень аргументів x).

Розглянуто відносини і дії над ними в алгебрі предикатів. Якщо перебирати всілякі набори (вектори), то деякі з них будуть належати відношенню, а інші - ні. Утворимо функцію P(x) = із двійковим значенням . Якщо набір x належить відношенню Р, то P(x)=1, а якщо не належить, то P(x)=0. Такі функції називаються предикатами.

Будь-яка функція P(x1, x2,…, xm)=, ( - логічна змінна), що відображає множину Um у множину ={0, 1}, називається m-місним предикатом, заданим на Um.

Нехай L - множина всіх відносин на Um, M - множина всіх предикатів Um. Відношення P L і предикат P M називаються відповідними один одному, якщо при будь-яких x1, x2,…, xmU:

(2)

Одержали предикат, що відповідає відношенню. Залежність (2) ставить у відповідність відношенню P предикат P.

Можна зробити і зворотний перехід: від предиката P перейти до відповідного йому відношення. Правило переходу таке:

Якщо P(x1, x2,…, xm) =1, то (x1, x2,…, xm)P;

Якщо P(x1, x2,…, xm) =0, то ( x1, x2,…, xm)P. (3)

Правила (2) і (3) установлюють взаємно однозначну відповідність між усіма відносинами множини L і всіма предикатами множини M. Множина усіх векторів (x1, x2,…, xm), що задовольняють рівнянню P(x1, x2,…, xm)=1, утворює відношення P, яке називається областю істинності предиката P. Природна мова використовує цей прийом. Предикат PM, обумовлений правилом (2), називається характеристичною функцією відношення PL. Одержуємо відношення, що відповідає предикату. У багатьох випадках оперувати предикатами зручніше, ніж відносинами. Переходимо від відносин до предикатів, та за рахунок цього виходимо на формульний запис відносин. Висловлення – це словесний запис предикатів.

Щоб визначити яка саме алгебра предикатів потрібна для вирішення задачі формалізації конкретної природно-мовної структури, проведені порівняльний аналіз і систематизація алгебр предикатів, розглянуті деякі конкретні реалізації алгебри предикатів.

Розроблено метод схемної реалізації предикатних операцій заміни, перестановки, підстановки і обчислення значень кванторів, який дає можливість розпаралелити обробку таких операцій під час роботи логічних мереж. Завдяки переходу від комбінаційних схем до послідовностних (тобто із пам’яттю), процес роботи логічної мережі, для реалізації якого застосовуються предикатні операції та квантори, може бути представлений за допомогою скінченних автоматів. Використання елементу затримки дозволило схемно реалізувати квантори. На рис. 1 приведена схема для обчислення значення квантора спільності, де ПЕ - перебір елементів, з - елемент затримки.

У третьому розділі розглянуті питання предикатної формалізації понять квазидекартова добутку, відображення, багатомісного відображення, образу і прообразу предмета, багатомісної відповідності. Розроблений метод схемної реалізації відображення, який проілюстрований на прикладах з морфології природної мови.

Предикат P(x1, x2,…, xm) заданий на області M, де M - яке-небудь відношення на Um, якщо значення його аргументів обмежені умовою (x1, x2,…, xm)M. У цьому випадку відношення M називається областю завдання предиката P. Умову (x1, x2,…, xm)M можна записати у вигляді рівняння M(x1, x2,…, xm)=1, у лівій частині якого записується формула предиката M, що відповідає відношенню M.

Декартовий добуток множин M1, M2,…,Mm - це предикат, який можна представити у вигляді: P(x1, x2,…, xm)= M1(x1)M2(x2) …Mm(xm).

Він визначається умовами:

1) усюди визначеності;

2) однозначності;

3) для будь-якої точки існує єдине координатне представлення;

4) для кожного координатного представлення існує єдина точка.

Поняття декартова добутку допускає узагальнення. Предикат, що визначається умовами (1-3) і допускає представлення у вигляді:

P(x1, x2,…, xm)=M1(x1, x2)M2(x2, x3, x4)…Mm(xm),

називається квазідекартовим добутком. З його співмножників відсутні змінні виключаються квантором існування.

Кожному предикату F(x, y), визначеному на MN, відповідає відображення f, що діє з M у N. Якщо для xM існує yN, такий, що xFy, то вважають, що відображення f ставить у відповідність предметові x предмет y, і пишуть y=f(x). Іншими словами: F(x, y)=1f(x)=y. Якщо ж для xM не існує yN, такий, що xFy, то говорять, що відображення f не ставить у відповідність предмету x ніякого предмета y і що воно для предмета x не визначено. Визначення відображення:

f(x)=Sx, де Sx={y|F(x, y)=1}.

Багатомісні відображення одержуємо, переходячи від предиката F(x, y) до предиката F(x1, x2,…, xn, y) і від відображення y=f(x) до відображення y=f(x1, x2,…, xn).

Неявним видом відображення називається його представлення формулою відповідного предиката. Наприклад, одномісне відображення A=B={a, b, c}; f: AB у неявному вигляді:

f(x)=y; F(x, y)=xaybxaycxbycxbyd.

Явним вигляді відображення називається його представлення системою імплікацій, що отримані в результаті імплікативного розкладання його неявного вигляду. Запишемо вищенаведене відображення в явному вигляді. Підставляємо x=a, одержуємо xaybyc, підставляємо x=b, маємо xbyc, для x=с маємо xc0. Явний і неявний вигляди являють собою різновиди аналітичного представлення відображень.

На основі отриманого опису розроблений метод схемної реалізації відображення, який проілюстрований на прикладах з морфології природної мови.

Нехай M={a1, a2,…, ak} - фіксована множина, що складається з K елементів; A - яка-небудь з його підмножин, AM. Для множини A складаємо набір (1, 2,…, k) логічних елементів 1, 2,…, k за таким правилом: якщо aiA, то i=1; якщо ж ai A, то i=0 . Набір (1, 2,…, k) називається характеристикою множини A. Предикат A(x) на M, що відповідає множині A з характеристикою (1, 2,…, k), запишеться формулою:

.

Набір (1, 2,…, k) називається також координатним представленням множини A. Пишуть: A=(1, 2,…, k). Предикат A(x) формується по його координатному представленню (1, 2,…, k) наступною схемою, що називається формуванням одномісних предикатів (рис.2).

Рис. 2. Схема формування одномісних предикатів

Побудуємо схему, що реалізує яке-небудь відображення. Беремо

предикат, що зв'язує першу та другу букви деяких закінчень прикметників:

F(x, y)=xаyяxяyяxуyюxюyюxоyюxеyюxыyеxиyеxоyеxеyе.

Будуємо відповідне йому відображення f(x)=y. Приймаємо N={я, ю, е}.

M={а ,я, у, ю, о, е, ы, и}.

Маємо:

я=xayя;

ю=xуxюxоxе;

е=xыxиxоxе. Рис. 3. Відображення f(x)=y

Нехай х ='o'. Схема, що реалізує відображення f, має вигляд:

Рис. 4. Схема, що реалізує відображення

Для знаходження образу предмета, елементи впізнавання схеми на рис. 4 заміняються на а, я,…, ы, и (координатне представлення). Якщо треба побудувати схему, що реалізує відображення, зворотне заданому, розгалуження проводів заміняються елементами поділу, елементи розподілу заміняються розгалуженням проводів.

Рис. 5. Схема, що реалізує відображення, зворотне заданому

Схема на рис. 5 по закінченням з другою буква ю чи е породжує множину перших букв закінчень: {ю, е}{у ,ю ,о, е, ы, и}.

Четвертий розділ присвячений удосконаленню алгебрологічної моделі морфологічних структур природної мови на прикладі відношення відмінювання повних неприсвійних прикметників російської мови та розробці алгебрологічного методу загальної роботи логічних мереж.

Словоформа кожного слова однозначно характеризується своїм закінченням. Алгебрологічна формалізація функції закінчення полягає у формульному записі мовою алгебри предикатів функції закінчення . Для цього спочатку записуємо області зміни для перемінних з блоку контексту слова (див. пояснення до рис. 6):

(4)

 

Далі для кожного закінчення по таблицях закінчень записуємо варіанти умов, при яких воно вживається, наприклад:

. (5)

Отримана алгебрологічна модель відмінювання повних неприсвійних прикметників російської мови має багато повторюваних частин у своїх формулах. Якщо цим частинам присвоїти певні імена, то можна, заміняючи ці частини їх іменами, істотно скоротити довжину формального опису об'єкта, наприклад, якщо ввести:

, ,

, ,

то (5) буде мати наступний вигляд: . Аналогічно записуються формули для блоків основи слова та форми слова.

Схемна реалізація формул, що описують алгебрологічні структури, приводить до характерних інженерних мереж ( які не були використані раніше), що називаються логічними мережами. Формальним описом об’єкта мовою алгебри предикатів є деякий предикат . Він виражає відношення , що представляє собою множину усіх наборів предметів , що задовольняють рівнянню . Саме це відношення виражає структуру описуваного об’єкта. За допомогою алгебрологічного методу загальної роботи логічних мереж, опис об’єкта представляється інакше – системою з шести предикатів , , , , , , де s -простір, що має бути описаний, x -змінна, що задана на універсумі предметів простору s, x1, x2 - координатні осі (вектори) простору s, і - номера місць векторів x1, x2, t - змінна, що формально задає поняття відношення для s. Перехід к єдиному предикату можливий шляхом утворення кон’юнкції з вищеназваних предикатів: = .

П’ятий розділ присвячений практичної реалізації логічної мережі. Проведено порівняльний аналіз технічних нейроних і логічних мереж. Розроблена структура логічної мережі для звукового варіанту відмінювання прикметників. Проаналізовано переваги апаратної реалізації логічної мережі над програмною. Побудовані бінарні зв’язки між тими вузлами логічної мережі звукового варіанта відмінювання прикметників, які відсутні чи відрізняються від вузлів логічної мережі текстового варіанту. Створена відповідна логічна мережа (рис. 6).

Вузли логічної мережі для звукового варіанта: х1 - рід; х2 - число; х3 - відмінок; х4 - ознака одушевленості; х5 - ознака вживаності; s - тип відмінювання; r - номер комірки парадигми; z - закінчення; zл - ліва частина закінчення; zп - права частина закінчення; z0 - ознака ударності закінчення; z1 - 1-й звук закінчення; z2 - 2-й звук закінчення; z3 - 3-й звук закінчення; у1 - останній звук основи слова; у2 - ознака ударності основи слова; у3 - ознака зм'якшення основи слова; х - ознака зм'якшення останнього звуку основи словоформи; у - останній звук основи словоформи. Числа від 1 до 20 - номера відношень (зв’язків) між вузлами.

- вузли мережі, що відрізняються по своїй структурі і властивостям від аналогічних у логічній мережі для текстового варіанта;

- вузли мережі, відсутні в логічній мережі для текстового варіанта

Рис. 6. Логічна мережа для звукового варіанта словоформ прикметників

У додатку наведені акти впровадження теоретичних і практичних результатів дисертаційної роботи.

ВИСНОВКИ

У дисертаційній роботі наведено результати, які, у відповідності з метою дослідження, в сукупності є вирішенням актуальної наукової задачі – підвищення якості формалізації природної мови за рахунок створення алгебрологічних моделей морфології та їх застосування у логічних мережах, які необхідні для створення мозкоподібних ЕОМ паралельної дії. Вирішення цієї задачі полягає в застосуванні розробленої моделі та методів в системах автоматичної обробки текстів природної мови та має велике значення для створення ефективного інтерфейсу спілкування між рядовими користувачами та автоматичними системами. У результаті вирішення сформульованої задачі:

1. Проведений аналіз основних наукових досягнень у галузі алгебрологічної формалізації та моделювання інтелектуальної діяльності людини показав, що, незважаючи на великі досягнення в теорії інтелектуальних інформаційних систем, багато задач у цій області ще чекають свого теоретичного і практичного рішення. Це обумовило вибір напрямку досліджень, формулювання мети та задач дисертаційної роботи.

2. Уперше розроблено метод схемної реалізації предикатних операцій заміни, перестановки, підстановки і обчислення значень кванторів, використання якого дозволяє розпаралелити обробку цих операцій в логічних мережах за рахунок застосування послідовностних схем.

3. Уперше розроблено метод схемної реалізації відображень, що дозволяє синтезувати логічні мережі для проектування мозкоподібних комп’ютерів, завдяки відтворенню алгебрологічного запису відображень на логічних інтегральних схемах, що програмуються.

4. Уперше розроблений алгебрологічний метод загальної роботи логічних мереж, призначених для створення мозкоподібних процесорів, що дозволяє розпаралелювати обробку символьної інформації.

5. Удосконалена алгебрологічна модель відмінювання повних неприсвійних прикметників російської мови, яка, завдяки запропонованій модифікації, описує функцію закінчення ширше, ніж попередні моделі та придатна для використання у логічних мережах.

6. Побудовані бінарні зв’язки між тими вузлами логічної мережі звукового варіанта відмінювання прикметників, які відсутні чи відрізняються від вузлів логічної мережі текстового варіанту. Створена відповідна логічна мережа.

7. Розроблені в дисертації алгебрологічний апарат, методи, алгоритми та програмна реалізація, що призначені для формалізації механізмів морфології природної мови, довели високу ефективність логічних мереж. Результати роботи впроваджені в системах синтаксичного аналізу прикметників російської мови, реалізованих на кристалі FPGA (ХНУРЕ, кафедра АПОТ сумісно з фірмою Aldec Inc. (USA)) .

8. Розроблені методи і модель формалізації механізмів морфології були програмно реалізовані та впроваджені в ТОВ „Віптел” у вигляді програмного керуючого модулю по наданню послуг IP-телефонії.

СПИСОК ОПУБЛІКОВАНИХ АВТОРОМ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ

1. Дударь З.В., Калиниченко О.В., Козяев Л.Л., Мельникова Р.В. О программной реализации логической сети // АСУ и приборы автоматики. - . - № 130. - С. 103- .

2. Дударь З.В., Мельникова Р.В. Об алгебраической формализации полных имен прилагательных // АСУ и приборы автоматики. - 2005.- № 131. - С. 104-112.

3. Дударь З.В., Мельникова Р.В. Формализация элементов эконом-ных многоступенчатых цепей // Вест. Нац. техн. ун-та „Харьк. политехн. ин-т”. Сб. науч. тр. Темат. вып.: Иформатика и моде-лирование. - Харьков: НТУ „ХПИ”. - 2005. – № 46. – С. 77-82.

4. Дударь З.В., Мельникова Р.В. О методах схемной реализации отображений // Східно-Європейський журн. передових технологій. - 2005. – № 2/2 (14).  С. 102-105.

5. Дударь З.В., Мельникова Р.В., Шабанов-Кушнаренко Ю.П. Отношения как предмет формульного описания // Радиоэлектроника и информатика. – 1997. – № 1. – С. 115-119.

6. Дударь З.В., Мельникова Р.В. Моделирование информационных структур // Вест. Харьк. Гос. политехн. ун-та. - 2000. - № 79. - С. 18-20.

7. Калиниченко О.В., Козяев Л.Л., Мельникова Р.В. О формальной структуре логических сетей // Радиоэлектроника и информатика. - 2005. - № 2. - С. 79-83.

8. Дударь З.В., Мельникова Р.В. Представление смысла текста в естественном языке // 6-я Междунар. конф. "Теория и техника передачи, приема и обработки информации" ("Новые информационные технологии"): Сб. науч. тр. - Харьков: ХТУРЭ, 2000, - С. 151-152.

9. Дударь З.В., Мельникова Р.В. Разработка системы логической поддержки проектирования информационных структур // 3-я Междунар. конф. “Теория и техника передачи, приема и обработ-ки информации”. - Харьков – Туапсе: ХТУРЭ, 1997. - С. 295.

10. Мельникова Р.В. Отношения и действия над ними в алгебре предикатов // 9-й Міжнар. молодіжний форум “Радіоелектроніка і молодь в XXI ст.”: Зб. матеріалів форуму. – Харків: ХНУРЕ, 2005. - С. 384.

11. Мельникова Р.В. О схемной реализации отображений // 9-й Міжнародний молодіжний форум “Радіоелектроніка і молодь в XXI ст.”: Зб. матеріалів форуму. – Харків: ХНУРЕ, 2005. - С. 383.

12. Мельникова Р.В. Об одном подходе к вычислению смысла текста // Зб. наук. пр. міжнар. конф. „Інформаційні технології: наука, техніка, технологія, освіта, здоров'я”. - Харків: Харк. держ. політехн. ун-т, 1999. -Ч. 1. - С. 131- 133.

АНОТАЦІЯ

Мельнікова Р.В. Алгебрологічні моделі морфології та їх застосування в логічних мережах. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.23 – системи та засоби штучного інтелекту. - Харківський національний університет радіоелектроніки, Харків, 2006.

Дисертація присвячена рішенню актуальної задачі підвищення якості формалізації природної мови на прикладі створення алгебрологічних моделей морфології та їх застосування у логічних мережах. Побудова логічних мереж необхідна при проектуванні мозкоподібних ЕОМ паралельної дії.

Розроблений метод схемної реалізації предикатних операцій заміни, перестановки, підстановки та обчислення значень кванторів. Отримане представлення довільного відображення. Сформульовані властивості квазідекартового добутку. Розроблений метод схемної реалізації відображень. Отриманий формульний запис мовою алгебри предикатів функції закінчення словоформ прикметників. Запропонований алгебрологічний метод загальної роботи логічних мереж. Побудована логічна мережа, що моделює морфологічне відношення відмінювання повних неприсвійних прикметників російської мови для звукового варіанту.

Ключові слова: природна мова, алгебрологічний апарат, предикат, предикатна операція, штучний інтелект, логічна мережа.

АННОТАЦИЯ

Мельникова Р.В. Алгебрологические модели морфологии и их применение в логических сетях. – Рукопись.

Диссертация на соискание научной степени кандидата технических наук по специальности 05.13.23 – системы и средства искусственного интеллекта. - Харьковский национальный университет радиоэлектроники, Харьков, 2006.

Диссертация посвящена решению актуальной задачи повышения качества формализации естественного языка на примере создания алгебрологических моделей морфологии и их применения в логических сетях. Построение логических сетей является необходимым при проектировании мозгоподобных ЭВМ параллельного действия.

Сейчас разработка современных цифровых систем обработки информации и систем искусственного интеллекта имеет тенденцию к использованию интегральных схем программируемой логики. Это связано с появлением новых субмикронных технологий и созданием мощной элементной базы в виде программируемых логических интегральных схем. Для повышения эффективности проектирования цифровых систем на этапе разработки модели информационного объекта необходимо дальнейшее развитие средств формального описания алгебры конечных предикатов. Диссертационная работа посвящена разработке новых решений, используемых при построении компьютерных систем общения на естественном языке, которые на базе логических сетей позволят распараллелить обработку символьной информации по принципу мозга человека. Формализованы основные операции над отношениями. Проведен сравнительный анализ и систематизация алгебр предикатов. Разработан метод схемной реализации предикатных операций замены, перестановки, подстановки и вычисления значений кванторов. Сформулированы свойства квазидекартового произведения, которое необходимо для описания естественно-языковых отношений. Получено представление произвольного отображения. Разработан метод схемной реализации отображений. Предложена система признаков и соответствующих им предметных переменных, однозначно определяющих функцию окончания словоформ имен прилагательных. Усовершенствована формульная запись на языке алгебры предикатов функции окончания словоформ имен прилагательных. Предложен алгебрологический метод общей работы логических сетей. Построена логическая сеть, моделирующая морфологическое отношение склонения полных непритяжательных имен прилагательных русского языка для звукового варианта.

Алгебрологический аппарат и методы, которые были разработаны для построения логической сети, использованы на кафедре АПВТ ХНУРЭ для ее аппаратной реализации при проектировании цифровых систем обработки информации на кристаллах; разработанные методы и модель формализации механизмов морфологии были внедрены в ТОВ "Виптел" для разработки компьютерного комплекса автоматизации работы по предоставлению услуг ІP-телефонии. Результаты кандидатской диссертации внедрены в учебный процесс для студентов 4-5 курсов специальности "Программное обеспечение автоматизированных систем" факультета "Компьютерные науки" ХНУРЕ в курсах лекций “Теория интеллекта” и “Алгебраическая логика”.

Ключевые слова: естественный язык, алгебрологический аппарат, предикат, предикатная операция, искусственный интеллект, логическая сеть

ABSTRACT

Melnikova R.V. Algebrologic models of morphology and their use in logical nets. - Manuscript.

Thesis for a of candidate of technical science degree on a specialty 05.13.23 – Systems and Means of Artificial Intelligence – Kharkіv National University of Radio Electronics, Kharkіv, 2006.

The dissertation covers the actual problems of natural language formal description quality formalization. Logical nets have been offered as a base of brain-like processors. Logical nets allow parallel processing of symbolic data.

Method of circuit realization of predicate operations such as substitution, displacement, replacement and quantifiers value circuit evaluation has been offered. Description of arbitrary reflection has been invented. Method of circuit realization of reflection has been elaborated. Algebrological model of adjectives inflexion has been improved. Algebrological method of logical nets working has been offered. This net is used for circuit representation of natural language formulas written in terms of finite predicates algebra. Vocal version of logical net for morphological inflexion of non-possessive adjectives of Russian language has been constructed.

Keywords: natural language, algebrological apparatus, predicate, predicate operation, an artificial intellect, logical net.

Відповідальний випусковій Руденко О. Г.

Підп. до друку 6.03.06. р.

Формат 60x84 '/16 Спосіб друку - ризографія

Умов. друк. арк. 1,2 Облік.- вид. арк. 1,10

Зам. № ________. Тираж 100 прим.

Віддруковано в навчально-науковому видавничо-поліграфічному центрі

ХНУРЕ

Україна, 61166, м. Харків, пр. Леніна, 14






Наступні 7 робіт по вашій темі:

МОЛОДІЖНИЙ СЛЕНГ У МОВЛЕННЄВІЙ СТРУКТУРІ м. ХЕРСОНА - Автореферат - 27 Стр.
САЙТ ЯК ЖАНР ІНТЕРНЕТ-КОМУНІКАЦІЇ (на матеріалі персональних сайтів учених) - Автореферат - 28 Стр.
РОЗРОБКА СКЛАДУ ТА ТЕХНОЛОГІЇ ТАБЛЕТОК ЕЛАГОВОЇ КИСЛОТИ - Автореферат - 20 Стр.
ЕТНОКУЛЬТУРНІ САМОІДЕНТИФІКАЦІЇ УЧНІВСЬКОЇ МОЛОДІ В УМОВАХ ТРАНСФОРМАЦІЇ УКРАЇНСЬКОГО СУСПІЛЬСТВА (НА ПРИКЛАДІ БОЛГАРСЬКОЇ ЕТНІЧНОЇ ГРУПИ) - Автореферат - 25 Стр.
Удосконалення технології формування Колісних пар локомотивів - Автореферат - 17 Стр.
ВДОСКОНАЛЕННЯ ОБЧИСЛЮВАЛЬНОГО ПРИСТРОЮ ЧАСТОТНО-СТРУМОВИХ ТА ВЕКТОРНИХ СИСТЕМ КЕРУВАННЯ ОБ’ЄКТІВ З АСИНХРОННИМИ МАШИНАМИ - Автореферат - 24 Стр.
ПРОТИРІЧЧЯ СВІТОГОСПОДАРСЬКИХ ЗВ’ЯЗКІВ І ФОРМИ ЇХ РОЗВ’ЯЗАННЯ В УМОВАХ ВКЛЮЧЕННЯ ПЕРЕХІДНИХ ЕКОНОМІК У ГЛОБАЛІЗАЦІЙНИЙ ПРОЦЕС - Автореферат - 42 Стр.