У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент


фрази.

START -> 103 (Simple sentense) 103 ->13 (зап. 1) 13 -> HE 1 -> 104 104 ->206 (зап. 2) 206 -> IS 2 -> 108 108 -> 20 (зап. 3) 20 ->BLACK 3 -> 109 109 -> 204 (зап. 210) 204 -> , 210 -> 108 108 -> 20 (зап. 3) 20 -> SHINY 3 -> 110 110 -> 209 (зап. 20) 209 -> AND 20 -> PROUD

 

Модель синтаксичної структури російської фрази та алгоритм синтезу англійської при автоматичному перекладі. Д.М.Йєйтс.

В роботі англійської дослідниці автоматичного перекладу Д.М.Йєйтс пропонується спосіб запису граматичних відомостей про російську фразу, що отримані за допомогою аналізуючого алгоритму. Цей запис побудований таким чином, що алгоритм синтеза англійської фрази може безпосередньо використовувати ці дані. Модель повинна була забезпечувати представлення в машині будь-якої синтаксичної структури, і це представлення, наскільки можливо, не повинно було залежати від особливостей обох мов. Наприклад, словосполучення не спросил в машині представлялось: “спрос- = ask, отрицательная форма, прошедшее время”. Подібні множини були названі системами.

Синтаксична структура представлялась за допомогою дерева безпосередньо складових з такими особливостями, як наприклад:

Деякі слова тексту, наприклад частки та допоміжні дієслова, взагалі не представлялися в синтаксичній структурі. Деякі слова могли бути представлені двічі, наприклад слово который, яке має одночасно зв’язувати підрядне речення з головним та входити в структуру підрядного речення.

Особливості реалізації моделі.

Синтаксична структура словосполучень представляється в машині за допомогою спискової структури , тобто набору об’єктів, кожний з яких або містить адреси одного або декількох інших елементів, або має відмітку про те, що він термінальний. Термінальні об’єкти – це слова або ідіоматичні вирази, нетермінальні – словосполучення, або складові. Наприклад, словосполучення самое интересное семинарское занятие має чотири термінальних елементи та два нетермінальні, які зв’язані таким чином:

ГП – група прикметника, ГІ – група іменника. Кожному елементу приписується тип складової (група іменника, дієслова), а кожній адресі – синтаксична функція, яку виконує ця менша група в більшій.

 

О – препозитивне означення (в групі іменника), Гс – головне слово (в групі іменника), ПрОП – визначник прикметника, П – прикметник (в групі прикметника).

При відповідному елементі міститься також набір граматичних характеристик, в цьому прикладі – число, рід, та відмінок головного іменника.

Існуючий алгоритм синтезу зберігає порядок слів та пунктуацію вхідної російської фрази, окрім особливих випадків, коли є спеціальні потреби для їх зміни. Ця обставина відображається в моделі таким чином: адреси підрядних складових зберігаються при кожному елементі в тому порядку, в якому стоять самі ці складові, і кожний елемент містить вказівки про всі знаки пунктуації, які його оточують.

Перелік всіх типів складових та синтаксичні функції їх складових, необхідних для опису фраз.

Складова | Можливі компоненти даної складової та їх синтаксичні функції.

Група іменника (ГІ) | Препозитивне означення (О)

Головне слово (Гс)

Прикладка (Пл)

Постпозитивне означення (ПО)

Група прикметника (ГП) | Препозитивний визначник прикметника (ПрОП)

Прикметник (П)

Постпозитивний визначник прикметника (ПтОП)

Прийменникова група (ПГ) | Прийменник (Пр)

Доповнення прийменника (Д)

Група прислівника (ГН) | Препозитивний визначник прислівника (ПрН)

Прислівник

Постпозитивний визначник прислівника (ПтН)

Група дієслова (ГГ) | Дієслово (Г)

Доповнення (Д)

Обставина (Об)

Група однорідних членів (ОГ) | Сполучник (С)

Члени однорідної групи (ЧО)

Просте речення (ПР) | Підмет (Пі)

Присудок (Прис)

Обставина (Об)

Підрядне речення (ПідР) | Сполучник (С)

Просте речення (ПР)

Складне речення (СкР) | Просте речення (ПР)

Обставина (Об)

Порівняльна група (ПорГ) як+ім. | Порівняльний сполучник (ПорС)

Порівняння (Пор)

Префіксна група (ПрфГ) вектор-функція | Префіксне означення (ПрфО)

Основне слово (Ос)

 

Крім того, кожному типу складових ставиться певна граматична характеристика. Наприклад, вказівки про тип (розповідне, питальне, окличне), чи є воно особовим чи ні. Якщо речення особове, йому треба приписати вказівки про число та особу. Всі ці вказівки приписуються до нетермінального елементу.

Приклад синтаксичної структури.

Алгоритм синтезу. Задачі програм обробки складових.

Задачей алгоритму синтеза є перетворення синтаксичної структури описаного вище типу в ланцюг літер, що представляють собою відповідну англійську фразу. При виборі англійського еквіваленту використовуються лише синтаксичні та граматичні характеристики, і не використовуються жодні семантичні відомості або лексичні характеристики.

Зручно мати окремі програми для обробки складових кожного типу. Наприклад, програма обробки складових для групи іменника викликається лише тоді, коли повинна бути оброблена група іменника.

Всі ПОС (програми обробки складових) повинні бути написані як рекурсивні програми, оскільки одна складова може міститися в іншій, і кожній ПОС необхідно вміти викликати інші ПОС.

Зміна порядку слів здійснюється за допомогою зміни порядку адрес у відповідному елементі.

Вибір англійського еквіваленту російського слова і надання йому потрібної форми здійснюється в останній момент, коли є вся інформація, необхідна для даної ПОС.

Приклади ПОС.

ПОС для групи іменника.

Перед групою іменника вставляється англійський прийменник, який визначається відмінком і вказівкою про синтаксичну функцію групи, наприклад, перед групою іменника вставляється прийменник of в тому випадку, коли вона має вказівку про родовий відмінок і є неузгодженим означенням в групі іменника. Узгоджені означення, які містять слова, залежні від прикметника або дієприкметника, і стоять після них, розміщуються в кінці групи, при цьому ставляться відповідні коми.

Результат аналізу:

Результат синтезу: primary signs of speech signals, chosen by system,

ПОС для групи дієслова.

В групу особового дієслова вставляються допоміжні дієслова і заперечна частка not, коли це необхідно.

Результат аналізу:

Результат синтезу: are insignificantly changed

Ця група дієслова має такі граматичні характеристики: 3-я особа, множина, теперішній час, пасив. Тому ПОС для групи дієслова вставляє are і передає управління ПОС для прикметника. Ця ПОС видасть англійський прикметник з суфіксом –ly.

Пропонуєма модель синтаксичної структури і описаний алгоритм є задовільними. Вони мають ту перевагу, що переклад може здійснюватись і при неповному алгоритмі.

“Мультістор” – система кореляційного аналізу для англійської мови. Е.


Сторінки: 1 2 3 4