У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Національна академія наук України

Інститут мовознавства ім. О.О.Потебні

ПОГРІБНА ОКСАНА ОЛЕКСАНДРІВНА

УДК 811.161. 2

ЛЕКСИЧНА ТА ГРАМАТИЧНА СЕМАНТИКА ІМЕННИКІВ

У „СЛОВНИКУ УКРАЇНСЬКОЇ МОВИ”

(назви знарядь праці та споруд)

Спеціальність 10.02.01 – українська мова

АВТОРЕФЕРАТ

дисертації на здобуття наукового ступеня

кандидата філологічних наук

Київ – 2005

Дисертацією є рукопис.

Роботу виконано у відділі лінгвістики Українського мовно-інформаційного фонду НАН України.

Науковий керівник – | кандидат філологічних наук, старший науковий співробітник,

Чумак Володимир Васильович,

Український мовно-інформаційний фонд НАН України,

заступник директора

Офіційні опоненти –

доктор філологічних наук, професор

Жайворонок Віталій Вікторович,

Інститут мовознавства ім. О.О.Потебні НАН України,

провідний науковий співробітник;

кандидат філологічних наук, доцент

Гнатюк Ірина Святославівна,

Інститут української мови НАН України,

старший науковий співробітник

Провідна установа – | Київський національний університет імені Тараса Шевченка, кафедра історії української мови

Захист відбудеться "16" березня 2005 р. о 14 годині на засіданні спеціалізованої вченої ради Д.26.172.01 для захисту докторських (кандидатських) дисертацій при Інституті мовознавства ім. О.О.Потебні НАН України (01001, м. Київ, вул. Грушевського, ).

З дисертацією можна ознайомитися в науковій бібліотеці Інституту мовознавства ім. О.О. Потебні НАН України.

Автореферат розіслано „12” лютого 2005 р.

Учений секретар

спеціалізованої вченої ради

доктор філологічних наук, професор Н.Г. Озерова

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

У сучасному мовознавстві зростає інтерес до проблем, пов’язаних із когнітивними аспектами функціонування мови, вивчення яких дозволяє простежити особливості механізмів комп’ютерного опрацювання природної мови, що є важливим чинником у створенні електронних мовно зорієнтованих систем. Лінгвістичною основою для подібних розробок є відображення специфіки системної організації мови в основних характеристиках – змісту (лексичної семантики) та форми (граматичної семантики) її лексичних одиниць. Саме такі ас-пек-ти слова як центральної одиниці мови знайшли адекватний опис у 11-томному академіч-но-му тлумачному Словнику української мови (К., 1970 – 1980) (далі – СУМ), який репрезентує їх системно і упоряд-ковано.

Значні здобутки у вивченні семантики слів пов’язують з традиційним мовознавством. Вони представлені у працях О.О.Потебні, В.В.Виноградова, В.М.Русанівського, М.П.Кочер-гана, Л.А.Лисиченко, Н.Г.Озерової, О.О.Тараненка, І.Р.Вихованця, А.П.Загнітка, І.К.Кучеренка, О.К.Безпояско, М.Я.Плющ, Н.Ю.Шведової, Е.В.Кузнецової та ін. Однак результати цих праць вимагають відповідної адаптації для сучасних досліджень, пов’язаних із створенням автомати-зо-ваних засобів опрацювання природної мови та розробки різноманітних лінгвістичних техно-логій.

Наукові дослідження В.А.Широкова, Є.А.Карпіловської, Н.Ф.Клименко, Н.М.Сухарини, Н.В.Сніжко, А.Я.Середницької та ін., пов’язані з комп’ютерною лексикографією, засвідчують, що автоматизована екстракція лінгвістичної інформації з тексту словників дозволяє простежити особливості лексичної і граматичної семантики при системному моделюванні лексики, її впро-вадженні в автоматичні системи і розкрити нові механізми функціонування мови як системи.

Актуальність дослідження. Актуальність даної дисертаційної праці полягає у необхід-ності створення комплексної лексикографічної моделі лексичної та граматичної семантики іменників, репрезентованої лексикографічним описом СУМа. Запропонований підхід до моде-лювання лексичної і граматичної семантики у їх словниковому відображенні стосується імен-никового лексико-граматичного розряду слів української мови, зокрема лексико-семантичних груп на позначення назв знарядь праці та споруд з наступними узагальненнями та висновками про властивості іменника як частини мови в цілому. Вибір лексем на позначення назв знарядь праці та споруд обумовлено репрезентативністю семантичних особливостей іменників цих лексико-семантичних груп. Семантичні особливості таких лексем виявляються у предметному (денотативному) значенні, формування якого здійснюється на основі переліку ключових ознак денотата. Тому семантика цих лексем орієнтується на об’єктивно виділений відрізок зовніш-нього світу, що зумовлює прозору і однозначну ідентифікацію семантичних компонентів у структурі їх значення. Наявність видової ознаки функціонального призначення як інтегральної у значенні лексем обох семантичних груп дозволяє встановити особливості її реалізації різними формальними конструкціями у тлумаченні досліджуваних іменників та простежити її вплив на формування компонентного складу значення цих лексем. Крім того, вибір іменників відповідних семантичних груп зумовлений тим, що лексеми на позначення назв знарядь праці і споруд щодо компонентного складу значення тільки частково досліджувалися в українському мовознавстві та вивчалися в інших аспектах, які не стосувалися формалізованого моделювання їх семантики.

Використання тлумачного словника з метою виділення необхідної лінгвістичної інфор-мації, яка розкриває додаткові механізми системної організації мови, стає важливою ознакою розвитку української комп’ютерної лексикографії, а відтак і мовознавства в цілому.

Зв’язок роботи з науковими програмами, планами, темами. Представлена дисертація є продовженням розробки наукової тематики Українського мовно-інформаційного фонду НАН України: а саме: 1) наукових тем Українського мовно-інфор-ма-цій-но-го фонду НАН Укра-їни „Україномовні лексикографічні системи” (4.19.15), „Теоретико-лінг-вістичні та інфор-ма-цій-ні за-сади автоматизованої обробки при-родної мови” (4.19.11), „Лексикографічні системи в інтелектуальному опрацюванні природної мови” (0102U003220), „Дослідження мовно-інформаційних процесів та розподілених систем національної словникової бази” (0102U003221); 2) завдань, які випливають з Указу Президента України від 7 серпня 1999 р. № 967 „Про розвиток національної словникової бази”.

Метою даного дослідження є комплексний аналіз та побудова лексикографічних моде-лей лексичної та граматичної семан-ти-ки іменників сучасної української мови, зокрема лексико-семантичних груп на по-зна-чення назв знарядь праці та споруд.

Досягнення поставленої мети передбачає вирішення таких завдань: 

створення лексикографічної бази даних для параметризації лексичної семантики імен-ників досліджуваних груп на основі набору відповідних лексикографічних параметрів та логічної структури тлумачень іменникових лексем; 

побудову моделі лексикографічної системи, що репрезентує феномен лексичної се-ман-тики досліджуваних іменників у СУМі; 

виведення формули структури тлумачення іменникових лексем на позначення знарядь праці та споруд; 

створення лексикографічної бази даних для параметризації граматичної семантики іменників української мови на основі набору відповідних лексикографічних параметрів граматичної семантики у тлумачному словнику; 

побудову моделі лексикографічної системи, що репрезентує феномен граматичної семан-тики іменників у тлумачному словнику; 

встановлення структурних типів граматичної семантики іменникових лексем на позначення знарядь праці та споруд.

Об’єктом дослідження є лексико-граматичний клас іменникових лексем сучасної укра-їнської мови, зокрема лексико-семантичні групи (далі – ЛСГ) на позначення назв знарядь праці та споруд.

Предметом дослідження є повний масив іменникових словникових статей (близько 53 тисяч) у його лексикогра-фіч-ній інтерпретації в системі СУМа.

Методи дослідження. Для досягнення мети дисертаційної роботи з урахуванням специфі-ки досліджуваного об’єкта було застосовано індуктивний та дедуктивний методи, систематично застосовувалися інфор-ма-цій-на теорія лексикографічних систем (далі – ІТЛС), теорія моделей даних, методи обчислю-валь-ного експерименту, компо-нент-но-го, так-со-номіч-но-го та контексто-логічного аналізів.

Наукова новизна роботи полягає у тому, що вперше в українському мовознавстві було проаналізовано лексикографічні моделі лексичної та граматичної семантики іменникових лек-сем на всьому масиві тлумачного Словника української мови. Вперше побудовано лексико-гра-фічні бази даних (далі – ЛБД) автоматичної репрезентації граматичної семантики (у співпраці з В.А.Широковим та І.В.Шевченком) та лексичної семантики іменникових лексем української мови, представлено авторську інтерпретацію деком-позиції структури іменникових словникових статей СУМа, встановлено якісне та кількісне співвід-ношення параметрів лексичної і граматичної се-мантики іменникових лексем та запропоновано нову класифікацію іменників української мови з урахуванням формальних показників їх гра-матичної семантики; виведено формули компонент-ної структури тлумачень іменників на позна-чення знарядь праці та споруд.

Теоретичне значення дисертаційного дослідження полягає у здійсненні авторської лек-сикографічної параметризації лексичної та граматичної семантики іменників сучасної україн-ської мови (зокрема лексем на позначення знарядь праці та споруд) на основі їх лексико-графічного опису у СУМі, а також у розробці нової класифікації іменників за комплексом формальних ознак граматичної семантики.

Практичне значення одержаних результатів полягає у можливості застосування ство-ре-них лексикографічних моделей лексичної і граматичної семантики іменників у авто-ма-ти-зованих лінгвістичних системах, спрямованих на опис, моделювання або розуміння природної мови, а також у можливості використання цих моделей в інформаційно-пошукових тезаурусах тематичного спрямування, системах для укладання та редагування словників у вигляді лекси-ко-графічних процесорів, аналізаторів у системах штучного інтелекту та ін.

Апробація роботи. Основні положення дисертаційного дослідження було представлено у доповідях на міжнародних наукових конференціях: „Мова, освіта і культура у сучасному світі” (Київ, грудень 2001), „Мови і культури національних меншин у контексті процесів демократизації й глобалізації” (Київ, листопад 2002), „Семіотика культури / тексту в етно-націо-на-льних картинах світу” (Київ, квітень 2004), на наукових семінарах Українського мовно-інформаційного фонду НАН України.

Особистий внесок здобувача. Основні результати одержані дисертанткою самостійно. У праці [5] автором запропоновано нову класифікаційну схему граматичної семантики українського іменника та виконано її верифікацію на матеріалі створених ЛБД.

Публікації. Основні результати дисертації викладено у п’яти публі-ка-ціях (одна у співав-торстві) [1–5], у виданнях, що ввійшли до переліку ВАК України.

Обсяг і структура дослідження. Дисертаційна робота складається зі вступу, трьох розділів, висновків та списку використаної літератури, який містить 310 найменувань. Обсяг дисертації без списку використаної літератури становить 217 сторінок. Загальний обсяг роботи (з бібліографією) – 244 сторінки.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовано актуальність теми, сформульовано мету і завдання роботи, подано ві-до----мості про наукову новизну отриманих результатів та їх практичне застосу-ван-ня, визначено ме-то--до-ло-гічну основу створення ЛБД для комплексного представлення грама-тичної та лексич-ної семан---тики іменників сучасної української мови.

Перший розділ „Теоретико-методологічні засади вивчення лексичної та граматичної семантики у сучасному мовознавстві” присвячено опису загального стану вивчення лексичної та граматичної семантики іменників української мови. Розглянуто поняття сучасної теоретичної лексикографії, окреслено етапи розвитку та напрям-ки пов’язаної з нею галузі комп’ютерної лексикографії, для якої формулюються і вирі-шу-ють-ся поставлені в цьому дослідженні завдання. Викладено теоретичні засади інформаційної теорії лексикографічних систем, яка становить теоретичне та методологічне підґрунтя опису досліджуваних у дисертації мовних явищ.

Згідно з методологічними засадами ІТЛС, лінгвістична інформація, яка стосується функ-ціонування слова як центральної одиниці мови, упорядкована та систематизовано репре-зентована в структурі СУМа. Остання, у свою чергу, має регулярну, лінгвістично осмислену (хоча й не завжди явно експліковану) будову. Цей факт дає підставу для розгляду тлумачного словника як джерела комплексної лінгвістичної інформації формального та змістового аспектів функціонування слова в мовній системі.

Відповідно до дихотомічної природи слова, лексикографічно опрацьованого у СУМі, словникова стаття V(x), де V – умовне позначення словникової статті, а х – будь-яке реєстрове слово словника, реалізується структурою, яку в графічному вигляді відображено на діаграмі 1 (при цьому F і C – оператори, що виділяють у тексті V(х) формальну і змістову частини опису реєстрової одиниці х – L(х) та Р(х), відповідно; Н – оператор, який забезпечує відповідність між L(х) та Р(х); елемент L(х) відіграє роль лівої, а Р(х) – правої частини словникової статті V(х)):

(1)

Модель лексикографічної системи Словника української мови постає як послідовне роз-різнення лівої та правої частин словникових статей, при цьому з лівою частиною співвід-но-ситься граматична семантика, а з правою – лексична. Якщо через V(СУМ) позначити лекси-кографічну систему СУМа як множину його словникових статей, то її структура набуває роз-ви-нення, представленого у формулі 2:

(2)

,

де V(СУМ) – лексикографічна система СУМа як множина його словникових статей; L(СУМ) – множина лівих частин V(СУМ); P(СУМ) – множина правих частин статей V(СУМ); Н – функ-ція, яка ставить ліву частину словникової статті у відповідність правій і забезпечує дихотомічну цілісність їхньої побудови. Така формула є універсальною для будь-якої лексико-графічної си-стеми. Оскільки її структура стосується СУМа, в якому словникову статтю очолює реєст-рове слово х, то формула 2 набуває конкретизації:

V(СУМ)=V(x); L(СУМ)=L(x); P(СУМ)=P(x), (3)

де V(x) позначає об’єднання всіх словникових статей СУМа; L(x) – об’єднання всіх лівих частин, а P(x) – об’єднання всіх правих частин цих словникових статей. Відповідно до виведених формул можна кон-статувати, що структура лексикографічної системи у її словниковому відображенні реалізується сумою структуротвірних елементів: V(х)={L(х); P(х); H(х)}.

З урахуванням особливостей відображення лінгвістичної інформації у тлумачному словнику серед основних структуротвірних елементів виділяється також множина операторів А, до якої належать міжстатейні відображення та відповідності між різними словниковими стат-тями й елементами їхньої структури. Зокре-ма, це можуть бути відображення типу А: V(х)>V(у), які стосуються словникових статей відсилкового типу.

На основі описаних структуротвірних елементів тексту словника окреслюється макро-структура СУМа, що є основою моделювання лексикографічної системи. Ліва та права частини як макроструктурні елементи СУМа характеризуються власною структурою, яка по відно-шен-ню до тексту словника є носієм його мікроструктури. Така мікроструктура і є об’єк-том опису конкретної лексикографічної системи.

При цьому структура макроелементів L(x) та P(x) рекурсивно поширюється на структуру мікроелементів, які позначаємо, відповідно, ?(х) та р(х), а структура ?(х) та р(х) визначається набором елементарних інформаційних одиниць, поєднаних у певних комбінаціях. Враховуючи викладене, в ІТЛС лексикографічна система СУМа узагальнюється і набуває вигляду діаграми 4:

V(х) L(x); P(x); Н(x)

L(x) Н(x) P(x)

(4)

л(x) Н(x) р(х) ?(x) Н(х) р(х)

Для здійснення поставлених завдань у даному дослідженні було побудовано відповідні ЛБД, що використовувались як інструмент виділення і моделювання необхідної інформації. Спо-чатку було створено ЛБД Іmen, формат якої відображав структуру словникових статей іменника за такими компонентами: реєстрове слово (поле Word), ліва частина словникової статті, в якій зафіксовано показники граматичної семантики реєстрового слова (поле LPart), номер лексико-семантичного варіанта реєстрового слова (поле Param), права частина словни-кової статті з відображенням у ній тлумачення реєстрового слова (поле Interpr).

У процесі дослідження структури граматичної семантики іменникових лексем на основі вихідної ЛБД Іmen було створено низку вторинних ЛБД, формат яких змінювався відповідно до автоматичних запитів, сформульованих нами для розв’язання конкретних завдань. Вторинні ЛБД є проміжними етапами автоматичного аналізу відповідних статей і стосуються виявлення лексикографічно ві-до-бражених іменникових граматичних параметрів, особливостей їх фіксування та способів ком-бі-нування у лівій частині словникових статей СУМа.

У другому розділі „Лексична семантика іменників у Словнику україн-ської мови” досліджується лексична семантика у її словниковому відображенні на прикладі іменникових лексем на позначення знарядь праці та споруд. Враховуючи теоретико-методологічні засади ІТЛС, праву частину словникової статті інтерпретовано з по-гляду структурних інформаційних елементів, які набувають ролі її формальних репрезентантів. Ними є: тлумачення основних значень (S Тут і далі використано умовні позначення за книгою: Широков В.А. Інформаційна теорія лексикографічних систем. – К.: Довіра, 1998. – 331 с.

), тлумачення відтінку (V), ілюстрація до основного значення (Is), ілюстрація до відтінку значення (Iv).

Як інструментальний засіб у дослідженні побудовано ЛБД RPart. До неї було включено іменникові лексеми на позначення знарядь праці (2005 одиниць) та споруд (445 одиниць), значення яких у СУМі подано за допомогою описових чи описово-синонімічних тлумачень. Формат утво--ре-ної бази включав поля: Word – відображення реєстрового слова, LРart – відображення лівої частини словникової статті, Param – відображення номера лексико-семантичного варіанта, Interpr – відображення тлумачення реєстрового слова. Основне відношення ЛБД RPart набуває такого вигляду (таблиця 1):

Таблиця 1.

Фрагмент бази даних ЛБД Rpart

Word | LPart | Param | Interpr | ГАЛЬВАНО#-МЕТРГАЛЬВАНО#МЕТР, а, ч. 1. Прилад високої чутливості для вимірювання малих величин електричного струму, напруги або кількості електрики.ГАЛЬВАНО-СКО#ПГАЛЬВАНОСКО#П, а, ч. 1. Найпростіший прилад для виявлення постійного електричного струму в ланцюгу і визначення його напряму.ГАЛЬМО#ГАЛЬМО#, а, с. | 1. Пристрій для сповільнення руху або зупинки транспорту і т. ін. | ГАМАЗЕ#ЙГАМАЗЕ#Й, ю, ч., ГАМАЗЕ#Я, ї, ж., заст.1. Будівля для зберігання зерна, муки та інших предметів.ГАРА#ЖГАРА#Ж, а#, ч. 1. Приміщення для стоянки та технічного обслуговування машин.ГАРДЕРО#БГАРДЕРО#Б, а, ч.2. Приміщення в громадському будинку, де зберігається верхній одяг; роздягальня.

У правій частині словникової статті безпосередній опис лексичного значення реєстрового слова репрезентовано у тлумаченні як структурному елементі збудованої ЛБД. Тому моделювання лексичної семан-тики іменникових лексем здійснювалося із урахуванням специфіки структурних особли-востей цього елемента.

Початково тлумачення розглядалося з погляду логічних відношень між його компонентами: воно виступає судженням, у якому поняття про певний об’єкт розкривається за допомогою фіксування ознак, необхідних і достатніх для його вирізнення з-поміж інших об’єктів чи явищ дійсності. Врахування категоріальних характеристик встановлених ознак дозволяє представити структуру тлумачення іменникових лексем на позначення знарядь праці та споруд у вигляді формули (5):

Т(х) = Dfd nRn Dfn (К?+К?), (5)

де Т(х) – тлумачення слова х, Dfd (дефінієндум) – тлумачне слово, Dfn (дефінієнс) – опис по-нят--тя тлумачного слова, К?+К? – складові структурні компоненти Dfn – відповідно, родова та видова ознаки, nRn – логічний зв’язок, яким поєднуються Dfd та Dfn.

Структура тлумачення на рівні логічних відношень перебуває у кореляції зі структурою на рівні виділення семантичних компонентів значення. Відповідно до методології ІТЛС ком-поненти значення реєстрового слова виводяться в результаті його декомпозиційного поділу на елементарні інформаційні одиниці з регламентованим набором типових семантичних компо-нен-тів, функціонування яких визначається узагальненим значенням, відносно сталим формаль-ним вираженням, визначеною синтаксичною роллю та зв’язками, які виникають між цими компонентами.

З метою здійснення декомпозиції тлумачень і визначення компонентного складу тлу-ма-чень досліджуваних іменникових лексем на основі первинної ЛБД RPart автором створено вторинну ЛБД RPart Decomp. Її формат розширено полями відпо-від-но до виділених у структурі тлумачення компонентів. Виявлені семантичні компоненти було занесено у певні поля ЛБД вручну.

Здійснення декомпозиції тлумачень ґрунтувалося на таких засадах:

1. Декомпозиція тлумачення (T) здійснюється за єдиним принципом для всіх тлумачень іменникових лексем ЛСГ назв знарядь праці та споруд.

2. Кожен виділений структурний елемент тлумачення є елементарним смислом і носієм узагальненого значення.

3. Усі уточнювальні компоненти тлумачення залежно від їх узагальненого значення розподіляються навколо двох центральних компонентів – семантичної теми та компонента функціонального призначення.

4. Компоненти, що групуються навколо центральних компонентів, є уточнювальними диференційними (Ds), які детермінуються центральними компонентами.

5. Компоненти тлумачення характеризуються типовими формальними ознаками, хоча форми їхнього вираження можуть варіюватися внаслідок перефразування тлумачення.

Лінгвістичний статус виділених семантичних компонентів у дисертації встановлювався відповідно до структури тлумачення на рівні логічних відношень: з елементами родової та ви-дової ознаки співвідносяться семантичні компоненти – семантична тема і функціональне призначення, які набувають статусу обов’язкових семантичних компонентів значення відповідних лексем.

Семантичну тему як ідентифікуючий, а тому обов’язковий компонент у структурі зна-чення лексем на позначення знарядь праці та споруд, представлено ідентифікаторами різного рівня узагальнення. Для ЛСГ на позначення назв знарядь праці вони формують чоти-ри-ярусну ієрархію, в якій на першому рівні виділено поняття найвищого рівня узагальнення „знаряддя”, що охоплює весь означений клас лексем; на другому рівні за сутнісною ознакою знарядь праці виокремлено семантичні теми нижчого рівня узагальнення: машина, присто-сування, апарат, механізм, інструмент, прилад, пристрій; на третьому рівні – семантичні теми нижчого рівня узагальнення, які на основі методу ступінчастої ідентифікації співвідносяться з поняттями вищого рівня: лом, лампа, струнотримач, молоток, ніж, кран, важіль, ліхтар, голка, засувка, циркуль, снаряд та ін. Наприклад: кронци?ркуль – маленький циркуль для креслення дуг радіусом до 1 мм.; колі?й – ніж, яким колють свиней; кия?нка? – дерев'яний молоток, яким користуються в столярстві; трубоуклада?ч – пересувний підйомний кран на гусеничному тракторі для укладання труб у траншеї; на четвертому – семантичні теми найнижчого рівня узагальнення. Сюди належать описові ідентифікатори типу: брус, трубочка, балка, дошка, жердка, планки, тичка, ланцюг, трос, паличка, стрижень, держак, ручка, розвилка та ін. Наприклад: кі?тва? – металевий стрижень з лапами, що зачіплюється за ґрунт і утримує на місці судно, пливучий маяк і т. ін.; якір.; рога?тка – дерев'яна розвилка з прив'язаною до обох кінців гумовою стьожкою для метання чого-небудь; ві?шало – закріплена на стовпах або підвішена на мотузках чи дротинах тичка для сушіння чого-небудь; жердка.

У семантичній групі на позначення споруд було також виділено семантичні ідентифі-катори трьох рівнів узагальнення. 1-й рівень: узагальнююче поняття „споруда”, під яке підво-диться весь клас даних слів; 2-й рівень: за сутнісною ознакою вичленовуються два родові ідентифікатори: будівля та будинок. Ідентифікатором будівля визначається значення лексем: хлів, альтанка, стодола, балаган, клуня, дім, будинок, тоді як поняття будинок також виявляється родовим і ним визначаються лексеми: садиба, будка, готель, театр, кімната. 3-й рівень представлений ідентифікатором нижчого рівня узагальнення приміщення, який, у свою чергу, визначається поняттям вищого рівня узагальнення – будівля. За наявністю іденти-фікатора приміщення виділяється синонімічна підгрупа лексем: помешкання, майстерня, повітка, гуртожиток, крамниця, кабіна, склеп, школа, цех та ін.

Відповідно до видової ознаки, яка диференціює родову, виділяємо компонент функціонального призначення, що є інтегральним щодо семантики лексем на позначення знарядь праці та споруд. Одночасно кваліфікуємо його як диференційний, оскільки цей компонент конкретизує семантичну тему у структурі значення досліджуваних лексем стосовно ознаки призначення, застосування. Безпосереднє звернення до аналізу семантичного компонен-та функціонального призначення у тлумаченнях досліджуваних слів показало, що для іменнико-вого класу лексем на позначення знарядь праці найхарактернішим є призначення, засто-су-вання, яке відображається за допомогою віддієслівних іменників чи дієслів із значенням „вимірювання” (124 лексеми), „тримати” у знач. ”підтримувати” (38 лексем), „подавання” (37 лексем), „різати” та похідні (36 лексем), „визначення” (33 лексеми), „очищувати” (33 лексеми), „перетворювати” (29 лексем), „з’єднування, скріплювання” (28 лексем), „записувати” (24 лексеми), „оброблення” (23 лексеми), „ловити” (23 лексеми), „робити, виробляти” (20 лексем), „передавати” (17 лексем), „піднімати” (16 лексем).

Для лексем – назв споруд найхарактернішим є функціональне призначення, що відо-бра-жається за допомогою віддієслівних іменників або дієслів на позначення: „зберігати щось” (70 лексем), „готувати, виготовляти щось” (23 лексеми), „тримати (у знач. утримувати) щось” (19 лексем), „захищати щось” (18 лексем), „проживати” (7 лексем), „відпочивати” (6 лексем). Компоненти семантична тема та функціональне призначення виявляються класифікаційними, на основі яких у межах досліджуваних ЛСГ можуть бути виділені підгрупи слів з класами назв об’єктів та лексичні підгрупи з конкретним способом засто-су-ван-ня, використання даних об’єктів. Це свідчить про відображення у тлумаченні системних зв’яз-ків, які існують в об’єктивній дійсності.

У структурі тлумачення досліджуваних лексем виділення інших семантичних елементів здійснювалося з урахуванням обов’язкових компонентів – семантичної теми та функціонального призначення. Відповідно до функціонування компонентів як таких, що поширюють семантику обов’язкових, виділяємо уточнювальні компоненти, які детермінуються семантичною темою та компонентом функціонального призначення.

Така семантична детермінованість реалізується у зв’язках відповідного характеру, що встановлюються між семантичною темою та уточнювальними компонентами, з одного боку, і функціональним призначенням та відповідним набором уточнювальних компонентів – з ін-шого. Виділені уточнювальні компоненти відносно семантичної теми перебувають в атрибу-тив-ному відношенні як уточнювальні ознаки до номінативного поняття, а щодо функціонального призначення вони виділяються як актантні пропозиції, зумовлені валентнісно-інтенційними властивостями дієслова у конструкції вираження компонента функціонального призначення.

Серед уточнювальних семантичних компонентів важливими класифікаційними властивостями характеризується компонент на позначення об’єкта, на основі якого визначаються класи об’єктів, що пов’язуються з тим чи іншим функціональним застосуванням предмета, а також встановлюються класи, семантично співвідносні зі значенням описуваного слова. Розподіл класів об’єктів (на позначення фізичних величин, продуктів харчування, сільськогосподарських реалій та назв осіб) відповідно до семантики компонента на позначення об’єкта у тлумаченні досліджуваних лексем виявляється у закономірному співвідношенні: якщо визначальним класом об’єктів для семантичної групи іменникових лексем на позначення знарядь праці є фізичні величини, то для лексичної групи на позначення споруд він є нехарактерним, тоді як одним із визначальних для семантики лексем – назв споруд є клас об’єктів на позначення осіб, що у семантиці лексем – назв знарядь праці проявляється найменше. Подібну закономірність, яка простежується відносно інших класів об’єктів, відображено у таблиці 2:

Таблиця 2.

Кількісний розподіл класів назв об’єктів відповідно до семантики компонента на позначення об’єкта у тлумаченні іменників ЛСГ назв знарядь праці та споруд

Клас об’єктів | Кількість у % у межах ЛСГ

назв знарядь праці | Кількість у % у межах ЛСГ

назв споруд | Фізичні величини | 17,1 | 0,3 | Продукти харчування, напої | 1,3 | 11,8 | Назви осіб | 1,2 | 15,2 | Сільськогосподарські реалії | 9,6 | 16,5 | Відсоткове співвідношення класів об’єктів у групі лексем на позначення назв знарядь праці вказує на значну кількість точних обчислювальних приладів, пов’язаних із науково-виробничою сферою, а також на значний відсоток назв об’єктів, пов’язаних із сільським господарством. На лінгвістичному рівні цей факт свідчить про значну кількість в такій іменниковій групі назв понять науково-виробничої сфери. Для лексем на позначення поруд розподіл класів об’єктів вказує на те, що їх семантика визначається функціональним призначенням стосовно людей і пов’язана з поняттями побутової сфери.

Відповідно до узагальненого змісту семантичних компонентів та зв’язків, що встановлюються між семантичними компонентами у структурі тлумачення досліджуваних лексем, виведено модель лексикографічної системи, що відображає феномен лексичної семантики таких слів (схема 1):

На схемі 1 Т(х) – тлумачення лексем на позначення знарядь праці та споруд; SK(ST) – семантичний комплекс із центральним компонентом ST – семантична тема; SK(F) – семантичний комплекс із центральним інтегрально-диференційним компонентом функ-ціонального призначення; Ds(ST) – уточнювальні компоненти семантичної теми: атрибутивний компонент (atr) та компонент на позначення місця при семантичній темі (locat?); D – дієслово або віддієслівний субстантив, на основі якого реалізується компонент функціонального призна-чення; Ds(D) – уточнювальні семантичні компоненти по відношенню до дієслова: на позначення об’єкта (obj), суб’єкта (subj), місця (locat?), мети (aim), напряму: звідки (ab), куди (ad), часу (time), умови (cond), інструмента (instr), засобу (med), сфери (sph), способу (mod); Н – оператор, що відображає зв’язок між семантичними комплексами SK(ST) та SK(F).

Встановлення особливостей компонентної структури значення лексем на позначення знарядь праці та споруд веде до побудови лексикографічних формул їх тлумачення. Структуру значення іменників ЛСГ на позначення назв знарядь праці можна представити за допомогою формули 6:

Т(х)=[atr + locat1]+ SТ + F + [obj + subj + instr + med + locat2 +

+ ab + ad + aim + cond] (6)

Для одиниць ЛСГ на позначення назв споруд така формула набуває незначного спрощення (формула 7):

Т(х)=[atr + locat1] + SТ + F + [obj + mоd + locat2 + ab + ad] (7)

Дужки [ ] в обох формулах вказують на можливість набуття компонентом факуль-та-тивного значення.

Здійснений аналіз тлумачень досліджуваних іменників свідчить про те, що їх структура визначається набором вказаних семантичних компонентів, які характеризуються узагальненим значенням, певною синтаксичною роллю, формою вираження і зв’язками.

У третьому розділі „Граматична семантика іменників у Словнику української мови” об’єктом вивчення стала відображена у СУМі граматична семантика іменників української мови, серед яких окремо розглянуто лексеми на позначення знарядь праці та споруд. Інструментом у цьому дослідженні є створена ЛБД LPart, з відображенням структури лівої частини словникової статті. У ній зафіксовано 52 іменників української мови, лексикографічно опрацьованих у СУМі.

Ґрунтуючись на теоретичних засадах ІТЛС, структуру граматичної семантики іменнико-вих лексем розглянуто з погляду її елементарних складових інформаційних елементів, які набувають ролі граматичних параметрів і виступають формальними репрезентантами грама-тич-ної семантики. Такими елементами є: число (параметр на позначення числа), рід (параметр на позначення роду), парадигма (параметр на позначення парадигматичного (словозмінного) класу), стиль (параметр з відображенням функціонально-стильової диференціації). В окремий умовно визначений параметр компонент виділено лексемний варіант реєстрового слова, специфіка якого зумовлена морфологічними (кореневими, коренево-суфіксальними), фонетичними або акцентуаційними відмінностями. Виділення таких елементів здійснене в процесі декомпозиції лівої частини словникових статей, що передбачало встановлення її структурного складу.

Виявлені граматичні параметри у структурі лівої частини словникової статті є ієрархічно упорядкованими. На найвищому рівні такої ієрархії виділяється комплекс, з яким співвідно-сить-ся параметр на позначення числа, нижче – блок, з яким співвідноситься параметр на позначення роду, за ним – підблок, що співвідноситься з параметром на позначення парадигматичного (словозмінного) класу, під яким – компонент з відображенням варіативності реєстрового слова. У такий спосіб встановлюється механізм структурування лівої частини словникової статті іменника, що відображено системою вкладень, яка формально визначається у такий спосіб:

L(х)=ЧКРБППК, (8)

де у лівій частині словникової статті L(х) виділяються: ЧК – сукупність числових комплексів, РБ – сукупність рід-блоків, ПП – сукупність парадигматичних підблоків, К – сукупність компо-нентів, а символом позначено входження кожного наступного елемента в попередній.

Побудова моделі лексикографічної системи з відображенням граматичної семантики полягала у встановленні способів кількісного співвідношення виділених параметрів гра-матичної семантики. З цією метою ЛБД LPart переформовано у вторинну ЛБД LPart Decomp від-по-відно до програмного запиту і в такий спосіб автоматично визначено способи кількісного ком-бінування граматичних параметрів у лівих частинах словникових статей іменників україн-ської мови. Результати фіксувалися у ЛБД, основне відношення якої подано в таблиці 3:

Таблиця 3.

Фрагмент бази даних ЛБД LPart Decomp з відображенням кількісного комбінування граматичних параметрів у лівих частинах словникової статті іменників

ID Stat | ID IN | Компонент | Парадигма | Рід | Число | 1898 | 1011 | БАЛКА#РИ | iв, | мн. | 1898 | 1012 | БАЛКА#РЦІ | iв, | мн.

1898 | 2111 | БАЛКА#Р | а, | ч. | одн. | 1898 | 2122 | БАЛКА#РЕЦЬ | рця, | ч. | одн. | 1898 | 2213 | БАЛКА#РКА | и, | ж. | одн. | При цьому у полі ID Stat фіксувався порядковий номер словникової статті, представленої реєстровим словом; у полі ID IN відображалися граматичні параметри у порядку їх виявлення програмою; поля Компонент, Парадигма, Рід та Число фіксували відповідний параметр, що відображався у словниковій статті.

Автоматично встановлені комбінації параметрів граматичної семантики кваліфікуються за допомогою спеціально розробленої нотації – системи умовних письмових позначень, пред-став-лених в аналітичній числово-буквеній формі. Здійснений у такій системі запис позначено терміном сигнатура. Кожна L(х) визначалася власною сигнатурою, що свідчить про належність до певного сигнатурного типу чи класу.

За допомогою автоматичного аналізу комбінування формальних репрезентантів грама-тичної семантики іменників було визначено граничні межі кількісного спів-від-ношення кожного з параметрів у межах будь-якої L(х). Відповідно до механізму вкладень встановлено правила:

1. Числових комплексів у межах одного реєстрового ряду може бути 1 або 2:

L(х)=ЧК? або L(х)=ЧК?+ЧК?;

2. Рід-блоків у межах одного числового комплексу може бути 1, 2 або 3:

ЧК=РБ? , ЧК=РБ?+РБ? або ЧК=РБ?+ РБ?+ РБ?;

3. Парадигматичних (словозмінних) підблоків у межах одного рід-блоку може бути 1, 2 або 3:

РБ=ПП? , РБ=ПП?+ПП? або РБ=ПП?+ПП?+ПП?;

4. Компонентів у межах одного парадигматичного підблоку може бути 1, 2 або 3:

ПП=К? , ПП=К?+К? або ПП=К?+К?+К?.

Виведені правила, що визначають кількісну параметризацію граматичної семантики іменників української мови, можна вважати за такі, що стосуються організації граматичної підсистеми іменника не тільки у словниковому відображенні, а й у системі мови загалом.

Параметризацію граматичної семантики з урахуванням кількісних співвідношень параметрів у межах лівої частини словникової статті відображає граф 1:

Граф 1.

З метою автоматичного визначення кількісного комбінування параметрів граматичної семантики у межах лівої частини словникової статті іменників було розроблено нотацію з відповідними позначеннями структурних елементів: комплексу, блоку, підблоку та компонента, за якою:

1. Для формального відображення елемента компонент використано цифрові символи, що вказують на загальну кількість компонентів, які реалізуються в межах кожного підбло-ку, блоку та комплексу лівої частини словникової статті.

2. Для формального відображення в нотації елемента підблок, що формується параметром на позначення парадиг-ма-тичного класу, використано позиційні умовні позначення. Загальну кількість підблоків у нота-ції відображено через одно- (х?), дво- (х?х?) чи тричленний (х?х?х?) числовий запис.

3. Для відображення в нотації структурного елемента блок, що формується параметром на позначення роду, застосовано символ крапки „ ”, який фіксу-єть-ся лише за наявності одночасно двох чи трьох параметрів роду в межах лівої частини словникової статті.

4. Для відображення маркованих параметрів елемента комплекс, типу „збірн.”, „мн.” чи „одн.” використано умовне позначення латинською літерою „ n . При відображенні двокомплексних структур застосовано символ : ” як спосіб відмежування одного числового параметра від іншого в межах реєстрової статті. Відсутність цифрових показників після двокрапки „ : ” вказує на умовно виділену, передбачувану в мові множину.

5. Для зафіксованих статей, типу ДРОЖ, розм. ДРIЖ, дро?жу, ч. і дро?жі, ж., у яких компонент виявляється спільним для кількох підблоків, введено символ рівності за компо-нентом „. =k ”, який може стосуватися спільного компонента для кількох підблоків.

6. Для зафіксованих статей, типу ПУТЬ, і?, ж., заст., ч., у яких підблок є спільним для кількох різних блоків, введено символ рівності за блоком .= .

У результаті автоматичного аналізу структур лівої частини словникових статей імен-ників отримано параметризацію, відповідно до якої виділено 31 структурний клас. Такі класи станов-лять лише 0,004% від теоретично можливих і передбачуваних системою мови 837 930 структурних типів, утворених внаслідок комбінування структурних елементів лівих частин словникових статей. Усі інші типи, які залишаються нереалізованими, можна розцінювати як такі, якими граматична семантика новоутворених іменників української мови може визначатися потенційно.

Аналізований матеріал засвідчує різне кількісне співвідношення в межах виявлених структурних класів граматичної семантики. Найчисленніші з них структурні класи (від 10 лексем) відображено у таблиці 4:

Таблиця 4.

Кількісний розподіл іменників української мови за сигнатурами

№ | Сигна-тура | Заг.

к-сть | Приклади L(х) | 1. 1: | 50 042 | ПIВУСТА#В, у, ч.; | 2. 1n | 1083 | ЧЕРЕПИ#ЦЯ, i, ж., збiрн.; | 3. 2: | 873 | ХОРТ, ХІРТ, хорта#, ч.; | 4. 1.=1: | 365 | СЕМИЛI#ТОК, тка, ч. і ж., розм.; | 5. | 1n:1.1 | 306 | СВА#НИ, ів, мн. (одн. СВАН, а, ч.; СВА#НКА, и, ж.); | 6. 1n:1 | 70 | ГА#ЛЛИ, iв, мн. (одн. ГАЛЛ, а, ч.);

7. 11: | 49 | ТУРЧЕНЯ#, я#ти, ТУРЧА#, а#ти, с.; | 8. 1.1: | 28 | РУКО#ПИС, у, ч., розм., рідко РУКО#ПИСЬ, і, ж.; | 9. 1.=k1: | 19 | ЧЕРI#НЬ, реня#, ч. i ре#нi, ж.; | 10. 3: | 18 | СЕМИРЯ#ГА, СЕМЕРЯ#ГА, СЕМРЯ#ГА, и, ж., заст.; | 11. | 2n | 17 | УСТА# (ВУСТА#), уст, мн.; | 12. 11n | 10 | У#СТОНЬКА, ньок, У#СТОНЬКИ, ів, мн.; | 13. 2.=2: | 10 | БІДА#ХА, рідко БІДА#ГА, и, ч. і ж. | Здійснена параметризація лівої частини словникових статей іменників дозволила провести статистичні дослідження іменникової граматичної підсистеми, зокрема підтверджено факт, що в українській мові граматична категорія числа є дуже розвиненою: лише 2,09% із загальної кількості іменників української мови припадає на лексеми, які не мають однієї з корелятивних форм. За числовим параметром встановлено розподіл іменників: збірних – 251 (0,5%), множинних (які не мають форми однини) – 850 (1,6%). Щодо сингулярних іменників, відображених у СУМі за параметром „тільки одн.”, виявлено всього 8 лексем. При цьому важливо зауважити, що класи сингулятивів на -ння, -ття та под. у СУМі не маркуються, тому фактично їх значно більше.

За родовим параметром було встановлено такі статистичні показники в розподілі іменників: однородових – 51 40 лексем (97%); двородових – 426 лексем (0,8%); триродових – 3 лексеми (0,005%).

Розподіл іменникових лексем за словозмінними класами виявився таким: з одним словозмінним класом в межах одного роду – 51 лексем (97%); з двома словозмінними класами – 54 лексеми (0,1%). з трьома словозмінними класами – 1 лексема (0,001%).

В окремий розряд виділено іменники з омонімічними структурами граматичної семантики, в яких виявлена одночасно словозмінна та родова розгалуженість при одному компоненті (19 лексем (0,03 %)) чи при двох спільних компонентах (2 лексеми (0,004 %)).

Відповідно до розподілу іменників за наявністю лексемного варіанта при реєстровому слові простежується тенденція до того, що компонентні варіації не є регулярними в українській мові, а поява додаткового варіанта веде до багатократного скорочення кількості лексем з такою структурою. У загальному масиві іменникових лексем української мови виділяються іменники: однокомпонентні – 51 11 (97,3%), двокомпонентні – 902 (1,7%), трикомпонентні – 21 (0,04%).

Статистичний розподіл іменникових лексем відображає загальну тенденцію до спрощення структури граматичної семантики українських іменників: чим простіша структура граматичної семантики, тим більше лексем нею визначається.

В українській мові лексеми на позначення знарядь праці та споруд серед розподілених за сигнатурними класами іменників визначаються шістьма типами структур граматичної семантики. Їх розподіл представлено у таблиці 5:

Таблиця 5.

Кількісний розподіл іменників лексико-семантичних груп на позначення

назв знарядь праці та споруд за сигнатурами

Сигнатура | ЛСГ на позначення назв знарядь праці | ЛСГ на позначення назв споруд | Кіл-сть в од. | Кількість у % | Кількість в од. | Кількість у %

[1:] | 1973 | 98,4 | 438 | 98,4 | [2:] | 27 | 1,3 | 6 | 1,3 | [1n] | 2 | 0,09–– | [1.=1:] | 2 | 0,09–– | [3:] | 1 | 0,05–– | [1.1:]–– | 1


Сторінки: 1 2