У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент


УДК 81'33

УДК 81'33

Монахова Т.В.

ЗАСТОСУВАННЯ ПРИЙОМІВ КОРПУСНОЇ ЛІНГВІСТИКИ В ЛЕКСИКОГРАФІЇ

У статті розглянуто можливість ефективного застосування корпусного підходу до укладання словника мови автора. Розкрито основні проблеми створення авторського корпусу як підґрунтя для укладання ідіолектного словника. Подано зразок ідеологічного словника у вигляді тезаурусу.

Ключові слова: ідіолект, корпусна лінгвістика, лексикографія.

В статье рассматривается возможность эффективного применения корпусного подхода к составлению словаря языка автора. Раскрыты основные проблемы создания авторского корпуса как основания для составления идиолектного словаря. Приведен образец идиологического словаря в виде тезауруса.

Ключевые слова: идиолект, корпусная лингвистика, лексикография.

In this article the possibility of effective use of corpus-based approach to the compiling of an author's language dictionary is considered. It analyzes the main problems of drawing up an author's corpus as a basis for compiling an idiolect dictionary. We propose an example of ideological dictionary as a thesaurus.

Key words: idiolect, corpus-based linguistics, lexicography.

Дослідники мови все частіше говорять про вихід мовознавства з кола суто гуманітарних наукових дисциплін і надання йому якостей дисципліни технологічної, стверджуючи, що в постіндустріальному суспільстві природна людська мова - мабуть, уперше в історії людської цивілізації - набуває технологічного статусу, від якого починає безпосередньо залежати ефективність функціонування суспільного виробництва, а зрештою - й інших суспільних інститутів. Лінгвістичний корпус стає підґрунтям створення інформаційно-лінгвістичних артефактів, призначених для інтелектуального опрацювання мови й необхідних для створення й функціонування високоефективних технологій оперування знаннями.

Проблематика корпусного напряму доволі розгалужена і передбачає студії, по-перше, загальної теорії корпусної лінгвістики, над якою працюють, зокрема, Дж. Синклер [12], В. Тойберт [13]; по-друге, кореляції корпусної лінгвістики та інших лінгвістичних дисциплін, по-третє, типології корпусів і методики інтерпретації корпусних даних, по-четверте, засад створення текстових корпусів природних мов тощо. Йдеться про доробок М. Баньки [10], Ґ. Кеннеді [11], О. Демської- Кульчицької [3], В. Рикова [5], Л. Ричкової [6], С. Шарова [9], В. Широкова [4] та ін.

Розробленням методики та процедури організації лексикографічного матеріалу на засадах корпусної лінгвістики займаються науковці Національного корпусу відділу лексикології, лексикографії та

Національного корпусу української мови Інституту української мови НАН України, зокрема, це створення електронного варіанта «Словаря української мови» за ред. Б. Грінченка [2].

Новизна нашої роботи полягає у спробі застосування дослідницьких корпусних методик до укладання словника мови автора, що мотивоване передовсім появою та інтенсивним розвитком такого напряму в сучасній науці про мову, як корпусна лінгвістика, яка уможливлює вивчення, аналіз, інтерпретацію тощо мовних реалій дещо під іншим кутом зору, ніж у так званій класичній, традиційній лінгвістиці. Погляд під іншим кутом зору на мовні реалії, відповідно, дає змогу отримувати нові результати й робити нові висновки. Швидкий розвиток інформаційних технологій, розширення електронних бібліотек та зростання кількості літератури на електронних носіях, зокрема й словників, зумовили актуальність нашого дослідження. Потреба у створенні ідіолектних словників класиків української літератури є очевидною.

Історично першою спробою використання комп'ютера для лінгвістичних цілей вважають Центр автоматизації вивчення літературних текстів у Галараті (Італія, 1956 р.). Основним завданням Центру було введення до комп'ютера максимального числа текстів, причому в різній графіці, з метою генеральної інвентаризації різноманітних лінгвістичних фактів, а саме: створення різного роду покажчиків і конкордансів слів, морфем, графем, синтаксем, частот, тобто матеріалу, який у подальшому планувалося використовувати для лінгвістичних, психологічних ті інших досліджень.

У сучасній корпусній лінгвістиці, крім побудови загальномовних корпусів, поширена практика створення й інших корпусів, серед яких значне місце посідають авторські корпуси.

Авторськими називають повнотекстові корпуси одного тексту, наприклад корпус Біблії, або текстів одного автора. Популярним авторським корпусом є Корпус текстов словаря языка Достоевского, який створювався як джерело для словника мови Ф. Достоєвського, і на сьогодні вже існує його ЄБ-версія під назвою «Достоевский: Тексты, исследования, материалы», яку поширюють разом із програмами оброблення корпусу, базою даних із ідіоматики і базою даних частотного словника. Укладено «Словарь языка Достоевского. Лексический строй идиолекта», який складається з кількох випусків і будується на словнику найважливіших для автора лексичних одиниць, які презентують світ мовної особистості [7].

Створено Корпус мови Пушкіна, за матеріалами якого укладено «Словарь языка Пушкина» [8]. Це найбільш повний і теоретично розроблений словник мови письменника. У ньому описано понад 20 000 слів російської мови, що зустрічаються у художніх і публіцистичних творах О.С. Пушкіна, а також у його листах і ділових паперах. Для кожного слова подано словникову статтю, в якій показано кількість його слововживань у текстах Пушкіна, сформульовано його значення, проілюстровано цитатами й запропоновано повний перелік слововживань, що містять указівки на граматичні форми й посилання на всі тексти, в яких зустрічається це слово. Окремо репрезентовано функціонування слова у складі фразеологічних одиниць.

Так, обов'язковими корпусними ознаками, згідно з твердженням О. Демської-Кульчицької [3, с. 56-58], є:

Відібраність, яка ставить вимогу відбору фактичного матеріалу. Виникає необхідність створення певної вибірки, яка передбачає застосування чітких правил екстрагування даних, що відповідають обраній стратегії побудови корпусу, мотивовані типом корпусу і метою його створення та специфікою експлуатації.

Репрезентативність, яка полягає в здатності корпусу відображати всі властивості предметної галузі.

Збалансованість, що полягає у введенні до корпусу пропорційної кількості текстових ресурсів. На практиці, де традиційно використовують різні методики відбору текстового матеріалу до корпусу, одним із доволі складних завдань є


Сторінки: 1 2 3