Автореферат Англомовна термінологія штучного інтелекту в контексті інших терміносистем (досвід лінгвостатистичного аналізу)

Автореферат - Англомовна термінологія штучного інтелекту в контексті інших терміносистем (досвід лінгвостатистичного аналізу)

Загрузка...

порожня

КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ ЛІНГВІСТИЧНИЙ УНІВЕРСИТЕТ

Сліпецька Віра Дмитрівна

УДК 811.111’373’46+81-114

Англомовна термінологія штучного інтелекту
в контексті інших терміносистем

(досвід лінгвостатистичного аналізу)

Спеціальність 10.02.04 – германські мови

Автореферат

дисертації на здобуття наукового ступеня

кандидата філологічних наук

КИЇВ – 2008

Дисертацією є рукопис.

Робота виконана на кафедрі англійської філології Київського національного лінгвістичного університету, Міністерство освіти і науки України.

Науковий керівник доктор філологічних наук, професор

Скороходько Едуард Федорович,

Український інститут лінгвістики і менеджменту,

кафедра прикладної лінгвістики, професор

Офіційні опоненти: доктор філологічних наук, професор

Левицький Віктор Васильович,

Чернівецький національний університет

імені Юрія Федьковича,

кафедра германського, загального

та порівняльного мовознавства, завідувач кафедри

кандидат філологічних наук

Грицьків Андрій Васильович,

Тернопільський національний економічний університет,

кафедра іноземних мов, доцент

Захист відбудеться 15.05.2008 р. о 10-30 годині на засіданні спеціалізованої вченої ради Д 26.054.02 Київського національного лінгвістичного університету (03680, МСП, м. Київ-150, вул. Червоноармійська, 73).

З дисертацією можна ознайомитись у науковій бібліотеці Київського національного лінгвістичного університету (м. Київ, вул. Червоноармійська, 73).

Автореферат розісланий 12.04.2008 р.

Учений секретар

спеціалізованої вченої ради,

професор О.М. Кагановська

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Упродовж останніх десятиріч термін як лінгвістичний феномен привернув увагу вчених у галузі не тільки термінознавства, але й загального мовознавства (В.Ф.Новодранова, M.L’Homme). З одного боку, це пов’язане з розвитком лінгвістичної науки про термін – природним процесом переходу від переважно описових розвідок до теоретичного узагальнення одержаних результатів (C.В.Гриньов, Т.Castellvi), дедалі глибшим усвідомленням ролі терміна в науковому дискурсі (Е.Ф.Скороходько). З іншого боку, впливають зовнішні чинники, серед яких не останнє місце посідають проблеми лінгвістичного забезпечення систем штучного інтелекту: автоматичний переклад, інформаційний пошук, реферування, видобування знань із текстових баз даних (K.Spark Jones). Проблеми лінгвістичного забезпечення систем штучного інтелекту стали особливо відчутними, враховуючи величезний обсяг текстових документів у мережі Інтернет. Ці проблеми знову вже на новому рівні актуалізували питання про характерні ознаки терміна і його ідентифікацію в тексті (F.Ville-Ometz).
З’явився навіть новий напрям досліджень, на стику термінознавства,
інформатики та комп’ютерних технологій, – автоматичне розпізнавання термінів
у тексті (К.Каgeura).

Незважаючи на значну кількість праць, присвячених науковій термінології, окремі терміносистеми залишаються практично не дослідженими. До них належить, зокрема, термінологія однієї з новітніх галузей знання – штучного інтелекту. Перебуваючи на стадії становлення, вона включає багато неологізмів (зокрема, авторських, уперше використаних у конкретному тексті), які не зафіксовані в термінографічних джерелах. Штучний інтелект належить до галузей знання, у яких домінує інтелектуальний складник. У таких галузях шлях творення термінів, як правило, починається не від ремісничої лексики, що характерне для більшості галузевих термінологій, а від авторських неологізмів: авторський неологізм > ,,стихійний” термін > загальноприйнятий (стандартизований) термін (Е.Ф.Скороходько). Внаслідок цього вивчення термінології штучного інтелекту сприятиме глибшому розумінню сучасних механізмів термінотворення. Крім того, слід зазначити, що поза увагою дослідників залишилися два важливі аспекти. Йдеться про термінологічний складник наукового тексту в усій його повноті
та про контрастивний аналіз термінологій у межах однієї мови. Науковий текст
з будь-якої тематики містить не тільки спеціальні (галузеві) терміни, але
й загальнонаукову лексику, а також терміни інших галузей (екстрагалузеві терміни). Мовні характеристики термінів різних категорій, так само, як їх функціонування в тексті, мають специфіку, яка до цього часу не стала об’єктом дослідження. Адже в більшості термінознавчих праць досліджується або термінологія взагалі – як специфічний шар лексики, або термінологія певної галузі (І.М.Гумовська, О.І.Гутиряк, Е.Т.Дерді, З.Б.Куделько, Г.Б.Фогель, О.В.Харченко та ін.). До того ж відчувається відсутність контрастивних студій термінологій в межах однієї мови, незважаючи на те, що зіставленню термінів різних мов (переважно під кутом зору перекладацької проблематики) приділено певну увагу (Ф.А.Циткіна). Це питання розглядається і в працях з перекладу (В.І.Карабан, Е.Ф.Скороходько). Проте комплексне зіставлення різних галузевих термінологій в межах однієї мови не виконувалося.

Актуальність теми дисертаційного дослідження визначається загальною тенденцією сучасного мовознавства, спрямованою на зіставні студії. Йдеться про зіставлення різних термінологічних систем в межах тієї самої мови. Крім того,
у зв’язку з накопиченням величезної кількості текстових документів у мережі Інтернету загострилася проблема автоматичного розпізнавання термінів (для наступного реферування та інформаційного пошуку). Це, у свою чергу, потребує кількісного опису формальних характеристик термінів.

Зв’язок роботи з науковими темами. Дисертацію виконано в межах комплексної теми кафедри англійської філології Київського національного лінгвістичного університету ,,Мовні системи. Динаміка функціонування фонетичних, граматичних та лексичних одиниць: когнітивний та
комунікативно-прагматичний аспекти (германські, романські та українська мови)” (тема затверджена вченою радою КНЛУ, протокол № 2 від 26 вересня 2005 року). Проблематика дисертації вписується в коло питань, досліджуваних згідно
з держбюджетною науковою темою № 0106U002115 ,,Функціональні моделі тексту та дискурсу в синхронії та діахронії: когнітивний, комунікативний та емотивний аспекти” (тема затверджена вченою радою КНЛУ, протокол № 6 від
30 січня 2006 року).

Мета дисертації полягає у встановленні спільних та відмінних рис спеціальних та неспеціальних термінів, які функціонують в обстежених текстах зі штучного інтелекту, матеріалознавста та обробки металу, аерокосмічних технологій та фінансово-економічної справи.

Поставлена мета вимагає розв’язання таких основних завдань:

1. З’ясувати місце термінології штучного інтелекту в термінологічному середовищі сучасної англійської мови.

2. Виявити спільні та відмінні риси структурних і термінотвірних характеристик спеціальних (інтра- та екстрагалузевих) та загальнонаукових термінів у текстах зі штучного інтелекту.

3. Встановити спільні та відмінні риси структурних і термінотвірних характеристик cпеціальних термінів штучного інтелекту та спеціальних термінів у текстах інших галузей знання технічного й гуманітарного напрямів.

4. Визначити спільні та відмінні риси структурних і термінотвірних характеристик екстрагалузевих термінів, які функціонують у текстах зі штучного інтелекту та таких же термінів у текстах інших наукових галузей.

5. Виявити спільні та відмінні риси структурних і термінотвірних характеристик загальнонаукових термінів, які функціонують у текстах зі штучного інтелекту та таких же термінів у текстах інших наукових галузей.

6. Визначити ступінь подібності між досліджуваними термінологіями.

Об’єктом дослідження є англомовні терміни, представлені в наукових текстах зі штучного інтелекту.

Предметом дослідження – структурні та словотвірні характеристики термінів штучного інтелекту в зіставленні з термінами інших галузей через призму лінгвостатичного аналізу.

У дослідженні перевіряється така гіпотеза: існує взаємозв’язок між галузевою і категоріальною належністю терміна та його структурними і термінотвірними характеристиками (довжина терміна, афіксальна модель, частиномовна модель, термінотвірний тип).

Матеріалом дисертаційної роботи слугують наукові статті (теоретичного характеру) технічного та гуманітарного напрямів, опубліковані в 1998-2005 рр. відомим нідерландським видавництвом Elsevier. Англомовні наукові статті репрезентують типологічно різні галузі. Обрано три галузі в межах
технічного напряму й одну – гуманітарного напряму: а) штучний інтелект;
б) теоретичне матеріалознавство й обробка металу; в) аерокосмічні технології;
г) фінансово-економічна справа. Галузі штучного інтелекту та авіакосмічних технологій перебувають на стадії становлення й активного розвитку (хоча
дещо відрізняються за віком), а галузі матеріалознавства та обробки металу, фінансово-економічної справи мають довгу історію і є відносно стабільними. Обрані галузі відрізняються за ступенем їхнього опрацювання у лінгвістичній літературі. Фінансово-економічна термінологія отримала достатнє висвітлення й залучена у роботі виключно для порівняння, а термінологія теоретичного матеріалознавства (властивостей сучасних матеріалів, методів їхнього випробовування, функціональні характеристики тощо) та аерокосмічних технологій (у першу чергу, аеромеханіки, теплофізики, міцності літальних апаратів) залишилися поза увагою вітчизняних дослідників.

Джерельну базу дослідження становлять терміни, отримані шляхом суцільної вибірки з англомовних наукових статей. Загальний обсяг опрацьованого матеріалу – 179117 слововживань (за галузями: штучний інтелект – 62777, матеріалознавство – 28865, аерокосмічні технології – 53086, фінансово-економічна справа – 34189); 5851 термін (за галузями, відповідно: 1499, 1466, 1436, 1450); 21673 терміновживання (відповідно: 8204, 5040, 3010, 5419).

Методи дослідження. Для вирішення поставлених завдань та з огляду на характер фактичного матеріалу в роботі комплексно використовуються такі методи: морфемний аналіз – для встановлення структурних характеристик термінів; словотвірний аналіз та термінотвірний аналіз – для виявлення термінотвірних характеристик; зіставний аналіз – для порівняння термінів різних категорій; елементи аналізу дискурсу – для встановлення функціонування термінів різних категорій у тексті. Для перевірки гіпотез, висунутих у результаті опрацювання емпіричного матеріалу, використано такі статистичні методи: критерій Стьюдента – для перевірки гіпотези прo рівність / нерівність середніх значень та для перевірки гіпотези про рівність / нерівність відсотків (часток); критерій ,,хі-квадрат” – для перевірки гіпотези про зв’язок між категоріальними ознаками; кластерний аналіз – для визначення ступеня подібності між досліджуваними термінологіями.

Наукова новизна дисертаційної праці забезпечується комплексним зіставленням різних галузевих термінологій у межах однієї мови. Вперше наведена характеристика англомовних термінів штучного інтелекту з погляду їхньої структури, утворення та функціонування в науковому дискурсі. Вперше описано продуктивні способи термінотворення у двох галузях сучасної науки: штучного інтелекту та матеріалознавства. Вперше виявлено, що є спільного та відмінного у термінах різних категорій і різних галузей знання щодо їхньої структури, утворення та функціонування в науковому дискурсі. Це уможливило встановлення статистично значущих зв’язків, по-перше, між довжиною термінів різних категорій, галузей та їх частотою; по-друге, між афіксальними моделями та категорією терміна; по-третє, між термінотвірним типом, частиномовною моделлю та категорією терміна, його галузевою належністю. Вперше визначено ступінь подібності між термінологіями штучного інтелекту, матеріалознавства, аерокосмічних технологій та фінансово-економічною.

Теоретичне значення роботи полягає в тому, що вона є внеском
у подальше опрацювання питань, пов’язаних із процесами термінотворення, зокрема в ракурсі зіставного термінознавства. Головні положення дисертаційного дослідження слугують підґрунтям для глибшого розуміння процесів термінотворення, залежності частотних, структурних і термінотвірних ознак терміна від галузі знання та категорії. Загальна характеристика англомовної термінології штучного інтелекту є внеском у теорію термінології взагалі та англомовних термінологій зокрема. Представлений у дисертації матеріал може слугувати основою зіставних досліджень термінологій штучного інтелекту в двох чи більше мовах.

Практичне значення дослідження полягає у можливості використання його основних положень та висновків у викладанні курсу лексикології англійської мови (розділи ,,Словниковий склад англійської мови як система,” ,,Словотвір”), у спецкурсах із термінознавства, а також при написанні курсових, дипломних та магістерських робіт, при укладанні методичних розробок, посібників та підручників. Фактичний матеріал може бути використаний у лексикографічній практиці при укладанні частотних словників. Запропоновані в нашій праці підходи та механізми можуть бути використані також у працях з питань українського, російського термінознавства.

Апробація роботи. Результати дослідження обговорювалися на п’яти наукових конференціях, у тому числі на чотирьох міжнародних: ,,Актуальні проблеми германської філології в Україні та Болонський процес” (Чернівці, 2007), ,,Сучасні проблеми лінгвістичних досліджень та дидактичні особливості викладання іноземних мов професійного спілкування у вищій школі”
(Львів, 2007), ,,Етнокультурні цінності і сучасна філологія” (Рівне, 2006), ,,Наука та практика 2007” (Полтава 2007); на V Міжвузівській конференції молодих учених ,,Сучасні проблеми та перспективи дослідження романських і германських мов і літератур” (Донецьк, 2007).

Публікації. Основні положення та результати дослідження відображені у дев’яти публікаціях: чотирьох статтях, три з яких опубліковані у фахових виданнях ВАК України (2,15 др. арк.), та чотирьох тезах доповідей на наукових конференціях. У співавторстві з Е.Ф.Скороходьком написано перший розділ монографії. Робота у співавторстві полягала у вибірці термінів, у здійсненні їх статистичної обробки та інтерпретації отриманих результатів. Загальний обсяг публікацій – 3,46 др. арк.

Загальний обсяг роботи. Обсяг тексту дисертації складає 165 сторінок, загальний обсяг праці разом із бібліографією і додатками становить 347 сторінок (додатки 153 сторінки). Список використаних бібліографічних джерел включає 202 позиції. Список термінологічних джерел включає 43 позиції.

Структура та обсяг роботи. Дисертація складається зі вступу, трьох розділів, загальних висновків, списку використаних бібліографічних джерел, списку джерел ілюстративного матеріалу, списку термінологічних джерел, додатків.

У вступі обґрунтовано вибір теми дисертації, визначено її актуальність і новизна, вказано об’єкт і предмет, сформульовано мету та завдання праці, розкрито теоретичне та практичне значення, описано матеріал дослідження та методи його аналізу, сформульовано основні положення, що виносяться на захист.

У першому розділі розглянуто проблеми визначення терміна, термінології та терміносистеми, описано вимоги до терміна, висвітлено процедури стратифікаційного аналізу термінологічної лексики; викладено основні теоретичні положення та методологічні засади дослідження, пов’язані з ідентифікацією термінів у науковому тексті; охарактеризовано використані в роботі статистичні методи дослідження і обґрунтовано їх використання.

У другому розділі описано термінологічну складову англомовних текстів зі штучного інтелекту; визначено частоту термінів; проаналізовано довжину термінів, частиномовні моделі, суфіксальні моделі (структурний і термінотвірний аспекти), термінотвірні типи; розглянуто три категорії термінів: спеціальних інтрагалузевих термінів штучного інтелекту, спеціальних термінів (екстрагалузевих) суміжних термінологій, а також загальнонаукових термінів, які зустрічаються в цих англомовних текстах.

Третій розділ присвячено зіставленню спеціальних та неспеціальних термінів в англомовних наукових текстах різних галузей; описано термінологічну складову англомовних текстів з матеріалознавства та обробки металу; визначено ступінь подібності чотирьох розглянутих термінологій; зіставлено термінологію штучного інтелекту з термінологією матеріалознавства та обробки металу.

У загальних висновках відображено основні результати дослідження; підведені підсумки роботи; окреслено перспективи подальших досліджень.

Додатки обсягом 153 сторінки складаються з 5 частин, у яких представлено таблиці, що ілюструють характеристики досліджуваних термінів.

ОСНОВНИЙ ЗМІСТ

Розділ 1. ,,Теоретичні та методологічні засади дослідження”.
У вітчизняному та зарубіжному термінознавстві дослідження можна поділити на два напрями: роботи загальнотеоретичного характеру (Б.М.Головін, С.В.Гриньов, І.С.Квітко, Т.Р.Кияк, Т.Chung, H.Felber) та описи окремих термінологічних об’єднань (П.В.Войко, О.В.Константінова, З.Б.Куделько, Г.Б.Фогель та ін.). У той же час, поставлена в цій праці мета у доступних нам роботах не визначалася.

Слід зазначити, що в основі нашого дослідження лежить низка теоретичних положень, часто дискусійних (розуміння наукового терміна, стратифікація термінологічної лексики наукового тексту тощо), яким уже була присвячена не одна праця. Дослідники переважно по-різному розуміють поняття ,,термін”. Існує два підходи щодо визначення терміна: структурно-субстанційний та функціональний. Прихильники структурно-субстанційного підходу розглядають термін як особливе слово, яке протиставляється за своєю семантичною
і граматичною структурою загальновживаному (Д.С.Лотте, Т.Л.Канделакі). Прихильниками функціонального підходу було доведено, що термін – це функція, тип вживання лексичної одиниці, а не особливий тип лексичної одиниці (Б.М.Головін, В.М.Лейчик, Т.Р.Кияк, Е.Ф.Скороходько). У дослідженні ми дотримувались концепції про функціональну природу терміна. Е.Ф.Скороходько розуміє термін як слово чи усталене словосполучення, яке виражає спеціальне поняття науки, техніки або іншої галузі людської діяльності та має дефініцію, яка розкриває ті ознаки цього поняття, що є релевантними саме для тієї галузі.
Це визначення терміна вважатимемо найбільш адекватним, тому що воно:
а) охоплює найважливіші ознаки терміна, такі, як наявність дефініції, його системність, обмежена сфера вживання; б) робить акцент на характері дефініції, адже саме дефініція включає термін у відповідну термінологічну систему;
в) поширюється також на загальнонаукову термінологію. Виходячи з цих характеристик, надалі спиратимемося на цю дефініцію.

У вітчизняному і зарубіжному термінознавстві існують протилежні погляди на поняття ,,термінологія” та ,,терміносистема”: а) ці терміни вважаються синонімічними (К.Я.Авербух; Е.Ф.Скороходько); б) терміни ,,термінологія”
і ,,терміносистема” – не синонімічні (В.М.Лейчик). При першому із зазначених підходів терміносистема – це термінологія, у якій експліцитно представлені її системні властивості (К.Я.Авербух). Терміни ,,термінологія” і ,,терміносистема” виступають у визначенні К.Я.Авербуха як гіперонім та гіпонім. В.М.Лейчик дещо по-іншому розуміє ці поняття. Відмінність між термінологіями та терміносистемами, на його думку, полягає у способі їх утворення. Відповідно до цього підходу, термінології утворюються стихійно, у міру накопичення знань. Терміносистеми свідомо конструюються після того, як сформувалася теорія. Говорячи про термінологію, дослідники розрізняють: а) науку про терміни (термінознавство); б) фахову лексику в складі всіх слів певної мови (наприклад, термінологія німецької мови); в) спеціальну лексику, що обслуговує певну галузь науки чи техніки (А.С.Д’яков, Т.Р.Кияк, З.Б.Куделько). Проте крім цих значень
у термін ,,термінологія” вкладають додатково різні смислові відтінки: всю сукупність термінів, незалежно від того, чи упорядкована вона, чи ні. За ознакою упорядкованості термінологія мови поділяється на упорядковану (стандартизовану) та на стихійну (Е.Ф.Скороходько). Термінології, не тільки стандартизованій, але й стихійній, як і лексиці в цілому, притаманна системність. Між термінами існують різноманітні відношення – семантичні, етимологічні, словотворчі тощо. Тому будь-яку термінологію можна назвати термінологічною системою. У працях термінологів часто неявно під терміносистемою розуміють систему упорядкованих термінів. Таким чином, по суті, термінологія
і термінологічна система (терміносистема) – синоніми. Синонімічність термінів ,,термінологія” і ,,термінологічна система” (,,терміносистема”) підтверджується тим, що навіть у нормативних документах вищого рівня (стандартах на терміни
й визначення), які репрезентують упорядковані термінології, вживається виключно назва термінологія. Ми дотримуємося позиції, що терміни ,,термінологія” і ,,терміносистема” синонімічні.

Існують різні погляди і на стратифікацію лексичної складової наукового тексту. Розбіжності стосуються, головним чином, статусу загальнонаукової лексики. Одні дослідники виділяють її як окрему категорію, поряд із термінологічною та загальнолітературною лексикою (М.М.Глушко), інші зараховують її до специфічного шару термінології (С.В.Шепітько). Ми поділяємо погляд С.В.Шепітько і в цій роботі обмежуємося аналізом термінологічної лексики й розрізняємо три категорії термінів, які функціонують у науковому тексті: інтрагалузеві терміни, які належать галузі знання, представником якої
є відповідний текст, екстрагалузеві терміни, які належать суміжній галузі знання, і загальнонаукові терміни.

Упродовж останніх десятиріч активізувалися спроби розв’язати проблему ідентифікації термінів у тексті. Ці спроби зумовлені необхідністю вироблення методів автоматичного розпізнавання термінів у тексті для систем штучного інтелекту. Ці методи вписуються в рамки двох основних підходів: статистичного (Т.Chung, U.Kiyotaka) та лінгвістичного (P.Drouin, M.Hong). Характерним для першого підходу є метод Т.Чанг, яка пропонує ідентифікувати терміни, порівнюючи частоту слова в текстах різного характеру й різного змісту. Недоліком чисто статистичних методів автоматичного розпізнавання термінів
у текстах є те, що сама по собі частота не може слугувати критерієм розмежування термінів і нетермінів. Автори лінгвістичних методів автоматичного розпізнавання термінів у текстах аналізують належність компонентів лексичної одиниці до тих чи інших частин мови (P.Drouin, M.Hong), використовують лексичні функції теорії ,,значення-текст” (B.Orliac), ідентифікують термін за його мовним оточенням
у тексті (H.Fulford). Усі спроби автоматизувати розпізнавання термінів у тексті можна вважати успішними лише частково. Ефективність подібних методів невелика. Ідентифікуються не більше 70% термінів тексту (H.Nakagawa). Це не дивує, адже автори методів автоматичного розпізнавання термінів у тексті вимушені шукати вихід у створенні чисто формальних, кількісних методик. Але мова, наукова у тому числі, не є формальною системою. Тому формальних ознак, які б дозволили чітко розрізняти термін від нетерміна, не існує. Ознаки, які фігурують у визначеннях терміна (до того ж, здебільшого неузгоджених, часто суперечливих), теж не можуть слугувати критеріями термінологічності. Можна погодитися з думкою С.В.Гриньова, Е.Ф.Скороходька, що взагалі не існує чіткої межі між терміном і нетерміном. Е.Ф.Скороходько вважає некоректним саму постановку питання типу ,,Це термін чи нетермін?” і наполягає на тому, що натомість слід говорити про ступінь термінологічності.

Відсутність чіткого критерію визначення термінологічності й неможливість його формулювання на сучасній стадії розвитку термінознавства залишають єдиний шлях відбору фахової лексики з текстів: комплексну методику ідентифікації термінів у науковому тексті. Ця методика спирається, передусім,
на аналіз контексту. Враховуються безпосередня чи опосередкована наявність дефініції, структура мовної одиниці, її сполучуваність з іншими одиницями
у межах досліджуваного тексту, можливість переосмислення компонентів.

Розділ 2. ,,Міжкатегоріальні зіставлення спеціальних та неспеціальних термінів у англомовних наукових текстах зі штучного інтелекту”. Кожний науковий текст, крім термінів, що позначають реалії відповідної галузі (інтрагалузевих термінів), містить екстрагалузеві терміни, а також загальнонаукові терміни. Не є винятком тексти зі штучного інтелекту. Інтрагалузеві терміни
в обстежених текстах становлять 74,6% (1118 одиниць). Характер інтрагалузевих термінів ілюструють такі приклади: digital image scene, edge detection (розпізнавання образів); data mining (видобування знань); concept-tree clustering (доведення теорем). Тексти зі штучного інтелекту містять терміни статистики, наприклад: correlation coefficient, integral square error; математики, наприклад: cluster analysis, Euclidean metric; обчислювальної техніки та інформатики, наприклад: on-line system, relational database; мовознавства, наприклад: antonymy relation, discourse structure; загальнонаукові терміни, наприклад: degree, dimension. Екстрагалузеві терміни у текстах зі штучного інтелекту складають, за нашими підрахунками, 8,4% (126 одиниць); загальнонаукові – 17,0% (255 одиниць) від загальної кількості термінологічних одиниць, а за кількістю терміновживань, відповідно, 11,9% та 31,6%. Таким чином, частка неспеціальних термінів
у наукових текстах зі штучного інтелекту значна. Проте бракує досліджень, присвячених з’ясуванню специфіки цих структурних і термінотвірних моделей термінів цих категорій.

Англомовна термінологія, як і більшість сучасних термінологічних систем, складається з лексичних одиниць двох типів: одно- та багатокомпонентних термінів (за компонент приймаємо кореневу морфему). До останніх належать
як складні слова і словосполучення, так і одиниці з невизначеним чи
перехідним статусом (Д.І.Квеселевич; Е.Ф.Скороходько). Кількість компонентів терміна називатимемо його довжиною. Серед досліджених термінів, які функціонують у текстах зі штучного інтелекту виявилося 395 однокомпонентних
і 1104 багатокомпонентних одиниць (які налічують дві й більше кореневі морфеми), що становить 26% і 74% відповідно. Це характеризує загальну тенденцію сучасного термінотворення, яка полягає у використанні складних синтаксичних одиниць. С.В.Гриньов стверджує, що 60–95% термінів в сучасних європейських мовах – це багатокомпонентні одиниці. Проте частка багатокомпонентних одиниць серед термінів різних категорій суттєво відрізняється. Якщо серед інтрагалузевих термінів 88% – багатокомпонентні одиниці, то серед екстрагалузевих їх 63%, а серед загальнонаукових – лише 8%.
У середньому інтрагалузевий термін налічує 2,275, екстрагалузевий – 1,817, загальнонауковий – 1,075 компонентів. Різниця – статистично значуща: в усіх випадках імовірність помилки практично дорівнює нулеві, довірчі інтервали не перетинаються. Найбільша довжина інтрагалузевого терміна – 6 компонентів, екстрагалузевого – 4, загальнонаукового – 3 компоненти. Результати дослідження надають можливість зробити висновок про те, що існує зв’язок між довжиною та категорією терміна. У середньому структурно найскладнішими виявилися інтрагалузеві терміни, найпростішими – загальнонаукові. Якщо прийняти середню довжину загальнонаукового терміна за одиницю, то співвідношення за цим параметром між інтрагалузевими, екстрагалузевими та загальнонауковими термінами, які функціонують у текстах зі штучного інтелекту, можна представити як 2,12 : 1,69 : 1,00.

Наша вибірка серед термінів, які функціонують у англомовних наукових текстах зі штучного інтелекту, налічує 395 однокомпонентних одиниць:
111 інтрагалузевих, 47 екстрагалузевих, 237 загальнонаукових. Практична неможливість передати всі поняття штучного інтелекту за допомогою однокомпонентних термінів веде до утворення структурно складніших одиниць – термінів-композитів та словосполучень. До найважливіших характеристик багатокомпонентних термінів належать частиномовна модель та термінотвірний тип терміна. Багатокомпонентні терміни, які функціонують у текстах зі штучного інтелекту, описуються 54 частиномовними моделями. Із цієї кількості
52 припадають на інтрагалузеві терміни, 11 – на екстрагалузеві й лише 5 – на загальнонаукові. Спільними для всіх трьох категорій термінів є три моделі, де
N – іменник, А – прикметник: NN, AN, ANN. Серед інтрагалузевих термінів продуктивними є такі моделі: NN, AN, NNN, ANN, NAN, ANNN. Майже половина багатокомпонентних термінів належить до моделі NN. Домінування утворень цього типу пояснюється, з одного боку, тенденцією до лаконічності та спрощення мовних форм, з іншого – широким діапазоном семантичних відношень, які здатна передавати конструкція NN. Перш за все, це об’єктні, суб’єктні, інструментальні відношення. У текстах галузі штучного інтелекту часто йдеться про ситуацію дії та про її окремі складники – об’єкт, інструмент чи результат дії, наприклад: chaining algorithm, character classification, data analysis.

Афікс несе певну інформацію про семантику терміна, незалежно від того, чи брав він участь у процесі термінотворення, чи ні. Тому була підрахована також частота фінальних суфіксів одно- та багатокомпонентних одиниць у структурі термінів штучного інтелекту. В останніх враховувався фінальний суфікс ядерного компонента. Так, у терміні error-tolerant graph isomorphism detection брався до уваги лише суфікс _ion. За критерієм хі-квадрат фіксується зв’язок між фінальними суфіксами та категорією термінів. Сила зв’язку (V Кремера) дорівнює 0,325.

За способом творення серед інтрагалузевих термінів штучного інтелекту домінують складні слова, серед екстрагалузевих – складні слова та словосполучення (різниця частот цих одиниць статистично не суттєва). Натомість загальнонаукові терміни, переважно однокомпонентні, – це частіше афіксальні утворення. Стосовно цієї ознаки термінів так само простежується зв’язок між категорією терміна і його термінотвірним типом. Сила зв’язку середня: V Кремера дорівнює 0,546. Таким чином, можна констатувати, що як за структурними, так
і за термінотвірними ознаками одиниці трьох розглянутих категорій – інтрагалузевих, екстрагалузевих та загальнонаукових термінів – суттєво відрізняються. Перша відмінність стосується структурної складності термінів. Найскладніші (й найдовші) в середньому інтрагалузеві терміни, найпростіші
(й найкоротші) – загальнонаукові. Цю відмінність можна інтерпретувати як таку, що віддзеркалює загальні лінгвістичні закони, зокрема закон економії мовленнєвих зусиль. Інтрагалузеві терміни охоплюють діапазон мовних засобів, що номінують увесь спектр наукових понять штучного інтелекту. Як у кожній науці, більшість останніх – складні вузькоспеціальні поняття. Терміни, що виражають складні наукові поняття (за класифікацією Е.Ф.Скороходька, ,,інформативні маркери”), мають, відповідно, складну семантичну структуру. Враховуючи тенденцію термінів до повнозначності (максимального віддзеркалення суттєвих ознак поняття) це неминуче призводить до ускладнення морфологічної та/чи синтаксичної структури мовної одиниці. З іншого боку, ці терміни функціонують переважно в текстах однієї галузі і мають меншу частоту вживання. Тому відносно громіздкі інформативні маркери менше відкидаються мовою. Екстрагалузеві терміни – це терміни наукових дисциплін, які використовуються в текстах різних галузей. Звідси випливає, що це такі спеціальні терміни, які виражають поняття більш-менш широкої сфери функціонування, тобто певні базові поняття (за класифікацією Е.Ф.Скороходька, ,,індикативні маркери”). Частота їхнього вживання більша, порівняно з інформативними маркерами та інтрагалузевими термінами в цілому. Отже, вони повинні більшою мірою підлягати дії закону економії, краще відповідати прагматичним вимогам лаконічності, структурної повноти, що й демонструє наше дослідження. Загальнонаукові терміни мають найширшу сферу функціонування. Тому вони найкоротші та найчастотніші.

Друга відмінність стосується різноманітності мовних форм. Кількість частиномовних моделей, реалізованих в інтрагалузевих, екстрагалузевих та загальнонаукових термінах, які функціонують у текстах зі штучного інтелекту, виражається співвідношенням 10,4 : 2,2 : 1. Імовірно, це корелює з довжиною термінів різних категорій. Терміни різних категорій істотно відрізняються й за продуктивністю частиномовних моделей. Із двох найпродуктивніших моделей – NN та AN – серед інтрагалузевих термінів домінує перша, а серед загальнонаукових – друга. Серед екстрагалузевих термінів різниця продуктивності цих моделей статистично не значуща. Домінування утворень типу NN серед інтрагалузевих термінів пояснюється тенденцією до лаконічності та спрощення мовних форм і широким діапазоном семантичних відношень, що їх здатна передавати ця конструкція. Використання моделі NN, безумовно, відповідає потребам мовця, тут – автора наукового твору. Але її переваги, зокрема її ,,поліреляційність”, мають також негативні наслідки. Якщо словосполучення типу AN найчастіше виражає певне відношення експліцитно, то модель NN – імпліцитно (пор. паралельні форми decomposition of graphs / graph decomposition, beveled cut / bevel cut). Звідси – реляційна розмитість цих форм. Термін decomposition algorithm може означати як алгоритм, що здійснює декомпозицію, так і алгоритм, який здійснює якусь іншу операцію шляхом декомпозиції (виступаючи у цьому значенні як скорочена форма decomposition based algorithm). Таким чином, читачу доводиться докладати додаткові розумові зусилля на дешифрування смислу таких виразів. Якщо стосовно інтрагалузевих термінів це певною мірою компенсується фаховими знаннями читача, то екстрагалузеві терміни типу NN несуть загрозу хибного розуміння. Істотно різниться й продуктивність різних способів термінотворення. За цим параметром співвідношення кількості інтрагалузевих, екстрагалузевих та загальнонаукових термінів таке: а) основоскладання – 52,91 : 3,18 : 1; б) синтаксичне термінотворення – 63,00 : 6,83 : 1; в) морфологічне (афіксальне) термінотворення – 0,26 : 0,13 : 1; г) семантичне термінотворення – 1,22 : 0,34 : 1. Деякі з відмінностей (пов’язаних, наприклад, зі структурною складністю терміна, поширеністю чисто іменникових утворень типу NN, NNN тощо) можна інтерпретувати як такі, що віддзеркалюють загальні лінгвістичні закони або особливості англійської мови.

Розділ 3. ,,Міжгалузеві зіставлення спеціальних та неспеціальних термінів у англомовних наукових текстах різних галузей”. Для з’ясування, що
є спільного й відмінного між термінами, які функціонують у наукових англомовних текстах зі штучного інтелекту й текстах інших наукових галузей, розглядатимемо окремо інтрагалузеві, екстрагалузеві та загальнонаукові терміни. Довжина інтрагалузевих термінів у чотирьох досліджених термінологіях становить у середньому 2,381 компонента, за галузями: штучний інтелект – 2,275, аерокосмічні технології – 2,728, матеріалознавство – 2,248, фінансово-економічна справа – 2,262. У трьох випадках (штучний інтелект, матеріалознавство, фінансово-економічна справа) різниця неістотна. Проте аерокосмічні терміни демонструють більшу, порівняно з трьома іншими галузями, довжину. В усіх чотирьох термінологіях розподіл термінів має багато спільного. Близько половини термінів припадає на двокомпонентні одиниці, чверть – на трикомпонентні, приблизно 10% – на однокомпонентні терміни. З поміж чотирьох термінологій дещо вирізняється за розподілом аерокосмічна. У ній відносно менше одно- та двокомпонентних одиниць, натомість більше довших термінів. Крім того, це єдина термінологія, в якій ми зареєстрували семи- та восьмикомпонентні одиниці, наприклад: augmented frequency-dependent pressurе coupled combustion response. Однак слід констатувати, що тенденції розподілу залишаються незмінними. Таким чином, враховуючи, що чотири досліджені терміносистеми належать до різних
за характером галузей знання, можна зробити висновок, що розподіл термінів
за довжиною – це одна з термінологічних універсалій.

Ураховуючи, що в сучасних термінологіях багатокомпонентні одиниці становлять до 80-90% термінів, увага до їхньої структури видається правомірною. Обстежені інтрагалузеві терміни належать до 149 різних частиномовних моделей. Найбільш різноманітними у цьому відношенні є аерокосмічні терміни: вони побудовані за 104 моделями (70% від загальної кількості моделей).
Інші дисципліни використовують меншу кількість моделей: у штучному інтелекті – 52 (35%), матеріалознавстві – 50 (34%), фінансово-економічній галузі – 56 (38%). Частково це пояснюється тим, що в аерокосмічній термінології кількість трикомпонентних, шестикомпонентних одиниць суттєво перевищує кількість таких термінів у інших галузях. Імовірно, що кількість моделей корелює
з кількістю термінів. Крім того, серед аерокосмічних термінів є
семи-восьмикомпонентні одиниці, відсутні в інших термінологіях. Статистично значуща різниця кількості термінів однієї моделі в різних термінологіях, тобто її різна продуктивність, дозволяє висунути припущення, що саме в цьому й полягає відмінність між дослідженими термінологіями. Для додаткової перевірки цієї гіпотези використано критерій ,,хі-квадрат”. Попарне зіставлення продуктивних моделей за цим критерієм так само показало, що зв’язок між галуззю та частиномовною моделлю існує. В усіх випадках різниця продуктивності статистично значуща: у парах ,,штучний інтелект :: аерокосмічна технологія” та ,,штучний інтелект :: фінансово-економічна справа” імовірність помилки не перевищує 0,00000. В парі ,,штучний інтелект :: матеріалознавство” – 0,02446. Одна з головних вимог до зіставного аналізу термінології – уніфікація опису порівнюваних об’єктів, оскільки важливо максимально зменшити вплив суб’єктивних чинників. Семантичні характеристики не мають формального вираження. Проте семантичну категорію терміна певною мірою віддзеркалює фінальний суфікс. З цією метою виділено три групи суфіксів. До першої ввійшли суфікси, пов’язані із ситуацією дії, які формують назви дії, а також суб’єкта, об’єкта, інструмента, результату дії, наприклад: -er, -ing, -ion, -ment, -or, -tor. Друга охоплює суфікси зі значенням властивості, якості: -ance, -ness, -ity, третя надає абстрактного значення, наприклад: _age, -cy, -ics, -ism, -ity, -ure, Це найтиповіші значення, наприклад: laser welding, acquisition, measurement, actuator, air compressor; base metal resistance, salience, robustness, velocity; strong semantic linkage, dominant frequency, structural dynamics, graph isomorphism, nominal geometric magnitude. Виявилося, що існує зв’язок між галуззю науки й кількістю термінів, оформлених суфіксами різних груп. Кількість інтрагалузевих термінів, що стосуються дії, у термінології штучного інтелекту істотно перевищує кількість термінів у інших галузях: 79% від загальної кількості термінів із фінальним суфіксом, у той час як у решті термінологій налічується 64% таких термінів. Натомість кількість термінів на позначення якостей, властивостей, ознак
у термінології штучного інтелекту істотно менша, ніж у термінологіях матеріалознавства й фінансово-економічній: 13% проти 21-22%. Кількість таких термінів в аерокосмічній термінології (15%) відрізняється не істотно. Так само термінологія штучного інтелекту містить істотно менше термінів з абстрактним значенням, ніж решта термінологій: 8% проти 13-21%. Перевірка за критерієм
,,хі квадрат” показує, що існує зв’язок між галузевою належністю терміна та його семантичною категорією (встановленою за структурним фінальним суфіксом). Сила зв’язку невелика: V Кремера дорівнює 0,120. Виявлену залежність можна пояснити характером референтного субстрату. Штучний інтелект спрямований на створення систем, які імітують людську діяльність.

Найчисленнішими в усіх чотирьох термінологіях, як і можна було чекати, враховуючи попередні результати, виявилися складні слова й словосполучення. На ці два типи одиниць припадає у кожній галузі від 77 до 86% інтрагалузевих термінів. У той же час питома вага термінів цих двох типів у різних термінологіях неоднакова. Частка складних слів у термінології штучного інтелекту перевищує аналогічний показник в усіх інших терміносистемах, за винятком матеріалознавства. Натомість частка словосполучень у термінології штучного інтелекту більша, ніж у термінології матеріалознавства. Загалом зв’язок між термінотвірним типом та галузевою належністю терміна існує. Сила зв’язку
(V Кремера) дорівнює 0,169. В усіх чотирьох термінологіях найбільша
кількість складних слів побудована поєднанням двох, трьох чи чотирьох іменникових основ. За частиномовною моделлю NN у термінології штучного інтелекту створено 440 термінів (75,60% від кількості складних слів у цій терміносистемі), в аерокосмічній – 295 (60,57%), у матеріалознавчій –
479 (73,47%), у фінансово-економічній (274%). За моделлю NNN, відповідно,
110 (18,90%), 144 (29,57%), 131 (20,09%), 76 (20,21%), а за моделлю NNNN –
12 (2,06%), 20 (4,11%), 22 (3,37%), 11 (2.93%) термінів. Загальна кількість частиномовних моделей термінів-словосполучень – 87. З них термінології штучного інтелекту належить 40, аерокосмічній – 53, матеріалознавчій термінології – 29, фінансово-економічній – 45. Спільними для чотирьох термінологій є тринадцять моделей, де Ad – прислівник, P1 – дієприкметник теперішнього часу, P2 – дієприкметник минулого часу, Prep – прийменник, наприклад: AN, ANN, AAN, ANNN, NAN, P1N, NPrepN, P2N, AdAN, AANN, NANN, N’sN, ANANN.

Серед трансформів (Е.Ф.Скороходько), або семантичних дериватів, у всіх досліджених термінологіях наявні як кореневі слова, так і афіксальні утворення, тобто одиниці, які приєднали суфікс чи префікс на стадії утворення побутового чи загальнолітературного слова. До першої групи в термінології штучного інтелекту належать 48 термінів (78,69% від загальної кількості трансформів у цій термінології), в аерокосмічній – 37 (86,05%), у матеріалознавчій – 58 (90,63%),
у фінансово-економічній – 12 (75,00%). Різниця статистично незначуща, можливо, через малу кількість трансформів. Як і в термінології штучного інтелекту, найчастіше спостерігається звуження значення, наприклад: flap ‘закрилок’.

Джерелом екстрагалузевих термінів у текстах різних галузей є низка наукових дисциплін. Головними донорами виступають біологія,
інформатика, математика, машинобудування, механіка, статистика, фізика, хімія. У текстах зі штучного інтелекту, на відміну від інших галузей, домінують
терміни математики, статистики, інформатики. Три найчастотніших екстрагалузевих терміни тут є представниками математики: set ‘множина’
(180 входжень, або 18,44% від загальної кількості вживань суміжних термінів), vertex ‘вершина графа’ (частота 111, або 11,37%), node ‘вузол графа’ (85, або 8,71%). У текстах з аерокосмічних технологій домінують терміни фізики та математики, з матеріалознавства – статистики, математики та машинобудування,
у текстах з фінансово-економічної справи – статистичні терміни та терміни машинобудування. Екстрагалузеві терміни, виявлені в текстах чотирьох галузей, представляють усі термінотвірні типи, за винятком абревіатур, присутніх лише
в текстах зі штучного інтелекту. Відмінності між термінотвірними типами екстрагалузевих термінів у різних галузях полягають у кількісному співвідношенні. Таким чином, як за складом, так і за деякими структурними
і термінотвірними характеристиками екстрагалузеві терміни у текстах різних наукових галузей мають суттєві відмінності. Очевидно, що і тут ці відмінності також обумовлені специфікою концептуального і когнітивного наповнення текстів. Розподіл загальнонаукових термінів за частотою в текстах різних галузей виявляє істотні розбіжності. Наприклад, якщо в текстах зі штучного інтелекту термін model має найвищий – перший – ранг, тобто є найчастотнішим (131 вживання, 5% від уживань усіх термінів цієї категорії), у текстах
інших галузей його ранг значно менший і становить 10,5 в термінології авіакосмічних технологій, 54 у матеріалознавстві, 29,5 у фінансово-економічній справі. У текстах із штучного інтелекту акцент робиться на теоретичне моделювання ментальних процесів, в аерокосмічних технологіях домінують методи розрахунків складних конструкцій, у матеріалознавстві – експериментальні дослідження

Сторінки: 1 2

��
��...

Наступні 7 робіт по вашій темі:

▪ ІМУНОФІЗІОЛОГІЧНІ ФАКТОРИ ПРОТИПУХЛИННОГО ЗАХИСТУ МОЛОЧНОЇ ЗАЛОЗИ СОБАК - Автореферат - 24 Стр.
▪ Обґрунтування РАЦІОНАЛЬНИХ ПАРАМЕТРІВ СИСТЕМИ ГІДРОТРАНСПОРТУ ТВЕРДИХ МАТЕРІАЛІВ НА ГІРНИЧИХ ПІДПРИЄМСТВАХ - Автореферат - 22 Стр.
▪ ПОБУДОВА ТРЕНУВАЛЬНОГО ПРОЦЕСУ СПОРТСМЕНІВ РІЗНОЇ КВАЛІФІКАЦІЇ, ЯКІ СПЕЦІАЛІЗУЮТЬСЯ З КІОКУШИНКАЙ КАРАТЕ - Автореферат - 30 Стр.
▪ ВНУТРІШНІ ФУНКЦІЇ ДЕРЖАВИ В УМОВАХ ЧЛЕНСТВА В ЄВРОПЕЙСЬКОМУ СОЮЗІ - Автореферат - 29 Стр.
▪ ВПЛИВ СТРУКТУРНИХ ДЕФЕКТІВ І НАПРУЖЕНЬ НА ФІЗИКО-МЕХАНІЧНІ ВЛАСТИВОСТІ ПЕРЕХІДНИХ МЕТАЛІВ, СПЛАВІВ І СПОЛУК - Автореферат - 44 Стр.
▪ ОБҐРУНТУВАННЯ ПАРАМЕТРІВ ТА УМОВ РОБОТИ БАГАТООПЕРАЦІЙНОЇ ҐРУНТООБРОБНО-ПОСІВНОЇ МАШИНИ ДО ТРАКТОРІВ КЛАСУ 1,4 - Автореферат - 24 Стр.
▪ Теоретико-методологічні основи базової педагогічної освіти майбутніх учителів - Автореферат - 61 Стр.