з жорстко позначеною предметною областю і моделлю представлення знань, тобто не є універсальними.
Придбання знань (knowledge acquisition) - процес наповнення бази знань експертом з використанням спеціалізованих програмних засобів.
Наприклад, система TEIRESIAS [Davis, 1982], що стала прародителькою всіх інструментаріїв для придбання знань, призначена для поповнення бази знань системи MYCIN або її дочірніх гілок, побудованих на "оболонці" EMYCIN [Shortliffe, 1976] в області медичної діагностики з використанням продукційної моделі представлення знань.
Термін формування знань традиційно закріпився за надзвичайно перспективною областю інженерії знань, яка займається розробкою моделей, методів і алгоритмів навчання, що активно розвивається. Вона включає індуктивні моделі формування знань і автоматичного породження гіпотез, наприклад ДСМ-метод [Аншаков, Шпаків, Фінн, 1986] на основі навчальних вибірок, навчання аналогічно і інші методи. Ці моделі дозволяють виявити причинно-наслідкові емпіричні залежності в базах даних з неповною інформацією, що містять структуровані числові і символьні об'єкти (часто в умовах неповноти інформації).
Формування знань (machine learning) - процес аналізу даних і виявлення прихованих закономірностей з використанням спеціального математичного апарату і програмних засобів.
Традиційно до завдань формування знань або машинного навчання відносяться завдання прогнозування, ідентифікація (синтезу) функцій, розшифровки мов, індуктивного висновку і синтезу з додатковою інформацією [Епіфанов, 1984]. У широкому сенсі до навчання по прикладах можна віднести і методи навчання розпізнаванню образів [Аткинсон, 1989; Schwartz, 1988].
Індуктивний висновок правил з фактів застосований також в системах AQ, AQUINAS, KSSI, INSTIL і деяких інших.
Найбільш новітніми серед методів машинного навчання є, мабуть, методи розпізнавання образів, зокрема, підхід алгебри, в якому передбачається збагачення початкових евристичних алгоритмів за допомогою операцій алгебри і побудова сімейства алгоритмів, що гарантує отримання коректного алгоритму для вирішення класу завдань, що вивчається, тобто алгоритму, що правильно класифікує кінцеву вибірку по всіх класах [3]. Проте застосування методів формування знань поки не стало промисловою технологією розробки баз знань.
Для того, щоб ці методи стали елементами технології інтелектуальних систем, необхідно вирішити ряд завдань [9]:
забезпечити механізм сполучення незалежно створених баз даних, що мають різні схеми, з базами знань інтелектуальних систем;
встановити відповідність між набором полий бази даних і безліччю елементів декларативною компоненти бази знань;
виконати перетворення результату роботи алгоритму навчання в спосіб уявлення, підтримуваний програмними засобами інтелектуальної системи.
Крім перерахованих існують також і інші стратегії отримання знань, наприклад, у разі навчання на прикладах (case-based reasoning), коли джерело знань - це безліч прикладів предметної області [1]. Навчання на основі прикладів (прецедентів) включає настроювання алгоритму розпізнавання на завдання за допомогою пред'явлення прикладів, класифікація яких відома [1].
Навчання на прикладах тісно пов'язане з машинним навчанням. Відмінність полягає в тому, що результат навчання у випадку, що розглядається тут, повинен бути інтерпретований в деякій моделі, в якій, можливо, вже містяться факти і закономірності предметної області, і перетворений в спосіб представлення, який допускає використання результату навчання в базі знань, для моделювання міркувань, для роботи механізму пояснення і т. д., тобто робить результат навчання елементом відповідної технології.
Наприклад, в системі INDUCE [Коов і ін., 1988] породжується несуперечливий опис деякого класу об'єктів по безлічі прикладів і контрприкладів даного класу. Як мова уявлення використовується мова змінно-знакової логіки першого порядку (варіант мови багатозначної логіки першого порядку).
Слід зазначити також появу двох нових "прапорів" в стані прихильників методів машинного навчання - це data mining і knowledge discovery. Обидва підходи базуються на аналізі даних і пошуку закономірностей. Таким чином, можна виділити три основні стратегії проведення стадії отримання знань при розробці ЕС (мал. 3.6).
З використанням ЕОМ за наявності відповідного програмного інструментарію, інакше придбання знань.
З використанням програм навчання за наявності репрезентативної (тобто достатньо представницькою) вибірки прикладів ухвалення рішень в предметній області і відповідних пакетів прикладних програм, інакше формування знань.
Без використання обчислювальної техніки шляхом безпосереднього контакту інженера по знаннях і джерела знань (будь то експерт, спеціальна література або інші джерела), інакше витягування знань.
2.3 Теоретичні аспекти витягування знань
Оскільки основною проблемою інженерії знань є процес витягування знаний, інженерові по знаннях необхідно чітко розуміти природу і особливості цих процесів. Для того, щоб розібратися в природі витягування знань, виділимо три основні аспекти цієї процедури:
А = { А1, А2, АЗ} = { психологічний, лінгвістичний, гносеологічний}.
2.3.1 Психологічний аспект витягування знань
З трьох аспектів витягування знань психологічний - А1 - є провідним, оскільки він визначає успішність і ефективність взаємодії інженера по знаннях (аналітика) з основним джерелом знань - експертом-професіоналом. Психологічний аспект виділяється ще і тому, що витягування знань відбувається найчастіше в процесі безпосереднього спілкування розробників системи. А в спілкуванні психологія є домінантною.
Спілкування, або комунікація (від лати. communicatio - зв'язок), - це міждисциплінарне поняття, що позначає всі форми безпосередніх контактів між людьми, - від дружніх до ділових. Воно широко досліджується в психології, філософії, соціології, етології, лінгвістиці, семіотиці і інших науках. Існує декілька десятків теорій спілкування, і єдине, в чому сходяться всі автори, - це складність, багатоплановість процедури спілкування. Підкреслюється, що спілкування - не просто однонаправлений процес передачі повідомлень і не двотактний обмін порціями відомостей, а нерозчленований процес циркуляції інформації, тобто сумісний пошук істини [Каган, 1988].
Отже, спілкування це процес вироблення нової інформації, загальної для людей, що спілкуються, й спільність, що їх породжує. І хоча спілкування - перший вид діяльності, яким опановує людина в онтогенезі, по-справжньому володіють культурою і наукою спілкування одиниці.
Можна виділити чотири основні рівні спілкування [Сагатовський, 1980].
Рівень маніпулювання, коли один суб'єкт розглядає іншого як засіб