до ще більшого збільшення розмірності блоку даних. “Прокляття розмірності” притаманне і для ЕОМ.
Різнотипність даних. Різні ознаки можуть вимірюватися в різних шкалах. Більшість алгоритмів розроблені для оброблення однотипних змінних, що часто викликає необхідність приводити різнотипні дані до одної шкали. Ясно, що більш правильною стратегією поведінки є розроблення алгоритмів, спеціально побудованих так, щоби була можливість оброблення різнотипних даних, не вносячи в протокол ніяких змін, не пов’язаних з експериментом.
Пропущені значення. Незаповнена частина таблиці даних – не такий вже рідкий випадок, особливо якщо експеримент виконується не в лабораторних, а в природних умовах. Виключити з таблиці строку і стовпчик, на пересіченні котрих знаходиться пусте місце, вихід далеко не завжди прийнятний. Можна, використовуючи надмірність таблиці, якимось чином “відновити” пропущені значення, а далі обробляти таблицю так, начебто їх і не було. Однак критерій “відновлення” та мета оброблення повинні бути погодженими.
Зашумленість. Досить часто занесені в протокол виміри насправді відрізняються від вимірюваного значення на деяку випадкову величину. Статистичні властивості цієї додаткової завади можуть не залежати від вимірюваної величини, і тоді кажуть про адитивний шум. У противному випадку має місце неадитивна або залежна завада.
Викривлення, відхилення від припущень. Приступаючи до оброблення протоколу спостережень, завжди виходять із деяких припущень про природу величин, що занесені в протокол. Довільний спосіб оброблення дає результати очікуваної якості тільки у тому випадку, якщо дані відповідають деяким припущенням. Далеко не завжди в ході оброблення даних звертають увагу на те, чи дійсно дані відповідають припущенням, що закладені в алгоритм оброблення.
Запитання для роздумів, самоконтролю, повторення
У чому полягають сучасні поняття експерименту?
Які вимірювані шкали Вам відомі?
Що таке шкала найменувань?
Що таке порядкові шкали?
У чому полягають бальні оцінки знань учнів?
Що таке шкала інтервалів, відношень та абсолютна шкала?
Поясніть поняття розпливчастості.
Як фіксуються результати експериментів?
Які класифікаційні моделі Вам відомі?
У чому полягають особливості протоколів спостережень?