можливості простої модифікації при зміні мови документів або вимог користувачів. Використання інформаційної мови забезпечує впорядкування технології і класифікації техніко-економічних даних, полегшує дослідження і формування складу і структури інформаційного середовища та визначення його найдоцільнішої структури, спрощується встановлення взаємозв’язків між різними інформаційними системами організації.
Класифікація інформації.
Класифікація і кодування інформації використовується для скорочення описової частини різноманітних відомостей, які зберігаються, обробляються і передаються.
Класифікація - це впорядкування об’єктів заданої множини (предмети, поняття, властивості та інше). Ознака подібності або відмінності об’єктів, яка використовується, називається основою класифікації. Сукупність правил впорядкування утворює систему класифікацій.
Основні вимоги до системи класифікації:
достатня ємність, яка дозволяє врахувати всю множину об’єктів класифікації;
гнучкість, яка дозволяє розширити цю множину без порушення структури класифікації;
економічно виправдана глибина класифікації;
можливість вирішення всіх задач;
можливість комплексного вирішення всіх задач, які можуть виникнути в даній організації;
простота введення класифікатора і автоматизація цього процесу.
Розрізняють ієрархічну і фасетну систему класифікації.
Ієрархічна система класифікації встановлює відношення підпорядкування між класифікаційними визначеннями, тобто спочатку по певній ознаці виділяються великі групи, кожна з яких в свою чергу у відповідності визначеною ознакою ділиться на дрібніші і т.д.
Фасетна система класифікації передбачає поділ початкової множини об’єктів на ряд незалежних груп у відповідності з різними ознаках або ж по їх сукупності. Весь набір ознак формується у паралельні фасети. В цьому випадку групи утворюються різними комбінаціями числових характеристик ознак, взятих з відповідних фасетів. Порядок розміщення фасетів при формуванні тієї чи іншої групи залежить від поставлених задач.
В результаті застосування будь-якої з даних систем класифікації або ж їх суміщення створюється класифікатор, який має обмежену сферу дії у вигляді систематизованого набору найменувань груп об’єктів і ознак, а також їх шифрів. Під шифром (кодом) розумітимемо позначення об’єкта або групи у вигляді знаку або комбінації знаків, тобто букв, цифр або чисел згідно правил встановлених системою кодування.
Для прикладу можна навести побудову ідентифікаційного номеру платника податків –перший і другий знак означають територію, третій та четвертий – номер державної податкової служби, останні – номер платника податків і контрольний розряд. Коди організацій присвоюються державними органами статистики. Складається з трьох блоків: реєстраційний номер, назва організації, відомча, територіальна та галузева приналежність організації.
Кодування інформації
Кодування - це процес присвоєння об’єкту шифру або коду, який замінює звичайний запис. Метою кодування є представлення інформації в компактнішій і зручнішій формі, що є необхідним при записуванні даних в документі, перенесенні їх на машинні носії, передачі і обробці з допомогою ЕОМ.
Системи кодування, які застосовуються в реальних інформаційних системах, повинні володіти рядом властивостей, найважливішими з яких є:
однозначність - шифр однозначно описує певну кількість інформації, яка має завершений зміст;
уніфікація - для всіх типів інформації створена єдина структура шифрів;
зв’язність - забезпечує просте перешифрування в загальноприйняті системи шифрів;
компресія - в деяких допускає випадках скорочення кількості знаків в шифрах;
дешифрованість - дозволяє раціонально відшуковувати інформацію по заданому шифру а також сортувати її по заданому признаку і редагувати по шифрах (без вияснення змістовного боку інформації).
Крім того, повинні передбачатися деяка надлишковість і гнучкість, які б забезпечували можливість розширення і внесення необхідних змін без порушення прийнятої структури класифікації.
Для кодування слід використовувати, як правило, десяткові цифри і букви, що полегшує обробку даних людиною і за допомогою комп’ютера. Бажано, щоб шифр мав по можливості мінімальну довжину, що спрощує заповнення і перевірку документів, а також зменшує необхідний обсяг пам’яті, кількість помилок і час обробки на комп’ютері.
Розрізняють чотири системи кодування техніко-економічної інформації. Перші дві - послідовна і паралельна - побудовані на попередньо здійсненій класифікації і тому називаються класифікаційними, наступні дві - порядкова і серійно-порядкова - називаються реєстраційними.
Послідовна система кодування відповідає ієрархічній системі класифікації. Її основна відмінність полягає в тому, що шифр будь-якого розміщеного нижче групування утворюється шляхом додавання його коду до коду вище розміщеного групування. Ця система досить інформативна, але, як правило, шифри мають велику довжину і складну структуру, в зв’язку з цим вона використовується лише при незначних змінах техніко-економічної інформації. Її застосовують, наприклад, в класифікаторах галузей економіки, органів державного управління.
Паралельна система кодування (її також називають розрядною, позиційною) ближча до фасетної системи класифікації. Для позначення того чи іншого фасету виділяється певний розряд або група розрядів шифру; при цьому, на відміну від послідовної системи, немає залежності ознаки, записаної в одному розряді, від тих, що записані в інших розрядах. По шифру неважко відтворити набір ознак, які характеризують об’єкт.
Таким чином, паралельна система забезпечує багатоаспектну класифікацію і кодування. Недолік - менша, ніж при послідовній системі інформативність.
Порядкова система кодування - найпростіша. Кожен об’єкт отримує черговий номер, який ще не зайнятий і відтепер буде його шифром., як правило, для зручності обробки інформації використовують рівномірний код, який містить в усіх випадках однакову кількість розрядів (наприклад, 0014, 2132, 0814 і т.д.).
Порядкова система найпростіша для ідентифікації (однозначного визначення об’єкта з допомогою шифру), шифри мають малу довжину. Її недолік - повна відсутність в шифрі будь-якої інформації про об’єкт і складність автоматичної обробки даних для отримання результатів. Тому порядкова система, якщо і використовується в чистому вигляді, то лише при невеликій кількості об’єктів і при використанні однієї ознаки.
Серійно-порядкова система кодування застосовується або, як розвинута порядкова, або у вигляді суміщення ієрархічної системи класифікації з порядковою системою кодування. В першому випадку при наявності двох і більше ознак об’єкти діляться на групи і кожній групі виділяється серія номерів, які і присвоюються в реєстраційному