1
Реєстраційні методи кодування. Порядкова та серійно-порядкова система кодування
Система кодування застосовується для заміни назви об'єкта на умовну позначку (код) з метою забезпечення зручної і більш ефективної обробки інформації.
Система кодування - сукупність правил кодового позначення об'єктів.
Код будується на базі алфавіту, що складає з букв, цифр і інших символів.
Код характеризується:
довжиною — число позицій у коді;
структурою — порядок розташування в коді символів, використовуваних для позначення класифікаційної ознаки.
Процедура присвоєння об'єктові кодового позначення називається кодуванням. Можна виділити дві групи методів, використовуваних у системі кодування (рис.1.1), що утворюють:
Рис. 1.1. Система кодування, що використовує різні методи
класифікаційну систему кодування орієнтовану на проведення попередньої класифікації об'єктів або на основі ієрархічної системи, або на основі фасетної системи;
реєстраційну систему кодування, не потребуючу попередньої класифікації об'єктів.
Класифікаційне кодування
Класифікаційне кодування застосовується після проведення класифікації об'єктів. Розрізняють послідовне і рівнобіжне кодування.
Послідовне кодування використовується для ієрархічної класифікаційної структури. Суть методу полягає в наступному: спочатку записується код старшого угруповання 1-го рівня, потім код угруповання 2-го рівня, потім код угруповання 3-го рівня і т.д. У результаті виходить кодова комбінація, кожен розряд якої містить інформацію про специфіку виділеної групи на кожному рівні ієрархічної структури.
Приклад. Проведемо кодування інформації, класифікованої за допомогою ієрархічної схеми (див. мал. 2.4). Кількість кодових угруповань буде визначатися глибиною класифікації і дорівнювати 4. Перш ніж почати кодування, необхідно визначитися з алфавітом, тобто які будуть використовуватися символи. Для більшої наочності виберемо десяткову систему числення — 10 арабських цифр. Довжина коду визначається 4 десятковими розрядами, а кодування угруповання на кожнім рівні можна робити шляхом послідовної нумерації ліворуч-праворуч. У загальному виді код можна записати як ХХХХ, де Х — значення десяткового розряду. Розглянемо структуру коду, починаючи зі старшого розряду:
1-й (старший) розряд виділений для класифікаційної ознаки "назва факультету" і має наступні значення: 1 — комерційний; 2 — інформаційні системи;
3—для наступної назви факультету і т.д.;
2-й розряд виділений для класифікаційної ознаки "вік" і має наступні значення: 1 — до 20 років; 2 — від 20 до 30 років; 3 — понад 30 років;
3-й розряд виділений для класифікаційної ознаки "стать" і має наступні значення: 1 — чоловік; 2 — жінка;
4-й розряд виділений для класифікаційної ознаки "наявність дітей у жінок" і має наступні значення: 1 — є діти; 2 — немає дітей, 0 — для чоловіків, тому що подібної інформації не потрібно.
Прийнята система кодування дозволяє легко розшифрувати будь-який код угруповання, наприклад:
1310— студенти комерційного факультету, понад 30 років, чоловіки;
2221 — студенти факультету інформаційних систем, від 20 до 30 років, жінки, що мають дітей.
Рівнобіжне кодування використовується для фасетної системи класифікації. Суть методу полягає в наступному: усі фасети кодуються незалежно друг від друга; для значень кожного фасета виділяється визначена кількість розрядів коду.
Приклад. Проведемо кодування інформації, класифікованої за допомогою фасетної схеми. Кількість кодових угруповань визначається кількістю фасетів і дорівнює 4. Виберемо десяткову систему числення як алфавіт кодування, що дозволить для значень фасетів виділити один розряд і мати довжину коду, рівну 4- На відміну від послідовного кодування для ієрархічної системи класифікації в даному методі не має значення порядок кодування фасетів. У загальному вигляді код можна записати як ХХХХ, де Х — значення десяткового розряду. Розглянемо структуру коду, починаючи зі старшого розряду:
1-й (старший) розряд виділений для фасета "стать" і має наступні значення: 1 —чоловік; 2—жінка;
2-й розряд виділений для фасета "наявність дітей у жінок" і має наступні значення: 1 — є діти; 2 — немає дітей, 0— для чоловіків, тому що подібної інформації не потрібно;
3-й розряд виділений для фасета "вік" і має наступні значення: 1 — до 20 років;
2 — від 20 до 30 років; 3 — понад 30 років;
4-й розряд виділений для фасета "назва факультету" і має наступні значення:
1 — радіотехнічний, 2 — машинобудівний, 3 — комерційний; 4 — інформаційні системи; 5 — математичний і т.д.
Прийнята система кодування дозволяє легко розшифрувати будь-який код угруповання, наприклад:
2135—жінки у віці понад 30 р., які мають дітей, і є студентами математичного факультету;
1021 — чоловіки віку від 20 до 30 років, що є студентами радіотехнічного факультету.
Реєстраційне кодування
Реєстраційне кодування використовується для однозначної ідентифікації об'єктів і не вимагає попередньої класифікації об'єктів. Розрізняють порядкову і серійно-порядкову систему.
Порядкова система кодування припускає послідовну нумерацію об'єктів числами натурального ряду. Цей порядок може бути випадковим або визначатися після попереднього упорядкування об'єктів, наприклад за алфавітом. Цей метод застосовується в тому випадку, коли кількість об'єктів невелика, наприклад кодування назв факультетів університету, кодування студентів у навчальній групі.
Серійно-порядкова система кодування передбачає попереднє виділення груп об'єктів, що складають серію, а потім у кожній серії здійснюється порядкова нумерація об'єктів. Кожна серія також буде мати порядкову нумерацію. По своїй суті серійно-порядкова система є змішаною: що класифікує й ідентифікує. Застосовується тоді, коли кількість груп невелика.
Приклад.
Усі студенти одного факультету розбиваються на навчальні групи (у даній термінології — серії), для яких використовується порядкова нумерація. Усередині кожної групи здійснюється упорядкування прізвищ студентів за алфавітом і кожному студенту привласнюється номер.
Література
Рогач І. Ф., Сендзюк М. А., Антонюк В. А. Інформаційні системи у фінансово-кредитних установах: Нанч. посібник. — 2-ге вид., перероб. і доп. — К.: КНЕУ, 2001. 239с.
Система кодирования.