Технології введення даних в інформаційних системах фінансових установ
Зараз неможливо уявити собі фінансову установу (банк або страхову компанію), яка б могла працювати без використання сучасної комп‘ютерної інформаційної системи, яка забезпечує своєчасне введення та обробку усіх необхідних для роботи даних. Але якщо швидкість обробки залежить від потужності комп‘ютерної системи і в наш час не є проблемою, то швидкість введення даних визначається багатьма факторами і суттєво залежить від методів та засобів, які використовуються для цього.
Дані можуть бути представлені як на електронних, так і на паперових носіях. Введення даних з електронних носіїв звичайно не вимагає ані багато часу, ані великих працевтрат, а от введення даних з паперових документів, навпаки, вимагає і часу і працевтрат. У даному дослідженні окреслені шляхи автоматизації введення паперових документів.
Характеристика паперових документів
Паперові документи, які обробляються у фінансових установах, звичайно являють собою стандартизовані паперові бланки (форми) з набором полів, що повинні заповнюватися вручну або за допомогою друкарської машинки, наприклад, платіжні доручення або заяви про страхування фізичних осіб. Деякі поля використовуються для запису ідентифікаційних даних, які дозволяють однозначно визначити, ким ці дані сформовані), а інші – для запису самих даних.
Автоматизовані робочі місця для введення звітних даних і формування звітів
Для введення в пам'ять комп’ютера звітних даних з паперових форм, заповнених від руки, часто використовуються програмно-апаратні комплекси, що включають персональні комп’ютери (ПК) із програмним забезпеченням, орієнтованим на введення операторами даних визначеного типу. Такі комплекси звичайно називають автоматизованими робочими місцями (АРМ) для введення даних. Екранні форми, що виводяться АРМ'ом на екран ПК, містять набір полів, які відповідають полям паперових форм. Тому за допомогою АРМ можна автоматизовано формувати базу звітних даних, тобто вводити дані в поля екранної форми безпосередньо з паперової форми, редагувати їх, проводити автоматичний контроль коректності й обробку даних, а також формувати базу даних.
Якщо вихідні дані вже були представлені в електронному виді (у виді набору чи файлів бази даних), тобто отримані в результаті попередньої обробки, для введення у комп‘ютер достатньо перетворити їх (конвертувати) у вхідний формат, який використовується для введення в бази даних АРМ, а потім ініціалізувати процес автоматичного введення. Розробка програми-конвертора звичайно не викликає утруднень.
Однак частка ручної праці при введенні даних залишається досить істотною і приводить до перевантажень нервової системи операторів, особливо, якщо розроблювачі АРМ'а не враховують ергономічних факторів. Як показує досвід використання подібних АРМ'ів, продуктивність праці операторів по введенню звітних даних складає в середньому від 60 до 200 документів за восьмигодинну зміну (у залежності від типу документа).
При збільшенні обсягів звітних даних істотно підвищити продуктивність праці операторів практично неможливо і треба збільшувати кількість АРМ'ів, тобто комп‘ютерів і операторів (якщо для цього є можливості).
Комплекси сканування і розпізнавання
В останні роки для введення звітних даних із заповнених від руки машинописно паперових форм усе ширше використовуються оптичні сканери з автоматичними подавачами паперу і системи автоматичного розпізнавання рукописних текстів (OCR/ICR).
Сучасні промислові сканери забезпечують введення до 200-300 сторінок у хвилину, а ICR забезпечують досить високу якість розпізнавання, верифікацію (перевірку правильності розпізнавання даних) і експорт результатів у бази даних.
Процеси сканування і розпізнавання відбуваються автоматично, а верифікація результатів розпізнавання (не всіх, а тільки непевно розпізнаних системою розпізнавання) і їх коригування повинні проводитися автоматизовано оператором-верифікатором. Як показує досвід використання таких систем, один оператор може перевірити і відкоригувати 400 - 500 і більш документів за зміну (у залежності від типу документів і відсотка їхнього заповнювання). Необхідно особливо підкреслити принципову зміну ролі людини (оператора-верифікатора) у цьому процесі в порівнянні з ручним введенням: оператор не вводить дані як при роботі з АРМ'ом, а тільки перевіряє і коригує непевно розпізнані дані, що і дає можливість істотного підвищення продуктивності праці. Але вартість систем автоматичного розпізнавання (ICR) досить велика і вони вирішують проблему прискорення тільки одного етапу-введення даних, а для автоматизації інших етапів необхідно розробляти окремі засоби
Можна провести аналогію між введенням перфокарт і введенням документів за допомогою оптичних сканерів (останні є набагато універсальнішим засобом, оскільки забезпечують введення образів будь-яких документів, а не стандартних перфокарт, і відносяться до електронно-оптико-механічних, а не електро-механічих пристроїв).
Треба також відзначити, що якість автоматичного розпізнавання суттєво залежить від якості самих форм для запису даних.
По-перше, форми повинні бути надруковані на якісному папері, який не буде рватися під час сканування сканером з автоподавачем аркушів.
По-друге, для зменшення помилок розпізнавання краще використовувати форми, на яких службові написи та лінії розподілу полів надруковані червоним або зеленим кольором, оскільки під час сканування ці написи та лінії можна видалити шляхом використання лампи відповідного кольору або відповідним налагодженням сканера і вони не будуть помилково сприйматися як текст, який необхідно розпізнати.
По-третє, форми повинні бути надруковані на якісному типографському обладнанні та якісною фарбою, тобто вартість форм, які необхідні для забезпечення сканування та автоматичного розпізнавання, буде суттєво вищою вартості форм, з яких можна вводити дані за допомогою АРМ‘а введення даних.
Крім того, для забезпечення сканування, розпізнавання, верифікації і експорту документів необхідно створити досить складний і досить дорогий програмно-апаратний комплекс сканування та розпізнавання (КСР)
Якщо порівняти описані засоби введення даних, то можна зробити такі висновки:
- технологія введення даних за допомогою АРМ‘ів введення проста і дешева, але продуктивність введення даних досить низька;
- технологія сканування і