ЗВ | Арк.
Зм. | Арк.. | № докум. | Підпис | Дата
5 Перетворення документів на електронну форму
5.1 Засоби сканування документів
Для створення електронного образу паперового документа використовують пристрій типу сканер. Сканер – це пристрій, який дає змогу вводити в комп’ютер чорно – біле або кольорове півтонове зображення, прочитувати графічну або текстову інформацію.
Основні робочі елементи сканера:
джерело світла, що використовується для освітлення документа.
світлочутлива головка, яка сприймає відбите від зразка світло
Принцип роботи:
Джерело освітлює оригінал, а світлочутливий датчик з певною частотою вимірює інтенсивність відбитого світла. Роздільна здатність сканера прямо пропорційна частоті вимірювань. У процесі сканування пристрій перетворює інтенсивність світла на двійковий код, який передається у пам’ять комп’ютера.
Сканери діляться на 3 категорії:
Ручний сканер – для сканування лише тексту одного листа з шириною поля 10-15см.
Листовий сканер – сканує лише окремо взяту сторінку.
Планшетний сканер – завдяки рухомому світлочутливому елементу може сканувати окремі сторінки зшитих видань.
Високопродуктивні сканери для великої площі документа і високої роздільної здатності повинні мати високопродуктивні лінії передач. Низькопродуктивні сканери використовують порт принтера. Для узгодження управляючих команд і програм опрацювання інформації існує єдиний стандарт (драйвер) , який називається TWAIN.
Режими роботи драйвера TWAIN фірми Primax
Start – виконує команди:
Сканування по попередніх настройках
Встановлення забарвлення (ч/б, кольорове)
Попереднє сканування
Locate – встановлення режимів виділення документа різними способами
Adjust – задання режимів повороту виділеного фрагменту
Properties – виконує команди:
Встановлення фокусування
Встановлення кольору
5804. ТП 00.04 10 ЗВ | Арк.
Зм. | Арк.. | № докум. | Підпис | Дата
Встановлення роздільної здатності (Resolution
Finish
Save settings – запис настройок драйвера у вказаний файл (для п.1).
Destination – перехід по вказаному шляху.
Start scanning – старт кінцевого сканування.
Stay active after scan – зберегти завантаження програми з панелі, тобто драйвер не вигружається.
Exit – вихід із програми.
5804. ТП 00.04 10 ЗВ | Арк.
Зм. | Арк.. | № докум. | Підпис | Дата
5.2 Засоби розпізнавання ( програма Fine Reader 4.0).
Сканування документа
Якщо потрібна точна настройка параметрів сканування, а також коли різні сторінки сильно різняться за якістю, краще працювати зі сканером через драйвер TWAIN. Для підключення драйвера “TWAIN” необхідно виконати команду Сервис — Опции. На вкладці «Сканирование» встановити позначку «Показывать диалог TWAIN-драйвера сканера»
Щоб почати сканування, треба ввімкнути сканер і клацнути на кнопці «Сканировать». На сканері автоматично або вручну встановлюють режими сканування: роздільну здатність, яскравість і контрастність. В автоматичному режимі до початку сканування у вікні сканера в меню Параметри користувач може лише змінити режим сканування (кольоровий або чорно-білий).
Після завершення попереднього сканування в ручному режимі проводиться
автоматична корекція зображення: горизонтальне та вертикальне вирівнювання
визначаються параметри зображення, які відображаються в лівій частині вікна сканера:
тип виведення,
межі вибраної області,
розміри виведення
підвищення різкості фотографій
встановлення оптичної роздільної здатності. Під час вибору роздільної здатності потрібно мати на увазі, що чим вона вища, тим точніше результат відповідає оригіналу, але при цьому різко зростають розміри документа і збільшується тривалість сканування. Як правило для текстових документів доброї якості можна вибрати роздільну здатність 200—300 точок/дюйм. Для того щоб здобути високоякісні зображення, необхідно встановити максимально можливу оптичну роздільну здатність.
Після встановлення нових параметрів проведеться кінцеве сканування
Вікно сканера закривається і зображення передається до програми FіпеRеаdег. У момент завершення передачі у вікні «Пакет» програми FіпеRеаdег оброблена сторінка відображається у вигляді значка, а на основній частині робочої області з'являється вікно, що містить зображення поточної сторінки. За допомогою кнопок панелі інструментів зображення можна повернути на кут, кратний 90°. У нижній частині вікна можна побачити збільшений фрагмент зображення, який вибирається у вікні «Изображение» клацанням мишею. Масштаб зображення в кожному вікні можна вибрати в контекстному меню або в меню Вид.
5804. ТП 00.04 10 ЗВ | Арк.
Зм. | Арк.. | № докум. | Підпис | Дата
5.3 Процес сегментації
Сегментація - це розбиття сканованого зображення на окремі фрагменти (блоки). Різні типи блоків обробляються програмою по-різному. Програма FіпеRеаdег підтримує такі типи блоків:*
текстовий («Текст») — на етапі розпізнавання перетворюється на текст;*
табличний («Таблица») — набір комірок, вміст яких перетворюється на текст окремо;*
зображення («Картинка») — вставляється в документ без зміни як графічний об'єкт;*
що містить штрих-код («Штрих-код») — розпізнається як штрих-код;*
зайвий («Нераспознаваемый») — під час розпізнавання ігнорується.
Процес автоматичної сегментації починається після клацання на кнопці «Сегментировать». При цьому різні типи блоків відображаються у вигляді прямокутних рамок різних кольорів зі своїм номером у лівому верхньому кутку.
Якщо структура сторінки складна, то можна скористатися ручною сегментацією або
провести корекцію результатів автоматичної сегментації. Новий блок створюється "протягуванням" миші по діагоналі блока, який треба створити. Для корекції блок спочатку необхідно виділити клацанням мишею, а потім за допомогою кутових маркерів змінити розміри або позицію поточного блока.
Команди редагування блоків винесено на панелі інструментів у вигляді кнопок
Створити блок.
Додати частку блока.
Вилучити частку блока.
Змінити позицію блока.
Змінити нумерацію блока.
Вилучити блоки, а також змінити структуру таблиці.
Додати горизонтальну лінію.
Додати вертикальну лінію.
Вилучити лінії.
У контекстному меню можна вилучити один або всі блоки, змінити тип блока, очистити блок. Після сегментації можна розпочинати розпізнавання тексту.
5804. ТП 00.04 10 ЗВ | Арк.
Зм. | Арк.. | № докум. | Підпис | Дата
5.4 Розпізнавання тексту
Підготовчий етап.
Встановити мову документа, вибравши її зі списку на панелі інструментів. Якщо документ містить фрагменти на різних мовах, то потрібні мови вибираються зі списку Другой з натисненою клавішею <Сt1>.
Вибрати потрібний тип тексту в списку на панелі інструментів.
Розпізнання може проходити в автоматичному і ручному режимі.
Автоматичний режим (кнопка «Распознать») У ході розпізнавання блоки розбиваються на рядки, рядки — на окремі символи,