У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





допомогою алгоритмів для заздалегідь визначених суб'єкт-об'єктних відносин між ними. Великі пошукові сервери в Інтернеті (наприклад, Yahoo, Yandex) підтримують алгоритми пошуку текстів «схожих» з даним і розрахунку релевантності знайдених документів вихідного запиту. Спеціалізовані системи повнотекстового аналізу (наприклад, у Росії це «Слідопит», «Текстаналіст») дають змогу проводити автоматичну класифікацію та реферування текстів [3].

Для бібліотечної системи важливе визначення апаратного програмного забезпечення, що напряму залежить від цілей, які ставить перед собою бібліотека.

На сьогодні існує велика кількість програмних продуктів, що призначені для автоматизації бібліотечних процесів. Серед західних систем для автоматизації можна виділити такі як: DYNIX, INNOPAC, GEAC, які наразі є досить коштовними навіть при купівлі базових пакетів послуг. З іншого боку, дуже цікавим набором функцій володіє система автоматизації бібліотек ІРБІС, розроблена в ДПНТБ Росії на базі пакета CDS/ISIS, розробленого ЮНЕСКО спеціально для бібліотек, музеїв, документальних архівів тощо. Вона застосовується в сотнях бібліотек Росії і країн СНД, серед яких бібліотеки різного профілю та рівня - від сільських до національних і від шкільних до вузівських, і підтримує роботу з форматами RUSMARC, UNIMARC і USMARC.

Розробка четвертого покоління системи - ІРБІС 64 - покликана значно розширити функціональні можливості, як-то:

Забезпечення справжньої багатомовності на основі використання UNICODE.

Підтримка повнотекстових баз даних з можливістю автоматичної класифікації і смислового аналізу текстів.

Використання як сервісного засобу орфографічного контролю текстових даних.

Важливою функцією саме для інформаційного аналізу, безперечно, є підтримка повнотекстових баз даних та можливість автоматичної класифікації текстів, а також їх смислового аналізу, що дає змогу значно скоротити затрати часу на базову обробку текстів і пошук необхідної інформації. Основна ідея автоматизованої системи смислового аналізу текстів базується на тенденції будь-якої інформації об'єднуватися в тематичні групи «за інтересами». Це явище відображає той факт, що різні галузі знань мають свою внутрішню, властиву їм мову (термінологію).

У багатьох наукових роботах обґрунтована можливість використання математичної статистики для виділення природно-тематичних груп з однорідної маси текстового матеріалу. Коротко підходи до вирішення завдання смислової обробки текстів можуть бути сформульовані у вигляді таких етапів:

створення повнотекстової бази даних з масиву текстів;

природно-тематична класифікація текстів на основі виділення значущих термінів предметної галузі за ознакою перевищення загальновживаної частоти;

надання інформації про розподіл слів у текстах у числовому вигляді та структуризація цієї інформації за допомогою алгоритмів вирішення слабоформалізованих завдань.

У результаті використання системи ІРБІС 64 повнотекстові електронні ресурси бібліотеки (або іншого певного масиву накопичених текстів у електронному форматі) стають частиною пошукового простору, доступного читачеві бібліотеки або ж аналітику, перед яким стоїть завдання вибору інформації і написання аналітичного матеріалу певної тематики.

Система ІРБІС 64 складається з таких основних компонентів:

АРМ «Адміністратор» - робоче місце фахівця, що виконує системні операції над базами даних у цілому, спрямовані на підтримку їх в актуальному і збереженому стані;

АРМ «Каталогізатор» - робоче місце бібліотечного працівника, що виконує функції з формування (поповнення й коригування) Електронного каталогу й інших БД системи. Також може використовуватися спеціалістом з відбору інформації для наповнення бази даних за певною тематикою;

АРМ «Комплектатор» - робоче місце бібліотечного працівника, що виконує функції з комплектування та обліку фондів бібліотеки на основі ведення спеціальної бази даних;

АРМ «Читач» - робоче місце з кінцевим користувачем електронного каталогу, призначене для всеосяжного пошуку в електронному каталозі, перегляду/друку знайденої інформації та формування замовлення на видачу знайденої літератури;

АРМ «Книговидача» - робоче місце бібліотечного працівника, що виконує функції з видачі та повернення літератури;

АРМ «Книгозабезпеченість» - модуль для вирішення завдання кни- гозабезпеченості для вузівських бібліотек.

Крім пошуку за словами з текстів, користувач отримує додаткову можливість знаходити тексти, близькі до заданого зразку. Як текст зразка може виступати запит користувача на мові оригіналу, довільний повний текст (зовнішній по відношенню до бази даних) або текст з бази даних. Крім кінцевого користувача (читача, аналітика) система орієнтована на користувача-експерта, у завдання якого входить попередня робота зі створення повнотекстової бази даних і природно-тематична класифікація текстів. Таким експертом може виступати як спеціаліст з первинного відбору інформації так і інженер з настройки системи. Крім того, система дозволяє експертам і фахівцям-класифікаторам працювати з повнотекстовими колекціями бібліотеки в режимі інтелектуального смислового аналізу текстів. Можливо також застосування системи для проведення смислового статистичного аналізу електронного каталогу бібліотеки з метою отримання і формалізації прихованого знання [6].

Для практичної реалізації повнотекстових баз даних і смислової обробки текстів у рамках ІРБІС 64 введено такі доопрацювання програмного забезпечення:

АРМ «Читач для повнотекстових баз даних» (для відображення результатів пошуку складає HTML-сторінку за допомогою набору форматів);

АРМ «Адміністратор» включено підсистему створення повнотек- стових баз даних, індексації та класифікації повних текстів на основі алгоритмів системи смислового аналізу текстів [7].

Дана система важлива для підвищення ефективності інформаційно- аналітичної діяльності бібліотечних установ. Її значення для відповідних спеціальних підрозділів бібліотек в можливості оптимізувати управління базами використовуваної інформації, удосконалення структур оперативних інформаційних ресурсів. Це важливо з огляду на те, що такого роду підрозділи, як наприклад СІАЗ НБУ імені В. І. Вернадського, серед своїх замовників мають управлінські та інші структури для обслуговування яких важливим є факт часу, організація замовленого матеріалу в стислі строки.

Список використаних джерел

Бродовський О. І. Нове покоління системи автоматизації бібліотек ІРБІС - ІРБІС64: від електронного каталогу до повнотекстових баз даних [Електронний ресурс].


Сторінки: 1 2 3