УДК 027:303
УДК 027:303.6:303.064
Володимир КАСАТКІН,
стажист-дослідник СІАЗ НБУВ
ІНФОРМАЦІЙНЕ ЗАБЕЗПЕЧЕННЯ
СУЧАСНОЇ БІБЛІОТЕКИ: ШЛЯХИ СТАНОВЛЕННЯ
У роботі розглядається сучасний стан розвитку інформаційно-аналітичної діяльності , процесів збору та аналізу інформації різних джерел та сучасне програмне забезпечення бібліотеки в контексті попиту на аналітичні дані.
Ключові слова: інформаційно-аналітична діяльність, аналітика, програмне забезпечення, системи моніторингу ЗМІ, повнотекстові бази даних, ІРБІС 64.
Одним з основних напрямів інформатизації, на який сьогодні спираються держструктури, бізнес, громадські організації та інші суспільні установи, всі категорії сучасних користувачів, - є інформаційно-аналітична діяльність, необхідна для прийняття ефективних управлінських рішень. Повна, точна і достовірна інформація про споживчий ринок , фірми-партнери, конкурентів, що випускається в галузі продукції, товарних ринків, ринку цінних паперів, інвестиційні можливості тощо, необхідна будь-якому підприємству для успішної діяльності на ринку, удосконалення ринкових відносин, на яких базується сучасне суспільство [2].
Наприкінці ХХ ст. аналітична діяльність набула широкого поширення і перетворилася у професійну діяльність. У багатьох країнах існують так звані «Фабрики думки», інформаційно-аналітичні відділи та служби в державних органах, компаніях, банках, політичних партіях. Загальною відмітною рисою даних служб є органічна інтегрованість у відповідні сфери діяльності, функціональний і організаційний симбіоз із їхніми соціальними інститутами і конкретними організаціями.
Стрімко розвиваються ринки аналітичної інформації, інтелектуального продукту, а також методичного та програмного забезпечення для його отримання.
Основою роботи в області інформаційного аналізу є глибока переробка матеріалів ЗМІ і фактографічних даних. Використання систем моніторингу дозволяє з мінімальними витратами оперативно отримувати інформацію з відкритих джерел, необхідну для відстеження активності конкурентів, оцінки публікацій про компанію, пошуку нових клієнтів та шляхів розвитку бізнесу, аналізу стану зовнішнього середовища організації.
Системи моніторингу ЗМІ в першу чергу призначені відбирати та сортувати матеріали, спрощуючи тим самим роботу аналітика. Таких програм на ринку близько сотні, але всі вони займаються, як правило, організацією зберігання середніх або великих обсягів інформації, володіють простими пошуковими можливостями та/або тематичним рубрикатором, не пропонуючи будь-якого механізму якісного аналізу. І це не випадково, бо якісний аналіз тексту припускає оцінку таких нюансів, як емоції, загрози, характер відносин між об'єктами, тощо. У цих сферах людський мозок здатний накопичувати досвід і володіє інтуїцією краще. Хоча швидкість оцінки при цьому й невелика, ми виграємо в якості.
При вирішенні інтелектуальних завдань комп'ютерна програма покликана максимально полегшити працю людини: по-перше, забезпечити обмеженою вибіркою документів, відсіявши за встановленим фільтрам зайве, по-друге, надати зручне автоматизоване робоче місце (АРМ) для проведення оцінок. Деякі з програм уміють робити «інтелектуальний» пошук масивом даних, відбираючи документи з набору ключових слів, частоті їх вживання і відносному розташуванню, і роблять це з урахуванням морфології. Ці програми вже здатні на просто контент- аналіз, тобто на семантичну статистичну обробку [4].
Клас таких аналітичних (за термінологією їх авторів, хоча не всі вони повною мірою відповідають цій назві) програм російських та українських розробників має гарні шанси саме в країнах колишнього СРСР. Там, де доводиться мати справу з україномовними та російськомовними текстами та документами, у вітчизняних комп'ютерних фірм немає гідних конкурентів. Серед них виробники правових баз даних і систем розпізнавання текстів, пошукових систем і автоматичних класифікаторів, словників і перекладачів на іноземні мови.
У російсько-українському сегменті мережі Інтернет можна знайти не менше 10 баз даних, орієнтованих на збір і зберігання матеріалів ЗМІ. Найбільш відомі з них: «Артефакт» компанії «Інтег- рум-Техно» (www.integrum.ru); система «Парк», створена «Парк.Ру» (is.park.ru); електронний кіоск Russian Story (www.russianstory. ru); Національна електронна бібліотека від НСН (nel.nns.ru); «Медіалогія» (www.medialogia.ru); УІС РОСІЯ (www.cir.ru); каталог ЗМІ від « СМИ.Ру» (www.smi.ru); InfoStream (infostream.ua); «Мониторикс»( monitorix.biz). Робота з усіма перерахованими джерелами, окрім «СМІ.РУ», платна, і всі їхні власники пропонують не тільки ознайомитися з матеріалами ЗМІ, а й надати деякі моніторингові послуги. А от компанія WPS (www.wps.ru) має свій електронний архів газет, журналів, транскрип- тів теле- і радіопередач в Інтернеті не тримає, використовуючи Internet як рекламний майданчик та інструмент для просування власних моні- торингових продуктів.
Бібліотеки є важливим джерелом інформатизації, продукування необхідної суспільству інформаційно-аналітичної продукції.
У наш час як в багатьох організаціях, приватних фірмах так і бібліотеках накопичується величезна кількість інформації в різноманітному форматі та з різних джерел, і дедалі більшого поширення набувають повнотекс- тові бази даних. Великі освітні центри організують в Інтернеті для студентів і співробітників бази наукових статей, авторефератів, багато організацій надають доступ до ресурсів електронних бібліотек, оргкомітети конференцій публікують тисячі повних текстів доповідей і ін.
Важливого значення набуває завдання створення повнотекстових баз даних на основі текстової інформації, накопиченої в електронному вигляді з метою спрощення їх подальшої фільтрації та аналізу. У загальнодоступних бібліотеках такий масив текстів документів звичайно виникає як результат сканування текстів за приватним замовленням користувачів. Із зростанням обсягів накопиченої інформації постає завдання смислового пошуку та експертного статистичного аналізу даних з метою надати користувачеві можливість правильно орієнтуватися в середовищі електронних фондів великого обсягу, а експерту - можливість виділяти підкласи текстів на задану тематику.
Нині у світі існують і активно розвиваються системи смислового пошуку в повнотекстових базах даних, які підтримуються провідними фірмами - виробниками серверів баз даних, наприклад, Oracle, Microsoft, IBM та ін. Такі системи будуються на основі багатовимірних сховищ, з яких дані витягуються і обробляються за