Пошук інформації в INTERNET
Мета роботи:
практичне застосування різних стратегій пошуку інформації в Інтернет;
набуття практичних навичок використання різних пошукових систем.
6.1 Короткі теоретичні відомості
Що таке пошук інформації в мережі
Пошук інформації в мережі – це послідовність дій, від визначення предмета пошуку до одержання відповіді на наявні питання з використанням усіх пошукових сервісів, що надає сьогодні Internet.
Перелічімо основні переваги використання мережі Internet при пошуку інформації:
використання максимально можливого «простору пошуку» інформації. Жоден з існуючих на сьогодні немережевих ресурсів не володіє тим обсягом інформації, що представлений у Internet;
жодне інше джерело не має таку оперативність і доступність Internet надає доступ цілодобово;
інформацію, отриману через Internet можна легко переслати своїм колегам для обговорення.
Тільки ці, перераховані, властивості вже показують, що в більшості випадків собівартість одержання інформації в мережі буде очевидно нижче, ніж при її одержанні з будь-якого іншого джерела. А у випадку, якщо інформація рідковикористовувана (наприклад, у вузькоспеціалізованій області) чи потрібна терміново, то Internet може взагалі виявитися єдино можливим джерелом її одержання.
І якщо великий бізнес може собі дозволити утримання цілих інформаційно-аналітичних служб, то для малого бізнесу Internet виявляється унікальним інструментом інформаційного забезпечення.
Повнота, достовірність і швидкість пошуку
Для того щоб знайдена інформація дійсно відображала реальне положення справ, пошук повинен задовольняти таким критеріям:
повнота охоплення ресурсів;
достовірність інформації;
висока швидкість проведення пошуку.
Контроль повноти охоплення ресурсів - досить серйозна проблема в тому випадку, якщо необхідно не просто знайти яку-небудь інформацію про цікавий для вас предмет, а потрібно мати повне уявлення про предмет пошуку і стан справ по даному питанню. Для того щоб провести повномасштабний збір інфор-мації, необхідно працювати з усіма відомими каталогами, пошуковими машинами, базами даних, регіональними телеконфе-ренціями, електронними дошками оголошень і аркушами розсилань.
Контроль достовірності інформації. Ще одна важлива і досить складна частина процесу пошуку. В силу своєї специфіки, Internet містить достатню кількість застарілої або недостовірної інформації. Багато в чому це пояснюється можливістю анонімного розміщення матеріалів, особливо на безкоштовних сервісах. В основному, контроль достовірності інформації - це аналітична робота. При цьому важливо зробити звірку знайденого фактичного матеріалу, з'ясувати статус документів, одержати інформацію про компетентність автора матеріалу і т.д.
Результати пошуку. Одержавши потрібну інформацію з мережі, постарайтеся для початку її перевірити.
Якщо це ціни на товарну продукцію чи послуги, обов'язково зв'яжіться з продавцем і уточніть їх (а заодно перевірте наявність необхідної продукції на складі в достатній кількості). Так само перевіряється будь-яка адресна інформація: хай би якими можливостями володіла сучасна техніка, але заносятьінформацію в мережу люди, а їм властиво помилятися, виявляти неакуратність, неоперативність і т.д.
Аналітичну інформацію перевіряють, порівнюючи дані,отримані з декількох джерел. Таким же способом перевіряють різноманітні статистичні дані.
Швидкість проведення пошуку в мережі.
Якщо не брати до уваги технічні характеристики підключення вона залежить в основному від двох факторів:
грамотного планування пошукової процедури;
досвіду роботи з ресурсом обраного типу.
Особливе значення швидкість проведення пошуку має в тому випадку, коли інформація швидко оновлюється.
Планування процесу пошуку
Ефективність будь-якого виду діяльності визначається чітким уявленням того, що, як і в якій послідовності ми збираємося робити, тобто чітким плануванням робіт. Сказане повною мірою стосується і процедури пошуку інформації в мережі Internet.
Розглянемо, з яких етапів складається процес пошуку інформації:
визначення предмета пошуку;
складання списку ключових слів;
вибір інформаційного простору;
визначення інструмента для пошуку;
попередній пошук;
аналіз отриманої інформації;
додатковий пошук.
Основні методи пошуку в мережі і їх використання
Існує два основних методи пошуку інформації в Internet - з використанням пошукової машини (автоматичні роботи-індексатори) або з використанням тематичного каталогу. При цьому сам механізм пошуку в обох випадках практично однаковий. Розходження виникають на другому етапі. Для пошукової машини - це складання списку ключових слів, а для каталогу на цьому етапі виробляється визначення тематики розділів, у яких може знаходитися необхідна інформація.
Слід відзначити, що пошукова машина звичайно робить сортування документів за принципом релевантності. При індексації документів пошукові машини вираховують так звану «вагу» слова на сторінці - співвідношення кількості повторів на сторінці заданого слова до загальної кількості слів на сторінці документа. Якщо заданий запит, що складається з декількох слів, то більш релевантними будуть документи, у яких сукупна вага слів буде максимальною. Однак, при підрахунку ваги не враховується, поруч чи окремо стоять дані слова, і тому немає гарантій, що в перших документах міститься максимальна кількість повторень словосполучень. Цілком можливо, що такого словосполучення там узагалі не буде.
Вибір пошукових інструментів. Цей етап визначає всю подальшу технологію пошуку -переходити до нього слід тільки після аналізу попередньо отриманої на попередніх етапах інформації.
Пошукові машини. За допомогою пошукових машин завжди легше знайти щось конкретне, і важче - щось загальне і невизначене. Природно, розмір бази даних пошукової машини вирішує не все. Для пошукової машини найголовніше -релевантність (відповідність запиту) посилань, що видаються, а на цей показник, крім розміру, впливає структура бази даних і синтаксис мови запитів.
Каталоги. Саме за допомогою каталогів зручно шукати інформацію на загальні теми (природа, мистецтво, комп'ютери, медицина і т.д.). Будь-який каталог має рубрикатор. Таким чином, інформація деякою мірою відсортована. Кожна адреса постачається анотацією представлених матеріалів. При рішенні досить стандартної пошукової задачі саме каталог, а не пошукова машина виявляються більш прийнятними для початку пошуку.
Багато в чому тип інформаційного ресурсу, що вимагається, визначається характером інформації, яку шукають:
адресна інформація - адресні довідники;
новини - новинні портали й інформаційні агентства, списки розсилань;
конкретна інформація - пошукові машини;
загальні дані - каталоги;
статистика - сервери статистичних