У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент


адреси). Цифрова адреса складається з чотирьох цілих чисел, кожне з яких не перевищує 256. Числа розділяються крапками, наприклад 197.165.1.15. Початок адреси визначає частину Internet, до якої підключено ЕОМ, а закінчення — адресу ЕОМ в цій частині мережі.

Під час роботи в Internet застосовують не просто доменні адреси, а універсальні покажчики ресурсів URL (Universal Resource Locator). URL — це адреса будь-якого ресурсу в Internet із значенням протоколу, за допомогою якого слід звертатися до нього. В покажчикові, крім власної адреси, є відомості про те, за допомогою якого протоколу треба звертатися до даного ресурсу, яку програму для цього необхідно задіяти та до якого конкретного файла потрібно звернутися на сервері. Стандартний покажчик URL складається з трьох частин: формату передачі; імені вузла, що містить необхідний файл; шляху до цього файла. Основний формат URL має вигляд:

format: //host. name. com/path/filename .html

Для пошуку URL-адрес розроблено велику кількість пошукових програм: Excite, InfoSeek, Lycos, Magellan, Yahoo, AltaVista, Rambler, Aport, Яndех та ін. Характеристики пошукових програм наведено в табл.2.

Пошукова програма вибору потрібної адреси звертається до серверів пошуку, доступних через інтерфейс Web. Основною функцією цих серверів є оброблення інформації з документів різних серверів (Web, FTP, Usenet та ін.), занесення її в БД і надання адреси цієї інформації за запитами користувачів пошуковими програмами.

За способом пошуку й організацією результатів усі пошукові програми класифікують на дві групи. Системи індексування (search index) проводять пошук за ключовим словом, заданим користувачем. Укладачі каталогів (search directory) організовують Web-сторінку в системах ієрархічно пов'язаних розділів. Індекс використовується для пошуку Web-сторінок за ключовими словами, каталог — за розділами, систематизованими за ієрархічними рубриками.

Грань між програмами індексування та складання каталогів поступово стирається. Все частіше можна зустріти індекс, забезпечений засобами побудови каталогу. Нерідко Web-сторінки мають подібність змісту з посиланнями на окремі розділи.

Таблиця 2.

Характеристики пошукових програм.

По суті список пошукових програм є також списком пошукових серверів. Пошукова програма — це клієнтська програма серверу пошуку. Таким чином, вибором пошукової програми визначається коло доступної інформації. Крім того, системи пошуку надають можливість обмежити коло пошуку вибраним географічним районом, ПС та ін. Слова запиту мають точно, повно і стисло характеризувати предмет пошуку. Чим більше слів у запиті, тим більше звужується пошук.

Основою пошуку є ключові слова, які задаються користувачем, та їх комбінації, що розділяються певними логічними зв'язками. Незалежно від пошукової системи, яка використовується, згідно з технологією пошуку інформації необхідно:

· перейти на сторінку системи, на якій знаходяться поля для введення і кнопка початку пошуку;

· якщо система дозволяє послідовне уточнення області пошуку, то перейти в розділи, що визначають мережі пошуку інформації (наприклад, пошук тільки в певній ПС або тільки серед американських вузлів Internet);

· ввести запит на пошук відповідно до правил, прийнятих у вибраній системі пошуку. У найпростішому випадку це одне чи небагато слів або словесні запити з логічними операціями І, АБО і НЕ;

· якщо система дозволяє, то уточнити деякі параметри запиту за допомогою додаткових полів, списків, прапорців і перемикачів, які можуть знаходитися на сторінці поруч із полем запиту;

· після введення ключових слів та їх комбінацій, що розділяються логічними зв'язками, активізувати кнопку початку пошуку (Search (Пошук) або Seek (Шукати)), що розміщується, як правило, поруч із вікном. Після деякої паузи автоматично формується Web-сторінка результатів, що містить адреси URL, назви і короткі описи знайдених джерел, які задовольняють результати пошуку;

· переглядаючи знайдені посилання на документи при знаходженні потрібного посилання, клацнути на ньому мишею і перейти на сторінку, яка розшукується. За необхідності переглянути інші знайдені сторінки можна повернутися назад до сторінки з посиланнями, на знайдені документи, після чого перейти до іншого посилання.

Технологію роботи пошукової системи в Internet ілюструє схема 1. Власне пошук за ключовими словами виконує система. Саме до неї звертається користувач, задаючи умови пошуку в рядку для ключових слів. По-шук проходить у БД, організованою програмою. Сукупність знайдених посилань та адрес URL оформляється у вигляді Web-сторінки результатів. "Павук" (Spider) (іноді "черв'як" (Worm) або "гусениця" (crawler)) має виявити якомога більше Web-сторінок. Для цього він запам'ятовує всі посилання на відкриті ним документи. У виявлених нових сторінках знову відшукуються і запам'ятовуються посилання. Це повторюється доти, доки не будуть вичерпані всі джерела посилань.

Щоразу, коли "павук" знаходить чергову Web-сторінку, укладач індексу (indexer) вивчає її вміст, заносячи слова, знайдені в посиланнях і тексті сторінок, у гігантську БД. Укладач індексу має створити базу, в якій URL-адреси відповідали б наборам слів, що зустрічаються в них.

Інформація на Web-сервері зберігається у вигляді Web-сторінок або Web-документів. Кожний сервер має свою початкову сторінку, яку бачить користувач, як тільки з'єднується з сервером. Він може мати одну початкову сторінку, але частіше кілька таких сторінок.

Знайдені адреси Знайдені адреси

Схема 2. Технологія роботи пошукової системи в Internet.

Web-сторінка — це файл у форматі HTML (Hyper Text Markup Language — мова гіпертекстової розмітки). Цей формат визначає зовнішній вигляд документа, а також взаємне розташування текстової, графічної і мультимедійної інформації. HTML надає можливість описувати інформаційні ресурси незалежно від програмно-апаратної реалізації, тобто елементи HTML описують сутність інформації, а не те, як вона виглядає на екрані монітора.

Зображення Web-сторінки на моніторі ЕОМ залежить від Web-броузера, що інтерпретує ключові слова, визначені форматом HTML-файла.

HTML-документи бувають двох типів: статичні та динамічні. До першого належать Web-сторінки, які існують у формі HTML-файла на момент їх запиту.

Динамічні Web-сторінки формуються спеціальними


Сторінки: 1 2 3