той час як інші індексують тільки 100 найбільш важливих слів в кожному документі, індексують розмір документу і кількість слів в ньому, назву, заголовки і підзаголовки і так далі. Вигляд побудованого індексу визначає, який пошук може бути проведений пошуковим механізмом і як отримана інформація буде інтерпретована.
Агенти знаходять інформацію, після чого її розміщують в базі даних пошукового механізму. Адміністратори пошукових систем визначають, які сайти або типи сайтів агенти мають відвідати та проіндексувати. Проіндексована інформація відправляється до бази даних пошукового механізму.
Поняття релевантності в інформаційно-пошукових системах
Релевантність – основне поняття при індексації документа в пошукових системах. Релевантність – міра відповідності, тобто це відповідність змісту знайденої сторінки до запиту користувача. Але комп'ютер - не людина, і тому пошукові системи використовують спеціальні алгоритми для визначення релевантності.
Різні пошукові системи використовують різні алгоритми ранжування, однак основними принципами визначення релевантності є наступні:
Кількість слів запиту у текстовому вмісті документу (тобто в html-коді).
Теги, в яких ці слова розташовуються.
Місцеположення шуканих слів у документі.
Питома вага слів, відносно яких визначається релевантність, у загальній кількості слів документу.
Види логічних операторів інформаційно-пошукових систем
Існують такі логічні оператори:
Оператор | Опис
+ | Логічне І. Даний оператор є за замовченням і діє першим, тобто запит «українські реферати» є рівнозначним до запиту «українські + реферати».
- | Логічне НІ дозволяє виключити із списку результатів документи, в яких міститься слово, що йде після оператора. Наприклад, за запитом: кавовий напій - кава, будуть знайдені тільки ті документи, в яких є слова кавовий напій, але немає слова кави.
| | Логічне АБО дозволяє знайти документи, які містять хоча б одне слово в запиті. Наприклад, за запитом: «казаки | козаки» будуть знайдені документи, які містять або слово «казаки», або слово «козаки».
Використовуючи можливості інформаційно-пошукових систем, виконую пошук інформації на запит “music” (рис.1-11).
Рис.1 – Результати пошуку в системі Тiscali
Рис.2 – Результати пошуку в системі Google
Рис.3 – Результати пошуку в системі Yahoo
Російськомовні інформаційно-пошукові системи
Рис.4 – Результати пошуку в системі Rambler
Рис.5– Результати пошуку в системі Aport
Рис.6– Результати пошуку в системі Yandex
Німецькомовні інформаційно-пошукові системи
Рис.7– Результати пошуку в системі Web
Рис.8– Результати пошуку в системі Freenet
Україномовні інформаційно-пошукові системи
Рис.9– Результати пошуку в системі Meta
Рис.10– Результати пошуку в системі Online
3. На основі отриманих даних в результаті пошуку зробити висновок про ефективність кожної з інформаційно-пошукових систем та скласти свій рейтинг ефективності розглянутих пошукових систем. Рейтинг оформити у вигляді таблиці.
4. На основі отриманих даних в результаті пошуку інформації на запит “Music” формую таблицю ефективності кожної з інформаційно-пошукових систем та складаю рейтинг.
Інформаційно-пошукові системи | Назва інформаційно-пошукової системи | Кількість посилань на сайти (млн.) | Рейтинг
Англомовні інформаційно-пошукові системи | Tiscali | 280 | 1
Google | 43,3 | 2
Yahoo | 14,3 | 5
10,8 | 6
Російськомовні інформаційно-пошукові системи | Rambler. | 25 | 3
Aport | 22 | 4
Яндекс | 0,216 | 11
Німецькомовні інформаційно-пошукові системи | Web | 0,551 | 8
Freenet | 0,258 | 10
Україномовні інформаційно-пошукові системи | МЕТА | 1,5 | 7
Online | 0,48 | 9
Висновки
Виконання даної лабораторної роботи дозволяє ознайомитись із роботою інформаційно-пошукових систем, відмінних від Google. На основі здійсненого пошуку в різних інформаційних системах було складено рейтинг тих, що володіють найбільшими ресурсами. Звідси випливає, що
Основные поисковые системы
http://www.msn.com/ — 41.9%
http://www.google.com/ — 32.3%
http://www.yahoo.com/ — 26.0%
http://www.ifind.freeserve.com/ — 17.0%
http://www.ask.com/ — 13.8%
http://www.aol.com/ — 12.6%
http://www.friendsreunited.co.uk/ — 8.9%
http://www.lycos.com/ — 8.0%
http://www.tiscali.co.uk/ — 7.0%
http://www.lycos-europe.com/ — 6.4% (495) 363-35-70