У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент


Тема:

Лабораторна робота

Тема: Робота в інтелектуальних пошукових системах, відмінних від Google.

Мета: Ознайомитись з інформаційно-пошуковими системами, відмінними від Google. Скласти рейтинг даних пошукових систем. Навчитися використовувати функції різних пошукових систем для інтелектуалізації пошукових запитів.

Хід роботи

Користуючись методами розширеного пошуку системи Google, оформляю таблицю англомовних (6-8), російськомовних (5-7), німецькомовних (4-6) та українськомовних (3-5) інформаційно-пошукових систем.

№ п/п | Назва інформацйно-пошукової системи | Опис

Англомовні інформаційно-пошукові системи

1 | | 32.3%

2 | | 26.0%

3 | | 8.9%

4 | |

8.0%

5 | | 7.0%

6 | | 6.4%

Російськомовні інформаційно-пошукові системи

1 | | 54.8267%

2 | | 21.7645%

3 | | 15.6207%

4 | | 4.5466%

5 | | 1.5788%

Німецькомовні інформаційно-пошукові системи

1 | | 34.1%

2 | | 19.7%

3 | | 13.8%

4 | / | 11.3%

5 | / | 5.1%

Українськомовні інформаційно-пошукові системи

1 | UaPortal ( ) | Пошуковий портал UАport має могутні пошукові можливості в текстах документів в мережі Інтернет, архівах української преси, українських новинах, товарах та послугах. Пошук виконується не тільки українською мовою, але й російською, англійською, французькою та ін. В Інтернет-холдінгу UAport об’єднав свої основні мережеві проекти Інформаційний центр "ЕЛВІСТІ", який являється протягом багатьох років одним з лідерів в українському сегменті Інтернет. Основна концепція UAport, відображена у слогані "Об’єднуючи краще, знайти головне", заключається в інтеграції інформаційних ресурсів і мережевих сервісів для максимального зодоволення широкого спектру запитів користувачів Інтернет. Найважливішою стратегіченою задачею UAport є створення одного з самих затребуваних в Україні мережевих ресурсів.

2 | Meta ( ) | По суті META.ua представляє широкопрофільний портал із зручною пошуковою системою, дозволяє шукати по всьому українському Інтернету, а також по Реєстру українських сайтів з урахуванням російської і української морфології. Це означає, що незалежно від граматичної форми ключових слів, отримаються документи, які містять шукані слова у всіх формах

3 | BigMirNet ( ) | Володіє потужною мовою запитів, що дозволяють контролювати найменші нюанси пошуку.

4 | OnlineUa ( ) | Пошук, каталог українських сайтів, новини, оголошення, розваги, прогнози погоди тощо.

5 | Холмс ( )

http://www.qango.com/

Типи інформаційно-пошукових систем

Завданням пошукової системи є пошук та відображення веб-сторінки з посиланнями на адреси, за якими можна знайти потрібну інформацію.

За принципом дії розрізняють кілька видів пошукових систем: *

пошукові каталоги; *

рейтингові системи; *

індексні бази даних.

Пошукові тематичні каталоги - звернувшись на адресу пошукового каталогу, користувач знаходить на його основній сторінці перелік тематичних категорій, наприклад таких як Освіта, (Education), Наука (Science), Бізнес (Business), Мистецтво (Art) тощо. Недоліком тематичних пошукових систем є порівняно невелике охоплення існуючих ресурсів мережі, оскільки простежити весь обсяг інформації, яка є в мережі Інтернет, практично неможливо навіть для значного колективу персоналу, який використовує сервер. Тому доцільно звертатись до каталогів ресурсів у випадку, коли необхідно швидко відшукати „типову” інформацію за необхідною тематикою. Наприклад, www.yahoo.com., www.meta.ua.

Рейтингова система – на головній сторінці розміщується перелік найважливіших тем, які, в свою чергу, містять список тематичних розділів. Вибравши потрібну тему, користувач отримує обмежений перелік веб-ресурсів, присвячених даній темі. Поруч з кожним веб-ресурсом висвітлюється оцінка його популярності, яка вимірюється в кількості переглядів цього ресурсу за останню добу. Проте, потрібно пам’ятати, що не завжди високий рейтинг об’єктивно відповідає якості веб-ресурсу. Наприклад, Top Ping - www.topping.com.ua, Рамблер - www.rambler.ru.

Індексні пошукові системи – ще називають пошуковими покажчиками, пошуковими серверами, словниковими пошуковими системами, автоматичними індексами, пошуковими машинами. Принцип роботи з індексними пошуковими системами (ІПС) засновано на ключових словах. Наприклад, www.meta.ua, , www.aport.ru, www.yandex.ru

Складові інформаційно-пошукових систем

Пошукові системи зазвичай мають три компоненти:

агент (павук, кроулер або робот), який переміщується по мережі і збирає інформацію;

база даних, яка містить інформацію, що зібрано павуками;

пошуковий механізм, який користувачі використовують як інтерфейс для взаємодії з базою даних.

Функції агента в індексованих інформаційно-пошукових системах

Засоби пошуку типу агентів, павуків, кроулерів і роботів використовуються для збору інформації про документи, які знаходяться в мережі Інтернет. Це спеціальні програми, які займаються пошуком сторінок в мережі, збирають гіпертекстові посилання з цих сторінок і автоматично індексують інформацію, яку вони знаходять для побудови бази даних. Кожний пошуковий механізм має власний набір правил, якими визначається збір документів.

Агенти є найінтелектуальнішими з пошукових засобів. Вони можуть робити більше, ніж просто шукати: вони можуть виконувати транзакції від імені користувача. Вже зараз вони можуть шукати сайти специфічної тематики і повертати списки сайтів, відсортованих за їх відвідуваністю. Агенти можуть обробляти вміст документів, знаходити та індексувати інші види ресурсів, не лише сторінки. Вони можуть бути запрограмовані для витягання інформації з вже існуючих баз даних. Незалежно від інформації, яку агенти індексують, вони передають її назад до бази даних пошукового механізму.

Павуки здійснюють загальний пошук інформації в Інтернет. Павуки повідомляють про зміст знайденого документа, індексують його і добувають підсумкову інформацію. Вони також переглядають заголовки, деякі посилання і відправляють проіндексовану інформацію до бази даних пошукового механізму.

Кроулери переглядають заголовки і повертають тільки перше посилання.

Роботи можуть бути запрограмовані таким чином, щоб переходити по різним посиланням різної глибини вкладеності, виконувати індексацію і перевіряти посилання в документі. Але вони можуть застрягати в циклах, адже, проходячи за посиланнями, їм потрібні значні ресурси мережі. Існують методи, що забороняють роботам пошук по сайтах, власники яких не бажають, щоби вони були проіндексовані.

Агенти збирають та індексують різні види інформації. Деякі, наприклад, індексують кожне окреме слово у документі, в


Сторінки: 1 2