У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





Методи та засоби позиціонування сайтів в системі World Wide Web Національний університет “Львівська політехніка”

Пелещишин Андрій Миколайович

УДК 004.738.5

Методи та засоби позиціонування сайтів в системі World Wide Web

Спеціальність 01.05.03 – математичне та програмне забезпечення обчислювальних машин і систем

АВТОРЕФЕРАТ

дисертації на здобуття наукового ступеня

доктора технічних наук

Львів – 2008

Дисертацією є рукопис.

Робота виконана в Національному університеті “Львівська політехніка” Міністерства освіти та науки України

Науковий консультант: | доктор технічних наук, професор

Пасічник Володимир Володимирович,

Національний університет “Львівська політехніка”,

завідувач кафедри інформаційних систем та мереж

Офіційні опоненти: | доктор фізико-математичних наук

Грінченко Тамара Олексіївна,

Інститут телекомунікацій і глобального інформаційного простору НАН України, старший науковий співробітник

доктор фізико-математичних наук, професор

Цегелик Григорій Григорович,

Львівський національний університет імені Івана Франка, завідувач кафедрою математичного моделювання соціально-економічних процесів

доктор технічних наук, професор

Соловйова Катерина Олександрівна,

Харківський національний університет радіоелектроніки, завідувач кафедри соціальної інформатики

Захист відбудеться 27 березня 2008р. о 13 год. на засіданні спеціалізованої вченої ради Д 35.052.05 у Національному університеті “Львівська політехніка” (79013, м.Львів-13, вул.С.Бандери, 12)

З дисертацією можна ознайомитися у науково-технічній бібліотеці Національного університету “Львівська політехніка” (79013, м.Львів, вул.Професорська, 1)

Автореферат розісланий “25” лютого 2008р.

Вчений секретар спеціалізованої вченої ради

доктор технічних наук, професор Р.А.Бунь

Загальна характеристика роботи

Актуальність теми. Математичне та програмне забезпечення процесів, що відбуваються в глобальній системі World Wide Web (WWW) є актуальним та важливим об'єктом наукових досліджень, серед яких чітко виділяються три основні напрями:

1) організація та структурування WWW (“погляд зверху”);

2) задоволення потреб користувачів WWW (“погляд знизу”);

3) організація та побудова сайтів (“погляд зсередини”).

Перший напрям об'єднує, зокрема, дослідження з пошуку та структурування інформації у WWW (серед них роботи J.Kleinberg, S.Brin, L.Page, И.Сегалович); дослідження у напрямку покращання подання семантики в WWW (дослідження в напрямку Semantic Web); побудову методів та засобів формування відкритого середовища обміну інформацією; розробку принципово нових способів організації глобального середовища (Web 2.0, Giant Global Graph – зокрема дослідження автора концепції WWW T.Berners-Lee) та напрямів його застосування (електронна комерція, дистанційна освіта, електронне урядування тощо).

Другий напрям об'єднує дослідження з інтелектуального аналізу журналів доступу користувачів (роботи R.Kosala, R.Bayeza-Yates, G.Piatetsky-Shapiro), моніторингу дій користувачів (роботи B.Mobasher, S.Chakrabarti), досліджень зручності сайтів (J.Nielsen, S.Krug) тощо.

Третій напрям досліджень сьогодні є найменш розвинутим і в цьому напрямі нині виділяються дослідження з інформаційного структурування сайтів, побудови діаграмних та XML-орієнтованих засобів опису сайтів (зокрема дослідження S.Lawrence, L.Rosenfeld), оптимальної технічної реалізації сайтів. Якщо перші два напрями досліджень визначають основні правила глобального середовища WWW, то третій напрям визначає шляхи підвищення ефективності сайтів за визначених правилЗ цієї точки зору результати наукових досліджень з позиціонування сайтів є затребуваними широким колом фахівців з організації та побудови сайтів, як такі, що повинні бути використані в переважній більшості реальних Веб-проектів та забезпечувати їхню успішність та ефективність.

Проте, у відомих літературних джерелах відчутним є брак грунтовних досліджень з позиціонування сайтів у WWW, збільшення їхньої популярності, конкурентної спроможності та стійкості сайтів до небажаних впливів. Недостатньо висвітлено методологічні, методичні та технічні питання організації взаємодії сайтів та глобального середовища з метою покращання позиції сайту на тривалу перспективу, відомі результати досліджень мають переважно прикладний та комерційний характер (И.Ашманов, J.Barker).

Позиція сайту визначає конкурентну спроможність та прибутковість сайту, його авторитетність та популярність серед користувачів WWW. Формування позиції сайту відбувається у процесі функціонування сайту у глобальній системі WWW. Це, своєю чергою, зумовлює актуальність досліджень з розробки нових методів та засобів позиціонування сайтів у глобальній системі WWW, які би мали належне наукове обгрунтування, формалізованість, прогнозовану результативність та універсальність.

Актуальність проблеми розроблення наукових методів та засобів позиціонування сайтів у глобальній системі WWW підтверджується, зокрема, узагальненими даними щодо значної перенасиченості WWW інформацією у порівнянні з аудиторією та, відповідно, низької затребуваності значної кількості інформації користувачами (понад 10 мільярдів сторінок для 1,1 мільярда користувачів). Істотна частина сайтів WWW взагалі у продовж тривалого часу може не мати жодного зацікавленого відвідувача, значна частина сайтів – невелику кількість відвідувачів, що, фактично, робить існування таких сайтів беззмістовним.

Формування ефективної позиції сайту є пріоритетним завданням, що постає в процесі побудови та функціонування сайту. Це підтверджується, зокрема, тим фактом, що бездоганно виконаний з програмно-технічного погляду сайт з високою імовірністю не забезпечить належної віддачі своїм власникам без виконання робіт з формування позиції сайту, причому традиційні технічні задачі з розробки та підтримки сайтів мають допоміжний характер.

Науково-прикладна проблема розроблення методів та засобів підвищення ефективності сайтів у глобальній системі WWW, що відображається у зростанні популярності, конкурентної спроможності, економічності сайтів та стійкості сайтів до небажаних впливів, є актуальним напрямком наукових досліджень у галузі комп’ютерних наук. Першочерговим завданням досліджень є методологічні, методичні та технічні питання організації сайтів та їхньої взаємодії з глобальним середовищем з метою покращання позиції сайту на тривалу перспективу. Внаслідок структурної істотної змістовної складності об'єкта досліджень та істотності впливу результатів на практичну реалізацію Інтернет-проектів, комплекс досліджень має проблемний характер і значне прикладне значення, особливо відчутне при проектуванні, розробці та реінжинірингу Веб-сайтів більшості відомих класів. Результати дослідження також можуть бути використаними для формування стратегій розвитку окремих регіональних, культурних та національних сегментів системи WWW, зокрема її українського сегмента.

Зв'язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконувалась у межах пріоритетного наукового напрямку, затвердженого серед актуальних проблем Міністерством освіти і науки України, “Нові комп'ютерні засоби та технології  інформатизації суспільства” за темами: ДБ/WEB “Розробка методів, алгоритмів та програмних засобів моделювання, проектування та оптимізації інтелектуальних інформаційних систем на основі Web-технологій” (номер державного реєстру 0102U001171), ДБ/Ізоморф “Розроблення методів і засобів побудови інтелектуальних інформаційних систем на основі часових реляційних баз даних” (номер державного реєстру 0104U002299) та ДБ/Дактиль “Математичне моделювання та програмна реалізація системи перекладу з жестової мови” (номер державного реєстру 0107U001116). Автор розробив нові моделі, методи, алгоритми проектування та розробки Веб-сайтів, що дало змогу підвищувати ефективність комплексних інформаційних систем різних класів.

Дисертаційна робота відповідає загальному напряму досліджень з використання WWW як інфраструктури інформаційного суспільства, що визначено як пріоритетний напрямок розвитку цивілізації у резолюції 60-ї сесії Генеральної Асамблеї ООН.

Мета і завдання дослідження. Метою дисертаційної роботи є підвищення ефективності сайтів шляхом розроблення нових науково обгрунтованих методів і засобів позиціонування сайтів та практичне їхнє втілення в українському сегменті WWW.

Мета дисертаційної роботи визначила необхідність виконання таких завдань:

системний аналіз розвитку та функціонування глобального середовища WWW і системних зв’язків у ньому та визначення пріоритетних задач, що постають у сфері реалізації нових та розвитку існуючих Інтернет-проектів;

розробка математичної моделі глобальної системи WWW, яка орієнтована на опис та вирішення завдань позиціонування сайтів і охоплює загальну формалізацію глобального середовища WWW, правил глобального середовища, модель сайту, що дає змогу описувати позицію сайту в WWW та його тематику;

розробка математичної моделі аудиторії сайту, що дає змогу описувати її структурні особливості, обсяги та цінність та визначає міру приналежності користувача WWW до аудиторії сайту;

системний аналіз і формалізація механізмів та процесів формування позиції сайту в глобальному інформаційному середовищі WWW, розроблення підходів до оцінки ефективності позиції сайту, уведення низки понять, що характеризують збалансованість позиції сайту та розробка методів підвищення ефективності взаємодії сайтів з дисбалансом у позиції;

розробка методів модифікації тематики та інформаційного наповнення сайтів Веб-спільнот, зокрема форумів та блогів, визначення принципових особливостей сайтів Веб-спільнот та їхнього впливу на процес та результати позиціонування;

розробка методів позиціонування сайтів шляхом формування взаємодіючих об'єднань сайтів (Веб-холдингів) та обгрунтування нових підходів до організації ефективної взаємодії сайтів у межах холдингу та координації діяльності холдингу як основи інкрементної стратегії розвитку Веб-холдингів:

розробка архітектури та технологічних рішень програмного комплексу автоматизації координації Веб-холдингу, що забезпечують ефективне позиціонування і розвиток як холдингу в цілому, так і окремих його сайтів.

аналіз та перевірка отриманих теоретичних результатів шляхом розробки та позиціонування експериментального Веб-холдингу.

Об'єктом дослідження є процеси формування позиції сайтів у глобальній системі WWW.

Предметом дослідження у дисертаційній роботі є методи та засоби підвищення ефективності позиції сайту в глобальній системі WWW.

Методи досліджень. Для вирішення завдань моделювання глобального інформаційного середовища WWW, сайту, його аудиторії використано теоретико-множинні підходи, загальну теорію систем, апарат теорії реляційних баз даних, нечітких множин, теорії імовірності. Для побудови методів моделювання тематики сайту застосовано теорію графів, апарати онтології, опису семантики та тематики інформаційних ресурсів, а також методи прикладної та математичної лінгвістики. Для визначення окремих складових позиції сайту використано сучасні теоретичні засади пошуку інформації в Інтернеті. Для формулювання та розв'язання задач підвищення ефективності позиціонування сайту застосовано апарат теорії оптимізації. Для формулювання та розв'язання задач підвищення ефективності Веб-холдингів використано апарат теорії формальних систем, багаторівневих ієрархічних систем, теорії координації. При проектуванні програмного комплексу автоматизації координації Веб-холдингу використано апарат розподілених інформаційних систем класу “клієнт-сервер” та технології обміну інформацією у відкритих системах. Для дослідження та аналізу отриманих результатів позиціонування сайтів холдингу “Рідна мережа” використано відповідні методи математичної статистики.

Наукова новизна одержаних результатів. Наукова новизна результатів роботи полягає у науковому обгрунтуванні та вирішенні наукової проблеми підвищення ефективності позиціонування сайтів у WWW шляхом вдосконалення їхньої взаємодії з середовищем. При цьому отримано такі наукові результати:

вперше розроблено математичну модель глобальної інформаційної системи WWW для вирішення завдань позиціонування сайтів, яка відображає загальну формалізацію глобального інформаційного середовища WWW та його правила функціонування, позиційну модель сайту та описання його тематики, що дало можливість формалізувати та вирішити важливі завдання організації ефективної взаємодії та позиціонування сайтів у глобальному середовищі;

удосконалено формальну модель аудиторії сайту уведенням мір приналежності до неї користувача WWW, мір корисності та цінності аудиторії, що дає змогу ефективно описувати структурні особливості та обсяг аудиторії;

удосконалено формальний опис механізмів і процесів формування позиції сайту в глобальній системі WWW на основі аналізу його взаємодії з глобальним інформаційним середовищем і математичної формалізації задач вибору оптимальної тематики сайту, що є основою розроблених методів визначення позиції сайту та підвищення її ефективності;

вперше запропоновано та обгрунтовано процес балансування позиції сайту та визначено деякі характеристики збалансованості позиції сайту, які грунтуються на формалізації співвідношення елементів позиції сайту та їхнього відхилення від експертних оцінок, що дало змогу побудовати нові ефективні методи позиціонування сайтів та організації ефективної взаємодії сайтів;

розроблено нові методи модифікації тематики та інформаційного наповнення сайтів Веб-спільнот, зокрема, форумів та блогів, з використанням розроблених у роботі математичних моделей і методів моделювання тематики сайтів та процесів формування позиції сайту, що дало змогу запропонувати і обгрунтувати нові ефективні механізми позиціонування сайтів Веб-спільнот;

вперше розроблено методи створення Веб-холдингів та координації їх функціонування, які грунтуються на запропонованих у роботі методах організації ефективної взаємодії сайтів та позиціонування сайтів Веб-спільнот, що стало основою для програмних засобів автоматизації діяльності Веб-холдингів.

Практичне значення одержаних результатів. Практичну цінність отриманих наукових результатів дисертаційної роботи підтверджено досягненням істотного підвищення ефективності процесу формування позиції нових сайтів в глобальній системі WWW та покращанням позиції уже наявних сайтів. Зокрема, практично цінними є наступні результати:

побудовано методи організації ефективної взаємодії між сайтами на основі існуючого дисбалансу в позиціях сайтів, які дають можливість організовувати взаємовигідну взаємодію сайтів;

розроблено методи та алгоритми оптимізації опису та подання тематики сайтів, що дозволяє усунути ряд обмежень на ефективність окремих сайтів;

розроблено методи та алгоритми покращання позиціонування сайтів-спільнот, що відповідає актуальним потребам побудови ефективних керованих Веб-спільнот;

побудовано методи створення Веб-холдингів та керування ними, що дозволяє радикально збільшувати сумарну ефективність та усуває принципові обмеження на ефективність сайтів окремих типів;

розроблено стратегію розвитку Веб-холдингу, яка забезпечує поступовий розвиток холдингу з мінімізацією витрат та ризиків;

розроблено програмний комплекс керування Веб-холдингом в архітектурі “клієнт-сервер”, що забезпечує автоматизацію та ефективне виконання основних задач організації та керування Веб-холдингів;

реалізовано Веб-холдинг "Рідна мережа", в якому практично реалізовано отримані в дисертації теоретичні результати, що дало змогу холдингу “Рідна Мережа” зайняти високу позицію в українському сегменті WWW та стати істотним чинником розвитку Уанету.

Практичне значення дисертаційної роботи підтверджується застосуванням розроблених теоретичних засад внеском Веб-холдингу “Рідна мережа” у практичне формування українського сегмента WWW і розвиток у регіоні технологій електронного урядування. Результати дисертаційних досліджень впроваджено при реалізації та позиціонуванні сайту Центральної виборчої комісії України, сайту Ради національних асоціацій при Кабінеті Міністрів України, Веб-холдингу Асоціації ІТ-підприємств України, інтернет-сервісу Української академічної і дослідницької мережі ІФС НАН України “УАРНЕТ”, сайту Національного університету “Львівська політехніка”, сайту Наукового Товариства Шевченка, у ряді культурних та мистецьких проектів Асоціації музеїв та галерей України, налагодженні системи електронного урядовання Львівської обласної державної адміністрації.

На основі проведених досліджень здобувачем розроблено методичне та програмне забезпечення, яке використане у навчальному процесі в Національному університеті “Львівська політехніка” при викладанні дисциплін магістерського рівня “Інформаційні технології комп’ютерних мереж”, “Проектування Веб-систем”, “Інформаційні технології відкритих систем”, “Проектування розподілених інформаційних систем”, “Комп’ютерна лінгвістика”.

Особистий внесок здобувача. Усі наукові результати дисертаційної роботи отримані автором самостійно. У друкованих працях, опублікованих у співавторстві, автору належать: [] – розділ 11 "Консолідація даних у глобальному інформаційному середовищі", розділ 12 "Ефективність сайтів", Розділ 13 "Тематичні характеристики Веб-сайту" та розділ 14 “Безпека в Інтернет” у частині постановки проблеми та аналізу системних загроз сайтів; [3] – розділи 2-5; [] – модель аудиторії сайту на основі нечітких множин, визначення функцій приналежності; [] – аналіз методів пошуку та консолідації даних у системі WWW; [] – аналіз системних загроз позиціонуванню сайтів у WWW; [] – використання Веб-сайтів для автоматизації діяльності освітніх закладів; [] – загальна схема та процес аналізу відвідування сайту, класи досліджень аудиторії сайту; [] – метод визначення тематики сайту на основі пошукових запитів та методи оптимізації на цій основі тематики сайту; [] – загальна архітектура програмного комплексу, опис окремих компонент; [] – метод визначення тематики сайту на основі розділів каталогів та методи оптимізації на цій основі тематики сайту; [] – постановка проблеми, аналіз тенденцій розвитку Semantic Web; [] – загальна архітектура системи системи класифікації новинних Інтернет-ресурсів; [] – аналіз особливостей використання DF- та ER-діаграм для проектування сайтів; [] – архітектура Веб-компоненти комплексної системи автоматизації діяльності інституту; [] – модель користувача WWW, модель історії транзакцій користувача; [] – визначення основних особливостей комплексів технологій Веб 2.0 та Semantic Web; [] – загальна структура системи автоматизації санаторної справи, архітектура Веб-компоненти системи; [] – аналіз стану проблеми та останніх досліджень, формальна модель Веб-сторінки, шляху навігації та сесії відвідувача, класи досліджень відвідувачів сайту; [] – аспекти розподіленої архітектури, модель даних системи “Студмістечко” та її Веб-компонента; [] – принципова схема функціонування методики дослідження, аналіз кількісних показників WWW та показників сайтів; [] – аналіз стану проблеми, визначення основних функцій та задач інформаційної системи аналізу діяльності Web-вузла та її структури, модель даних системи; [] – особливості адміністрування систем з обмеженим набором операцій для роботи з базами даних; [] – архітектура системи аналізу слабоструктурованих Веб-ресурсів; [] – моделювання груп користувачів форумів з використанням нечітких множин; [] – аналіз активності користувача в WWW; [] – Інтернет-компонента системи автоматизації діяльності інституту; [, ] – загальна архітектура інтелектуальної системи опрацювання новинних ресурсів; [] – модель поведінки користувача WWW; [] – загальна архітектура системи автоматизації діяльності Львівського історичного музею; [] – аналіз актуального стану WWW та перспектив розвитку; [] – застосування Інтернет-технологій для автоматизації діяльності освітніх закладів; [] – формалізація використання глобальних інформаційних технологій у тестуванні; [] – використання нечітких множин для моделювання груп користувачів; [] – постановка проблеми, аналіз окремих сценаріїв розвитку форумів.

Структура та обсяг роботи. Дисертаційна робота складається зі вступу, шести розділів, висновків, списку літератури з 259 найменувань та 1 додатку. Загальний обсяг дисертації становить 328 сторінок, з них 248 сторінок основного тексту, ілюстрованих 32 рисунками та 11 таблицями.

Апробація результатів дисертації. Основні результати наукових досліджень неодноразово доповідалися на ряді міжнародних та Всеукраїнських наукових конференцій, зокрема:

Міжнародна конференція з індуктивного моделювання "МКІМ-2002" (Львів-2002);

Перша Всеукраїнська конференція серії EVA "Електронні зображення та візуальні мистецтва. EVA-2002" (Київ-2002);

Second and Forth International Conferences " Internet Education Science" (Baku-Vinnyca-Velico Ternovo-2004, 2006);

Международная школа-конференция по приоритетному направлению “Информационно-коммуникационные системы” (Зеленоград, Россия, 2005);

VI Международная научно-практическая конференция "Искусственный интеллект – 2005. Интеллектуальные и многопроцессорные системы – 2005" (Геленджик, Россия, 2005) ;

Second International Conference "Advanced Computer Systems and Networks: Design and Application ACSN-2005" (Львів, 2005);

Міжнародна науково-практична конференція “Інтелектуальні системи прийняття рішень та інформаційні технології” (Чернівці, 2006);

Всеукраїнська міжвузівська науково-технічна конференція науково-педагогічних працівників (Львів, 2007);

First and Second International Conferences on Computer Science and Information Technologies "CSIT-2006, 2007" (Львів, 2006-2007);

First and Second International Conferences on Computer Science and Engineering "CSE-2006, 2007" (Львів, 2006-2007);

Науково-практичні семінари міжнародних виставок “Комп'ютер+бізнес” та “Комп'ютер+офіс” (2002-2004);

Наукові семінари Наукового Товариства Шевченка (2005-2007).

Результати дисертаційних досліджень регулярно доповідалися на наукових семінарах кафедри “Інформаційні системи та мережі” Національного університету “Львівська політехніка” (2001-2007).

Публікації. За результатами дисертаційних досліджень опубліковано 46 наукових праць, з них – 2 монографії, 1 навчальний посібник, 30 публікацій – у фахових наукових виданнях, з них 24 – відповідають вимозі ВАК України щодо кількості публікацій в одному виданні.

Основний Зміст роботи

У вступі обґрунтовано актуальність теми, сформульовано мету та основні завдання досліджень, показано зв'язок із науковими програмами, планами, темами, сформульовано наукову новизну. Розглянуто практичну цінність, реалізацію і впровадження результатів роботи. Наведено дані про особистий внесок здобувача, апробацію роботи та публікації.

У першому розділі подано загальний аналіз стану WWW, перспектив розвитку та наявних проблем. Визначено основні характеристики WWW. Досліджено сучасний стан проблеми позиціонування сайтів у глобальній системі WWW. У розділі здійснено аналіз місця та ролі глобальних сервісів у структурі і функціонуванні WWW та їхнього впливу на вирішення завдань позиціонування сайтів. Досліджено сучасні підходи до організації пошуку інформації в WWW та взаємного впливу позиціонування сайтів і пошукових систем, проаналізовано вплив підвищення активності користувачів на формування структури та інформаційного наповнення WWW і явища Beб 2.0, визначено вплив цієї тенденції на задачі позиціонування сайтів.

Cьогодні WWW об'єднує в собі сотні мільйонів сайтів, інформацію з котрих отримує понад 1 мільярд користувачів Інтернету. Проте за останні кілька років, окрім кількісних, відбулися і принципові якісні зміни у WWW. Основний характер цих змін – перетворення інформаційного середовища на глобальну систему, тобто з множини окремих сайтів, що взаємодіють з окремими користувачами через мережу Інтернет, WWW трансформувався у цілісну систему складових, що взаємодіють між собою за певними правилами – сайтів та користувачів.

Для сайту тепер істотною є як його технічна складова, так і системна – набір властивостей, що характеризують безпосередню участь сайту у процесах взаємодії в межах системи WWW. Як наслідок, при розробці, супроводженні та модифікації сайтів виникають задачі не тільки технічного характеру, а й задачі системні, які базуються на властивостях та закономірностях, що існують у системі WWW, і шляхи вирішення яких лежать не лише у площині технічних рішень, а й у площині вдосконалення стосунків сайту з глобальним середовищем – іншими сайтами та користувачами, тобто із задачами позиціонування сайту у глобальному середовищі WWW.

Системний характер WWW має два основні прояви (див. рис. ):

конкуренцію сайтів: проявляється в жорсткій конкуренції за головний спільний ресурс WWW – користувачів та інші похідні;

кооперацію сайтів – проявляється в існуванні методів взаємодії сайтів для отримання взаємних вигод та переваг.

Рис. . Фактори формування глобальної системи WWW.

Показники сайту, що характеризують місце та роль сайту в системі WWW, формуються завдяки правилам глобального середовища – набору різноманітних правил різного рівня формалізованості та обов’язковості взаємодії сайтів та користувачів у середовищі WWW. Найважливіша група правил стосується того, як користувач WWW шукає потрібну йому інформацію та переміщається по WWW. Для власників сайтів ці правила відображають, як саме і з яких джерел (генераторів трафіку) можна отримати трафік – потік відвідувачів для сайту. З цих джерел найважливішими на сьогодні є пошукові системи та ресурси класу Веб 2.0 (див. табл.1).

Таблиця . Основні джерела трафіку в WWW

Джерело трафіку | Частка у сумарному трафіку | Актуальність

Пошукові системи | 40% | Зростає

Каталоги та рейтинги | 10% | Зменшується

Сервіси Веб 2.0 | 15% | Стрімко зростає

Сайти-партнери | 5% | Стабільна

Онлайн-реклама | 10% | Стабільна

Позамережеві джерела | 20% | Зменшується

Сам по собі пошук інформації в гіпертекстових масивах даних є достатньо добре розв’язаною з теоретичного погляду задачею. Проте, пошук інформації в WWW має ряд принципових особливостей, зокрема – великі об'єми даних та зацікавленість власників інформації у маніпулюванні результатами роботи пошукових систем. Встановлено, що для ефективного рангування результатів пошуку окрім лінвістичних критеріїв необхідно застосовувати додаткові критерії, що є характерними для гіпертекстового наповнення WWW, зокрема “вага” чи “авторитетність” сторінки. Найпопулярнішим сьогодні підходом із “зважуванням” сторінки є підхід, запропонований L.Page і розвинутий у межах алгоритмів роботи системи Google. Цей підхід грунтується на визначенні величини PageRank (ранг сторінки) для кожної сторінки. PageRank характеризує імовірність перебування відвідувача на сторінці. Для визначення цієї імовірності використовується структура посилань WWW. Фактично, будується математична модель навігації користувача по посиланнях з використанням апарату ланцюгів Маркова.

З точки зору проблеми позиціонування сайтів, використання величини PageRank та подібних для рангування ресурсів WWW є одним з ключових правил глобального середовища. Врахування цього правила є необхідним для розробки як теоретичних підходів до вирішення проблеми позиціонування сайтів, так для розробки спеціалізованих алгоритмів та програмних засобів.

У другому розділі запропоновано та обгрунтовано позиційні моделі WWW сайту, аудиторії сайту та тематики сайту, що є орієнтованими на формалізацію та вирішення задач позиціонування сайтів. У цій роботі розроблена модель є основою для формулювання та розв'язання комплексу задач позиціонування сайту.

У найзагальнішій формі WWW з погляду системної організації глобального середовища є трійкою:

(сайти WWW, користувачі WWW, правила глобального середовища) .

Основними складовими є: сайт – логічно зв’язаний набір інформації у WWW, що має єдиного власника та цілі існування; користувачі WWW – люди, які вирішують певні задачі, здійснюючи доступ до сайтів; правила глобального середовища – набір різноманітних правил різного рівня формалізованості та обов’язковості взаємодії сайтів та користувачів.

Сайт з погляду задач позиціонування являє собою таку четвірку:

, ()

де – структура сайту; – база даних сайту; - аудиторія сайту; - оточення сайту.

За такого підходу структура сайту моделюється традиційними для інформаційних систем методами з урахуванням специфіки функціонування у глобальному інтерактивному середовищі.

Моделювання бази даних сайту також здійснюється традиційними для інформаційних систем на основі баз даних методами – відповідними апаратами моделювання баз даних з урахуванням особливостей збереження та опрацювання даних у глобальному розподіленому середовищі.

Ефективність позиції сайту визначається його аудиторією (популярністю, частотою здійснення транзакцій тощо). Тобто

. ()

Оточення сайту являє собою таку двійку:

, ()

де – сайти, що визначають (авторитезують) Site; – сайти, що визначаються (авторитезуються) сайтом Site.

Аудиторія сайту у роботі описується як:

, ()

де Aud(Site) аудиторія сайту;Ui – користувач WWW; B(Ui,Site) – міра приналежності користувача Ui до аудиторії сайту Site, Nu- к-сть користувачів.

Отже, кожному користувачу WWW ставиться у відповідність величина, яка характеризує міру приналежності користувача до аудиторії сайту B(Ui,Site), причому . Побудова цієї функції здійснюється відповідно до цілей, що ставлять власниками щодо свого сайту і визначається природою міри цінності користувача для сайту. У структурі функції відображається основний механізм отримання прибутку від відвідування сайту користувачами WWW. Так, для тих мір цінності, які пропорційно залежать від числа відвідувачів сайту, функція приналежності визначається як імовірність відвідування користувачем WWW сайту упродовж контрольного періоду T:-

. ()

На практиці рідко є можливість побудувати функцію приналежності користувача WWW до аудиторії сайту в аналітичному вигляді (). У такому разі описання функції здійснюється у табличному вигляді, причому здійснюється групування користувачів. Група користувачів сайту (j-а група користувачів) – множина користувачів WWW, об’єднаних однаковим значенням ознаки Ch:

. ()

Тобто як групова ознака вибираються такі характеристики користувача, які визначають міру його приналежності до аудиторії сайту. Для усіх користувачів певної групи міра приналежності до аудиторії сайту є константою:

, ()

де - кількість груп користувачів.

Аудиторія сайту є об’єднанням усіх груп користувачів:

. ()

Кожен користувач може належати лише до однієї групи:

. ()

Для кожного користувача Ui виділяються набір з характеристик, які слугують базовими для визначення міри приналежності до аудиторії сайту. Тоді:

. ()

Для кожного сайту існує спеціальна група Gr0 користувачів WWW, до якої належать користувачі WWW, які практично ніколи не скористаються послугами сайту:

, ()

де – мала контрольна величина.

Формули ()-() є основою для визначення обсягів аудиторії, що грунтується на мірі приналежності користувача до аудиторії:

, ()

де – обсяг аудиторії сайту

У випадку, якщо аудиторія сайту структурована по групах:

. ()

Для окремого відвідувача (користувача) сайту визначено міру цінності, що відображає математичне сподівання міри досягення власниками певної цілі щодо цього відвідувача.

, ()

де – цінність i-го користувача сайту; – цінність j-ї цілі сайту; – імовірність досягнення сайтом j-ї цілі щодо i-го користувача сайту, – кількість можливих цілей.

Також у розділі досліджено проблему моделювання та подання тематики сайту в WWW, взаємозалежність аудиторії сайту та тематики сайту. Зроблено акцент на моделюванні відомих методів опису тематики сайтів у WWW, які є важливою складовою правил глобального середовища.

За допомогою рубрик каталогів тематику сайту описано як множину рубрик, у яких подається сайт:

()

де – частота потрапляння відвідувача на сайт за запитом за контрольний проміжок часу (на практиці для сайтів з великою відвідуваністю – 1 день) ; - певна контрольна величина, яка визначає мінімально допустиму частоту появи для запиту, що характеризує тематику сайту, - кількість рубрик.

За допомогою пошукових запитів тематику сайту описано як множину пошукових запитів за якими знаходиться сайт у пошукових сервісах:

()

де Fr(Qsi) – частота потрапляння відвідувача на сайт за запитом Qsi за контрольний проміжок часу; C(Qs) - певна контрольна величина, яка визначає мінімально допустиму частоту появи для запиту, NQs - кількість можливих запитів.

У третьому розділі роботи формалізовано задачу позиціонування сайту, досліджено механізми формування позиції сайту та визначено базові підходи до розв'язання задачі позиціонування сайту. Визначено позицію сайту в системі WWW як сукупність ряду ключових системних характеристик сайту, розроблено методи взаємодії сайтів в WWW з метою покращання позиціонування, побудовано методи та алгоритми оптимізації тематики сайтів.

Позиція сайту у системі WWW – сукупність важливих системних показників сайту, які об’єктивно відображають тематику, популярність та конкурентоспроможність сайту. Позиція сайту являє собою таку п'ятірку:

, ()

де Th(Site) - тематика сайту; Db(Site) - інформативність сайту; Aud(Site) – аудиторія сайту; Auth(Site) – авторитетність сайту; Rank(Site,Th) – ранг сайту серед сайтів певної тематики.

Інформативність сайту визначається як множина сторінок сайту з унікальним наповненням, обсяг змістовного наповнення яких (без контрольних та службових елементів) більший за певну усталену величину. Кількісна оцінка інформаційного наповнення сайту є такою:

, ()

де Pgi – i-та сторінка сайту, що формує наповнення сайту, Size(Pgi) – фізичний розмір сторінки у величинах, характерних для цього типу сторінок без урахування контрольних та службових елементів та гіпертекстової розмітки; Block – константа, що відображає усереднений для WWW контрольний розмір сторінки цього типу, що відповідає вимогам зручності сайтів (web-usability) та правилам глобального середовища.

Авторитетність сайту є агрегованою авторитетністю його сторінок

. ()

Методи визначення авторитетності сторінок сайту є частиною правил глобального середовища. Сумарна кількісна оцінка авторитетності сайту є такою:

. ()

Ранг сайту – множина величин, кожна з яких визначає імовірність вибору сайту серед конкурентів у певному глобальному сервісі за певною тематикою:

, ()

де Srj – j-й пошуковий сервіс; Rank (Site, Th, Srj) – імовірність вибору сайту Srj за певною тематикою.

Інтегрований ранг сайту за заданою тематикою формується на підставі рангу сайту у кожному глобальному сервісі окремо. Тоді:

, ()

де Pr(Th, Srj) – імовірність того, що користувач, зацікавлений у тематиці скористається послугами глобального сервісу Srj.

У разі, коли глобальним навігаційним сервісом є пошукова система, необхідною є також агрегація за пошуковими запитами, що можуть використовуватися для пошуку за заданою тематикою:

, ()

де Pr(Sej,Qsk) – імовірність того, що користувач, зацікавлений у тематиці користаючись послугами пошукової системи Sej, сформує запит Qsk.

Для більшості сайтів їхня прибутковість для власників визначається позицією сайту в WWW. Така прибутковість далі у роботі називається ефективністю позиції сайту або просто ефективністю сайту.

Найчастіше ефективність сайту визначається сумарною цінністю аудиторії сайту на підставі ()-():

, ()

або, при групуванні аудиторії, з використанням виразів (), () :

. ()

Інші складові позиції сайту на його ефективність впливають лише опосередковано – через залежність від них аудиторії сайту.

До одного позиційного класу зараховуватимемо сайти, які мають співмірні основні показники , визначені за (12), (13), (18)-(23).

Позицію сайту вважаємо повністю збалансованою, якщо суб’єктивний фактор мало впливає на його позицію в WWW.

Нехай:

-коефіцієнт ефективності авторитетності;

-коефіцієнт ефективності інформаційного наповнення;

-коефіцієнт ефективності тематики;

-коефіцієнт авторитетності наповнення.

Тоді позицію сайту вважаємо локально тематично збалансованою (або просто тематично збалансованою) за тематикою Th, якщо характер та параметри співвідношень між компонентами позиції сайту (Db, Auth, Aud, Rank) мало відрізняються від тих, які відзначаються для глобально збалансованого сайту тематики Th цього ж позиційного класу, тобто виконуються такі нерівності:

()

де Etalon – глобально збалансований сайт; – мале число.

Далі у розділі досліджено окремі випадки дисбалансу позиції сайту, визначено шляхи усунення дисбалансу як методу покращання позиції сайту. Приклади такого дисбалансу наведено на рис. .

Рис. . Співвідношення “Авторитетність-популярність”

Взаємодія сайтів з різними формами дисбалансу за дотримання певних умов дає змогу усувати чи зменшувати ті втрати та ризики, яким загрожує дисбаланс у позиції сайту. У такому разі взаємодія сайтів носить компенсаційний характер для учасників взаємодії.

У роботі визначено такі види взаємодії сайтів: переміщення аудиторії; зміна авторитетності сайту; зміна рангування сайту; обмін інформаційним наповненням.

Далі у роботі обґрунтовано таке правило ефективної взаємодії: вплив Site1 на Site2 покращує позиції сайту Site1 лише за умови, якщо саме цей вплив є корисним для відвідувачів Site1, тобто длпоя організації ефективного впливу необхідно, щоби справджувалася наступна нерівність:

It(Site1) < It(Site*1), ()

де It(Site1) – сумарна корисність сайту Site1, It(Site*1) – сумарна корисність сайту після його трансформації, що необхідна для організації взаємодії.

У розділі досліджено окремі випадки взаємодії сайтів та методи підвищення її ефективності.

У деяких випадках єдиним можливим методом підвищення ефективності сайту є модифікація його тематики. Основою цієї модифікації є наступна модель, що базується на математичному описі тематики сайту () та ().

Нехай – множина альтернативних тематик сайту; – тематика сайту – множина тем, що описують тематику сайту; – цінність і-ї теми для сайту; – частота звернення до i-ї теми користувачами WWW. Тоді:

, ()

де – імовірність переходу на сайт користувача, що звернувся до і-ї теми.

Величина залежить від характеристик глобального конкурентного середовища, у якому функціонує сайт. Користувач може потрапити не на конкретний сайт, а на сайт конкурентів щодо цієї теми. Методи визначення цієї величини залежать від вибраного методу опису тематики сайту.

У такому разі задача оптимізації тематики сайту визначається так:

. ()

Для розв'язання задачі ()-() розроблено методи оптимізації тематики сайтів: звуження, розширення та модифікації існуючої тематики сайту.

У четвертому розділі дисертаційної роботи розроблено методи позиціонування сайтів ряду спеціальних видів, зокрема форумів, блогів, інших форм Інтернет-спільнот. Принциповою відмінністю сайтів Інтернет-спільнот від традиційних сайтів, що представляють своїх власників, є високий ступінь залежності інформаційного наповнення сайту від його відвідувачів. Така безпосередня залежність відсутня у традиційних представницьких чи інформаційних сайтах. Сама аудиторія сайту безпосередньо наповнює сайт інформацією, і у такий спосіб уже самостійно формує позицію сайту інтернет-спільноти. Крім прямого інформаційного зв’язку “сайт-користувач” виникає і зворотній зв’язок “користувач-сайт”, який для деяких типів Інтернет-спільнот взагалі є домінуючим (фактично сайт стає похідним від спільноти).

У роботі детальніше досліджено форуми, як найзагальнішу форму реалізації Інтернет-спільноти, та проаналізовано особливості інших форм сайтів спільнот. Транзакція користувача форуму описана як четвірка:

, ()

де tQ – час транзакції, IdTr- унікальний код транзакції, Acctype(Tr) – тип дії користувача; Actinfo – інформація, що супроводжує транзакцію.

Міра приналежності користувача до форуму

, ()

деAcctype – множина можливих типів трансакцій; – кількість транзакцій j-го типу; – максимально можлива кількість транзакцій j-го типу для користувача; Cj – коефіціент важливості транзакції j-го типу для власників сайту; – імовірність здійснення Cj транзакцій j-го типу для і-го користувача форуму продовж контрольного часу T.

Міра корисності користувача форуму є такою

, ()

де – цінність дії користувача форуму; – тип транзації Actionj.

Вирази ()-() дозволяють застосувати до вирішення задачі позиціонування спільнот уже розроблені в попередніх розділах моделі сайту та аудиторії ()-().

Тематика та наповнення форуму мають ієрархічний характер (див. рис. ).

Рис. . Ієрархічний характер тематики та наповнення форуму

Відповідно до наведеної вище ієрархічної структури тематики форуму запропоновано така формування позиції форуму в WWW яку графічно представлено на рис. .

Рис. . Схема формування позиції форуму

У п’ятому розділі дисертаційної роботи розроблено методи побудови холдингів Веб-сайтів (Веб-холдингів) як ефективного механізму позиціонування сайтів в WWW, запропоновано та обгрунтовано процес позицінування холдингу в WWW. Досліджено динамічні аспекти функціонування холдингу, виділено основні цикли координації холдингу. Запропоновано інкрементну стратегію розвитку холдингу, як комплекс правил та заходів щодо розвитку та позиціонування холдингу у тривалій перспективі за умов обмежених ресурсів та динамічного розвитку середовища.

Ефективним способом оптимального подання організації в WWW є формування Веб-холдингу (або просто холдингу) – сукупності взаємозалежних сайтів, які мають одного власника або власників із спільними інтересами та координують свою діяльність згідно з інтересами власників.

Невід’ємною частиною холдингу є координаційний центр – організаційна одиниця, яка здійснює загальне планування діяльності Веб-холдингу, моніторинг та аналіз сайтів холдингу та їхнього позиціонування, вироблення рекомендацій та вказівок щодо організації взаємодії сайтів холдингу.

Особливо важливим аспектом використання Веб-холдингів є можливість організації ефективних взаємних впливів сайтів у межах холдингу, що грунтуються на розбалансованості позиції сайтів. Дисбаланс у позиції сайту, що входить у холдинг, усувається використанням завищених показників для позиціонування інших сайтів.

Можливий приклад використання описаного вище підходу до балансування позицій сайтів у межах холдингу наведено на рис. .

Рис. . Приклад балансування сайтів у межах холдингу

На схемі “Aud+” позначено дисбаланс в сторону завищення популярності, “Auth+ “ – завищення авторитетності, “Db+ “ – завищення інформативності. Позначеннями з “мінусом” – відповідні заниження.

У роботі введено поняття ступеня асоційованості сайту As(Site) в холдинг. Таке поняття, з одного боку, відображає ступінь зацікавленості координатора в прибутковості сайту, а з іншого – ступінь можливого впливу на сайт. Вважатимемо, що , – кільсть сайтів у холдингу. Як правило, повністю асоційованими у холдинг є сайти, що належать координатору (власнику координаційного центру холдингу), для них .

Базовими в холдингу є сайти, які є основним джерелом прибутковості для холдингу та відіграють роль його основи. Зокрема, на них припадає основна частка інформаційного наповнення сайту та їхня аудиторія значною мірою складається з регулярних відвідувачів.

Донорами є сайти, основними завданнями яких є компенсація у межах холдингу дисбалансу у позиції базових сайтів. Визначено та побудовано методи реалізації наступних видів сайтів-донорів: вхідні – сайти з високим рівнем адаптованості до вимог пошукових систем, і, відповідно – з відвідуваністю; концентратори - які містять цінну для суспільства інформацію, внаслідок чого мають певну авторитетність, і надалі авторизують інші сайти холдингу; агрегатори - накопичують зовнішню стосовно холдинга інформацію для подальшого використання на інших сайтах холдинга.

Для інтегрованої оцінки позиції холдингу побудовано контрольні величини. Контрольна тематика холдингу визначається як спільна тематика найпопулярніших та найприбутковіших базових сайтів холдингу:

, ()

де Base(Hold) – множина базових сайтів холдингу; Const – деяка


Сторінки: 1 2





Наступні 7 робіт по вашій темі:

РЕАЛІЗАЦІЯ ДЕРЖАВНОЇ ПОЛІТИКИ У СФЕРІ ЕКОНОМІЧНОЇ БЕЗПЕКИ НАЦІОНАЛЬНОЇ ЕКОНОМІКИ - Автореферат - 30 Стр.
Можливість судово-медичної діагностики раптової серцевої смерті за результатами лабораторних досліджень - Автореферат - 30 Стр.
ВПЛИВ УЛЬТРАЗВУКУ НА ДЕФЕКТИ ТА ФОТОЕЛЕКТРИЧНІ ВЛАСТИВОСТІ КРЕМНІЮ І СТРУКТУР НА ЙОГО ОСНОВІ - Автореферат - 26 Стр.
КУЛЬТУРОМОВНЕ БУТТЯ ХУДОЖНЬОГО ТВОРУ ЯК ПЕРЕКЛАДОЗНАВЧА ПРОБЛЕМА - Автореферат - 30 Стр.
Розробка процесу сушіння плодово-ягідної сировини змішаним теплопідводом зі штучним пороутворенням - Автореферат - 28 Стр.
МОРФОФУНКЦІОНАЛЬНІ ОСОБЛИВОСТІ ПЕЧІНКИ, ПІДШЛУНКОВОЇ ЗАЛОЗИ ТА ТОНКОЇ КИШКИ ПРИ ЕСЕНЦІАЛЬНІЙ ГІПЕРТЕНЗІЇ - Автореферат - 28 Стр.
Кінетика руйнування матеріалів з урахуванням впливу раптових змін в режимі навантаження - Автореферат - 23 Стр.