Сучасні технологічні засоби обробки інформації
5.1. Гіпертекстова технологія
Типовим прикладом використанням гіпертекстової технології є мови HTML і XML, які використовуються при розміиці сторінок, які ми бачимо в Internet. Нижче приведено їх опис.
Мова HTML
HTML (Hypertext Markup Language) — це проста мова розмітки гіпертексту (тобто формат даних), використовуваний у Web. Формат HTML дозволяє представити цілий ряд гіпертекстових документів. Звичайно, HTML-файли — статичні документи. Використовуючи шлюзи (див. нижче роздягнув «Інтерфейс CGI»), у форматі HTML можна відобразити динамічну інформацію, наприклад, вибірку з баз даних.
HTML — спрощена версія узагальненої мови SGML (Standard Generalized Markup Language), формально визначальну структуру документів. Мова HTML проста, але досить могутній для представлення більшості документів загального призначення. У полях, що описують тип умісту, формат HTML позначається типом text/html.
Базову основу Web складають HTML-документи з гіперпосиланнями (у виді URL), передані по протоколі HTTP.
Ранні версії HTML описувалися неформально. Першим формально описаним і широко підтримуваним стала мова HTML версії 2.0. Наступна версія — HTML 3.2 — також одержала широку підтримку, Зовсім недавно вийшла версія HTML 4.0. От найбільш значні розходження між версіями 3.0 і 4.0:
стандартизовані таблиці стилів;
підтримка двунаправленої писемності;
удосконалені фрейми;
удосконалені таблиці;
підтримка математичних символів;
підтримка додаткових можливостей для інвалідів (озвучування і читання наосліп).
Теги
Для опису і розмітки документів у мові HTML застосовують тега (tags) — вони дозволяють створювати заголовки, абзаци, списки, гіперпосилання і форматувати символи. Теги не чуттєві до регістра символів.
Більшість тегів HTML використовуються парами, причому кожна пара складається з відкриваючого і замикаючого тегів. Відкриваючий виділяєтся символами “<” і “>”. Закриваючий — символами «</» і «>)>' Наприклад, для того щоб представити текст “Foo” жирним шрифті 14 використовується пара тегів <У> і </У>:
<B>Foo</B>
Деякі теги бувають тільки відкриваючими. Так, Для примусового перекладу рядка відразу за текстом “Bar” можна використовувати тег <BR>
Bar<BR>
Деякі теги не можуть бути вкладеними. у HTML-документах припустимі коментарі. Вони полягають між
“<!--“ і “-->”.
Структура документа
Усі HTML-документи мають формальну структуру, вона проілюстрована в наступному прикладі.
<DOCTYPE HTML PUBLIC "—//W3C//DTD HTHL 3.2 Flnal//EN">
<HTML>
<HEAD>
<TITLE>
<!-- Заголовок документа -->
</TITLE>
<!-- Інші заголовки —>
</HEAD>
<BODY>
<!-- Тіло документа -->
</BODY>
</HTML>
Документи HTML версії 3.2 використовують заголовок <!DOCTYPE>. Весь документ обмежений парою тегів <HTML> і </HTML>. Позначка-дані документа, у тому числі пари тегів <TITLE> і </TITLE>, полягають між тегами <HEAD> і </HEAD>, дані документа — між <BODY> і </BODY>.
Мова XML
Мова XML (Extensible Markup Language) — це технологія, що розвивається під патронажем консорціуму W3C. Мова XML доповнює HTML і заснований мовою SGML (Standard Generalized Markup Language). У той час як HTML описує набір команд, що визначають розташування даних на сторінці, мова XML дозволяє описати дані HTML-сторінки за допомогою типів інформації, що представляється. Прямим наслідком цього стало те, що пошукові машини повертають більш осмислену інформацію. Наприклад, використовуючи XML, пошукова машина в стані визначити, коли слово “cookie” на HTML-сторінці відноситься до Інтернету, а коли до солодкого десерту.
За допомогою XML браузери здатні однократно завантажувати HTML-сторінку, а потім працювати з нею автономно, не звертаючи до сервера. Клієнт вправі будь-яким образом переглядати дані і керувати ними. В ідеалі XML дозволить клієнту витягти з результату пошуку, наприклад, назва й адреса готелю, а потім завантажити ці зведення в картографічну програму для складання маршруту.
Синтаксис XML
Для кодування символів у XML використовується кодування Unicode. Це означає, що XML сполучимо з безліччю мов світу. Для передачі даних по каналах зв'язку разом з Unicode застосовують кілька видів перекодування. За замовчуванням XML задіє UTF-8 (Universal Transformation Format-8). (Подробиці про Unicode і UTF-8 — у главі 4.)
На відміну від HTML, у мові XML мають значення регістр символів і відступи пробілами.
Деякі символи в XML зарезервовані, наприклад “<” і “>” — обрамлення тегів. Ці символи в текстових рядках варто кодувати як “<” і “>” відповідно. Таким чином, рядок “25 > 24 і 25 < 26” кодується в XML як “25 > 24 і 25 < 26”.
Синтаксис мови XML дуже схожий на синтаксис HTML і складається з послідовностей тегів, тексту і коментарів. Основна відмінність у тім, що теги XML, скоріше, характеризують те, що представляють дані, чим те, як їх варто представляти. Ще одна відмінність XML — потенційно необмежений набір тегів: користувач може визначати власні теги, у той час як у HTML вони фіксовані.
Синтаксис мови XML представлений серією елементів, кожний з який складається з відкриваючого тега, змісту і закриваючого тега, наприклад:
<PERSON>
<LASTNAME>Gates</LASTNAME> <FIRSTNAME>Bill</FIRSTNAME>
</PERSON>
Тут елемент PERSON (людина) починається в першому рядку і закінчується в останній. Як видно з приклада, один елемент може містити вкладені інші елементи. Прості документи можуть містити самі себе і самі себе описувати. Складні документи описуються в зовнішньому DTD-файлі опису типу документа (Document Type Definition).
5.2. Мережні технології
На даний час уявити собі аудиторію комп’ютерів без мережі важко, але процес їх стандартизації важкий, атому існують різні технології на базі яких вони створені. Нижче приведений їх огляд.
Технологія Ethernet
Ethernet — це найпоширеніший на сьогоднішній день стандарт локальних мереж. Загальна кількість мереж, що працюють по протоколі Ethernet у даний час, оцінюється в 5 мільйонів, а кількість комп'ютерів із установленими мережними адаптерами Ethernet — у 50 мільйонів.
Коли говорять Ethernet, те під цим звичайно розуміють кожної з варіантів цієї технології. У більш вузькому змісті Ethernet — це мережний стандарт, заснований на експериментальній мережі Ethernet Network, що фірма Xerox розробила і