Бази даних у Internet
Бази даних були природньо поєднані з WWW і CGI з самого початку Web. Фактично, Web є неосяжною всесвітньою базою даних, колекцією даних і ресурсів, доступних за допомогою клацання мишкою.
На вищому рівні, взаємодія з серверними базами даних є одним з найбільш природних застосувань CGI. Кінцевий користувач може представити запит через форму і мати результати, які показуються безпосередньо назад до його вікна перегляду.
Через те, що протягом транзакції з базою даних взаємодія у реальному часі звичайно не потрібна, однієї з головних перешкод CGI (відсутність постійного зв'язку) уникають одразу. Крім того, розмір бази даних майже не впливає на швидкість транзакції, тому що до клієнта посилаються тільки результати запиту. (Будь-хто, хто використовував один з пошуковиків Web, - наприклад, AltaVista або Lycos, може підтвердити це.)
Хоч будь-який вид бази даних доступний через CGI, є декілька типів баз даних, які стали дуже популярними на Павутині:
Невеликі текстові бази даних. Вони є найлегшими для створення та корисними для багатьох малих або середніх задач. Ці бази даних є просто файлами ASCII з розмежуванням або записами фіксованої довжини. Адресні книги, списки, і такі інші бази даних з обмеженим рядом елементів добре відповідають вимогам саме цього методу.
Бази даних Web. Природніми кандидатами для баз даних Web є безпосередньо Web. Служби, які контролюють великі порції Павутини (наприклад, Usenet, Gopher, і так далі) виникають дуже часто. Це можна також застосувати до локальних мереж і єдиних машин. Індексне програмне забезпечення, подібне до freeWais або Ice може створити базу даних повного сайту, який потім буде доступний через програми CGI.
Великі серверні бази даних. Великі бази даних взагалі зберігаються в сервері деякої бази даних (навіть якщо сервер є також клієнт, як наприклад найбільш загальні базові бази даних Windows). Поки сервер має деякий інтерфейсний метод для інших програмам, інформація в цих базах даних буде доступна з програм CGI.
Практично, бази даних Web можуть бути деякою комбінацією вищевказаних. Кожна база даних має власні потреби, і програми CGI часто повинні бути налагодженими, щоб відповідати вимогам вашої конкретної бази даних.
Інтерфейси Баз даних
Для ефективного поєднання вашої бази даних з Web без будь-яких втрат, CGI повинен використовуватися як в інтерфейсі так і в реалізації взаємодії бази даних.
Інтерфейс CGI
Поперше, треба розглянути те, як користувач збирається ввести запити до бази даних. Форма HTML є найбільш загальним шляхом для користувача, щоб представити інформацію, хоч є і інші шляхи. Як приклад, розглянемо інтерфейс до адресної книги. Проста форма могла б бути схожою з цим:
<HTML><HEAD><TITLE>My Address Book</title></head>
<BODY>
<H2>Welcome to my address book</h2>
To find addresses that match a certain category, fill in that category and
then press 'submit'.
<FORM ACTION="address.cgi" METHOD="POST">
Name: <INPUT SIZE=45 name="name"><br>
Phone: <INPUT SIZE=45 name="phone"><br>
Street Address: <INPUT SIZE=45 name="street"><BR>
City: <INPUT SIZE=20 name="city"> State: <INPUT SIZE=3 name="state">
Zip: <INPUT SIZE=6 name="zip"><br>
<INPUT TYPE=SUBMIT Value=" Query
<INPUT TYPE=RESET Value=" Form
</body></html>
Ця форма викликає CGI-скрипт address.cgi. Це є інтерфейс взаємодії з базою даних. Намір інтерфейсу - забрати дані з форми, проаналізувати їх, і передати запит до бази даних. Якщо база даних є текстовим ASCII-файлом, інтерфейс є також і реалізацією. Він повинний зробити пошук, інтерпретувати дані, і потім передати результати назад до клієнта. Для серверів баз даних (включаючи такі індекси Web,як freeWais і Ice), інтерфейс повинний надати запиту форму, яку сервер зрозуміє, і потім передати запит до сервера. CGI-програма повинна потім забрати результати і передати їх до користувача. Дуже часто в цьому випадку інтерфейси і реалізації містяться в тій же програмі. На системах, які підтримують це (UNIX, Amiga, і інші), для цього можна застосовувати розгалуження процесу. У Windows-середовищі, необхідні спеціальні програми, які використовують OLE або деякий інший тип зв'язку.
Щоб повернутися до прикладу адресної книги, можна створити в даний момент програму CGI, яка відповість запиту клієнта.
По-перше, нам потрібно знати формат бази даних безпосередньо. Малий текстовий формат є достатнім для наших потреб. Ми повинні використовувати розмежовані дані, хоч записи фіксованої довжини повинні також працювати. Запис прикладу слідує:
0:Elmer J. Fudd:555-1234:42 Jones Lane:Chuckville:CA:90210
Цей формат буде добре обізнаний до будь-кого, хто бачив файл пароля UNIX. Є дві перешкоди до цього формату. Сума всіх полів не може перевищити ніяких обмежень лінійної довжини на будь-якій системі, яку ви використовуєте (в нашому випадку, це не має бути проблемою). Також, розділювач (двокрапка) не повинний з'являтися в будь-якому полі, або це буде сприйнято як початок нового поля. У ідеальному світі, це не повинне бути проблемою (, якщо не хто-небудь, хто живе за адресою "Нью-йорк: Місто"). Але фактично, люди роблять памылки. Таким чином, треба бути ознайомленим з цією потенційною проблемою.
Тепер, коли ми знаємо форму бази даних, ми можемо почати програму CGI, щоб зібрати інформацію від форми. Будь-яка мова може використатися для написання CGI, але в цьому прикладі використано Perl для використання можливостей обробки тексту.
#!/bin/perl
require cgi_head; # Дістати дані з форми та роздрукувати заголовок.
!!!!!
У всіх CGI, написаних на Perl в цьому розділі, модуль cgi_head.pm використовується, для збору інформації від форми і надрукувати необхідний заголовок HTML. Цей модуль розміщує вхід форми з ім'ям 'foo' в асоціативний вхід з ім'ям $FORM{'foo'}. Існує декілька вільнодоступних програм для декількох мов, для виконання цього,