div 2
A[P[k]] ? A[P[2*k]] та A[P[k]] ? A[P[2*k+1]] (18.2)
Таким чином, виведення значення першого елемента масиву в результатний файл g задається як write(g, A[P[1]]). Замість обміну місцями значень у масиві A відбувається обмін значень у масиві P, заданий процедурою indswap:
procedure indswap(i, k : Longint);
var v : Longint;
begin
v := P[i]; P[i] := P[k]; P[k] := v.
end;
Із описання розв'язання нашої задачі побудови файла з якомога довшими відрізками неважко виділити окремі підзадачі та задати їх розв'язання підпрограмами.
Однією з підзадач є "заповнити масив змістом сховища". Реалізуємо сховище додатковим файлом типу T. Нехай копіювання значень із нього в масив задає процедура із заголовком
procedure copyfa(var f : FoT; var A : ArrT; var m : Longint);
Третій параметр служить для повернення кількості скопійованих значень. Оскільки сховище має таке саме подання, що і початковий файл, цією процедурою можна скористатися і для початкового заповнення масиву з файла.
Наступна підзадача – "вивести елементи масиву A у порядку неспадання в результатний файл без їх заміщення новими". Нехай це виведення задає процедура outtree із заголовком
procedure outtree(var f : FoT; var A : ArrT; m : Longint);
Для подальшого уточнення алгоритму скористаємося підпрограмами підрозділу 17.4.2, дещо змінивши їх із урахуванням подання даних.
Нехай процедура з заголовком indbld(m:Longint) задає початкову перестановку значень масиву P таким чином, що виконується умова (18.2). Нехай процедура indreorg(i,k:Longint) задає відновлення властивості (18.2) у частині масиву A[P[i]], … , A[P[k]].
З використанням усіх указаних підпрограм уточнимо алгоритм. Нехай змінна n зберігає кількість значень, скопійованих у масив A, ch – кількість значень, записаних у сховище, подане файлом h. Нехай last – останнє значення, виведене в результатний файл. Не записуючи всіх означень, наведемо основну частину програми:
copyfa(f, A, n); indbld(n); ch:=0;
while (n>0) and not eof(f) do
begin
last:=A[P[1]]; write(g, last);
read(f, A[1]);
if (A[1] < last) and (ch < MX) then
begin write(h, A[1]); ch:=ch+1 end
else
if A[1] < last then {ch=MX}
begin
outtree(g, A, n);
copyfa(h, A, n); ch:=0;
indbld(n);
end
else {A[1] ? last}indreorg(1, n)
end;
if n > 0 then outtree(g, A, n);
if ch > 0 then
begin
copyfa(h, A, n); ch:=0;
indbld(n); outtree(g, A, n)
end
Із зазначених вище підпрограм уточнимо лише процедуру outtree, решта залишаються вправами (див.підр.17.4.2).
procedure outtree(var f : FoT; var A : ArrT; m : Longint);
begin
while m>3 do
begin
write(g, A[P[1]]); indswap(1, m);
m:=m-1; indreorg(1, m);
end;
write(g, A[P[1]]);
if m=3 then
if A[P[2]] > A[P[3]] then indswap(2, 3);
if m > 1 then write(g, A[P[2]]);
if m=3 then write(g, A[P[3]])
end
Задача
18.1. Написати програму сортування файла на основі ідей, описаних у підр.18.1–18.2.
3. Індексові файли
Почнемо з прикладу. Дані про абонента телефонної мережі включають в себе його номер, прізвище, адресу та багато іншої інформації. Шукати дані про абонента доводиться, наприклад, як за його номером, так і за прізвищем. А пошуки у відсортованому файлі значно швидші, ніж у невідсортованому. Отже, за значеннями якого з полів – номера чи прізвища – слід сортувати файл?
Відповідь на це питання дає застосування так званих індексових файлів. Розглянемо послідовність пар із рядків і чисел:
<("qw", 31), ("er", 86), ("ty", 12), ("io", 24)>.
Якщо замінити пари їх номерами (індексами) у послідовності, то упорядкування пар за алфавітним зростанням їх рядків має вигляд <2, 4, 1, 3>, тобто найменшим є "er" із пари 2, наступним – "io" із 4 тощо. Така послідовність номерів і є змістом індексового файла, відповідного цій послідовності пар за упорядкуванням рядків. Водночас, можна так само упорядкувати пари за зростанням чисел: <3, 4, 1, 2>, і це буде змістом іншого індексового файла.
Отже, значеннями елементів індексового файла є номери (або інші позначення) елементів основного файла. Перший елемент індексового файла вказує на найменший із елементів основного файла за деяким їх упорядкуванням, другий – на наступний тощо, останній – на найбільший. Якщо елементи основного файла мають багато полів, то для нього можна створити кілька різних індексових файлів.
Індексові файли дозволяють взагалі не сортувати основний файл. У випадку, коли його елементи складаються сотнями й тисячами байтів, таке сортування надто дороге. Індексові ж файли складаються з цілих, і їх сортування, як правило, можна здійснити, представивши їх зміст у масиві.
Отже, використання індексових файлів дозволяє одночасно розглядати той самий файл як упорядкований за значеннями кількох різних полів його записів. Саме це дозволяє вести швидкий пошук у ньому за кількома різними ключами.
Задачі
2. Написати пpоцедуpу побудови індексового файла за файлом записів.
3. Написати пpоцедуpу виведення записів типізованого файла за зростанням значень указаного поля (з використанням індексового файла).
4. Написати процедуру зміни індексового файла при
а) додаванні б) вилученні
записів основного файла.