часто називаються терміном OLTP (On-Line Transaction Processing) - оперативна транзакційна обробка, у противагу OLAP - оперативній аналітичній обробці [25];
системи, орієнтовані на аналітичну обробку даних - системи підтримки прийняття рішень (СППР), або Decision Support Systems (DSS).
На перших стадіях інформатизації завжди потрібно навести порядок саме в процесах повсякденної рутинної обробки даних, на що й орієнтовані традиційні СОД, тому випереджувальний розвиток систем цього класу цілком закономірний.
Системи другого класу (СППР) є вторинними стосовно них. Часто виникає ситуація, коли дані в організації накопичуються в ряді незв'язаних СОД, багато в чому дублюючи один одного, але не будучи ніяк погоджені. У такому випадку достовірну комплексну інформацію одержати практично неможливо, незважаючи на її удаваний надлишок.
Метою побудови корпоративного сховища даних (data warehouse) є інтеграція, актуалізація й узгодження оперативних даних з різнорідних джерел для формування єдиного несуперечливого погляду на об'єкт управління в цілому. При цьому в основі концепції сховищ даних лежить визнання необхідності поділу наборів даних, використовуваних для транзакційної обробки, і наборів даних, застосовуваних у системах підтримки прийняття рішень. Такий поділ можливий шляхом інтеграції роз'єднаних у СОД і зовнішніх джерелах деталізованих даних у єдиному сховищі, їхнього узгодження і, можливо, агрегації. Сховища як предметно-орієнтовані, інтегровані, немінливі, підтримуючі хронологію набори даних, організовані з метою підтримки управління, покликані виступати в ролі єдиного джерела істини, що забезпечує менеджерів і аналітиків достовірною інформацією, яка необхідна для оперативного аналізу і підтримки прийняття рішень.
Сховище даних являє собою послідовність моментальних знімків корпоративної інформації через визначені, заздалегідь задані, проміжки часу. Воно може поповнюватися щодня, щотижня або щомісяця - це визначається в процесі його організації. Початкові дані для сховища надходять із БД, що підтримують різні бізнес-процеси компанії, а також із зовнішніх джерел. Вхідні дані попередньо повинні бути оброблені, щоб протиріччя реального часу не перешкоджали використовувати інформацію. Інформація цього типу дозволяє аналізувати тенденції або стан на визначений момент часу. Історичний погляд на події має велике значення для прийняття перспективних рішень.
Середовище сховища даних – це складний конгломерат різноманітних інструментів і функцій, що реалізують безперервний процес створення, експлуатації, поступового розширення і зміни інформаційного складу. Основними компонентами такого середовища є програми доступу до джерел даних, інструменти перетворення оперативних і зовнішніх даних, бази даних сховища, програма керування сховищем (адміністратор).
Концепція сховищ даних припускає не просто єдиний логічний погляд на дані організації, а дійсну реалізацію єдиного інтегрованого джерела даних. Альтернативним, стосовно цієї концепції, способом формування єдиного погляду на корпоративні дані є створення віртуального джерела, що спирається на розподілені бази даних різних СОД. При цьому кожний запит до такого джерела динамічно транслюється в запити до вихідних баз даних, а отримані результати узгоджуються, зв'язуються, агрегуються і повертаються до користувача. Однак, при цьому такий спосіб має ряд істотних недоліків:
час обробки запитів до розподіленого сховища значно перевищує відповідні показники для централізованого сховища. Крім того, структури баз даних СОД у високому ступені нормалізовані, тому в аналітичному запиті до них потрібно звернення до великого числа таблиць, що також приводить до зниження швидкодії.;
інтегрований погляд на розподілене корпоративне сховище можливий тільки при виконанні вимоги постійного зв'язку всіх джерел даних у мережі. Таким чином, тимчасова недоступність хоча б одного з джерел може або зробити роботу ІС неможливою, або привести до помилкових результатів;
виконання складних аналітичних запитів над таблицями СОД споживає великий обсяг ресурсів сервера БД і приводить до зниження швидкодії СОД, що неприпустимо, тому що час виконання операцій у СОД часто досить обмежений;
різні СОД можуть підтримувати різні формати і кодування даних, дані в них можуть бути неузгоджені. Дуже часто на одне й те саме питання може бути отримано кілька варіантів відповіді, що може бути зв'язане з несинхронністю моментів відновлення даних, відмінностями в трактуванні окремих подій, понять і даних, зміною семантики даних у процесі розвитку предметної області, помилками при введенні, утратою фрагментів архівів і т.д. У такому випадку ціль - формування єдиного несуперечливого погляду на об'єкт керування - може не бути досягнута;
головним же недоліком варто визнати практичну неможливість огляду тривалих історичних послідовностей, тому що при фізичній відсутності центрального сховища доступні тільки ті дані, що на момент запиту є в реальних БД зв'язаних СОД. Основне призначення СОД - оперативна обробка даних, тому вони не можуть зберігати дані за тривалий (більш декількох місяців) період; у міру старіння дані вивантажуються в архів і віддаляються з транзакційної БД. Що стосується аналітичної обробки, то тут саме найбільш цікавий погляд на об'єкт управління в історичній перспективі.
Сховище даних функціонує у такий спосіб: за заданим регламентом в нього збираються дані з різних джерел - баз даних систем оперативної обробки. У сховищі підтримується хронологія: нарівні з поточними зберігаються історичні дані з указанням часу, до якого вони відносяться. У результаті необхідні дані про об'єкт управління збираються в одному місці, приводяться до єдиного формату, узгоджуються і, у ряді випадків, агрегатуються до мінімально необхідного рівня узагальнення.
Спрощеним варіантом корпоративного сховища даних можуть бути вітрини даних, що містять інформацію, яка відноситься до окремих аспектів діяльності організації. При цьому головна ідея полягає в тому, що вітрини даних містять тематичні підмножини заздалегідь агрегованих даних, за розмірами набагато меншими, чим загальне корпоративне сховище даних, і, тим самим вимагають менш продуктивної техніки для їх підтримки. При об’єднанні двох концепцій використовують сховище даних у якості єдиного інтегрованого