Создание информационно-аналитических комплексов и систем поддержки принятия решений с использованием OLAP и WEB технологий.
Потребность в анализе данных
Во всем мире организации накапливают или уже накопили в процессе своей деятельности большие объемы данных. Эти коллекции данных хранят в себе большие потенциальные возможности по извлечению новой, аналитической информации, на основе которой можно и необходимо строить стратегию, выявлять тенденции, находить новые решения. Для некоторых организаций такой анализ является неотъемлемой частью их повседневной деятельности, но большинство, только начинает приступать к нему всерьез.
Хранилища Данных
Для того чтобы обеспечить возможность анализа накопленных данных, организации стали создавать хранилища данных, которые представляют собой интегрированные коллекции данных, собранные из различных систем оперативного доступа к данным.
Основная цель хранилищ — создание единого логического представления данных, посредством:
- Интеграции в одном месте, согласования и агрегации ранее разъединенных детализированных данных: исторических архивов, данных из оперативных систем, данных из внешних источников
- Разделения наборов данных, используемых для оперативной обработки, и наборов данных, используемых для решения задач поддержки принятия решений.
- Обеспечения всесторонней информационной поддержки максимальному кругу пользователей.
Несмотря на различия в подходах и реализациях, всем хранилищам данных свойственны следующие общие черты:
Предметная ориентированность. Информация в хранилище данных организована в соответствии с основными аспектами деятельности предприятия; это отличает хранилище данных от оперативной БД, где данные организованы в соответствии с процессами. Предметная организация данных в хранилище способствует как значительному упрощению анализа, так и повышению скорости выполнения аналитических запросов.
Интегрированность. Исходные данные извлекаются из оперативных БД, проверяются, очищаются, приводятся к единому виду, в нужной степени агрегируются (то есть вычисляются суммарные показатели) и загружаются в хранилище. Такие интегрированные данные намного проще анализировать.
Привязка ко времени. Данные в хранилище всегда напрямую связаны с определенным периодом времени. Данные, выбранные их оперативных БД, накапливаются в хранилище в виде «исторических слоев», каждый из которых относится к конкретному периоду времени. Это позволяет анализировать тенденции в развитии.
Неизменяемость. Попав в определенный «исторический слой» хранилища, данные уже никогда не будут изменены. Это также отличает хранилище от оперативной БД, в которой данные все время меняются. Стабильность данных также облегчает их анализ.
Хранилища данных (Datawarehouse) и оперативный анализ данных (On-Line Analytical Processing, OLAP) — новые информационные технологии, которые обеспечивают аналитикам, управленцам и руководителям высшего звена возможность изучать большие объемы взаимосвязанных данных при помощи быстрого интерактивного отображения информации на разных уровнях детализации с различных точек зрения в соответствии с представлениями пользователя о предметном пространстве. Сегодня хранилища данных и OLAP становятся неотъемлемой частью современных корпоративных систем поддержки принятия решений.
Масштабы и способ использования этих хранилищ данных изменяются в широких пределах в зависимости от типа организации и вида деловой информации, для поддержки которых они разрабатывались.
Архитектура хранилищ данных.
Основными компонентами хранилища являются:
- источники данных,
- хранилище данных,
- оперативный склад данных,
- витрины данных,
- метаданные.
Источники данных.
Источниками данных хранилища служат оперативные транзакционные системы, которые обслуживают повседневную учетную деятельность компании.
В качестве источников данных, могут быть рассмотрены внешние системы, в том числе и Интернет. Детальные данные из источников могут либо напрямую поступать в хранилище, либо предварительно агрегироваться до требуемого уровня обобщения.
Хранилище данных.
Хранилище данных представляет собой предметно-ориентированную базу или совокупность БД, извлекаемых из источников, которые организованы по сегментам, отражающим конкретную предметную область.
Оперативный склад данных.
Оперативный склад служит буфером между транзакционными источниками данных и хранилищем. Данные, прежде чем попасть в хранилище, должны быть преобразованы в единые форматы, очищены, объединены и синхронизированы. Оперативный склад данных служит аккумулятором данных, поступающих от источников, перед их загрузкой в хранилище. В отличие от хранилища данных информация в складе данных может изменяться со временем в соответствии с изменениями, происходящими в источниках данных.
Данные оперативного склада регулярно обновляются. Каждый раз, когда данные изменяются в оперативных системах и внешних источниках, соответствующие им данные из оперативного склада также должны быть изменены. Частота обновления оперативного склада зависит как от частоты обновления источников, так и от регламента загрузки данных в склад.
Витрины данных (Data mart).
Витрины данных (киоски данных) можно рассматривать как маленькие хранилища, которые создаются с целью информационного обеспечения аналитических задач конкретных управленческих подразделений компании.
Витрины данных можно представить в виде логически или физически разделенных подмножеств хранилищ данных. Обычно они строятся для обслуживания нужд определенной группы пользователей.
Источником данных для витрин служат данные хранилища, которые агрегируются и консолидируются по различным уровням иерархии. Детальные данные могут также помещаться в витрину или присутствовать в ней в виде ссылок на данные хранилища.
Метаданные.
Метаданные (или данные о данных) являются ключевым элементом в Хранилище. Они содержат полное описание логической и физической структуры данных, всех процессов загрузки данных, специализированных приложений для анализа и представления данных в определенных областях, а также дополнительную информацию обо всех элементах Хранилища, помогающую легко ориентироваться в его сложной структуре.
По функциональным требованиям эти средства можно разделить на две основные группы: средства просмотра и поиска, и средства создания и поддержки.
Методология построения хранилищ данных.
Существуют различные подходы к стратегии построения корпоративного хранилища данных. Наиболее эффективным подходом является подход, при котором в процессе разработки и внедрения хранилища данных осуществляется его пошаговое наращивание на основе единой системы классификаторов и общей среды передачи и хранения данных — спиральная модель процесса разработки.
Выбор метода реализации Хранилищ Данных.
Для успешного внедрения Хранилища Данных крайне важен правильный выбор поставщика. Предлагаемое им решение должно удовлетворять следующим критериям:
- Полнота — решение должно покрывать бизнес-потребности компании, предлагать полный спектр программных продуктов, обеспечивать техническую поддержку, обучение и другие сервисные услуги. Помимо технологической основы, оно должно включать в себя готовые приложения, которые позволят менеджерам решать вышеупомянутые аналитические задачи — поиска возможностей роста, обеспечения финансовой эффективности и баланса между ними.
- Интегрированность — решение должно хорошо вписаться в существующую среду; оно должно обеспечить бесперебойное взаимодействие всеми между компонентами системы на основе стандартов, принятых в индустрии программного обеспечения.
- Неограниченность — решение должно быть адаптируемым к изменениям; оно должно быть расширяемым на большее количество пользователей и большие объемы данных.
- Гарантированность — решение должно быть проверенным в смысле получаемых бизнес-преимуществ и качества технологии; поставщик должен иметь прочные финансовые позиции, значительную долю рынка, хорошую клиентскую базу и большое число партнеров, внедряющих его технологии.
Заключение.
Построение информационных систем в технологии Хранилищ данных является сложной и ресурсоемкой задачей. Все этапы разработки и эксплуатации системы должны опираться на надежные, хорошо зарекомендовавшие себя в многочисленных проектах средства, полностью интегрированные в единую среду.



