Реализация Централизованного хранилища данных в ПАО «Ростелеком»
- Data Warehouse
- Data Engineering
Задача
В ПАО Ростелеком используется порядка 1400 различных операционных систем-источников, решающих различные прикладные бизнес-задачи (выполнение бухгалтерских расчетов, биллинг, система линейно-технического учета, HR-аналитика и т.д.).
Для обработки и анализа данных систем-источников исторически было сформировано 4 хранилища федерального уровня, кроме того, в каждом из макрорегиональных филиалов построены свои локальные хранилища, локальные системы подготовки данных, дублирующие функционал хранилища, и подсистемы отчетности.
Такое разнообразие потребителей данных вызывает кратные нагрузки на операционные системы, при этом модели одних и тех же данных могут кардинально отличаться между хранилищами, что влечет расхождение информации, различную интерпретацию данных коммерческих, финансовых, натуральных показателей.
Поэтому в 2018 был запущен амбициозный проект – построение корпоративного хранилища данных, которое смогло бы объединить данные из всех систем-источников и локальных хранилищ данных и сделать их консистентными и удобными для построения консолидированной отчетности.
Решения
Централизованное хранилище данных - это
-
Повышение доступности, актуальности и качества данных для бизнеса.
-
Увеличена скорость подготовки отчётности и как следствие скорости принятия управленческих решений: на данных ЦХД выполнено более 300 бизнес-проектов.
-
Сокращены затраты на поддержку и развитие витрин/отчетности за счет централизации функционала, гармонизации набора технологий работы с данными при миграции нецелевых хранилищ в ЦХД.
-
Возможность быстрого анализа, построения пилотных моделей за счет наличия песочницы для бизнеса с доступом ко всем аналитическим данным для подготовки быстрой аналитики (без привлечения службы ИТ).
-
Все компоненты платформы управления данными, лежащей в основе ЦХД, зарегистрированы в реестре отечественного программного обеспечения и удовлетворяют требованиям импортозамещения.