RT.DataLake

Мощный и гибкий инструмент для организации эффективного корпоративного хранилища данных.
Отвечает высоким требованиям надежности, доступности и низкой стоимости хранения данных, предназначен для обработки данных любых объемов, основан на базе Apache Hadoop.

Ключевые функции и возможности

  1. Актуальные и стабильные версии компонент для исключения проблем совместимости, помимо последней версии Hadoop 3 мы поддерживаем дистрибутив Hadoop 2.
  2. Управление компонентами RT.DataLake обеспечивается через интерфейс RT.ClusterManager, включающие такие функции, как:
    автоматическая установка кластера, благодаря собственным ansible-скриптам
    мониторинг и отслеживание состояния каждого компонента системы
    возможность гибкого масштабирования
  3. Функции управления безопасностью: настройка ролевой модели.

Состав компонентов

Компонент Сборка Hadoop 2.8.5 Сборка Hadoop 3.0.0 Сборка Hadoop 3.3.0
Hadoop
2.8.5 3.0.0 3.3.0
Hive
2.3.3 3.1.1 3.1.2
Spark
2.3.1 2.4.0&3.0.0 3.0.1
Zookeeper
3.4.12 3.4.5/3.7.0 3.5.6
Hbase
1.4.8 2.2.6 2.3.3
Hue
4.10.0 4.10.0 4.10.0
Ranger
0.7.1 2.2.0 2.2.0
Ozone
--- --- 1.0.0
Oozie
4.3.1 5.2.1 5.2.1
Tez
0.9.1 0.10.0 0.10.0
Livy
0.5.0 0.7.1 0.7.1
Phoenix
4.14.0 5.1.0 5.1.2
Zeppelin
0.9.0 0.9.0 0.9.0
Sqoop
1.4.7 1.4.7 1.4.7
Flume
1.8.0 1.9.0 1.9.0
Solr
7.3.1 8.7.0 8.11.1
Knox
0.14.0 0.14.0 0.14.0
Flink
1.6.1 1.11.6 1.11.6
Avro
1.8.2 1.8.2 1.8.2
Parquet
1.9.0 1.9.0 1.9.0

Преимущества

Сборка на базе открытых проектов Apache. Управление компонентами RT.DataLake обеспечивается через интерфейс RT.ClusterManager
Короткий цикл доставки изменений (bug fix, security bug fix и new features) в код и выпуска новых версий RT.DataLake за счет автоматизации сборки и тестирования версий
Техническая поддержка и консультации пользователей на русском языке, полноценный комплект технической и эксплуатационной документации на русском языке
Гибкие варианты поставки и развертывания решения: от самостоятельной установки дистрибутива в инфраструктуре Заказчика до использования готового решения в облачной инфраструктуре дата-центров Ростелекома и его партнеров
Программный продукт зарегистрирован в реестре отечественного программного обеспечения

Типовые кейсы использования

Построение корпоративного хранилища больших данных, предназначенного для хранения большого объема неструктурированной и слабоструктурированной информации.
Использование неструктурированной и слабоструктурированной информации в решении различных бизнес-задач, от построения отчетности, до создания моделей машинного обучения.

Свидетельства и сертификаты