RT.DataLake

Мощный и гибкий инструмент для организации эффективного корпоративного хранилища данных
Отвечает высоким требованиям надежности, доступности и низкой стоимости хранения данных, предназначен для обработки данных любых объемов, основан на базе Apache Hadoop

Ключевые функции и возможности

  1. Актуальные и стабильные версии компонент для исключения проблем совместимости, помимо последней версии Hadoop 3 мы поддерживаем дистрибутив Hadoop 2. Гибкая кастомизация сборки дистрибутива
    • Возможность выбора компонентов (в том числе новых) и их версий
    • Возможность обновления версий отдельных компонентов
  2. Управление компонентами RT.DataLake обеспечивается через интерфейс RT.ClusterManager, включающие такие функции, как:
    • Автоматическая установка кластера, благодаря собственным ansible-скриптам
    • Мониторинг и отслеживание состояния каждого компонента системы
    • Возможность гибкого масштабирования
  3. Функции управления безопасностью: настройка ролевой модели
    • Керберизация кластера
    • SSL
    • Aудит

Состав компонентов

КомпонентСборка Hadoop 2.8.5Сборка Hadoop 3.0.0Сборка Hadoop 3.2.2Сборка Hadoop 3.3.0
Hadoop
2.8.53.0.03.2.23.3.0
Hive
2.3.33.1.13.1.23.1.2
Spark
2.3.12.4.0 3.0.0 3.2.02.4.0 3.0.1 3.2.03.0.1
Zookeeper
3.4.123.4.5 3.7.03.4.14 3.7.03.5.6
Hbase
1.4.82.2.62.2.62.3.3
Hue
4.10.04.10.04.10.04.10.0
Ranger
0.7.12.2.02.2.02.2.0
Oozie
4.3.15.2.15.2.15.2.1
Tez
0.9.10.10.00.10.00.10.0
Livy
0.5.00.7.10.7.10.7.1
КомпонентСборка Hadoop 2.8.5Сборка Hadoop 3.0.0Сборка Hadoop 3.2.2Сборка Hadoop 3.3.0
Phoenix
4.14.05.1.05.1.05.1.2
Zeppelin
0.9.00.9.00.10.10.9.0
Sqoop
1.4.71.4.71.4.71.4.7
Flume
1.8.01.11.01.11.01.11.0
Solr
7.3.18.7.08.11.38.11.1
Knox
0.14.01.6.11.6.10.14.0
Flink
1.6.11.11.61.11.31.11.6
Avro
1.8.21.8.21.8.21.8.2
Parquet
1.9.01.9.01.9.01.9.0
PostgreSQL
11.14 12.1011.14 12.1011.14 12.1011.14 12.10

Преимущества

Сборка на базе открытых проектов Apache. Управление компонентами RT.DataLake обеспечивается через интерфейс RT.ClusterManager
Короткий цикл доставки изменений (bug fix, security bug fix и new features) в код и выпуска новых версий RT.DataLake за счет автоматизации сборки и тестирования версий
Техническая поддержка и консультации пользователей на русском языке, полноценный комплект технической и эксплуатационной документации на русском языке
Гибкие варианты поставки и развертывания решения: от самостоятельной установки дистрибутива в инфраструктуре до готового решения в облачной инфраструктуре дата-центров Ростелекома и его партнеров
Программный продукт зарегистрирован в реестре отечественного программного обеспечения (реестровая запись №10729 от 22.06.2021)
Гибкая кастомизация дистрибутива в соответствии с потребностями Заказчика: возможность выбора компонентов (в том числе новых) и их версий
Возможность установки в кластере нескольких единовременно работающих версий Spark

Типовые кейсы использования

Построение корпоративного хранилища больших данных, предназначенного для хранения большого объема неструктурированной и слабоструктурированной информации.
Использование неструктурированной и слабоструктурированной информации в решении различных бизнес-задач, от построения отчетности, до создания моделей машинного обучения.

Свидетельства о регистрации

Документация и релизы

Подробная и актуальная информация о продукте: руководства, справочные материалы, инструкции по установке, статьи по настройке и эксплуатации ПО, а также подробные заметки о релизах, информирующие о новых функциях, исправлениях и обновлениях