RT.DataLake

Мощный и гибкий инструмент для организации эффективного корпоративного хранилища данных.
Отвечает высоким требованиям надежности, доступности и низкой стоимости хранения данных, предназначен для обработки данных любых объемов, основан на базе Apache Hadoop.

Ключевые функции и возможности

  1. Актуальные и стабильные версии компонент для исключения проблем совместимости, помимо последней версии Hadoop 3 мы поддерживаем дистрибутив Hadoop 2. Гибкая кастомизация сборки дистрибутива.
    • Возможность выбора компонентов (в том числе новых) и их версий
    • Возможность обновления версий отдельных компонентов
  2. Управление компонентами RT.DataLake обеспечивается через интерфейс RT.ClusterManager, включающие такие функции, как:
    • Автоматическая установка кластера, благодаря собственным ansible-скриптам
    • Мониторинг и отслеживание состояния каждого компонента системы
    • Возможность гибкого масштабирования
  3. Функции управления безопасностью: настройка ролевой модели.
    • Керберизация кластера
    • SSL
    • Aудит

Состав компонентов

Компонент Сборка Hadoop 2.8.5 Сборка Hadoop 3.0.0 Сборка Hadoop 3.2.2 Сборка Hadoop 3.3.0
Hadoop
2.8.5 3.0.0 3.2.2 3.3.0
Hive
2.3.3 3.1.1 3.1.2 3.1.2
Spark
2.3.1 2.4.0 3.0.0 3.2.0 2.4.0 3.0.1 3.2.0 3.0.1
Zookeeper
3.4.12 3.4.5 3.7.0 3.4.14 3.7.0 3.5.6
Hbase
1.4.8 2.2.6 2.2.6 2.3.3
Hue
4.10.0 4.10.0 4.10.0 4.10.0
Ranger
0.7.1 2.2.0 2.2.0 2.2.0
Oozie
4.3.1 5.2.1 5.2.1 5.2.1
Tez
0.9.1 0.10.0 0.10.0 0.10.0
Livy
0.5.0 0.7.1 0.7.1 0.7.1
Компонент Сборка Hadoop 2.8.5 Сборка Hadoop 3.0.0 Сборка Hadoop 3.2.2 Сборка Hadoop 3.3.0
Phoenix
4.14.0 5.1.0 5.1.0 5.1.2
Zeppelin
0.9.0 0.9.0 0.10.1 0.9.0
Sqoop
1.4.7 1.4.7 1.4.7 1.4.7
Flume
1.8.0 1.11.0 1.11.0 1.11.0
Solr
7.3.1 8.7.0 8.11.3 8.11.1
Knox
0.14.0 1.6.1 1.6.1 0.14.0
Flink
1.6.1 1.11.6 1.11.3 1.11.6
Avro
1.8.2 1.8.2 1.8.2 1.8.2
Parquet
1.9.0 1.9.0 1.9.0 1.9.0
PostgreSQL
11.14 12.10 11.14 12.10 11.14 12.10 11.14 12.10

Преимущества

Сборка на базе открытых проектов Apache. Управление компонентами RT.DataLake обеспечивается через интерфейс RT.ClusterManager.
Короткий цикл доставки изменений (bug fix, security bug fix и new features) в код и выпуска новых версий RT.DataLake за счет автоматизации сборки и тестирования версий.
Техническая поддержка и консультации пользователей на русском языке, полноценный комплект технической и эксплуатационной документации на русском языке.
Гибкие варианты поставки и развертывания решения: от самостоятельной установки дистрибутива в инфраструктуре до готового решения в облачной инфраструктуре дата-центров и его партнеров.
Программный продукт зарегистрирован в реестре отечественного программного обеспечения.
Гибкая кастомизация дистрибутива в соответствии с потребностями Заказчика: возможность выбора компонентов (в том числе новых) и их версий.
Возможность установки в кластере нескольких единовременно работающих версий Spark.

Типовые кейсы использования

Построение корпоративного хранилища больших данных, предназначенного для хранения большого объема неструктурированной и слабоструктурированной информации.
Использование неструктурированной и слабоструктурированной информации в решении различных бизнес-задач, от построения отчетности, до создания моделей машинного обучения.

Свидетельства о регистрации