RT.DataLake
Мощный и гибкий инструмент для организации эффективного корпоративного хранилища данных.
Отвечает высоким требованиям надежности, доступности и низкой стоимости хранения данных, предназначен для обработки данных любых объемов, основан на базе Apache Hadoop.
Ключевые функции и возможности
-
Актуальные и стабильные версии компонент для исключения проблем совместимости, помимо последней версии Hadoop 3 мы поддерживаем дистрибутив Hadoop 2. Гибкая кастомизация сборки дистрибутива.
- Возможность выбора компонентов (в том числе новых) и их версий
- Возможность обновления версий отдельных компонентов
-
Управление компонентами RT.DataLake обеспечивается через интерфейс RT.ClusterManager, включающие такие функции, как:
- Автоматическая установка кластера, благодаря собственным ansible-скриптам
- Мониторинг и отслеживание состояния каждого компонента системы
- Возможность гибкого масштабирования
-
Функции управления безопасностью: настройка ролевой модели.
- Керберизация кластера
- SSL
- Aудит
Состав компонентов
Компонент | Сборка Hadoop 2.8.5 | Сборка Hadoop 3.0.0 | Сборка Hadoop 3.2.2 | Сборка Hadoop 3.3.0 |
---|---|---|---|---|
|
2.8.5 | 3.0.0 | 3.2.2 | 3.3.0 |
|
2.3.3 | 3.1.1 | 3.1.2 | 3.1.2 |
|
2.3.1 | 2.4.0 3.0.0 3.2.0 | 2.4.0 3.0.1 3.2.0 | 3.0.1 |
|
3.4.12 | 3.4.5 3.7.0 | 3.4.14 3.7.0 | 3.5.6 |
|
1.4.8 | 2.2.6 | 2.2.6 | 2.3.3 |
|
4.10.0 | 4.10.0 | 4.10.0 | 4.10.0 |
|
0.7.1 | 2.2.0 | 2.2.0 | 2.2.0 |
|
4.3.1 | 5.2.1 | 5.2.1 | 5.2.1 |
|
0.9.1 | 0.10.0 | 0.10.0 | 0.10.0 |
|
0.5.0 | 0.7.1 | 0.7.1 | 0.7.1 |
Компонент | Сборка Hadoop 2.8.5 | Сборка Hadoop 3.0.0 | Сборка Hadoop 3.2.2 | Сборка Hadoop 3.3.0 |
---|---|---|---|---|
|
4.14.0 | 5.1.0 | 5.1.0 | 5.1.2 |
|
0.9.0 | 0.9.0 | 0.10.1 | 0.9.0 |
|
1.4.7 | 1.4.7 | 1.4.7 | 1.4.7 |
|
1.8.0 | 1.11.0 | 1.11.0 | 1.11.0 |
|
7.3.1 | 8.7.0 | 8.11.3 | 8.11.1 |
|
0.14.0 | 1.6.1 | 1.6.1 | 0.14.0 |
|
1.6.1 | 1.11.6 | 1.11.3 | 1.11.6 |
|
1.8.2 | 1.8.2 | 1.8.2 | 1.8.2 |
|
1.9.0 | 1.9.0 | 1.9.0 | 1.9.0 |
|
11.14 12.10 | 11.14 12.10 | 11.14 12.10 | 11.14 12.10 |
Преимущества
Сборка на базе открытых проектов Apache. Управление компонентами RT.DataLake обеспечивается через интерфейс RT.ClusterManager.
Короткий цикл доставки изменений (bug fix, security bug fix и new features) в код и выпуска новых версий RT.DataLake за счет автоматизации сборки и тестирования версий.
Техническая поддержка и консультации пользователей на русском языке, полноценный комплект технической и эксплуатационной документации на русском языке.
Гибкие варианты поставки и развертывания решения: от самостоятельной установки дистрибутива в инфраструктуре до готового решения в облачной инфраструктуре дата-центров и его партнеров.
Программный продукт зарегистрирован в реестре отечественного программного обеспечения.
Гибкая кастомизация дистрибутива в соответствии с потребностями Заказчика: возможность выбора компонентов (в том числе новых) и их версий.
Возможность установки в кластере нескольких единовременно работающих версий Spark.
Типовые кейсы использования
Построение корпоративного хранилища больших данных, предназначенного для хранения большого объема неструктурированной и слабоструктурированной информации.
Использование неструктурированной и слабоструктурированной информации в решении различных бизнес-задач, от построения отчетности, до создания моделей машинного обучения.