Pull to refresh

Comments 3

Поддержка Docker-контейнеров. Это позволит запускать в Hadoop рабочие нагрузки, не связанные с большими данными.

На самом деле любые нагрузки. Тут ведь дело в чем — контейнер запускается на том узле, где у вас лежат данные. Там совершенно не обязательно уже есть нужный образ docker для запуска. Его нужно достать из реестра, а это сравнительно долго. Если же он уже есть — то запускать можно сразу. Собственно, примерно такая же картина имеет место и для других типов приложений — jar и python (с библиотеками) ведь тоже надо доставлять на узлы кластера так или иначе. Это просто расширение, которое включает в известный Yarn набор приложений еще и docker.

у слонов наполеоновские планы :) очень воодушевляет :D
Жаль, что Cloudera и Hortonworks все еще предлагают Hadoop 2.6.0 и 2.7.3 в своих последних сборках. При их текущем темпе Hadoop 3.x появится в энтерпрайзе только через год-два в лучшем случае.
Sign up to leave a comment.