Java
Apache
Big Data
Hadoop
Комментарии 2
0
либо любым из инструментов типа Crunсh.


что такое Crunсh?
0
Apache Crunch — это такой… в общем map-reduce на стероидах. Умеет запускаться локально, на Yarn и на Spark.

Близок с Spark по идеологии, и похож по API, слегка, но SQL (и оптимизации) не умеет. Зато умеет Авро, паркет, понимает схемы, и имеет источники и приемники скажем для HBase.

Неплохой в целом инструмент, но я боюсь что он помер. Коммиты раз в несколько месяцев — это симптом, однако.
Только полноправные пользователи могут оставлять комментарии., пожалуйста.