Как стать автором
Обновить

Комментарии 5

Основная претензия к Snowflake — data lock-in.


Open-source версия, или хотя бы публичная документация формата файлов на S3 нужна индустрии.

Да, есть такое мнение, но немногие это учитывают как важный фактор при выборе платформы для аналитики.
Кому-то, возможно, будет интересно почитать короткую дискуссию на эту тему — она в комментариях к статье:
Selling the Data Lakehouse

Несколько странное требование к базе данных. Большинство OLAP решений по факту пропиетарные и не раскрывают свои форматы. А зачем? Если вам надо загрузить или выгрузить данные - куча открытых форматов подерживается. В чем там lock in вы усматриваете?

Ну если рассматривать Snowflake как базу то ОК, но если рассматривать как ground-truth data lake, то пока что есть аргументы что лучше по старинке хранить Parquet файлы на S3. Athena по функционалу и мощности — лишь подобие Snowflake. А хотелось бы большего.

Максим, очень хорошая статья! Спасибо )
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.