Pull to refresh

Comments 3

А этот текст точно не yalm-100b писало? RDS? SCD? Spark сотни миллионов строк в минуту? (а я думал он распределённый и масштабируется) Delta Lake инструмент для data quality? Как связаны снимки ФС и партиционирование? Понятно что гуглопереводчик, но не понятно как.

Spark масштабируемый и распределенный, да, но как это отменяет сотни миллионов? Delta Lake был назван "инструментом" автором книги, а "инструментом для data quality"..., боюсь вы придумали сами. Со "снимками ФС", да допущена промашка, слова "флйловой системы" -- лишние, но они и встречаются только один раз в заголовке

Это не гуглопереводчик, это хуже.

В некоторых отношениях она похожа на фабрику данных (data fabric)

Даже гуглопереводчик знает, что fabric - это ткань, а не фабрика.

Sign up to leave a comment.