Как стать автором
Обновить

Комментарии 3

Спасибо за статью, забрал в закладки.
Слишком сложно.
Fetchmail+procmail, а дальше уже ссылку передаем для нужного сервиса (на загрузку?).
Безусловно, есть очень много утилит, программ и скриптов, решающих данную проблему. В то же время, не стоит забывать, что ключевым контекстом в статье является описываемый ETL процесс и данные операции рассматриваются как небольшая часть одного большого непрерывного процесса, где одни действия и данные зависят от других.

С технической стороны, если используется конкретный фреймворк (в нашем случае Apache Airflow), то куда логичнее использовать его стандартные средства и архитектуру (сенсоры, операторы).

Вероятно, при необходимости можно построить ETL процесс в Airflow с использованием Fetchmail+procmail оптимальнее (зависит от критерия) представленного. Но будет ли он проще, чем использование стандартной библиотеки вопрос открытый. С удовольствием посмотрел бы на такую реализацию.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории