Pull to refresh
0
@ahasread⁠-⁠only

User

Send message

Как и зачем «Ашан» построил платформу для работы с Big Data в публичном облаке

Reading time14 min
Views6.6K


Space Station by Kaioshen


Современный ритейл уже не может обходиться без построения прогнозных и рекомендательных систем на основе Big Data. Но при больших объемах данных, таких как у «Ашана», работа с большими данными на локальных мощностях неэффективна: это дорого, сложно в эксплуатации и может привести к гонке за ресурсы между подразделениями.


Поэтому некоторые компании приходят к облачной Big Data-платформе как к инструменту, который дает простую масштабируемость и управляемость для систем, работающих с Big Data. Переход на такую платформу не будет простым: недостаточно перенести рабочие системы в облако как они есть. Потребуется глобальная перестройка — причем не только в плане архитектуры и технологий, но и на уровне корпоративной культуры. Пользователям отчетов придется учить SQL, а разработке, тестированию и эксплуатации — дружить под флагом DevOps.


Я — Александр Дорофеев, ex Head of Big Data в компании «Ашан Ритейл Россия», в статье расскажу:


  • почему для наших задач самым подходящим решением оказалась специализированная единая Big Data-платформа и какую целевую архитектуру мы выбрали;
  • почему ее понадобилось делать на базе публичного облака и почему мы для этого выбрали облачную платформу Mail.ru Cloud Solutions;
  • как происходил переезд в облако, с какими трудностями мы столкнулись и каких результатов удалось достичь.
Читать дальше →
Total votes 27: ↑26 and ↓1+25
Comments2

Сравнительный анализ Low-code BPM-систем

Reading time19 min
Views22K

Однажды утром вы просыпаетесь с непреодолимой жаждой выбрать Low-code BPM-систему для своих нужд. Побочным результатом такой жажды стала эта статья. Текст не дает однозначного ответа о том, какая лучше. Зато она пригодится аналитикам, которые хотят оптимизировать процессы и столкнулись с задачей выбора. С любовью к процессам мы взглянули на 4 и оценили их удобство и гибкость.

Посмотреть на BPMS
Total votes 6: ↑5 and ↓1+4
Comments2

Знакомство с Debezium — CDC для Apache Kafka

Reading time18 min
Views85K


В своей работе я часто сталкиваюсь с новыми техническими решениями/программными продуктами, информации о которых в русскоязычном интернете довольно мало. Этой статьей постараюсь восполнить один такой пробел примером из своей недавней практики, когда потребовалось настроить отправку CDC-событий из двух популярных СУБД (PostgreSQL и MongoDB) в кластер Kafka при помощи Debezium. Надеюсь, эта обзорная статья, появившаяся по итогам проделанной работы, окажется полезной и другим.

Что за Debezium и вообще CDC?


Debezium — представитель категории программного обеспечения CDC (Capture Data Change), а если точнее — это набор коннекторов для различных СУБД, совместимых с фреймворком Apache Kafka Connect.
Читать дальше →
Total votes 52: ↑52 and ↓0+52
Comments1

Information

Rating
Does not participate
Registered
Activity