Articles / Profile of IvanKhozyainov / Habr

Иван Хозяинов @IvanKhozyainov

User

Profile Publications 3Comments 29Bookmarks

IvanKhozyainov Apr 15 2021 at 05:25

Обогащение данных — что это и почему без него никак

5 min

12K

ITSumma corporate blogIT Infrastructure*Apache*Big Data*Data Engineering*

Обогащение данных — это процесс дополнения сырых данных той информацией, которая в исходном виде в них отсутствует, но необходима для качественного анализа. Оно требуется, чтобы конечные потребители данных получали качественную информацию.

В этой статье рассмотрим, что такое обогащение данных в контексте их автоматизированной обработки и какие технические средства мы для этого используем.

Главный результат — если объединять данные, применяя предложенную нами схему обогащения, то в дальнейшем аналитикам не потребуется каждый раз делать JOIN-запрос, что сэкономит как ценное время людей, так и машинные ресурсы.

+15

IvanKhozyainov Jan 27 2021 at 10:40

Организуем платформу обработки потоковых данных из Kafka, Spark и Greenplum

8 min

9.7K

ITSumma corporate blogIT Infrastructure*Big Data*Data storage*Data Engineering*

Technotext 2021

Привет, Хабр!

Меня зовут Иван Хозяинов, а работаю в ITSumma, где изучаю и применяю технологии, связанные с большими данными, машинным обучением и аналитикой. В этой статье хочу рассказать о системе хранения и обработки данных и инструментах, которые встречаются на пути от сырых исходников до представления, удобного для последующего анализа.

Поговорим, как связаны серверы в дата-центре и распределенные приложения для обработки данных и почему пришлось написать свой коннектор для Spark и Greenplum.

+17

IvanKhozyainov Nov 3 2017 at 08:27

Кибер-оракул: поиск аномалий в данных мониторинга с помощью нейросети

8 min

20K

ITSumma corporate blogSystem administration*Server Administration*Mathematics*Machine learning*

Количество данных, которые получает наш мониторинг выросло настолько, что для их обработки мощности только человеческого разума уже не хватает. Поэтому мы надрессировали искусственный интеллект помогать нам искать аномалии в полученных данных. И теперь у нас есть Кибер-Оракул.

Кибер-оракул, очевидно

Читать дальше →

+31