Как стать автором
Обновить
6
0
Дмитрий Чекрыгин @dmt_chkg

System analyst

Отправить сообщение

Рекомендательные системы: идеи, подходы, задачи

Время на прочтение11 мин
Количество просмотров48K


Многие привыкли ставить оценку фильму на КиноПоиске или imdb после просмотра, а разделы «С этим товаром также покупали» и «Популярные товары» есть в любом интернет- магазине. Но существуют и менее привычные виды рекомендаций. В этой статье я расскажу о том, какие задачи решают рекомендательные системы, куда бежать и что гуглить.
Читать дальше →
Всего голосов 34: ↑33 и ↓1+32
Комментарии7

Ввоз и монтаж оборудования в дата-центре

Время на прочтение2 мин
Количество просмотров25K
Как мы и обещали, переходим от повествования о строительстве дата-центра к более предметным областям. Сегодня мы расскажем и покажем, как происходит ввоз, регистрация и монтаж клиентского оборудования в дата-центр. В принципе, здесь нет ничего удивительного, или захватывающего, но тем, кто интересуется вопросами типа «как же там все устроено», наверняка будет интересно.

image

Читать дальше →
Всего голосов 145: ↑132 и ↓13+119
Комментарии154

Что особенного в Cloudera и как ее готовить

Время на прочтение6 мин
Количество просмотров12K
Рынок распределенных вычислений и больших данных, если верить статистике, растет на 18-19% в год. Значит, вопрос выбора софта для этих целей остается актуальным. В этом посте мы начнем с того, зачем нужны распределенные вычисления, подробней остановимся на выборе ПО, расскажем о применении Hadoop с помощью Cloudera, а напоследок поговорим о выборе железа и о том, как оно разными способами влияет на производительность.

Читать дальше →
Всего голосов 18: ↑15 и ↓3+12
Комментарии3

Архитектура, сертифицированная по SQL Server Data Warehouse Fast Track (DWFT): что это значит и как устроено

Время на прочтение10 мин
Количество просмотров4.3K
Крупные производители популярного софта заботятся о своих заказчиках по-разному. Один из способов — создать программу сертификации. Чтобы, когда заказчики в раздумьях блуждают между аппаратными конфигами для конкретного софта, производитель этого софта мог подойти и с уверенностью показать пальцем: «Бери вот это и все будет хорошо».

Такую программу для своего SQL Server разработал Microsoft — SQL Server Fast Track (DWFT). По ней сертифицируются конфигурации хранилищ данных — те, которые соответствуют требованиям рабочей нагрузки и могут быть внедрены с меньшим риском, стоимостью и сложностью. Звучит прекрасно, но интересно все-таки оценить эти критерии на практике. Для этого мы подробно разберем одну из конфигураций, имеющих сертификацию SQL Server Data Warehouse Fast Track.


Читать дальше →
Всего голосов 10: ↑10 и ↓0+10
Комментарии0

Тестирование и отладка MapReduce

Время на прочтение5 мин
Количество просмотров6K
В «Ростелекоме» мы используем Hadoop для хранения и обработки данных, загруженных из многочисленных источников с помощью java-приложений. Сейчас мы переехали на новую версию hadoop с Kerberos Authentication. При переезде столкнулись с рядом проблем, в том числе и с использованием YARN API. Работа Hadoop с Kerberos Authentication заслуживает отдельной статьи, а в этой мы поговорим об отладке Hadoop MapReduce.


Читать дальше →
Всего голосов 25: ↑23 и ↓2+21
Комментарии6

Как «склеить» Intel-based сервер и преодолеть scale-up потолок в 8 процессоров

Время на прочтение3 мин
Количество просмотров5.4K
Если вы занимаетесь выращиванием больших баз данных и вдруг упираетесь в потолок производительности — пришло время расширяться. Со scale-out расширением понятно: серверы добавляете и горя не знаете. Со scale-up все не так весело. Согласно стандартной glueless-архитектуре, мы берем два процессора, потом добавляем к ним еще два… так доходим до восьми и все. Больше Intel не предусмотрел, копите на новый сервер.



Но есть и альтернатива — glued-архитектура. В ней двухпроцессорные вычислительные блоки соединяются между собой через нод-контроллеры. С их помощью верхний порог на один сервер поднимается до 16 и более процессоров. В этом посте подробней расскажем о glued-архитектуре вообще и о том, как она реализована в наших серверах.
Читать дальше →
Всего голосов 28: ↑28 и ↓0+28
Комментарии5

Информация

В рейтинге
Не участвует
Откуда
Воронеж, Воронежская обл., Россия
Дата рождения
Зарегистрирован
Активность