150.5
Karma
21.6
Rating
73
Subscribers
Евгений Потапов @eapotapov

Специалист по срочным вопросам

Проблемы обеспечения 100% доступности проекта

Проблемы обеспечения 100% доступности проекта

Проблемы обеспечения 100% доступности проекта

RabbitMQ против Kafka: два разных подхода к обмену сообщениями

+1
спасибо, обязательно посмотрим!
это серия из 5-и статей которая сравнивает именно кролика и кафку, но мы посмотрим как можно вписать

Как построить IIoT архитектуру своими руками

0
спасибо за комментарий, просто хочется чтобы можно было это сделать в условных «домашних условиях»

а в домашних условиях — дошел до магазина и взял raspberry pi

кстати, есть ли какие-то доступные альтернативы, которые будут надежнее? мы скорее про платформы чем про edge поэтому и самим интересно)

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

0
Если человека все устраивает, и не хочет заниматься другой работой, то заставлять нет смысла. У нас есть пример, когда исполнитель стал управляющим (директором, по сути), но оказалось, что это совсем не его, пытался делать все сам, очень много работал. Выгорел и вообще ушёл от нас на год, но потом вернулся простым исполнителем — отлично сейчас работает.

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

0
Да, в деньгах тоже. Главное помнить, что это совсем другая работа :)

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

0
До сих пор не было такой проблемы, люди сами хотят развития, смены характера работы. Повышения, в конце концов.

Если человеку не интересно, и он сам не хочет ничего менять, как-то специально его мотивировать довольно тяжело и непонятно зачем.

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

0
Сначала мы занимались больше разработкой, но потом поддержка стала нашим основным направлением. Мы даже собирались вообще закрыть разработку, но отдел довольно внезапно ожил, и сейчас там работает 25 человек и планируем взять еще.

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

+2
На этом Хайлоаде была целая менеджерская секция.
Highload проекты же кто-то разрабатывает и поддерживает, значит кто-то руководит теми, кто разрабатывает и поддерживает :)

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

0
Изначально мы нанимаем админов и разработчиков. Если окажется, что у человека действительно есть опыт и, главное, желание, то он довольно быстро может стать тимлидом.

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

0
Тимлиды одновременно являются и исполнителями, и менеджерами. Коммуникации иногда идут напрямую, а иногда через тимлида, в зависимости от задачи.

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

0
Спасибо :)

Все руководители выросли внутри. Когда то мы думали о том, чтобы нанимать внешних, но отказались от этой идеи.

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

+3
В нашем случае они как раз вышли из исполнителей, поэтому хорошо понимаю работу своих подчиненных :)

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

0
Решения об изменении структуры приходят когда по старому жить уже просто нельзя. Когда становится понятно, что теперь действительно надо что-то менять, то приходится думать, как перераспределить нагрузку.

Как именно это сделать, заранее, конечно, неизвестно. Но поскольку мы никогда не нанимали людей на должность менеджера, то мы исходили из того, кто у нас есть, а не из того, как правильно строить структуру. Перебирали варианты, ставили человека на роль менеджера, и если получалось хорошо, он там оставался, если, по разным причинам, не получалось — пробовали другие варианты. И так постепенно сложилась структура, которая есть сейчас.

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

0
Спасибо. Общение свободное, но это все равно меньшее хаоса, чем когда никто ничего не понимает. Правда у нас вообще вся работа построена на чатах (подробнее можно посмотреть вот тут: www.itsumma.ru/blog/kak-my-ispolzuem-telegram-v-tekhpodderzhke), поэтому все привыкли к такому режиму.

Директор по здравому смыслу: как перестать все контролировать и начать работать в команде

Про бэкапы, черную пятницу и коммуникации между людьми: как мы накосячили и научились больше так не делать

0
Выше про это уже спрашивали:) Не было хранилища поблизости, на которое смогли бы за приемлемое время перенести такой объём данных. А через основной канал в 100Мбит не уложились бы ни в какой возможный даунтайм.

Про бэкапы, черную пятницу и коммуникации между людьми: как мы накосячили и научились больше так не делать

+1
мы, с давних пор, исходим из того, что надо быть прозрачным с клиентом.
с момента события сразу сообщили о том, что происходит и продолжали поддерживать связь до исправления (это каждые 10 минут в следующие два дня).
клиенты оказались понимающие, бэкапы с той операции стали сниматься (а до этого не снимались год или больше и предыдущие специалисты говорили, что бэкапы снять нельзя)
мы обсудили, что один раз накосячить можно и работу продолжили
спасибо клиентам, отношения сейчас очень хорошие

Про бэкапы, черную пятницу и коммуникации между людьми: как мы накосячили и научились больше так не делать

0
у нас основная работа идет в чатах, но чаты строго в телеграме и, при этом, серъезно интергрированы с системой управления проектами и мониторингом — вот здесь пишем об этом habrahabr.ru/company/itsumma/blog/335446

спасибо за коммент, приходите к нам в uptime.community поговорить ;), можно в телеграм канале telegram.me/uptime_community
можно в фб www.facebook.com/groups/uptime.community

Про бэкапы, черную пятницу и коммуникации между людьми: как мы накосячили и научились больше так не делать

0
Админ искал только удалённые файлы и хотел очищать только удалённые. Но на деле получилось так, что поиск по выводу lsof делался правильно, но потом некорректно передавались данные на команду очистки. Что-то типа такого было:

for i in 'lsof -p id_xtrabackup| grep -i dele' ; do echo ""> /proc/id-mysql/fd/$i ; done


И вместо id-mysql нужно было подставить айдишник экстрабекапа. Но увы.

Про бэкапы, черную пятницу и коммуникации между людьми: как мы накосячили и научились больше так не делать

Про бэкапы, черную пятницу и коммуникации между людьми: как мы накосячили и научились больше так не делать

0
Ну или вы там про отсутсвие слейва говорили — а почему бы его не поднять? После 18 же можно перезапустить MySQL?

Перезапустить, конечно, можно. Но чтобы где-то сделать слейв, туда сначала нужно унести данные базы. А сложности с перенесением данных я уже описал в предыдущем комментарии:)

Про бэкапы, черную пятницу и коммуникации между людьми: как мы накосячили и научились больше так не делать

+1
Собственно, план и состоял в том, чтобы в первую очередь сделать бэкап и горячий резерв базы, с которого можно будет круглосуточно безболезненно снимать данные.

Способы снятия бэкапа, конечно же, обсуждались разные. И как в самом начале заметки говорилось, база у клиента была немаленькая, больше 2Тб. Никакого локального хранилища с толстым каналом, к сожалению, рядом не было. А на 100Мбитах тащить такой объём данных — это больше трёх суток в идеальных условиях. Т.е. «за пару часов вечером после шести» это было, увы, не решить.

Потому и было принято решение снимать бэкап в фоне экстрабэкапом.

Про бэкапы, черную пятницу и коммуникации между людьми: как мы накосячили и научились больше так не делать

+1
я бы не назвал это «простили», но если речь о штрафах/увольнениях — то нет, не штрафовали/не увольняли.
работу над ошибками проводили плотную и со всеми.
один раз ошибается каждый, и чаще всего — это из-за ошибок в процессах в компании
можно было бы опасаться за то, что такое повторится, но человек опытный а работа шла в огне.

Ожидание длиной в 15 лет. Nginx Application Server

Ожидание длиной в 15 лет. Nginx Application Server

Ожидание длиной в 15 лет. Nginx Application Server

+5
хмм, ну не знаю.
из того что мы видим в целом (не привязываясь только к веб-аппликейшнам) «продукт» становится очень разрозненным, причем это происходит по всем направлениям.
больше нет одного мониторинга для всего (смотрим за инфраструктрой в прометеусе, за приложением в ньюрелике, шлем логи в ELK итп), больше нет «одного приложения», есть несколько проектов с нодой и руби на фронте, с питоном в бэкэнде, делают это разные команды с разными компетенциями и так далее.
как раньше собирали софт и кубиков/библиотек, так теперь кубики это «компентенции» групп разработчиков — ктото специализируется на фронте и они же пишут часть бэкэнда на ноде, _очень_ часто при этом может быть вообще какой-то старый кусок на PHP, ну и так далее.
также с базами, при всей противоречивости монги, очень часто видим монгу на фронте, постгрес и кликхаус на аналитике.
да, это сложнее и я до конца это не одобряю, но такой мир (имхо, могу быть и не прав ;) )

Как звезда бразильских сериалов случайно помогла открыть IT-компанию в России

Включайтесь в игру: the MAZE DevOps game от ITSumma

Включайтесь в игру: the MAZE DevOps game от ITSumma

Включайтесь в игру: the MAZE DevOps game от ITSumma

Добавляем двухфакторную OTP аутентификацию в SSH за 10 минут

0
конечно :)
мы не претендуем на глобальное решение которое заменит все, но если есть телефон, есть желание защититься лучше, и при этом не постоянным паролем а дополнительно OTP кодами, можно просто склонить репозиторий и через пять минут получить решение, то есть да, другие решения конечно есть, но мы поделились простым, которое может быть кому то пригодиться (и люди вместо сложного внедрения будут использовать наше) :)

Добавляем двухфакторную OTP аутентификацию в SSH за 10 минут

0
чуть ниже уже ответил
главный мой страх по сути: любой кейлоггер позволит утащив сертификат ввести пароль и работать с сервером, допускать такого не хочется ни по какой причине (поэтому и на почту делают не второй пароль а именно одноразовые коды — даже свиснутый код не сработает)

Добавляем двухфакторную OTP аутентификацию в SSH за 10 минут

Добавляем двухфакторную OTP аутентификацию в SSH за 10 минут

+1
о, здесь очень просто
даже лично я, оставаясь параноиком боюсь компрометации лэптопа/компьютера где лежит ключ
как говорят — по настоящему система защищена тогда, когда ты понимаешь что даже в случае компрометации, важные данные не будут потеряны
условно говоря если хоть каким то образом мой компьютер будет скомпрометирован (кейлоггер, что угодно), зайти на серверы будет нельзя, так как 2FA не даст повторить попытку

Как настроить командную работу и сохранять спокойствие в чатах Телеграма, если всё горит, и все в аду

0
о это интересная мысль, спасибо! нам бы тоже пригодилось, подумаем быстро обязательно!
1 There