Articles / Bookmarks / Profile of SashulyaK / Habr

Александр Коншин @SashulyaK

Computer Vision Engineer

Profile Publications 2Comments 8Bookmarks 16

re9ulus Mar 19 at 10:00

Quantization Deep Dive, или Введение в современную квантизацию

Medium

16 min

15K

Programming*Яндекс corporate blogAlgorithms*Machine learning*Artificial Intelligence

✏️ Technotext 2023

Привет! Меня зовут Василий Землянов, я занимаюсь разработкой ML-инфраструктуры. Несколько лет я проработал в команде, которая делает споттер — специальную маленькую нейросетевую модельку, которая живёт в умных колонках Яндекса и ждёт от пользователя слова «Алиса». Одной из моих задач в этой команде была квантизация моделей. На пользовательских устройствах мало ресурсов, и мы решили, что за счёт квантизации сможем их сэкономить — так в итоге и вышло.

Потом я перешёл в команду YandexGPT. Вместо маленьких моделей я стал работать с очень крупными. Мне стало интересно, как устроена квантизация больших языковых моделей (LLM). Ещё меня очень впечатляли истории, где люди берут гигантские нейросети, квантизируют в 4 бита и умудряются запускать их на ноутбуках. Я решил разобраться, как это делается, и собрал материал на доклад для коллег и друзей. А потом пришла мысль поделиться знаниями с более широкой аудиторией, оформив их в статью. Так я и оказался на Хабре :)

Надеюсь, погружение в тему квантизации будет интересно как специалистам, так и энтузиастам в сфере обучения нейросетей. Я постарался написать статью, которую хотел бы прочитать сам, когда только начинал изучать, как заставить модели работать эффективнее. В ней мы подробно разберём, зачем нужна квантизация и в какой момент лучше всего квантизовать модель, а ещё рассмотрим разные типы данных и современные методы квантизации.

+81

avmakarow Dec 20 2022 at 15:53

Объяснение рекомендаций

4 min

2.8K

Algorithms*Онлайн-кинотеатр Иви corporate blogMachine learning*

Рекомендательные системы уже давно неотъемлемая часть большинства современных веб-сервисов. Скорее всего, заходя на какой-либо развлекательный (и не только) сайт, вы не раз задавались вопросом, почему именно этот контент или этот товар предлагается вам.

В Иви давно заметили, что недостаточно просто рекомендовать что-то пользователю, важно объяснять свои действия. Если пользователю покажут незнакомый контент, то он будет воспринимать это как нечто неинтересное.

Поэтому хочется, чтобы пользователь понимал:

Насколько ему могут быть интересны наши рекомендации.
Зачем мы ему это показываем.

Меня зовут Андрей Макаров, я разработчик рекомендательной системы онлайн-кинотеатра Иви. В этой статье я расскажу, зачем мы объясняем рекомендации на нашем сервисе, что для этого уже сделали и что только планируем.

Читать дальше →

+11

SashulyaK Nov 22 2022 at 11:49

Генерация трейлеров и хайлайтов. Опыт Иви

10 min

2.3K

Конференции Олега Бунина (Онтико) corporate blogMachine learning*

Technotext 2022

Яркий и динамичный контент, даже не супер продающий, привлекает внимание пользователя в четыре раза лучше статичной картинки. Это отличный способ увеличить конверсии просмотров и вырастить прибыль. Но что делать, если на создание одного трейлера у команды уходит слишком много времени, без гарантий, что получится хорошо?

Меня зовут Александр Коншин, я Тимлид команды Computer Vision в онлайн-кинотеатре IVI. 15 лет пишу код. 5 из них посвятил нейросетям и обработке изображений. Сейчас создаю сервисы, которые генерируют промо-контент для фильмов и мультиков с помощью алгоритмов машинного обучения и компьютерного зрения. Мы работаем с длинным контентом в виде фильмов, сериалов или мультфильмов и дополнительными материалами: трейлерами, фильмами о фильме, хайлайтами — короткими форматами, которые помогают пользователю быстро ознакомиться с содержанием.

В этой статье расскажу о том, как мы искали и нашли способ автоматизировать генерацию трейлеров и хайлайтов к фильмам, которые появляются в нашей библиотеке. Раскрою немного технической и инженерной конкретики и расскажу, какой профит получили в итоге.

madcat1991 Apr 22 2022 at 10:45

Как персонализация постеров помогла IVI повысить CTR и конверсию в просмотры

3 min

5.6K

Онлайн-кинотеатр Иви corporate blogMachine learning*IT-companies

Мы в IVI столкнулись с проблемой низкого доверия к контенту, который пользователи встречают впервые. Одна из причин — неинформативные и непривлекательные постеры. Чтобы исправить эту ситуацию, мы научились персонализировать постеры, выбирая для пользователя более понятные и привлекательные изображения. Мы провели эксперимент, который показал, как на самом деле важна для зрителя визуальная составляющая при выборе контента.

Читать дальше →

+18

ultrar Nov 16 2021 at 10:00

Синтетические постеры для кино: как обрезать логотип телеканала, хардсабы и чёрные грани

5 min

5.2K

Working with video*Algorithms*Image processing*Онлайн-кинотеатр Иви corporate blog

На IVI пользователи выбирают кино для просмотра, ориентируясь в первую очередь на постер и название фильма. Обычно правообладатель предоставляет один постер для каждого фильма и сериала, но бывают ситуации, когда могут понадобиться дополнительные/альтернативные изображения. Их создание — трудоемкая задача, потому что с помощью этих изображений нужно передать содержимое контента. Чтобы упростить её, мы прибегаем к генерации синтетических постеров. В этой статье я немного приоткрою занавес и расскажу о том, как мы удаляем визуальный мусор в процессе создания постеров.

+35

avmakarow Feb 15 2021 at 16:43

Автоматическая документация для Flask с использованием OpenAPI

5 min

19K

Python*Онлайн-кинотеатр Иви corporate blogFlask*

Tutorial

Техническая документация, как известно, крайне важная часть любого проекта. До недавнего времени мы прекрасно жили с таким генератором документаций как Sphinx. Но наступил момент переходить на технологии с бОльшим набором возможностей, поэтому мы приняли решение переписать нашу документацию на более современный стандарт: OpenAPI Specification. Эта статья является скромным гайдом по такому переезду. Она будет интересна Python-разработчикам, особенно тем, которые используют Flask. После ее прочтения вы узнаете, как создать статическую OpenAPI документацию для Flask приложения и развернуть ее в GitLab Pages.

Читать дальше →

+18

iggisv9t Sep 4 2019 at 14:04

Визуализация больших графов для самых маленьких

12 min

56K

Data Mining*Data visualization*Machine learning*Open Data Science corporate blogArtificial Intelligence

Что делать, если вам нужно нарисовать граф, но попавшиеся под руку инструменты рисуют какой-то комок волос или вовсе пожирают всю оперативную память и вешают систему? За последние пару лет работы с большими графами (сотни миллионов вершин и рёбер) я испробовал много инструментов и подходов, и почти не находил достойных обзоров. Поэтому теперь пишу такой обзор сам.

Читать дальше →

+93

SashulyaK Apr 16 2020 at 13:08

Как мы научились делить видео на сцены с помощью хитрой математики

7 min

16K

Working with video*Algorithms*Онлайн-кинотеатр Иви corporate blog

Technotext 2020

За 10 лет существования ivi мы собрали базу из 90000 видео разной длины, размера и качества. Каждую неделю появляются сотни новых. У нас есть гигабайты метаданных, которые полезны для рекомендаций, упрощают навигацию по сервису и настройку рекламы. Но извлекать информацию непосредственно из видео мы начали только два года назад.

В этой статье я расскажу, как мы разбираем фильмы на структурные элементы и зачем нам это нужно. В конце есть ссылка на репозиторий Github с кодом алгоритмов и примерами.

Читать дальше →

+65

iggisv9t Aug 1 2019 at 15:05

Визуализация новостей рунета

6 min

15K

Open source*Data Mining*Machine learning*Open Data Science corporate blogNatural Language Processing*

Представьте себе, что вы поспорили с друганом, что было раньше — ~~курица или яйцо~~ повышение какого-то налога, к примеру, или новости на эту тему, или вовсе важное событие заглушили тучей новостей про новую песню, скажем, Киркорова. Удобно было бы посчитать, сколько новостей на каждую тему было в каждый конкретный момент времени, а потом наглядно это представить. Собственно, этим и занимается проект “радар новостей рунета”. Под катом мы расскажем, при чём здесь машинное обучение и как любой доброволец может в этом поучаствовать.

Читать дальше →

+35

alexdorofeeff Feb 14 2017 at 19:09

Как «пробить» человека в Интернет: используем операторы Google и логику

9 min

930K

Information Security*Эшелон corporate blog

Tutorial

В очередной статье нашего цикла публикаций, посвященного интернет-разведке, рассмотрим, как операторы продвинутого поиска Google (advanced search operators) позволяют быстро находить необходимую информацию о конкретном человеке.

В комментариях к первой нашей статье, читатели просили побольше практических примеров и скриншотов, поэтому в этой статье практики и графики будем много. Для демонстрации возможностей «продвинутого» поиска Google в качестве целей были выбраны личные аккаунты автора. Сделано это, чтобы никого не обидеть излишним интересом к его частной жизни. Хочу сразу предупредить, что никогда не задавался целью скрыть свое присутствие в интернете, поэтому описанные методы подойдут для сбора данных об обычных людях, и могут быть не очень эффективны для деанонимизации фэйковых аккаунтов, созданных для разовых акций. Интересующимся читателям предлагаю повторить приведенные примеры запросов в отношении своих аккаунтов и оценить насколько легко собирать информацию по ним.

Читать дальше →

+88

108

iggisv9t Feb 19 2018 at 14:18

Визуализация данных для киноманов: скрапим рекомендации фильмов и делаем интерактивный граф

11 min

29K

Python*Data Mining*Data visualization*Machine learning*Open Data Science corporate blog

Tutorial

Однажды я наткнулся на интерактивную карту lastfm и решил обязательно сделать подобный проект для фильмов. Под катом история о том, как собрать данные, построить граф и создать своё интерактивное демо на примере данных с кинопоиска и imdb. Мы рассмотрим фреймворк для скрапинга Scrapy, пробежимся по методам визуализации больших графов и разберёмся с инструментами для интерактивного отображения больших графов в браузере.

Читать дальше →

+63

frekenbok Mar 23 2016 at 13:21

Интервью без сучка и задоринки: как программисту успешно пройти собеседование

14 min

57K

Professional literature*Wirex corporate blog

Translation

Пост подготовлен специально для корпоративного блога Wirex — компании, предлагающей удобное мобильное финансовое приложение для управления личными счетами. Изначально статья задумывалась как подготовительный материал, который автор отправляет своим кандидатам, но в итоге последний решил опубликовать его в открытом источнике, а мы, посчитав тему интересной, сделали перевод для вас, уважаемые читатели.

Тот факт, что вы являетесь хорошим программистом, играет поразительно малую роль при прохождении собеседования. Для того чтобы ваша работа была продуктивной, вам нужно уметь решать огромные, склонные разрастаться проблемы неделями и месяцами. Каждый вопрос на собеседовании, напротив, длится менее одного часа. Для того чтобы хорошо показать себя на интервью, вы должны знать, как быстро решать небольшие проблемы под давлением, при этом ясно излагая свои мысли. Это совершенно другое умение (в то же время я не говорю, что способность с легкостью решать задачи на собеседовании не имеет никакой связи с навыками программирования. Просто эта связь выражена куда слабее, чем считают многие компании, и именно другими факторами, отличными от специализированных умений, объясняется столь внушительное расхождение).

Читать дальше →

+11

marks Aug 21 2014 at 09:27

Два года на Марсе — как выглядит Curiosity сейчас?

2 min

194K

RoboticsAstronautics

Не так давно марсоход Curiosity отпраздновал (вернее, за него отпраздновали создатели устройства) два года пребывания на Красной планете. Само собой, время не могло не оставить отметины на обличье марсохода, так сказать, и сейчас эти отметины очень даже заметны.

Наверное, наиболее сильно Марс подействовал на колеса: в Сети не раз появлялись фотографии колеса Curiosity, с относительно большими дырами и царапинами. Пока что все это не очень влияет на работоспособность аппарата, что не может не радовать. Но сравнить то, что было, и то, что стало не помешает. Под хабракатом — несколько фотографий, позволяющих оценить текущее состояние Curiosity и сравнить его с тем, что было в самом начале.

Читать дальше →

+173

Meklon Oct 13 2014 at 15:28

Не пельменем единым жив программист или история о том, как все успеть

7 min

137K

BiotechnologiesDIYLifehacks for geeks

Tutorial

По заявкам трудящихся и в связи с переносом — возвращаю пост, который многих порадовал. Надеюсь НЛО будет не против.

На написание этого поста меня сподвиг замечательный пост «За что конкретно я ненавижу некоторых отдельно взятых маркетологов — или как айтишник по магазинам ходил». Сразу хочу извиниться за возможные опечатки — пишу с планшета, сидя в микроавтобусе и вытягивая сеть телефоном. Hacker's keyboard очень удобен для ssh-доступа, но большие тексты писать им не очень удобно.

IT- специалисты — народ любопытный. То соберут на базе микроконтроллеров автоматическую систему полива и освещения для любимого фикуса, то пропатчат прошивку мультиварки для раздачи торрентов. Но, по непонятной и загадочной причине, когда дело доходит до еды, пресловутый принцип DIY дает сбой. И наш герой, способный часами переделывать кинескоп старого телевизора в Луч Смерти, идет на кухню утолить голод соевым текстуратом пополам с гидроцеллюлозой и «коллагеновым сырьем».

В этом посте я хочу разрушить миф о том, что еда может быть либо быстрой и удобной, либо съедобной. Не секрет, что многим из нас приходится работать по 12 часов в сутки, что не способствует кулинарным подвигам с участием 28 приправ и перьев с зада дракона, омытых слезами единорога. Вы получите замечательную возможность посмотреть в глаза своей половинки на 8 марта после того, как она получит не контроллер для дистанционного управления шторой, а свежевыпеченный хлеб ручной работы рано утром. Если вам надоело есть синтетику — добро пожаловать под hubracut.

Читать дальше →

+257

293

neod Jul 3 2012 at 00:47

Неочевидный способ борьбы с прокрастинацией

3 min

32K

Lifehacks for geeksBrain

From sandbox

Наверняка, многие слышали о таком понятии, как “состояние потока”. Сейчас выходит много умных книжек и статей на эту тему. Но если не вдаваться в подробности и говорить простыми словами, то это такое состояние, в котором лучше всего работать. Концентрация и вовлеченность в таком состоянии максимальны, правильные решения приходят в голову быстро и естественно, ничто окружающее не отвлекает: ни захламленный рабочий стол, ни неудобное кресло, ни поздний час или голодный желудок.

Все это здорово, и каждый из нас, скорее всего, вспомнит что-то из своего опыта. Но проблема в том, что “перестроить” себя в такое состояние не просто, а вот “вывалиться” из него очень легко. Особенно, если речь идет о скучной или непонятной работе, в этом случае «инерция для входа” особенно высока. Размышляя недавно обо всем этом, я понял, что периодически неосознанно использовал один прием, которым и хочу поделиться.

Читать дальше →

+148

104

soulburner Jul 15 2012 at 20:36

Как распознать кракозябры?

1 min

426K

Typography*

В комментариях к предыдущему посту про иероглифы сказали, что хорошо бы иметь такую же блок-схему для кракозябр.

Итак, вуаля!

За источник информации была взята статья из вики. В блок-схеме «UTF-16 → CP 866» означает, что исходная кодировка была «UTF-16», а распозналась она как «CP 866».

Как всегда — кликабельно. Исходник в .docx: здесь.

+407