Comments / Profile of zodiak / Habr

Шкарупа Алексей @zodiak

User

Profile Publications 2Comments 104Bookmarks 605

Есть подозрение что репозиторий выдирали из основной кодовой базы и не тестировали.

Отсутствует requirements.txt на который есть отсылки в Readme
Скрипт test.py без бубнов не запускается, т.к. в tools/inference.py есть невалидный импорт (from .stylematte import StyleMatte - при этом модуль stylematte отсутствует)
При смене чекпоинта с best_ffhqh512.pth на iharmony512.pth валятся ошибки про несовпадение размеров:

Missing key(s) in state_dict: "normalizers.3.weights", "normalizers.3.fg_var", "normalizers.3.fg_bias", "normalizers.3.patched_fg_var", "normalizers.3.patched_fg_bias", "normalizers.3.bg_var", "normalizers.3.bg_bias", "normalizers.3.grid_weights".
size mismatch for encoder.1.0.weight: copying a param with shape torch.Size([32, 16, 3, 3]) from checkpoint, the shape in current model is torch.Size([64, 16, 3, 3]).
size mismatch for encoder.1.0.bias: copying a param with shape torch.Size([32]) from checkpoint, the shape in current model is torch.Size([64]).
...

Написал бы об этом всем в issues, но вы их прикрыли.

Look

Как мы автоматизировали загрузку товаров на онлайн-витрину Fix Price

zodiak Jan 10 at 16:00

Вы пишите про ESB как про конкретный продукт, хотя это целый класс систем. Расскажете какую конкретно Вы внедрили?

Look

Матирование изображений, или как получить фотореалистичный передний план

zodiak Jun 20 2023 at 14:25

Эх, хотелось бы что-то крутое увидеть...

Например собственный публичный датасет для маттирования на пару тысяч уникальный масок. Или какое-то новшество в архитектуре (да чтобы еще и на Comp1K соту выбить).

А то GuidedFilter так-то уже давно известная и точно не самая крутая в плане качества штука для апсемплинга.

Look

Теория вероятностей в машинном обучении. Часть 2: модель классификации

zodiak Mar 22 2023 at 16:53

А не подскажите ли как произвести вывод функции ошибки если хочется считать дисперсию в задаче классификации по аналогии с формулой (20) из предыдущей части? (ну или хотя бы где об этом почитать)

Look

Как битриксоиды в React уходили

zodiak Nov 14 2022 at 09:19

Из интересных наработок пожалуй только наш аналог IncludeComponent. С одной стороны можно было бы... С другой выкладывать без документации и тестов не хочется, а сил на них пока не хватает.

Look

Как битриксоиды в React уходили

zodiak Nov 12 2022 at 14:13

???

Второй как раз про него

Look

Как битриксоиды в React уходили

zodiak Nov 10 2022 at 20:48

Поправил, спасибо

Look

Копнём поглубже: сравниваем популярные алгоритмы оптимизации с менее известными

zodiak Jul 20 2021 at 16:37

Было бы здорово если бы при тестировании на реальных задачах вы осветили:

а) Как эти алгоритмы ведут себя с LSTM (например в языковых моделях)

б) Как эти алгоритмы ведут себя с большими батчами (2K ... 65K) - есть ли профит от LAMB-подобных оптимизаторов

Такие типы задач в бенчмарках делают крайне редко, к сожалению.

Look

TensorFlow vs PyTorch в 2021: сравнение фреймворков глубокого обучения

zodiak Jun 30 2021 at 17:14

Позволю высказать критику вашего теста.

Вы упускаете, что несмотря на простоту дебага "динамического графа", статический при этом все же быстрее (параллельность выполнения неблокирующих друг друга веток).
Статический граф можно оптимизировать https://www.tensorflow.org/guide/graph_optimization // Например, сюда относится оптимизация NHWC -> NCHW при тренировке на GPU ибо так быстрее считается. В Pytorch такое порядок каналов идет по умолчанию, а TF приходится думать "конвертировать или нет" / "будет быстрее считаться или нет"
TF v2 не отказался от статического графа. В этом и прикол, что когда нужно подебажить можно скомпилировать модель с run_eagerly=True, а когда нужна производительность с False
Не являюсь большим знатоком в PyTorch, но кажется он подает данные в модель подготавливая их в многопроцессном режиме. Для адекватного сравнения я бы ожидал увидеть подачу в TF данных через tf.data.Dataset с prefetch-ем который использует плюсовый бекенд и многопоточность и с с генерацией ранодомных данных через tf.random.* а не конвертацией из numpy. Ну и как бы желательно делать model.train с указанием количества эпох, а не train_on_batch
Также для полноты картины хотелось бы чтобы при тестировании в TF был включен XLA (по ощущениям ускоряет тренировку больших моделей процентов на 10-15, в частности заменяет BatchNorm на fused-реализацию) и замерялись 2-я и последующие эпохи (на 1й TF делает оптимизации), а сами эпохи длились хотя бы минут по 5.

Look

Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)

zodiak Aug 25 2020 at 07:38

>>Кажется, не существует датасетов с эталонной разметкой с текстами из соцсетей
Хотя бы на подкорпусе тайги, который выложен в Universal Dependencies

>>Понятно, что будет плохо. «Правила в Razdel оптимизированы для аккуратно написанных текстов с правильной пунктуацией»
Разумеется понятно. Но было бы здорово понимать что считать вариантом «б».

Look

Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)

zodiak Aug 25 2020 at 07:21

Хотелось бы все-таки увидеть сравнение razdel с другими системами на текстах соц. сетей

Look

Как собрать компьютер для ML

zodiak Dec 18 2019 at 13:35

Современные Ryzen (конкретно 3900x) рвут по всем тестам старые Threadripper-ы (1920x). Материнки b450 стоят значительно дешевле.
А продать в будущем десктопный комплект будет сильно проще.
Да, 2- а не 4-канальная память.
Если суммарное количество видеокарт 1-2-3, то других «за» в сторону Threadripper-а нет.

SSD в вашей сборке ИМХО дороговат (маркетинг). Самый дешевый того же объема будет не сильно уступать.

Look

Всё, что вы знали о word2vec, неправда

zodiak Aug 30 2019 at 10:17

Думаю неточность идет от функции ошибки.
Конкретно вот в этом примере на TF www.tensorflow.org/tutorials/representation/word2vec создаются 2 embedding-матрицы: одна непосредственно для слов (то что потом будем использовать на инференсе), вторая — для Noise Contrastive Loss (ее для инференса не используем).

Есть еще 1 прикол w2v, который мало кто видит.
В оригинальной статье в CBOW используется сложение контекстных векторов. А по факту через месяц после публикации кто-то додумался использовать среднее. Спросили у Миколова — он подтвердил, что доли процента добавляет.
И в результате в gensim используется mean.

Look

Художественные детские книги про социнжиниринг

zodiak Apr 23 2019 at 16:56

Мой дежурный ответ про две книги Митника и две книги Чалдини

Озвучьте пожалуйста, что за книги (у Чалдини читал только «Психология влияния»)

Look

Два в одном: программируемый по Wi-Fi монитор качества воздуха и стрелочные часы

zodiak Mar 7 2019 at 09:00

Еще бы коробочку симпатичную…

Look

Ok Яндекс! А где наши «Reach Goals»?

zodiak Jan 25 2019 at 14:22

У Вас упал процент ошибок «не загружен счетчик».
Есть подозрение что даже с загруженным локально счетчиком не получится отправить данные в метрику (например, злой adblock+++ блокирует ip-адрес). Было бы интересно проверить.

Look

Исправляем опечатки в поисковых запросах

zodiak Dec 19 2018 at 08:36

А если у Вас есть датасет и Вы его выложите — вообще респект.

Look

Исправляем опечатки в поисковых запросах

zodiak Dec 19 2018 at 08:19

На недавнем соревновании у всех победителей хорошо зашел Seq2Seq. Было бы интересно сравнить.

Look

Применение сверточных нейронных сетей для задач NLP

zodiak Apr 10 2018 at 15:13