Генерация синтетических изображений с использованием диффузионно-трансформерной модели (DiT) / Комментарии / Хабр

digtatordigtatorov 23 авг 2023 в 13:29

2. Открытый репозиторий с исходным кодом и комментариями разработчиков.

Stable diffusion есть в репе automatic1111, с удобным пользовательским интерфейсом.

3. Генерация картинок без всевозможных фильтров. Очень часто генеративные модели, например, Stable Diffusion, создают эффекты свойственные иллюстрациям, нам хотелось этого избежать.

Сам месяц назад начал поиски и наткнулся на реп kohya_ss для обучения Lora. Если честно не заметил эффектов иллюстраций, думаю можно избавиться от них с теми же Lora. Можно дополнительно использовать негативные промпты. Можно попробовать другие модели.

А вот кстати по поводу масштабов моделей базовая stable 1.5 на 800 миллиардов параметров, месяц назад вышла XL версия с 3.5 триллионами параметров. Дообучить ее с помощью Lora вполне возможно рядовому пользователю.

Сгенерировал около 10 тысяч изображений, качеством вроде даже доволен), так что stable как альтернативу вполне можно использовать. Ваша статья упала как никогда вовремя, спасибо за проделанную работу.

Комментарии 2

NewTechAudit 25 авг 2023 в 06:59

Добрый день!

Спасибо за комментарий, глянем обязательно репозитории, про которые говорите. Надеемся, что наша статья вам чем-то пригодится)) На счет Lora, наверняка можно как-то использовать с DiT моделями.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Генерация синтетических изображений с использованием диффузионно-трансформерной модели (DiT)

Комментарии 2

Публикации

Истории