Как стать автором
Обновить

Генерация синтетических изображений с использованием диффузионно-трансформерной модели (DiT)

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров2.6K
Всего голосов 1: ↑1 и ↓0+1
Комментарии2

Комментарии 2

2. Открытый репозиторий с исходным кодом и комментариями разработчиков.

Stable diffusion есть в репе automatic1111, с удобным пользовательским интерфейсом.

3. Генерация картинок без всевозможных фильтров. Очень часто генеративные модели, например, Stable Diffusion, создают эффекты свойственные иллюстрациям, нам хотелось этого избежать.

Сам месяц назад начал поиски и наткнулся на реп kohya_ss для обучения Lora. Если честно не заметил эффектов иллюстраций, думаю можно избавиться от них с теми же Lora. Можно дополнительно использовать негативные промпты. Можно попробовать другие модели.

А вот кстати по поводу масштабов моделей базовая stable 1.5 на 800 миллиардов параметров, месяц назад вышла XL версия с 3.5 триллионами параметров. Дообучить ее с помощью Lora вполне возможно рядовому пользователю.

Сгенерировал около 10 тысяч изображений, качеством вроде даже доволен), так что stable как альтернативу вполне можно использовать. Ваша статья упала как никогда вовремя, спасибо за проделанную работу.

Добрый день!

Спасибо за комментарий, глянем обязательно репозитории, про которые говорите. Надеемся, что наша статья вам чем-то пригодится)) На счет Lora, наверняка можно как-то использовать с DiT моделями.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории