Как стать автором
Обновить

InstantID: Создание персонализированных изображений по одному фото. И лучший бесплатный генератор нейро-аватарок

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров19K
Всего голосов 51: ↑47 и ↓4+43
Комментарии18

Комментарии 18

Спасибо большое за то, что познакомили с такой полезной технологией и за подробное объяснение, как ей пользоваться! =)

попробовал. Усиливает возраст (старее получается)
Улыбка с фото теряется, и лицо становиться грустное.

Пробовали в промт добавить, чтобы лучики счастья были н алице?)

АВАТАРКИ ДАВАЙ!!!11

Прочитал было АВАДА КЕДАВРА!!!11

Подскажите, а вот это вот " (best quality:1. 5)" в prompt - это что? где про это можно почитать? "best quality" это какой-то параметр из фиксированного списка или человеческий язык, и можно заменять синонимами? 1.5 - это значит, "в полтора раза сильнее, чем просто best quality? Это система как-то интуитивно понимает (и можно заменить на "полтора" скажем или 1+0.5), или это, опять же, какой-то язык параметров?

Это вы про промпт инжиниринг, это тема часа на три. Если очень коротко, когда-то обучались самые первые модели дата-сеты были черти какие, просто скачанный интернет, и зачастую за описание фото принимались ключевые слова или хэштеги.

А на разных площадках свои приколы с ключевыми словами, условно в инстаграме одни тренды, на девианарте другие, но тренды есть и люди одни и те же хештеги использовали.

Таким образом некоторые странные фразы начали иметь положительное влияние на генерацию, такие как masterpiece или artstation. Ну а раз они делают картинку лучше, то люди начали их использовать, брать друг у друга и просто добавлять в свои запросы, авось станет лучше.

И это все привело к тому, что у нас укоренились мусорные запросы, вроде вот таких вот конструкций (best quality:1.5), притом тут 1.5 это синтаксис которые еще и усиливает этот токен.

На самом деле на SDXL моделях уже нет смысла их использовать, она отлично понимает нативный язык, для чего и создавалась, но по привычке люди по прежнему это делают.

Технологии безусловно шагнули вперед, но я единственный, кого уже тошнит от таких аватарок?

Да мы ж только начали, до этого и близко не так качественно было =)

Но бесполезным говном это как было так и осталось.

"Итак," - пишется СЛИТНО

Не всегда.

И так тоже.
;)

Если вы гордый обладатель жирной современной видеокарты, желательно от 16гб видеопамяти и только Nvidia

Ну да, пошел я нафиг со своим встроенным видео на Intel i7-2700K.

Попробовал запустить локально, используя ComfyUI с CUDA 12.1.

Убил половину дня на настройку, но... В-общем не заработало у меня. Используя CPU - работает, результат схож с тем, что у вас в статье. Но Время... на одну генерацию уходит 2000 секунд.

Вышло обновление расширения ControlNet для Automatic1111.

Теперь в нем есть поддержка InstantID. Инструкция куда класть модели и какие выставлять параметры тут. У меня получилось запустить на карточке с 8GB VRAM. Качество 512x512 пока так себе, буду играть с настройками.

WebUI запускаю с этими ключами:

--no-half-vae --lowvram --xformers --opt-sub-quad-attention

Удалили просто ту модель, можно другую прицепить.

А есть проверенные модели?
И я использую колаб, а там используется та модель что в git репозитории. Репу я себе скопировал, и путь в колабе поменял.теперь ищу где ссылка на модель в копии репы находится.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории