Comments 11
Сколько весит сама модель?
Возможно ли превратить изображение в текстовый промт который можно будет восстановить в что-то похожее на оригинальное изображение с сохранением «смысла»?
В первой части текста, до блока оценки, я уж подумал «вот он, суперкомпуктер из сериала След, который шакалье качество снятого в jpg автомобильного номера с 3х километров переводит в красивую картинку». Но нет. Пока нет.
Добрый день! Спасибо за публикацию. Я хотел уточнить - а есть ли какие-то цифры по потреблению ресурсов машины при сжатии и тайминги процесса сжатия? Качество и размер это важные параметры, но вычислительные рессурсы также важны (возможно сжатие идет в 5 раз дольше чем jpg и ресурсов тратится в разы больше). Спасибо!
Примерно 16Гб ОЗУ, 4 Гб видеопамяти, и по 30 секунд на шаг, а всего их 4, если правильно помню из статьи.
JPEG-у же нужно будет пару килобайт памяти и кодироваться он будет со скоростью примерно 100 мегапикселей в секунду на процессоре без всякого ускорения видеокартой.
То есть, дольше будет не в 5 раз, а в 50 000 раз. Про ресурсы - не у каждого дома такой комп, что способен запустить Stable Diffusion.
Для лиц есть Gfpgan. Хотя с таким разрешением.. 😉
Сжатие изображений при помощи модели Stable Diffusion