PatientZero Oct 3 2022 at 14:49

Сжатие изображений при помощи модели Stable Diffusion

10 min

12K

Image processing*Data compression*Machine learning*Artificial Intelligence

Translation

+39

Comments 11

lea Oct 3 2022 at 15:15

Сколько весит сама модель?

Kristaller486 Oct 3 2022 at 15:29

Вся SD 4,2гб, часть, которая отвечает за картинки, если я не ошибаюсь, около 2гб

entze Oct 3 2022 at 16:42

Возможно ли превратить изображение в текстовый промт который можно будет восстановить в что-то похожее на оригинальное изображение с сохранением «смысла»?

dronperminov Oct 3 2022 at 18:44

Base64 :)

expdxx Oct 3 2022 at 16:52

В первой части текста, до блока оценки, я уж подумал «вот он, суперкомпуктер из сериала След, который шакалье качество снятого в jpg автомобильного номера с 3х километров переводит в красивую картинку». Но нет. Пока нет.

Quark-Fusion Oct 3 2022 at 17:34

в красивую, но целиком выдуманную картинку

+14

shamash Oct 4 2022 at 03:39

bralexey Oct 4 2022 at 14:46

Добрый день! Спасибо за публикацию. Я хотел уточнить - а есть ли какие-то цифры по потреблению ресурсов машины при сжатии и тайминги процесса сжатия? Качество и размер это важные параметры, но вычислительные рессурсы также важны (возможно сжатие идет в 5 раз дольше чем jpg и ресурсов тратится в разы больше). Спасибо!

orekh Oct 4 2022 at 19:28

Примерно 16Гб ОЗУ, 4 Гб видеопамяти, и по 30 секунд на шаг, а всего их 4, если правильно помню из статьи.

JPEG-у же нужно будет пару килобайт памяти и кодироваться он будет со скоростью примерно 100 мегапикселей в секунду на процессоре без всякого ускорения видеокартой.

То есть, дольше будет не в 5 раз, а в 50 000 раз. Про ресурсы - не у каждого дома такой комп, что способен запустить Stable Diffusion.

entze Oct 5 2022 at 18:17

SD оптимизируют и он запускается на Intel без GPU на 16 ГБ оперативы. Вполне себе машина.

madwtj Oct 4 2022 at 22:05

Для лиц есть Gfpgan. Хотя с таким разрешением.. 😉

Show the best of all time