интересно, Илья обучил свою модель с помощью LoRa, Это значит, что рядом с моделью были созданы новые слои. А тут получается LoRa поверх LoRa. Как так может быть? какая в итоге архитектура будет?

YarKo_69 Jan 5 at 16:38

Не совсем.

Подготовим ноутбук для предобработки и обучения модели
Для начала загружаем модель LLama2 и адаптер LoRa (обязательно ставим параметр is_trainable = True)

Параметр is_trainable = True подразумевает, что мы загружаем обученные слои для дообучения.

vova_sam Jan 5 at 17:56

Т.е. мы пе(до)реобучаем обученные Ильей слои LoRa? Т.е. корректируем существующие слои Lora?

YarKo_69 Jan 5 at 18:46

Да, всё верно. Это было сделано для того, чтобы не удалять полностью обучение русским диалогам и тд. А для того чтобы вывод был в нужном формате и логичность вывода сохранилась.

vova_sam Jan 5 at 22:12

понял. спасибо. Работал, кстати, в Инлайне у Дрожжина несколько лет назад )
я обучил предложенную Вами модель, а потом IlyaGusev/saiga_mistral_7b_lora. Так вот вторая дала субъективно лучше результаты.

Show the best of all time