Как стать автором
Обновить

Комментарии 21

Это не сработает с моделями от OpenAI, у них защита от эксплоитов и они не обращают внимания на информацию в своих ответах, то есть так нельзя даже стиль задать. И в данном случае были просто примеры того что с помощью файн-тюнинга можно сделать. В реальных условиях же лучше вообще не закидывать инфу в модель, а сделать подгрузку информации с сервера чтобы экономить токены.

Попробуй проверить свою теорию на практике и посмотри что выйдет.

и платить при каждом запросе за передачу лишних токенов. Наверное можно на как-то не экономно..

Это не сработает, я же писал выше. У моделей от OpenAI есть защита от этого. Я сам раньше думал что так можно, но оказывается их модели очень сильно отличаются от других и опенсорсных

Как задать вопрос, чтобы gtp наделал в штанишки

Видимо там небольшая ошибка в инструкции, ChatGPT ими перегружен и путается в них. Насчёт времени: Это делается через системное сообщение, отдельная программа сообщает модели какое сегодня число

Для того, чтобы самостоятельно указать кол-во эпох, необходимо делать это через API.


Можно для полных нубов, какое число эпох следует указывать, от чего зависит этот параметр и на что влияет?

Одна эпоха — полная пробежка по всему датасету.

Для хороших и простых датасетов хватит 8 эпох, для сложных и нелогичных нужно от 12 до 24.

Если эпох слишком мало, их не хватит чтобы настроить веса модели.

Если вы из России, то через что пополняете баланс аккаунта? Все что я нашел, имеет просто невменяемую комиссию.

На авито можно карту Казахстана купить

"заместо" - давно такого слова не слышал в использовании.

Вы не обижайтесь, ваши статьи я читаю, но вам бы обучить GTP, чтобы она исправляла грамматику, добавляла знаки препинания и обогащала текст Ваших статей.
Просто Вы же публичные статьи пишете. А так, конечно, вы в полном праве писать и говорить как считает нужным

а вот эта Ваша тяга к информации о смерти, суицидам. Надо с ней что то делать

Заместо

Насчёт запятых, они стоят правильно. Я учитываю все возможные правила и если запятую даже в теории можно не ставить — я её не ставлю.

Касательно обогащения текстов —"обогащённые" текста выводят меня из себя, я считаю текст способом для передачи информации. Вы же не едите обогащённый уран? У меня есть некоторые псих. расстройства из-за которых я неправильно воспринимаю речь, поэтому мне нужен стандарт написания статей.

Про информации о смерти и о суицидах — я просто считаю это смешным. У меня нет суицидальных мыслей.

смерть это безусловно часть жизни. Суицид - очень плохо как для материалистов, так и для духовных людей, т.к. нарушает общий принцип живого.

Оба эти явления я бы не назвал "смешными". Но Ваше право воспринимать все по своему.
Удачи Вам!

А по теме интересно узнать, как обучающие данные обрабатываются: что там "под капотом" у модели

У OpenAI модели не опенсорсные, не известно. Известно только то, что GPT-4 "переписывает" датасет перед запуском алгоритма для подбора весов, а что именно это за алгоритм они не говорят, поскольку они разработали свою альтернативу для backpropagation

Может быть, есть универсальный датасет, отключающий любую цензуру, желательно, полностью?

Решил я зафайтюнить модель под erp, а в итоге получил это сообщение... Видимо не судьба...

Какой баланс был? Что внутри датасета?

Баланс был 25$. Модель gpt-3.5-turbo-1106

Внутри 18+ примеры ERP на английском. Потом перевел на русский, все равно это выводит.

Какие именно примеры?

Я думаю на Хабре такое нельзя писать)

Какую модель?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации