GPT-4o теперь можно дообучать на своих наборах данных
В качестве примера приводится ситуация, в которой производитель скейтбордов дообучает модель для чат-бота, куда скейтеры обращаются с вопросами о хранении и ремонте «досок». В OpenAI отметили, что чтобы увидеть разницу, достаточно добавить в обучающий датасет всего «несколько десятков примеров».
Дообучение доступно всем разработчикам с платной подпиской. В соответствующем разделе нужно нажать на кнопку «Создать» и выбрать gpt-4o-06.08.2024 в выпадающем меню с базовыми моделями. Как устроен файнтюнинг, описано в справочном разделе.
Пока можно загрузить только текстовые данные — изображения и другие виды контента не поддерживаются. На дообучение в среднем уходит до двух часов.
По словам OpenAI, «контроль» над дообученными моделями будет исключительно у самих разработчиков. Компания не будет использовать запросы, ответы и прочие «бизнес-данные» для тренировки ИИ или передавать третьим лицам.
Дообучение обойдётся в $25 за 1 млн токенов (до 23 сентября 2024 года организациям полагается по 1 млн токенов в день бесплатно). При использовании дообученной модели 1 млн «входных» токенов будет стоить $3,75, а «выходных» — $15.
Читать на dev.by