Stability AI выпустила новую версию генератора изображений Stable Diffusion 3 Medium
Компания показала новую версию Stable Diffusion, которая предназначена для генерации изображения по текстовому описанию.
Stable Diffusion меньше по размеру, чем другие версии модели: она способна работать на потребительских видеокартах. Уменьшенный вариант пригодится пользователям и компаниям с ограниченными ресурсами. Новую нейросеть можно тестировать через API на сервере Stable Artisan в Discord. Веса модели доступны для некоммерческого использования на Hugging Face.
В новой модели повысилось качество генерации изображений человеческих лиц и рук, а также улучшились возможности в области типографики и понимания текстовых запросов. Это позволяет Medium точно интерпретировать сложные текстовые описания и реалистично воссоздавать пространственное расположение элементов.
Ранее представленная модель Stable Duffusion 3 станет Large: у нее 8 миллиардов параметров, в отличие от Medium c 2 миллиардами параметров. Версия Medium сможет работать на домашних видеокартах, с 5 Гбайт памяти, но рекомендуется использовать 16 Гбайт.
Читать на dev.by