Stability AI выпустила обновление ИИ-генератора Stable Diffusion
Stability AI показала предварительную версию Stable Diffusion 3.0 — флагманской генеративной ИИ-модели. Компания пообещала вскоре представить нейросети для создания 3D-изображений и видео.
«Анонсируем Stable Diffusion 3 в ранней предварительной версии, нашу самую функциональную модель преобразования текста в изображение со значительно улучшенной производительностью в многотемных подсказках, качеством изображения и возможностями правописания», — говорится на сайте проекта.
В течение года разработчик постепенно улучшал базовую модель Stable Diffusion, выпуская обновления. Новая версия имеет улучшенное качество изображения и лучшую производительность. Нейросеть обеспечивает более точное написание текста внутри сгенерированных изображений: в прошлом типографика была слабой стороной модели.
Предварительная версия Stable Cascade использовала архитектуру Würstchen для повышения производительности и точности. Версия 3.0 использует другой подход, опирающийся на диффузионные модели-трансформеры, что сближает ее с недавно анонсированной модели Sora компании OpenAI.
Другая важная инновация — это согласование потоков. Новый метод обучения нейросетей с помощью «непрерывных нормализующих потоков» (Conditional Flow Matching — CNF) применяется для моделирования сложных распределений данных. Это приводит к более быстрому обучению, более эффективному отбору образцов и повышению производительности по сравнению с диффузионными путями.
Пока Stable Diffusion 3 доступна только по запросу через лист ожидания — заявки принимают здесь. Точная дата публичного релиза пока не сообщается.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.