Инженер Microsoft нашел уязвимость в ИИ-генераторе DALL-E 3. Компания потребовала замолчать

Старший инженер по искусственному интеллекту Шейн Джонс обнаружил уязвимость в генераторе изображений, которая позволяла обходить защитные механизмы нейросети и генерировать незаконный контент.

Оставить комментарий

Джонс решил рассказать о проблеме после того, как в соцсетях стали появляться сгенерированные порноизображения Тейлор Свифт. Инженер призвал OpenAI изъять DALL-E 3 из открытого доступа. Предположительно злоумышленники использовали инструмент Microsoft Designer, который частично основан на этом генераторе.

Инженер утверждает, что сообщил о проблеме руководству еще 1 декабря 2023 года. Тогда же он получил ответ от работающего с такими обращениями сотрудника: тот заявил, что проблема не касается ни внутренней сети Microsoft, ни учетных записей клиентов компании, и рекомендовал направить обращение в OpenAI. Джонс сделал это 9 декабря, но так и не получил ответа.

14 декабря Джонс разместил пост на LinkedIn с призывом отозвать DALL-E 3 c рынка. С ним связался начальник, который передал требование юридического отдела Microsoft немедленно удалить публикацию, а его обоснование обещали прислать позднее. Работник удалил публикацию, но никаких сообщений от юристов он так и не получил.

30 января он направил письма двум сенаторам, одному конгрессмену и генпрокурору штата Вашингтон. OpenAI прислала ответ, в котором заявила, что описанный Джонсом метод не позволяет обходить средства безопасности генератора.

Тейлор Свифт против порнотроллей: дипфейки певицы наводнили соцсети
По теме
Тейлор Свифт против порнотроллей: дипфейки певицы наводнили соцсети
Джорджа Карлина сделали чат-ботом: наследники комика подали в суд из-за его ИИ-образа
По теме
Джорджа Карлина сделали чат-ботом: наследники комика подали в суд из-за его ИИ-образа
Meta представила улучшенную версию ИИ-генератора кода Code Llama
По теме
Meta представила улучшенную версию ИИ-генератора кода Code Llama

Читать на dev.by