Инженер Microsoft нашел уязвимость в ИИ-генераторе DALL-E 3. Компания потребовала замолчать
Старший инженер по искусственному интеллекту Шейн Джонс обнаружил уязвимость в генераторе изображений, которая позволяла обходить защитные механизмы нейросети и генерировать незаконный контент.
Джонс решил рассказать о проблеме после того, как в соцсетях стали появляться сгенерированные порноизображения Тейлор Свифт. Инженер призвал OpenAI изъять DALL-E 3 из открытого доступа. Предположительно злоумышленники использовали инструмент Microsoft Designer, который частично основан на этом генераторе.
Инженер утверждает, что сообщил о проблеме руководству еще 1 декабря 2023 года. Тогда же он получил ответ от работающего с такими обращениями сотрудника: тот заявил, что проблема не касается ни внутренней сети Microsoft, ни учетных записей клиентов компании, и рекомендовал направить обращение в OpenAI. Джонс сделал это 9 декабря, но так и не получил ответа.
14 декабря Джонс разместил пост на LinkedIn с призывом отозвать DALL-E 3 c рынка. С ним связался начальник, который передал требование юридического отдела Microsoft немедленно удалить публикацию, а его обоснование обещали прислать позднее. Работник удалил публикацию, но никаких сообщений от юристов он так и не получил.
30 января он направил письма двум сенаторам, одному конгрессмену и генпрокурору штата Вашингтон. OpenAI прислала ответ, в котором заявила, что описанный Джонсом метод не позволяет обходить средства безопасности генератора.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.