OpenAI эксплуатировала кенийцев за $1-2 в час для разметки данных

ИИ-компания Sama из Сан-Франциско несколько занималась разметкой изображений и текста для OpenAI. Эти данные применялись для обучения чатбота ChatGPT, чтобы тот не выдавал сексистские, расистские и другие нежелательные комментарии. Однако люди, которые выполняют «чёрную работу», трудятся за копейки и при этом страдают. Об этом пишет издание Time, которое проанализировало внутренние документы двух компаний и пообщалось с их подрядчиками.

3 комментария

Чтобы научить нейросеть распознавать и отфильтровывать токсичный контент, необходима размеченная вручную база такого контента. Этим в том числе занимались подрядчики Sama, которые работали на аутсорсе в Кении.

В конце 2021 года компании подписали три контракта на общую сумму около $200 млн. OpenAI выслала подрядчикам Sama десятки тысяч фрагментов текста с описаниями сексуальных домогательств, разжигания ненависти и насилия. Примерно три десятка работников были разделены на три команды — по одной на каждую тему.

За 9-часовую смену им приходилось читать и размечать по 150-250 фрагментов объёмом от 100 до более 1000 слов. Несколько сотрудников рассказали Time, что работа их морально травмировала, а встречи с психотерапевтами были редки и бесполезны.

В контрактах значилось, что OpenAI будет платить Sama за работу $12,5 в час. Кенийские подрядчики при этом зарабатывали от $1,32 до $2 в час после вычета налогов в зависимости от уровня и выполнения плана. Также «за вредность» им выдавали бонус — $70 в месяц.

OpenAI открыла приём заявок на продвинутую версию ChatGPT
По теме
OpenAI открыла приём заявок на продвинутую версию ChatGPT

Sama разорвала сотрудничество с OpenAI в феврале 2022 года — за 8 месяцев до истечения контрактов — после того, как та запросила для анализа базу изображений, содержащих потенциально незаконный контент, такой как сексуальное насилие над детьми, изнасилования и другую жестокость для обучения другого ИИ-проекта, не связанного с ChatGPT. Работников с проекта по ChatGPT уволили или перевели на другие низкооплачиваемые проекты.

В Sama заявили, что за смену подрядчики должны были размечать лишь по 70 фрагментов текста, а получали за это от $1,46 до $3,74 в час «чистыми». Указанные в контрактах $12,5 включают прочие расходы компании, например на инфраструктуру и бонусы.

OpenAI подтвердила, что использовала труд кенийских работников для создания инструмента для обнаружения проблематичного контента. Но отметила, что не ставила целей по производительности, а за выплаты и заботу о психическом состоянии подрядчиков отвечала Sama.

Помимо OpenAI, Sama оказывает услуги по разметке данных Google, Microsoft, Meta и другим компаниям. Людей калифорнийская компания нанимает в Кении, Уганде и Индии.

В Google «бьют тревогу» из-за нового чат-бота ChatGPT
По теме
В Google «бьют тревогу» из-за нового чат-бота ChatGPT

Читать на dev.by