Amazon просит сотрудников заводить аккаунты на GitHub, чтобы быстрее собирать код для тренировки ИИ-моделей
Руководство Amazon попросило сотрудников регистрировать аккаунты на GitHub и передавать их компании, чтобы она могла собрать оттуда больше кода, узнал Business Insider. Данные очень нужны Amazon для обучения домашних ИИ-моделей.
Емейл с заголовком «Help with data» сотрудникам разослала команда Artificial General Intelligence (Amazon AGI) в конце мая. В нём говорилось, что ей нужны «количественные и качественные метаданные с GitHub» для целей обучения ИИ.
Проблема в том, что с одной учётной записи можно делать всего 5 тысяч запросов на сбор данных в час. А на GitHub размещено более 150 млн публичных репозиториев, поэтому из-за лимита задача потребует «много лет». Но если делать это с нескольких аккаунтов одновременно, то сроки можно сократить до «нескольких недель», говорят в Amazon AGI
Призыв прозвучал на самом высоком уровне — его адресовал старший вице-президент группы и главный научный сотрудник Amazon Рохит Прасад. В другом емейле он добавил, что «это займёт всего 5 минут!»
Данные нужны Amazon для тренировки находящейся в разработке модели, которую внутри компании называют её «самым амбициозным» ИИ-проектом. Это очень важно для Amazon, поскольку сейчас в сфере генеративного ИИ она отстаёт от Microsoft, Google и Meta.
Такая уловка вызывает этические вопросы и уж точно не обрадует конкурента Microsoft, но тем не менее была одобрена корпоративными юристами и специалистами по безопасности Amazon. Хотя Microsoft сама получила иск за нарушение лицензий GitHub, потому что использовала данные с него для обучения ИИ-ассистента Copilot.
В Amazon изданию сказали, что выступают за соблюдение прав владельцев и создателей контента, а также что используют лучшие отраслевые практики по сбору данных для своих моделей. А аккаунты нужны как раз затем, чтобы не нарушать правила GitHub и не получить бан. В GitHub и Microsoft не ответили на запрос BI о комментарии.
Читать на dev.by