Отдел новостей 25 августа 2023, 14:37

OpenAI пытается скрыть, что тренировала ChatGPT на книгах, защищённых авторским правом

Согласно новому исследованию ByteDance (владеет TikTok), чатбот ChatGPT пытается скрыть, что был обучен на материалах, охраняемых авторским правом. Работа была направлена на повышение надёжности и точности ответов языковых моделей при помощи различных приёмов.

6 комментариев

OpenAI пытается скрыть, что тренировала ChatGPT на книгах, защищённых авторским правом

Согласно новому исследованию ByteDance (владеет TikTok), чатбот ChatGPT пытается скрыть, что был обучен на материалах, охраняемых авторским правом. Работа была направлена на повышение надёжности и точности ответов языковых моделей при помощи различных приёмов.

ChatGPT, как и практически все другие большие языковые модели, обучался на огромных наборах данных и текста из интернета, в том числе на книгах. К OpenAI всё чаще предъявляют претензии и судебные иски за использование таких работ без разрешения правообладателей.

В итоге OpenAI и другие компании вроде Google, Meta и Microsoft просто больше не раскрывают информацию о том, какие данные скармливали моделям. Но в неудобном факте могут признаваться сами ИИ-инструменты, и это очень беспокоит разработчиков.

Поэтому теперь ChatGPT всячески уходит от ответа на пользовательские запросы, в которых присутствуют фразы из несвободно распространяемых материалов — например, когда исследователи вводят предложение из книги и пытаются получить следующее за ним. Хотя предыдущая версия модели без проблем выдавала точное продолжение заданной фразы.

ChatGPT даёт неправильные ответы на вопросы по программированию более чем в половине случаев

«Мы полагаем, что разработчики ChatGPT внедрили механизм для определения, когда пользователь стремится вытянуть защищённый авторским правом контент или проверить сходство между сгенерированным ответом и контентом, защищённым авторским правом», — отмечают исследователи.

Но несмотря на это ChatGPT всё равно может выдавать такой контент, как и многие другие ИИ-модели. Исследователи проверяли различные версии ChatGPT, OPT-1.3B от Meta, FLAN-T5 от Google, DialoGPT от Microsoft и ChatGLM разработки Университета Цинхуа в Китае. Все они точно или почти точно ответили на запросы с фразами из книг о Гарри Поттере британской писательницы Джоан Роулинг — иногда ответы отличались одним-двумя словами. «Все большие языковые модели выдавали текст, который больше напоминал защищённый авторским правом контент, чем случайно сгенерированный текст», — говорят исследователи.

Вместе с тем они считают, что новшество в ChatGPT поможет оградить использовавшийся для обучения защищённый контент от пользователей, которые специально хотят его извлечь при помощи кастомизированных запросов.

OpenAI получила иск за использование данных пользователей для обучения ChatGPT

6 комментариев

Текст: Отдел новостей Фото: Warner Bros. Источник: Insider Теги: chatgpt, openai, авторское право, генеративный ии, искусственный интеллект, языковая модель

Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке»."

Сайт компании Вакансии

Размещение рекламы

Нейросеть «оживляет» классические пиксельные игры

Meta разработала ИИ для «чтения мыслей»

Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей

4 комментария

Разработчик пиратского софта сдал коллегу, который «спиратил» его код

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

yusup95 FullStack developer в Global Freelance

0

Интересно что думает Джоан Роулинг на этот счет

wchar_t

0

Подозреваю, что ChatGPT учился на хороших книгах тайком от своих разработчиков.

teki

0

Настало весёлое время, когда можно попытаться выудить у AI конфиденциальные/авторские данные на которых его использовали :D

Пользователь отредактировал комментарий 25 августа 2023, 16:00

Alex V

1

chatgpt совершенно точно знаком с содержанием многих книг. Недавно я просил его пересказать мне конкретный эпизод из Ложной слепоты. Он без проблем все расказал. Не очень понимаю, как это можно скрыть.

Anonymous ceo в localhost

0

Но ведь Роулинг отменили, теперь что, и чатгпт отменять придется?

zabelarus14 Инженер в НИИ им. Баца

0

их уже перевели на американский?

Войдите, чтобы оставить комментарий