Обновлено в 17:07

OpenAI обвинили в «миллиардах долларов» ущерба для The New York Times. Газета утверждает, что понесла огромные убытки и недополучит прибыль из-за обучения нейросети на материалах издания.

Согласно иску, модели OpenAI способны «дословно копировать тексты статей и воспроизводить стиль» The New York Times, что лишает газету подписок, рекламы и других доходов. «Ответчики пытаются «зайцем» проехать на масштабных инвестициях издания в журналистику и создают продукты-заменители без разрешения и оплаты», — цитирует документ The Verge.

Не разделяет позицию NYT гендиректор компании — разработчика искусственного интеллекта «А-Я эксперт» Роман Душкин:

Роман Душкин гендиректор компании — разработчика искусственного интеллекта «А-Я эксперт» «Человек, купивший газету за свои кровные деньги, заплативший пару долларов за бумажный выпуск: он какие права получает на те буквы, которые на этой газете напечатаны? А на те смыслы, которые эти буквы выражают? Я думаю, что юристы как тех, так и других компаний, как газеты, так и компании типа Microsoft, OpenAI — они тоже свой хлеб не зря едят. Они хорошие юристы, я уверен. Они будут в судах много-много лет, если не десятилетий, заниматься перетягиванием каната друг на друга, и там как судья отреагирует, потом начнутся апелляции. A второе — газета потеряла миллиарды прибыли. В нашей правовой системе, когда мы заключаем какой-нибудь договор, обычно пишут, что возмещение убытков или потерянной прибыли должно быть доказано. То есть если газета сможет доказать, как они потеряли миллиарды прибыли — ну, например, вот если бы не использовалась, газета бы получила миллиард долларов прибыли, а вот OpenAI использовала, и газета это не получила. Что было бы, если б у бабушки были усы? Я вот не знаю, как это доказать».

Вердикт по процессу может стать для США прецедентом в вопросах права на использование материалов при обучении нейросетей. С одной стороны, успех коммерческого продукта OpenAI действительно во многом обеспечен материалами, на которых обучалась нейросеть. С другой — обычные журналисты в своей работе тоже читают статьи других изданий, учатся на этом и пишут собственные материалы в коммерческих целях. Есть ли здесь параллели? Рассуждает управляющий партнер «Коллегии медиаюристов» Федор Кравченко:

Федор Кравченко управляющий партнер «Коллегии медиаюристов» «Отличие от обычного чтения такой статьи журналистом заключается в двух вещах. Во-первых, речь идет не об одной статье и даже не о тысяче статей, а об огромном архиве The New York Times, таким образом, речь идет об обработке больших данных. А второе отличие заключается в том, что, когда человек читает статью, он в основном запоминает смысл, суть, а авторское право охраняет именно форму произведения, то есть в этом смысле идея охраняться не будет. Что же касается искусственного интеллекта, то, в отличие от людей, он не столько понимает смысл вот этих статей в The New York Times, сколько запоминает именно форму. И, таким образом, модель искусственного интеллекта действительно неким новым образом использует такие литературные произведения, как статьи в газетах. Сейчас в мировой практике в основном защищаются исключительным правом правообладателя такие способы использования, как, например, воспроизведение, изготовление экземпляров или доведение до всеобщего сведения, когда в интернете выставляется тот или иной текст, или другое произведение, или публичное исполнение, и многие другие. А вот сейчас мы видим совершенно новый способ использования, ранее неизвестный, такой как обучение модели искусственного интеллекта на этом тексте. Скорее всего, рано или поздно такой способ использования будет прямо поименован в правовых актах, которые говорят о том, что именно правообладатель обладает исключительным правом разрешать или запрещать такое использование, но пока об этом можно вести споры в судах».

Осенью с иском против OpenAI выступила американская Гильдия авторов. Писатель Джордж Мартин и другие члены организации обвинили компанию в нарушении авторских прав и «систематическом воровстве в массовом масштабе». Согласно иску, среди прочего разработчики ChatGPT обучали модель на книгах, скачанных из пиратских электронных библиотек.

При этом не все создатели контента выступают против нейросетей. Associated Press, Politico и Business Insider заключили с OpenAI соглашение об использовании своих материалов для тренировки моделей.