
Image by Szabo Viktor, from Unsplash
Создатели YouTube невольно подпитывают AI-модели Google
Google подтвердил использование подмножества видео с YouTube для обучения своих моделей искусственного интеллекта, включая Gemini и продвинутый генератор видео Veo 3.
Спешите? Вот основные факты:
- Создатели не были проинформированы о том, что их видео используются для обучения AI инструментов.
- Условия использования YouTube позволяют Google лицензировать загружаемый контент по всему миру без выплаты авторских отчислений.
- Эксперты предупреждают, что AI может конкурировать с создателями без их согласия или компенсации.
Новость, впервые сообщенная CNBC, вызвала критику со стороны создателей контента и специалистов в области интеллектуальной собственности, которые беспокоятся о том, что их контент может использоваться для разработки инструментов, которые в конечном итоге могут заменить их.
«Мы всегда использовали контент YouTube для улучшения наших продуктов, и это не изменилось с появлением ИИ», — сказал представитель YouTube CNBC.
«Мы также признаем необходимость в установлении границ, поэтому мы вложились в надежные меры защиты, которые позволяют создателям контента защитить свой образ и сходство в эпоху ИИ», — добавил представитель.
CNBC сообщает, что на YouTube размещено более 20 миллиардов видео. Однако Google не раскрывал конкретное число видео, которые они используют для обучения AI. В статье отмечается, что даже 1% выборки из огромного каталога YouTube все равно приведет к миллиардам минут контента, что превышает обучающие данные большинства конкурирующих платформ AI.
CNBC поговорил с несколькими создателями контента и профессионалами в области интеллектуальной собственности, которые не знали, что их контент может быть использован для обучения AI. «Вполне вероятно, что они используют данные многих авторов, которые потратили много времени, энергии и своих собственных мыслей на создание этих видео», — сказал Лука Арригони, генеральный директор компании по цифровой идентификации Loti. «Это не совсем справедливо по отношению к ним», — добавил он.
Google представил Veo 3 в мае с помощью кинематографического контента, созданного с помощью искусственного интеллекта. Хотя у компании есть законное право использовать загруженный контент согласно условиям использования YouTube, эксперты, такие как Дэн Нили из Vermillio, предупреждают, что инструменты, созданные с помощью искусственного интеллекта, могут конкурировать напрямую с создателями, предоставляющими данные для обучения.
«Мы видим, что все больше авторов обнаруживают поддельные версии себя», — сказал Нили CNBC.
Дополнительно подогревая дебаты, расследование показало, что несколько крупных компаний в области искусственного интеллекта, таких как Apple, Nvidia, Anthropic и Salesforce, использовали тексты более чем 173 000 видео с YouTube для обучения моделей AI, несмотря на политику платформы.
Эти видео были взяты с более чем 48 000 каналов, включая таких популярных создателей контента, как MrBeast, PewDiePie и Marques Brownlee, а также академические и новостные учреждения, например MIT, Khan Academy, NPR и BBC.
Отсутствие ясной опции отказа или предупреждения, когда AI сканирует контент, побудило создателей требовать большей прозрачности и защиты для процессов обучения AI.