
Image by AbsolutVision, from Unsplash
Издатели Блокируют AI Ботов для Защиты Контента
Издатели новостей продолжают бороться с AI-ботами, подают иски на технологические компании, предупреждая, что скрейпинг угрожает журналистике, системам справедливого вознаграждения, а также будущему открытого веба.
В спешке? Вот основные факты:
- Инструменты ИИ, такие как ChatGPT, снижают трафик на новостных сайтах.
- Cloudflare запустил инструменты для блокировки неавторизованных скрейперов AI.
- Reddit и iFixit подали в суд или заблокировали компании AI, такие как Anthropic.
В новом отчете от The Wall Street Journal (WSJ), издательства новостей начинают противостоять компаниям, работающим в области искусственного интеллекта, которые незаконно используют контент с их веб-сайтов без компенсации. По мере того как инструменты ИИ, такие как ChatGPT и Gemini от Google, становятся все более популярными, многие медиакомпании пытаются блокировать ботов, которые без разрешения используют их материалы.
«Вы хотите, чтобы ваш сайт читали люди, а не боты, особенно боты, которые не приносят вам никакой выгоды», — сказал Николас Томпсон, генеральный директор The Atlantic, который заключил лицензионное соглашение с OpenAI, но планирует блокировать другие AI компании, как сообщает WSJ.
Такая тактика, известная как «скрейпинг», существует еще с ранних дней Google. Тогда поисковые системы приводили трафик на сайты издателей. Теперь AI чат-боты предоставляют сводки новостей, которые отвлекают читателей от посещения их первоисточников. Сочетание снижения трафика, генерируемого ботами, и снижения рекламных доходов стало общей проблемой для многих издателей.
Чтобы противостоять этому, издатели обращаются к технологическим компаниям, таким как Cloudflare, которая недавно запустила инструменты, позволяющие веб-сайтам контролировать, могут ли AI-боты получить доступ к контенту. Генеральный директор Dotdash Meredith Нил Вогель, чья компания также лицензирует контент для OpenAI, заявил: «Люди, которые создают интеллектуальную собственность, должны быть защищены, иначе никто больше не будет создавать интеллектуальную собственность», как сообщает WSJ.
Некоторые компании, такие как Reddit и iFixit, предприняли юридические шаги. Reddit подал в суд на AI-компанию Anthropic за то, что она собирала данные более 100 000 раз, несмотря на просьбы прекратить. iFixit заявила, что Anthropic обратилась к ее серверам миллион раз за один день.
Борьба также происходит в суде. The New York Times подает в суд на Microsoft и OpenAI, в то время как News Corp и ее дочерние компании берутся за Perplexity. BBC также угрожает судебным иском против стартапа в области искусственного интеллекта Perplexity, обвиняя его в скрейпинге своего контента для обучения его базовой модели.
Тем временем, некоторые беспокоятся, что более строгие правила против скрейпинга могут блокировать законные использования, такие как академические исследования, как отмечено в WSJ.
Как предупредила Шейн Лонгпре из Инициативы по происхождению данных, «Интернет разделяется между теми, кто предлагает наивысшую цену. Это очень плохо для концентрации рынка и открытости», как сообщает WSJ.