Настоящая угроза новостному бизнесу

Искусственный интеллект стал угрозой для новостного бизнеса, пишет WP. СМИ смогут вернуть себе статус ведущего поставщика достоверного контента, только если смогут создавать эксклюзивную информацию, проверять и дополнять ее, говорится в статье Джима Альбрехта, опубликованной на «ИноСМИ».

Новостная индустрия всегда ругала новые технологии, будь то радио или телевидение, интернет или генеративный искусственный интеллект. В конце концов, газеты долгое время обладали монополией на распространение информации, и с каждым нововведением эксклюзивность франшизы снижается.

Эта проблема касается и меня лично. Последние семь лет я руководил командой в компании Google, которая занималась тем, чтобы сделать веб-экосистему благоприятнее для новостных изданий. Мы создавали продукты для удешевления производства дорогостоящей публицистики (предоставляя им передовые инструменты анализа документов с использованием искусственного интеллекта), упрощения покупки пользователями подписки и предоставления издателям возможности демонстрировать редакционную точку зрения и таким образом эффективнее находить аудиторию. Благодаря этому издания всего мира получили многомиллиардную прибыль.

Но это не отменило факта обесценивания периодики интернетом. Раньше, чтобы узнать результат спортивных матчей, котировки акций, время показа фильмов, место проведения гаражных распродаж и расписание концертов, люди заглядывали в газету. Теперь всю эту информацию можно быстро найти в интернете. Если раньше у потребителей было 20 причин купить газету, то теперь осталась всего одна — новости, то есть трудоемкая и дорогостоящая работа, с которой рекламодатели не особенно рады ассоциироваться.

Чтобы противостоять такому повороту событий, новостные издания (поначалу в Европе, а затем и по всему миру) начали обращаться к регулирующим органам и законодателям с просьбой помочь восстановить былое господство или хотя бы рентабельность. И мне предстояло выяснить, как на эти требования отреагирует Google.

Издания жаловались, что веб-платформы вроде Google и Facebook* обкрадывают их, публикуя заголовки и рекламные объявления со ссылкой на их статьи. Глупый шаг, ведь универсальная истина интернета гласит: трафик нужен всем! Только посмотрите, сколько времени и денег издания тратят на размещение на этих платформах своих ссылок и контента, а потом еще и приплачивают компаниям по поисковой оптимизации и менеджерам соцсетей за популяризацию. Мы оказались в малопонятной ситуации, когда одни говорят: «Вы воруете у нас статьи», а другие требуют размещать их ссылки как можно чаще и выше в поиске.

Это не значит, что у новостных изданий вообще не было реально законных жалоб: до 2017 года Google редко давал ссылки на статьи с платным доступом, что наносило ущерб той модели подписки, на которую начинали полагаться веб-издания. Подборка новостных результатов была несовершенной: иногда сайт, подготовивший кропотливый оригинальный репортаж, размещался ниже менее авторитетного ресурса, который просто взял и быстренько переписал эту сенсационную информацию; и вообще пользователей интересовал только заголовок, а не переход по ссылке к самой статье. Google исправил первый пункт и добился устойчивого прогресса во втором, но совершенно бессилен в отношении третьего — битвы, которую дизайнеры обложек и редакторы передовиц десятилетиями вели еще до появления интернета.

В любом случае регулирующие органы в ответ предложили платформам платить изданиям за каждое размещение заголовка/подводки, а иногда и за саму ссылку. По мере распространения этих правил по миру — в Европе, Австралии, Индонезии, Бразилии, Канаде — я тратил все больше времени на подготовку к отключению новостных продуктов и поисковиков, а также созданию систем учета для фиксации «сниппетов» (фрагмент исходного текста или кода программы, применяемый в поисковых системах и текстовых редакторах. – Прим. «ИноСМИ») и расчета платежей. Соответственно, на предоставление журналистам средств исследования и копирования и на создание механизмов для удержания подписчиков времени оставалось все меньше.

Что касается Facebook*, то обмен данными с новостными изданиями падал с каждым годом. Есть известный экономический факт: когда берешь вещь с установленной рыночной ценой и продаешь дороже, то спрос падает. До принятия этих законов никто никогда не спрашивал разрешения на создание ссылки на веб-сайт и не платил за это. Наоборот: если кому-то и платили, то стороне, разместившей ссылку. Почему? Потому что трафик нужен всем! В конце концов именно поэтому реклама процветает везде — как у изданий, так и у платформ. Они предлагают рекламодателям распространение, и те им платят, потому что распространение имеет ценность и редко бывает бесплатным.

Между тем большие языковые модели (LLM) приблизились к воспроизведению задач на уровне человека. Во многих продуктах начали появляться функции на основе LLM — проверка грамматики, автозаполнение и так далее, — и это работало. Для меня наблюдать за тем, как издания препираются из-за места в поисковике, пока LLM тихо, но стремительно развиваются, — все равно что наблюдать за перепалкой из-за цветочных композиций для свадьбы под открытым небом на фоне бесшумно приближающейся большой грозовой тучи.

А затем, словно раскат грома, возник ChatGPT, и все стало на свои места. Проблема никогда не состояла в том, что платформы размещают ссылки на новостные статьи: им это положено. Проблема в том, что новые технологии создали среду, в которой им, возможно, вообще не нужно делать отсылок к новостным сайтам: они могут просто взять новость, попросить нейросеть переписать ее и опубликовать на собственной платформе.

иииии-1_ст+++ copy.jpg

И мир внезапно перевернулся для меня с ног на голову. Скоро абсурдное требование новостных изданий об оплате трафика вытеснит не менее абсурдное предложение от индустрии высоких технологий: «Как насчет того, чтобы мы создали продукт на основе вашего контента, а трафика взамен перенаправляли мало или вообще нисколько?». В долгосрочной перспективе ни одна из этих иррациональностей не выстоит. Они либо зачахнут ввиду собственной экономической абсурдности, либо попадут под прицел судов, законодателей и регулирующих структур.

Но, увидев воочию, сколь беспомощно последние выстроились в очередь за первым из этих предложений, я полагаю, что дело дойдет и до второго. Ставки максимально высоки. По одну сторону конфликта находится экзистенциальный риск для издательской индустрии, по другую — для технологических инноваций.

Сначала идут суды. В декабре газета New York Times дала первый залп, подав иск против OpenAI и Microsoft за нарушение авторских прав, начиная с использования ее документов при обучении LLM. Вполне вероятно, что первый раунд выиграют IT-компании. ИИ-продукты преобразуют текст в геометрические соотношения, которые принципиально отличаются от новостных сюжетов, откуда были взяты, и заменить оригинал этим математическим «векторам» не под силу. Иными словами, LLM, похоже, проходят проверку на добросовестное использование.

Только внедрив модель в потребительский продукт наподобие чат-бота или поисковой системы, можно увидеть потенциальное нарушение авторских прав. В конце концов, LLM может создавать вариации любого текста. Но даже несмотря на их очевидную способность заменять оригиналы, на которых обучалась модель, они все же представляют собой лишь вариации сродни рерайтингу, к которому часто прибегают разного рода издания (обратите внимание: Times в своем иске представляет доказательства того, что ChatGPT абзацами цитировал ее контент — явное нарушение авторских прав, — но это можно легко исправить, как и рерайтеров можно научить не переписывать материалы из других источников дословно). Более того, не бывает авторских прав на факты. И все же, как защитить права производителей контента?

Ответ, как мне кажется, в том, что LLM склонны выдумывать нереальное, и их обучение настолько дорого обходится, что модели обновляются не днями или неделями, а месяцами. Как указывает в иске Times, продукты с генеративным ИИ, как правило, полагаются на так называемое обоснование, в ходе которого изречения нейросети сверяют с соответствующими исходными документами, чтобы исключить выдумки. Этот процесс особенно важен, если пользователь спрашивает о недавнем событии, в котором на момент обучения LLM соответствующих фактов не существовало. В таких случаях ИИ может дать точный ответ только в том случае, если извлекает факты из свежих обосновывающих документов. Они-то и есть суть работы, которую выполняют газеты (поиск и сообщение новых фактов), и плоды этого труда должны принадлежать тем, кто его осуществляет.

Суды могут счесть, а могут и не счесть убедительным различие между обучением и обоснованием. Если не сочтут, Конгресс будет обязан вмешаться. Законодательно закрепляя защиту авторских прав на контент, используемый ИИ в целях обучения, Конгресс получает возможность создать систему авторского права, которая достигает многих конкурирующих социальных целей. Это позволит продолжать внедрение инноваций в области искусственного интеллекта посредством обучения и тестирования LLM; это потребует лицензирования контента, который ИИ-приложения используют для проверки высказываний и поиска новых фактов; а лицензионные платежи позволят финансово поддерживать и стимулировать важнейший элемент работы СМИ — поиск и проверку новой информации, — вместо того чтобы заставлять технологическую индустрию платить за переписывание уже давно известной информации.

Такое законодательство предоставит изданиям новые возможности для получения дохода. Если обучение LLM сочтут правомерным, а обоснование — нет, способность изданий проверять информацию и дополнять ее актуальными фактами станет не просто ценной, но и потенциально эксклюзивной. Небольшая местечковая медиакомпания может предпочесть лицензировать статьи и фактическую информацию для услуг генеративного ИИ, а крупная медиакомпания — предложить подписчикам собственный дифференцированный ИИ-сервис на основе OpenID или Google API, но обогащенный при этом недоступной другим поставщикам конфиденциальной информацией. Такая услуга станет для подписчиков более своевременной, всеобъемлющей и актуальной, чем собственные продукты поставщиков технологий, и позволит изданиям вернуться к тем категориям информации, в которых они последний раз эффективно конкурировали в далекую эпоху расцвета печати.

Если суд или Конгресс возьмут и действительно перепишут таким образом правила, на что будет похож мир новых СМИ? Во-первых, чтобы воспользоваться преимуществами новой структуры, медиакомпаниям необходимо понять, что ожидания потребителя вот-вот кардинально изменятся.

В эпоху печатных изданий статьи создавались, печатались на бумаге и распространялись среди читателей. Интернет изменил все, что касалось распространения и бумаги, в то время как сам контент остался нетронутым. Но в будущем изданиям придется больше думать не о статьях, а о коммуникации с пользователем. Последний будет все меньше и меньше взаимодействовать с самими статьями и вместо этого обсуждать новости с теми, кого в технологической индустрии раньше называли «интеллектуальными агентами».

Еще в 1990-х компания Microsoft представила Clippy — анимированную улыбчивую скрепку, которая хлопает глазами и прерывает вас в неподходящий момент вопросом, не нужна ли помощь. И хотя Microsoft давно положила конец ее страданиям, идею, как это часто бывает, в конце концов подхватила IT-индустрия.

Новое поколение Clippy на базе LLM будет делать все то, о чем в 1996 году Microsoft могла только мечтать: информировать вас о новостях, распорядке дня и электронных письмах; отвечать за вас и на ваши вопросы; помогать в работе. Однажды вы проснетесь и узнаете, что The Washington Post объявила о запуске нового ИИ-помощника по имени Марти. На запрос о дополнительной информации вам предложат получить его прямо сейчас на правах подписчика. Марти присоединится к беседе и расскажет о последних новостях, ответит на вопросы с помощью соответствующей инфографики, проинформирует о политических сплетнях и порекомендует новый сериал на основе ваших интересов (поскольку вы подписчик, он знает, что вам нравится). «Не поможешь найти ресторан в четверг вечером?» — спросите вы, и Марти расскажет о лучших заведениях в округе и предложит в одном из них скидку.

Конечно, в реальности все может сложиться совсем иначе в зависимости от исхода текущих споров об авторских правах и способности изданий представить будущее, совершенно непохожее на все, что они знали прежде. Но одно можно сказать наверняка: как и 30 лет назад в случае с интернетом, эти детали определят то, удастся ли новостному бизнесу вернуть себе статус ведущего поставщика достоверной информации или же он придет в окончательный, необратимый упадок.

*деятельность Meta (соцсети Facebook и Instagram) запрещена в России как экстремистская

В иллюстрации использовано изображение автора IGraphics (CCBY3.0) и изображение автора dialogue (CCBY3.0) с сайта https://thenounproject.com/ и фото с сайта https://unsplash.com/

12.02.2024

Подробнее

Азиатская турбулентность

Обвал южнокорейского фондового рынка и растущие проблемы с государственным долгом Японии могут стать источником масштабного кризиса.

27.07.2026 09:00:00

Подробнее

Пятый элемент перевозок

Южнокорейская компания Saean R&D Co., Ltd. представила новую технологию воздушно-реактивной тяги, которая может решить одну из главных проблем современных «летающих такси» — высокий уровень шума и ограниченную скорость аппаратов с открытыми воздушными винтами.

26.07.2026 13:00:00

Подробнее

Азиатская турбулентность

Подробнее

Под звездным небом Калахари

Племя охотников-собирателей жуцъоанси, живущее на северо-востоке Намибии, выработало уникальные знания в области астрономии. Однако растущее световое загрязнение в этом регионе может нарушить важную для них связь с лунным циклом.

Подробнее

Дипломатия без дипломатов

В эпоху развития технологий главным инструментом культурного влияния становятся не государственные институты, а цифровые платформы, алгоритмы и миллионы обычных пользователей, формирующих международное восприятие стран.

Подробнее

«Живая ярость»: зимой и летом одним цветом

«Живая ярость» не только стала одним из главных боевиков года, но и доказала, что зритель снова ценит реальные трюки больше компьютерной графики.