4 июля, 07:00
Олимпиада в Париже продолжает поставлять необычные новости. Новая инициатива вокруг Игр в Париже — комментарий от нейросети. Крупнейшая американская телекомпания NBC, которой принадлежат права на показ Олимпиады в Северной Америке, пошла на смелый эксперимент — часть трансляций будет сопровождаться сгенерированным нейросетью голосовым потоком.
Телеоператор разработал программу Your Daily Olympic Recap on Peacock, которая будет обладать словарным запасом в семь миллионов различных вариаций языковых выражений известного комментатора Эла Майклза, взятыми за долгие годы его работы на NBC. Сама по себе идея как минимум интересна, но не лишит ли со временем компьютер нас комментария от человека?
Если вы боялись, что со временем нейросети будут отбирать хлеб у человека, то, судя по всему, не зря. Вот еще один повод для паранойи и футурофобии — компания NBC впервые в истории телевидения будет использовать созданную искусственным интеллектом версию голоса спортивного комментатора Эла Майклза во время ключевых моментов летних Олимпийских игр в Париже. Разработанная программистами телегиганта нейросеть в качестве основы для своей работы возьмет огромный хронометраж с репортажей самого Майклза, который комментирует Игры на американскую аудиторию уже не один десяток лет. Естественно, никакого смысла повторять заготовленные фразы заранее нет, система будет стараться адаптироваться под происходящее на спортивной площадке и искать наиболее релевантные фразы Эла. Есть у нее возможность генерировать и новые словесные конструкции, и даже произносить слова, которых не было в изначальном лексиконе программы, однако тут уже могут быть заметны огрехи.
Систему обкатали на нескольких тестовых трансляциях, и эксперты остались ею довольны. Причем наибольшее впечатление она произвела на самого Майклза. «Честно говоря, это было потрясающе. Это поразительно. И немного страшно», — сказал комментатор в эфире NBC News. Можно было бы сказать, что страшно Элу из-за шанса потерять работу. Однако NBC отдельно подчеркнула: на контракте самого Майклза работа ИИ никак не скажется. Он продолжит работать в комфортном для себя режиме. Более того, за использование его голоса нейросетью компания выплатит ему повышенный гонорар. Так что как минимум в финансовом плане Эл не потеряет. Да и зритель вроде как только выиграет. Все-таки каким бы профессионалом и мэтром Майклз ни был, в 79 проводить часы напролет в эфире, как в былые годы, он уже не может.
Американец на диване получит трансляции со знакомым ему с детства голосом с утра до вечера, Майкл — прибавку к пенсии, а NBC обкатает новые технологии и получит приток аудитории. Казалось бы, выигрышная для всех история! Однако без важных вопросов не обойтись. Первый — насколько искусственный интеллект будет продвинутым? Доступные массам нейросети по типу ChatGPT одновременно и поражают воображение, и расстраивают своей ограниченностью. Избавиться от шлейфа искусственности им пока тяжело, и первая ассоциация, которая приходит на ум, — это комментарий в спортивных видеоиграх по типу FIFA или NHL. Перед каждым сезоном или раз в несколько сезонов в студии записывают порядка 300-400 тысяч реплик, казалось бы, на все возможные сценарии происходящего на поле. По крайней мере сами комментаторы называют работу над озвучкой спортивных симуляторов адской.
«Я просто охренел. Мне казалось, что я останусь без голоса, без сил, без семьи, без возможности ходить, говорить. Ну это было реально очень сложно. Так как надо было озвучить всю базовую программу, там было часов 50, наверное. Тебе могли засчитать сессию, только если ты сидишь 6-8 часов. Ну, это было несколько дней настоящего ада. Бывало, что ты повторяешь одну и ту же фразу раз семь-восемь. Потому что фраза одна и та же, а в конце: «Манчестер Сити», «Манчестер Юнайтед», «Ливерпуль», «Ньюкасл». Это раздражало: 10 английских команд, 10 испанских. Италия, Франция. Начинаешь бросаться в телевизор», — вспоминал свой опыт озвучки Константин Генич. Однако даже такой основательный подход не помог EA Sports создать настоящий аналог живого комментария. На десятый час игры ты понимаешь, что реплики повторяются, звучат невпопад и выпадают из контекста.
Слышать избитые клише в духе «надо бить и забивать» и «как он с метра не попал» в десятый раз, причем в не подходящих фразам игровых обстоятельствах игрокам порядком надоело, поэтому многие «фиферы» выбирают интершум. Однако допустим даже, что спецы NBC смогут создать по-настоящему интерактивный продукт, который будет адаптироваться к живой картинке не хуже человека. В целом такое возможно, все-таки в голливудском кино уже не первый год «оживляют» умерших актеров через нейросети. И так качественно, что среднестатистический зритель и не заметит подмены. Но тут мы сталкиваемся с другой проблемой. Насколько это вообще этично? Майклз продал NBC права на свой голос сразу на 50 лет — так что в теории никто не запретит телекомпании использовать его и после смерти Эла. Вот тут уже действительно становится страшно.
В России инициатива NBC также вызвала немалый интерес. Комментаторы в Сети уже пишут, что мечтают посмотреть Игры в Париже под комментарий Николая Озерова, Владимира Маслаченко, Нины Ереминой, Анны Дмитриевой, Юрия Розанова и Василия Уткина. С одной стороны, будет и правда здорово. Но с другой, не заменяем ли мы таким образом человека машиной? Не оскорбляем ли память этих людей и их наследие? И в конце концов, останется ли в мире нейросетей место для живых эмоций реальных журналистов? Сейчас мы не только о своей профессии беспокоимся, но и о конечном продукте для потребителей. Ведь чему никогда и никак не научить искусственный интеллект — это мыслить нешаблонно и спонтанно выдавать в эфире фразы, которые тут же попадают в народный фольклор.