На наших глазах сбывается давняя мечта ленивых копирайтеров — появилась кнопка «сделать красиво». А так же «написать креативно» и «сочинить музыку для фона». И все это благодаря происходящей прямо сейчас нейросетевой революции в производстве контента, которая кардинально меняет рынок производства контента. Ветер нейросетевых перемен грозит оставить без работы десятки специалистов, которые еще вчера чувствовали себя спокойно и уверенно. Давайте попробуем разобраться с основными «фронтами» этой революции.
Инструменты и помощь в кастомизации контента
Есть несколько достаточно очевидных направлений работы нейросетей с контентом, которые можно разделить на ключевые типы: видео, аудио, текст и изображения. В потоке социальных сетей мы прежде всего видим два из них — визуальные (создание изображений и видео) и текстовые.
Самые популярные нейросети для создания визуалов — MidJourney и Stable Diffusion, но есть множество конкурентов, в том числе в России, например, Kandinsky от Сбер (Это улучшенная версия мультимодальной нейросети ruDALL-E, которая генерирует картинки по описанию на русском языке). Явным лидером среди текстовых можно назвать ChatGPT от компании OpenAI, в которую Microsoft в этом году инвестировал $10 млрд. Также недавно Microsoft анонсировал новые версии поисковика Bing и браузера Edge на основе искусственного интеллекта. Пока они работают в тестовом режиме, но в ближайшие недели станут доступны в полном объеме. В этих программах добавят возможность интерактивного поиска с помощью оптимизированной версии ChatGPT, при этом разработчики по сути переосмыслили пользовательский опыт: поиск, просмотр веб-страниц и чат объединены в единое целое, оптимизируя таким образом скорость и качество получаемых ответов.
Перечисленные выше инструменты легко использовать для создания и кастомизации любого контента. Предположим, вам нужно сделать пост о новом продукте компании для нескольких социальных сетей и пары-тройки СМИ. Вы можете написать текстовую основу, которую далее с помощью ChatGPT легко перепишете 5, 10 или 15 раз, меняя подачу, акценты и стилистику.
Или, например, у вас сеть кофеен и вы хотите объявить об акции к празднику. В Telegram вы напишете короткий пост о самой акции, а на сайте и в других источниках (Дзен, блог на vc и так далее) можете подать эту тему совершенно по-другому, используя возможности нейросетей. У ChatGPT можно запросить подборку традиционных праздничных кофейных напитков для разных стран, получить текст и использовать его в качестве врезки на сайте, а в Дзене — как основную тему материала, нативно встроив информацию об акции.
А с помощью технологий генеративно-состязательных сетей, создающих изображения по текстовым описаниям, вы получите абсолютно любое количество картинок для иллюстрации ваших текстов. При этом их создание займет не много часов, а 15–20 минут. Эти картинки с помощью добавления нескольких уточняющих слов без труда будут стилизованы под работы любого известного вам художника или фотографа.
Важно помнить, что помимо популярных, и находящихся постоянно на слуху нейросетей есть сотни других, которые контент-мейкеры могут использовать как удобный и быстрый инструмент под конкретные нужды: сделать из обычной аудиозаписи практически студийного качества звук, высокоточно сделать AI перевод, убрать фон на изображении, улучшить размер и качество изображения, создать эффектную презентацию, и решать еще огромное множество повседневных задач.
Deepfake-технология и цифровые копии
Deepfake-технология активно проникает в digital-индустрию в формате видео-контента: рекламные ролики, кино, сериалы и так далее. Бренды уже сейчас могут заполучить в свои кампании абсолютно любого персонажа, инфлюенсера, актера, ученого, подключив возможности ИИ.
Если у вас есть цифровая копия определенного персонажа, то вы можете заниматься бесконечной кастомизацией контента на разные площадки. Актера не нужно приглашать на съемки, регулярно платить гонорар и выполнять условия райдера. Достаточно подключить нейросети и команду из нескольких технических специалистов. Например, у вас есть бренд шоколада. В Тикток в течение 15 секунд про ваш продукт может рассказывать Роберт Паттинсон, во ВКонтакте Киану Ривз сделает распаковку разных вкусов, а в Одноклассниках Арнольд Шварценеггер душевно ответит на все вопросы касательно состава продукта. Таким образом вы охватите несколько площадок, подстроив контент под ЦА, цели и задачи.
Огромное пространство для творчества технология открывает в сфере образования — школьную программу по литературе может рассказать кумир школьников Влад А4, а для людей более взрослых можно «пригласить» Жана-Поля Бельмондо. Владимир Маяковский лично, и в великолепном качестве расскажет свои лучшие стихотворения, а театралы смогут насладиться новыми спектаклями Иннокентия Смоктуновского. Безусловно все это возможно только при согласии и одобрении правообладателей или наследников знаменитости.
Но судя по наметившейся тенденции среди голливудских звезд создавать раз в год свои высококачественные цифровые копии, они совсем не прочь позагорать у бассейна, пока цифровой двойник зарабатывает им деньги снимаясь в очередной рекламе премиального авто.
Увеличение скорости публикации контента и оптимизация маркетингового бюджета
Человечество еще со времен промышленной революции волнует вопрос, возможна ли полная замена специалистов машинами. Текущая нейросетевая революция вновь вывела на арену споры относительно этики, авторского права и потери рабочих мест. В каком то смысле мы наблюдаем возрождение луддитов — специалисты, находящиеся под угрозой проигрыша программным продуктам активно сопротивляются этому давлению. Прямо сейчас в США группа художников подала коллективный иск к компаниям Stability AI Ltd., Midjourney Inc. и DeviantArt Inc. за использование защищенных авторским правом изображений для обучения искусственного интеллекта. Чем закончится этот процесс мы пока не знаем, но он однозначно значительно повлияет на будущее технологии.При этом угроза исчезновения массы рабочих мест явно преувеличена. На сегодняшний день полностью делегировать работу с креативными задачами искусственному интеллекту нельзя, этот процесс невозможен без человека. Пока что речь идет об оптимизации творческого процесса, сокращении смен некоторых специалистов и контент-команд, уменьшении времени их работы. Если приглядеться, нейросети наоборот, дают специалистам новые возможности, которых у них не было еще вчера.
Возьмем в пример копирайтинг. Копирайтер, освоивший несколько нейросетей, может выполнять функции дизайнера, монтажера и даже саунд-продюсера. Если раньше над разными медиа форматами работало множество специалистов и на создание одного поста порой требовалось несколько часов или целый рабочий день, сейчас один специалист, вооружившись нейросетями, может сделать большую часть работы самостоятельно. Но human touch все еще играет роль. Поэтому какими бы качественными и исчерпывающими ни были процессы ИИ, они потребуют корректировок и более существенной персонализации (в зависимости от кейса).
Нейронные сети, как таковые, не способны на творчество в привычном понимании. То есть, технически ИИ не может ничего «придумать». Соответственно, в сферах где необходимо творчество и креатив, может использоваться как инструмент для помощи в генерации новых идей. «Живой» арт станет в будущем чем то выделяющимся, и соответственно более дорогим. Отдельной, неподвластной компьютеру сущностью является индивидуальный стиль, присущий любому хорошему художнику.
Аудио и подкасты — отдельная строка
В сентябре 2020 года портал «Рамблер» внедрил в свои подкасты технологии искусственного интеллекта и запустил «<Техно_субботу>». По выходным основного ведущего подменяет робот Валера, который при помощи text-to-speech зачитывает новости из мира технологий, рассказывает о научных прорывах, исследованиях и отраслевых прогнозах. Технология синтеза речи и ее внедрение в подкасты позволяет автоматизировать процесс производства выпусков и вывести процессы на новый уровень.
Существуют приложения и боты для озвучки. Наиболее популярным русскоязычным ботом в Telegram можно назвать Silero, позволяющий вводить текст и получать озвучку голосами разных персонажей, профессиональных дикторов и простых людей.
На данный момент процесс синтеза речи искусственным интеллектом все еще не идеален, и часто встречаются ошибки в ударениях, паузах, интонациях и произношении отдельных групп слов. Но это вопросы времени, так как технология довольно гибкая и быстро развивающаяся.
Сейчас одновременно разрабатываются и выводятся на рынок множество продуктов по генерации голоса, которые можно использовать при создании подкастов. С другой стороны, это еще и возможности для манипуляции и скандалов. Урегулирование вопросов касательно ИИ существенно отстает от стремительного развития самих технологий.
Как будет выглядеть процесс создания контента даже в не очень далеком будущем предсказать сложно. Наиболее вероятным путем станет появления универсальных специалистов, освоивших множество нейросетей и умеющих выстраивать их работу в нужную последовательность. Нужен ролик? Собираем «команду проекта». За арт-дизайн будет отвечать нейросеть Midjourney, за диалоги и сюжет — GPT-3, за саундтрек — Soundover, а за голос рассказчика — Replica. Хотим текст? Вот вам другой алгоритм. А у нас наконец то появится время выспаться.