Ликбез: об искусственном интеллекте простым языком
Искусственный интеллект (ИИ) — хайповый термин, которым можно назвать практически все что угодно: от Скайнет из «Терминатора» до простейших ботов для игр в сапера или шахматы.Машинное обучение (Machine Learning, ML) — группа алгоритмов (программ), способных решать задачи с данными не на основе заданных правил, как классические алгоритмы, а на основе обучения, как человек. Обычно под искусственным интеллектом подразумевают именно алгоритмы машинного обучения. В профессиональной среде их принято называть «моделями». Так что нет причин завидовать айтишнику, который «всю ночь развлекался с моделью».
Нейронные сети — продвинутая группа алгоритмов ML, которая по своей архитектуре напоминает структуру человеческого мозга. Кстати, для нас, как для конечных пользователей, это различие незначительно. Иногда вау-эффект от технологий достигается и без всяких «нейронок».
Генеративные нейронные сети — нейронные сети, «заточенные» под задачу создания (генерации) контента: текста, картинок, видео, кода и так далее. Именно к этой группе относится ChatGPT, Midjourney, DALLE и прочие хайповые ML-модели. Значимой особенностью ChatGPT является ее способность воспринимать запросы, сформулированные в свободной форме, учитывать контекст разговора и отвечать «человеческим» языком.
Прелесть ML-алгоритмов в том, что они работают с данными по тому же принципу, как и человеческий мозг, но при этом быстрее обрабатывают информацию, проще масштабируются и не знают усталости.
В отличие от них, классические алгоритмы работают на основе правил: если пользователь нажал красную кнопку, покажи страницу А, зеленую — покажи страницу Б. Но что делать, если пользователь совершил неожиданное действие: вместо кнопки отправил грустный смайлик? Чтобы предусмотреть все варианты, потребовалось бы написать бесконечное количество правил. ML-алгоритмы же, как и человек, изучают правильные решения, а потом сами решают, как поступать эффективно. Нашумевшая новинка в области ML-алгоритмов — генеративные нейронные сети. Давайте разберем три ярких примера их применения.
Чат-боты
Самый очевидный и набивший оскомину пример. Чат-боты в бизнесе стали популярны примерно в 2016 году, следуя тренду, начатому голосовыми ассистентами Apple, Google и Amazon в 2011. Тогда все говорили, что это «новый интернет», и чат-боты скоро заменят всех сотрудников в продажах и клиентском сервисе.
Революции не произошло, но я уверен, что именно сейчас пришло время второго дыхания для этой истории. Дело в том, что в 2016 году чат-боты работали на основе сравнительно примитивных алгоритмов с нейронными сетями:
- Пользователь вводит сообщение.
- Бот вычисляет для него вектор — набор чисел, характеризующий смысл сообщения.
- В базе данных бота есть какое-то количество готовых ответов, и для каждого есть вектор.
- Бот сравнивает вектор сообщения пользователя и векторы готовых ответов, находит самый похожий и выдает пользователю готовый ответ.
Так можно решить только самые простые, линейные вопросы, которые редко встречаются в чате. При этом бот не пропускает пользователя к живому оператору, что часто вызывает раздражение.
С появлением генеративных сетей, в том числе ChatGPT, чат-боты могут выйти на тот уровень, который им предсказывали в 2016 году. Конечно, просто заменить локального чат-бота на ChatGPT нельзя: он не знает специфической информации, актуальных данных клиента, не держит tone of voice компании. Надо действовать хитрее.
Сейчас мы в Точке тестируем связку ChatGPT с Retrieval-моделью. Retrieval — другая «нейронка». Она по запросу пользователя вытаскивает из огромной базы знаний нужные фрагменты текста. Вот как это работает:
- Пользователь формулирует запрос.
- ChatGPT распознает суть запроса и контекст, даже, если раньше такие вопросы не задавались.
- Retrieval находит самые подходящие кусочки данных из базы знаний.
- ChatGPT отвечает пользователю на «человеческом языке», используя нужные данные от Retrieval.
Так довольный клиент получает мгновенный адекватный ответ, а бизнес экономит ресурсы поддержки.
Анализ звонков
Другой пример, который может получить новое дыхание — анализ звонков с помощью распознавания голоса и последующей работы с текстом.
Распознавание голоса — еще одно применение технологии машинного обучения. Отправляя записанный аудиофайл в модель, мы получаем текстовую транскрипцию произнесенной речи. Точность этого процесса может быть неидеальной, но достаточно высокой, чтобы использовать полученный результат.
Первый бум распознавания речи в России был с 2015 по 2021 годы. Ключевую роль в этом процессе сыграли Яндекс, Speech Analytics и ЦРТ, МТС, Тинькофф и еще много других.
Очевидное применение — распознавать звонки клиентов, чтобы оценивать сотрудников компании, находить инсайты о клиентах и классифицировать обращения.
Также как и с чат-ботами, на старте было очень много ожиданий. Теперь мы можем анализировать 100% коммуникаций с клиентами вместо 1%. Значит, 100% менеджеров будут работать на пике эффективности, а мы будем знать кратно больше информации о клиентах и принимать data-driven решения в маркетинге и продукте.
В двух разных компаниях я наблюдал за проектами, связанными с распознаванием речи. В обоих случаях внедрение технологии принесло свою пользу, но это было далеко от ожиданий. И причина вовсе не в недостаточной точности самого распознавания, а в уровне технологий для работы с большим объемом текста.
Например, мы могли легко определять операторов, которые плохо следуют скрипту, но сразу выяснилось, что 100% следование скрипту вовсе не является залогом высокой конверсии. А в Точке, например, вообще нет скриптов, и непонятно, какую пользу мы можем получить.
Или мы могли выяснить, что успешные продавцы используют в разговорах определенные фразы. Но когда мы добивались, чтобы отстающие продавцы тоже использовали эти фразы, их результаты не улучшились.
То есть продажи и качественный клиентский сервис — это области, требующие более тонкого и индивидуального подхода. Появление нового поколения генеративных нейронок, типа GPT-4 Turbo, дает нам такую возможность — разумеется, при правильном подходе.
Представим гипотетический пример. Берем ML-модель уровня GPT-4. Она умеет хорошо понимать запрос, учитывать контекст и формулировать ответы на человеческом языке. Дообучаем ее на большом объеме расшифрованных успешных звонков, чтобы показать, что такое «хорошо» в нашем понимании. Далее отправляем в нее расшифровки звонков «отстающего» менеджера. И обогащаем запрос релевантными материалами из нашей базы знаний с помощью уже знакомой Retrieval-модели. На выходе получаем персональные рекомендации для повышения эффективности менеджера на основе реальной практики. Если поставить такой процесс на регулярную основу, можно получить впечатляющие результаты.
Другой, более футуристичный вариант — с помощью похожей связки давать менеджерам подсказки для общения с клиентом в реальном времени в ходе звонка.
Третий способ — загрузить в условный ChatGPT расшифровки звонков продавцов за месяц после запуска нового продукта и попросить сформулировать 3 ключевые инсайта для его улучшения.
Генерация пользовательского контента
Еще один пример — генерация пользовательского контента. Прямое назначение генеративных нейронных сетей — создавать уникальный контент, и это можно и нужно использовать в клиентском сервисе. Но есть и подводные камни: нейросетка не просто подбирает подходящий контент, проверенный человеком, а создает его с нуля, поэтому результат раз на раз не приходится. Иногда ИИ отвечает хорошо и точно, а иногда бессовестно фантазирует. Хороший пример — история с адвокатом, который подготовился к суду с помощью ChatGPT. Поэтому применять генерацию контента можно в тех случаях, когда не нужна гарантированная точность, а клиент сам может оценить и скорректировать результат.
Например, генерация описаний товаров для маркетплейсов. Создание карточек товаров — рутинная и сложная задача для продавца. Нужно, чтобы текст был продающим, SEO-оптимизированным, но при этом не копировал описания аналогичных товаров других продавцов.
У нас в Точке есть сервис для торговли на маркетплейсах. Мы подключили к нему бота на основе ChatGPT, который сам создает описания товаров, и за счет этого сэкономили время предпринимателям — нашим клиентам.
Второй пример — генерация текста вакансии. Наем сотрудника начинается с написания объявления, и написать хороший текст — сложная и времязатратная задача. Надо составить портрет кандидата, выделить и сформулировать привлекательные для него аспекты должности, подобрать верный тон, чтобы установить доверие.
Мы в Точке недавно в пилотном режиме запустили сервис найма сотрудников для начинающих предпринимателей с функцией создания красивого текста вакансии на основе простой анкеты через ChatGPT. Это сильно упрощает вход в сервис для клиентов, создает вау-эффект, увеличивает конверсию.
Резюмируем
Мы разобрали три примера применения современных ML-алгоритмов в клиентском сервисе. Разумеется, их гораздо больше.
Мы видим, что технологии развиваются итеративно. И не всегда хайп по случаю появления новой «нейронки» — идеальный момент для внедрения. Революции, сравнимой с появлением интернета, мобильных или GPS, после появления ChatGPT все еще не случилось, а ведь ей через 2 недели год. Рекордный по скорости рост до 100 миллионов пользователей остановился на 180 млн, кратно не дотягивая до того же Google.
Поэтому моя заключительная рекомендация такая:
- Держать руку на пульсе новых технологий, чтобы не упустить момент.
- Помнить, что «внедрение нейронных сетей» — это не самоцель, а еще одно средство для решения старых проблем.