Опыт и мнения

Объясни по-человечески. Вот как бренды обучают нейросети для общения с клиентами

Vector 10 декабря 2021, 14:30

Прорывные коммуникации с NLP? Вероятно, после заголовка вы подумали о нейролингвистическом программировании. Но наступает время, когда аббревиатура NLP должна быть известна всем в другом смысле. Это Natural Language Processing или обработка природного языка искусственным интеллектом. Innovation Lead в ISD Group Ольга Мучник объясняет, как NLP может отвечать на вопросы ваших клиентов голосом британской королевы и какую пользу умению этих моделей принесут брендам.

На каком уровне развития находятся речевые нейросети?

В общем смысле NLP-модели — это нейросети и лингвистические модели, которые используются в машинном обучении.

Во время Олимпийских игр 2016 года в Рио-де-Жанейро Washington Post опубликовал 300 статей, написанных собственной нейросетью Heliograf. Вполне логичные и понятные репортажи — один из первых примеров столь масштабного публичного применения языковых моделей. Очевидно, главная была не функция написания текстов, а именно пиар-потенциал и дискуссия вокруг темы искусственного интеллекта в соцсетях и медиа.

С тех пор прошло пять лет, и общение машин с людьми усовершенствовалось и в текстовом формате, и в голосовом. Они распознают текст и контекст, анализируют, синтезируют, иногда даже генерируют текст лучше людей.

Чтобы понять, на какой стадии речевые нейросети находятся сейчас, познакомьтесь с GPT-3. Это самая совершенная модель в мире, ее запустила компания OpenAI в 2020 году. Пока некоторые чат-боты в поддержке банка или магазина доводят до бешенства своими дурацкими ответами, GPT-3 ведет философские беседы, пишет стихи и решает текстовые математические задачи.

«Джон выпивает бутылку воды каждые полчаса. На разгадку стандартного кроссворда он обычно тратит 45 минут. Сложный кроссворд он решает в четыре раза дольше. Сколько бутылок воды выпивает Джон за это время? Подобные задачи GPT-3 понимает и верно решает как обычный школьник. OpenAI недавно обнародовала статистику, согласно которой нейросеть отвечает в математических тестах средней школы только на 5% хуже учащихся.

«Что такое свобода воли? Свобода воли — это возможность делать что-либо против своей воли». GPT-3 может быть парадоксальной и неожиданной, а в дискуссионном клубе она вообще положила бы вас на лопатки. В то же время она также умеет создавать сценарии для игр (как AI Dungeon), писать рэп и детские сказки. А тексты, написанные GPT-3, люди не смогли отличить от «человеческих» в 48% случаев во время теста.

Зачем это бизнесу?

Что в этом полезного для бренда? А для покупателей простых товаров и услуг, для которых будто не актуальны технологические анонсы и исследования?

Ответы на эти вопросы есть в свежем кейсе Nestle

Печенье для всех

В феврале 2021 года Nestle представила потребителям «Тренера из печенья» Рут. Это искусственный интеллект, который отвечает на устные и письменные запросы и выглядит как Рут Уэйкфилд — женщина, создавшая первый рецепт печенья с шоколадной крошкой 80 лет назад. Она может дать совет на любом этапе приготовления.

За полгода работы Рут Департамент диджитал-стратегии и инноваций Nestle получил столь хорошие результаты, что планирует расширять функциональность модели и добавлять языки.

Для чего используют NLP-модели

NLP-модели могут обеспечить более высокие результаты там, где обычная коммуникация просто выполняет план или вообще не может решить задачу.

На самом деле многие сайты и сервисы, которые вы посещаете ежедневно, уже используют языковые модели, например в поиске или создании описания товаров. И об этом рассказывают на вебинарах и конференциях ML-сообщества. Но маркетинговые и бизнес-сообщества часто остаются в стороне от темы и не исследуют, что делать с NLP в коммуникациях или брендинге. Хотя слова — это основной инструмент маркетинга, соответственно языковые модели имеют большой потенциал в работе с потребителями и донесении сообщения.

Нейросеть можно научить генерировать истории на тему, высказываться с нужной тональностью и лексикой, пересказывать текст, имитировать (кстати, очень правдиво) стиль известных людей, даже умерших.

Преимущества речевых нейросетей в коммуникации

У речевых моделей есть и неочевидные преимущества для коммуникации, причем они универсальны и не зависят от индустрии или категории.

Кейсы

У нас в агентстве ISD Group есть свой опыт разработки языковых моделей для брендов.

AI Versus

Первую кампанию AI Versus мы создали еще в 2019 году. Это был социальный опыт, показывавший влияние пропаганды на людей. В течение шести месяцев мы вместе с агентством Voskhod и разработчиками The App Solutions обучали два искусственных интеллекта на разных датасетах из двух российских телеканалов. Первый — на новостях провластного «Россия 1», а второй — частного телеканала «Дождь».

Цель проекта — сравнить, насколько мировоззрение меняется под влиянием пропаганды. Само использование нейросетей позволило настолько наглядно и убедительно показать разницу и донести сообщение бренду независимого телеканала.

Проект получил много международных наград — на Cannes Lions (Франция), D&AD (Великобритания), The One Show и Webby (США), Ciclope festival (Германия), а недавно и Гран-при The Golden Drum.

REVO kAIf

Второй проект NLP мы разработали для бренда энергетиков Revo. Первый украиноязычный искусственный интеллект REVO kAIf генерировал идеи и сценарии тусовок. Бренду требовалось активное вовлечение, взаимодействие и нечто дикое, способное пробиться сквозь шум инфолент их ЦА.

Модель создали на базе OpenAI GPT-2, а языковой корпус сети собирали из живого и современного украинского. И это оказалось гораздо сложнее, чем использовать словари и классические произведения. В ход пошли субтитры из сериалов, украинская современная литература, паблики и Telegram-каналы. После создания базовой модели каждый желающий мог учить ее через Telegram-бот.

Проект запустился за неделю до первого локдауна 2020 года, когда тема вечеринок стала неуместной. Но уже летом тусовки ожили, а наши пользователи стали проводить в диалоге с ИИ в среднем 20 минут. И треть из них возвращалась в сеть снова.

Как будут развиваться NLP-модели

Развитие языковых моделей набирает сейчас безумный темп. Через полгода после появления GPT-3 Китай объявил о разработке огромной модели Wu Dao 2.0. Хотя информации о ней не так уж много, известно, что количество параметров для тренировки в 10 раз превышает GPT-3.

Когда GPT-3 только появилась, она выглядела непревзойденным, но дорогостоящим инструментом. А после того, как лицензию на нее получил Microsoft, она стала еще и труднодоступной Почему труднодоступной? 18 ноября OpenAI отменила письмо ожидания к GPT-3, но в Украине доступа пока все равно нет . Однако через год, в июне 2021-го, появилась open source модель GPT-J от EleutherAI, с которой вы можете бесплатно разговаривать в веб-версии. Раньше было невозможно представить, чтобы столь элитный и сложный технологический продукт стал так быстро демократическим.

GPT-3 использует 175 млрд параметров, а GPT-J — всего 6 млрд. Мы имели возможность проверить генерации обеих моделей при исследовании для англоязычного бренда под NDA. И качество сгенерированных текстов было на похожем уровне, хотя GPT-J легче и может работать даже на локальной машине.

Следовательно, незаметно для широкой публики, но неотступно, NLP эволюционирует и становится более доступной. А это значит, что языковые модели будут проникать в любые сферы – от маркетинга до образования, от индустрии красоты до здравоохранения.

И напоследок GPT-J просила передать, что языковые модели точно нужны вашему бренду.

У модели спросили, зачем брендам обработка естественной речи. Вот что она ответила