Читать книгу: «Чат-боты»

Шрифт:

Чат-боты

Что такое чат-боты

Чат-бот (или диалоговый робот) – это программа, которая имитирует человеческое общение.

Алгоритм бота может быть ориентирован как на ведение неструктурированного диалога, так и на решение поставленных клиентом задач. Большое распространение боты получили в бизнесе, как в высококонкурентной среде, где особенно важна клиентская поддержка. Аналитики KPMG поставили чат-ботов на вторую строчку среди самых популярных инструментов цифровизации у российских компаний (на первом месте – большие данные и предиктивная аналитика).

По данным исследования Tidio общая экономия от внедрения чат-ботов составляет на 2023 год около $11 млрд и может позволить компаниям уменьшить расходы на поддержку клиентов более чем на 30%. Выгоду приносят несколько принципиальных преимуществ чат-бота:

• 

многозадачность

: обрабатывает до нескольких тысяч запросов одновременно, что существенно снижает время ожидания для клиента;

• 

доступность

: под рукой у клиента ежедневно в любое время дня и ночи;

• 

надежность

: отвечает по сценарию, не может нагрубить или сорваться на клиента.

Другим важным отличием ботов является простая интеграция с внутренними информационными системами заказчика, такими как CRM-системы и базы данных, причем не только для непосредственного взаимодействия с клиентами, но и для сбора данных. Голосовой бот сделает аудиозапись разговора, автоматически переведет его в текст и при желании выделит и запомнит нужные сущности (имя клиента, возраст, адрес, номер телефона и др.). Собранные данные можно использовать для улучшения пользовательского опыта: согласно исследованию Deloitte, компании с клиентоориентированной бизнес-моделью на 60% более прибыльны, чем те компании, для которых клиенты не находятся в центре внимания. Собирая данные о посетителях, чат-бот со временем становится более персонифицированным, а компания лучше узнает свою аудиторию.

Благодаря интерактивности чат-бот чаще удерживает и возвращает клиента, что также приносит дополнительную выгоду, ведь вернувшиеся клиенты приносят на 67% больше выгоды, чем новые. Этот эффект можно усилить, если научить бота говорить на отвлеченные темы и расширить его базу знаний. Даже если посетитель после общения с ботом не заинтересуется товаром, вы ничего не потеряете – он не занимал линию и не отвлекал сотрудника. Напротив, если коммуникация ему понравится, он вернётся вновь и даже может привлечь новых потенциальных клиентов.

Цифровизация бизнес-процессов – очевидный тренд последних лет, а период карантина продемонстрировал преимущества автоматизированных и легко масштабируемых систем в кризисной ситуации. Старший директор-аналитик в отделе обслуживания и поддержки клиентов Gartner, Ума Чалла, прогнозирует, что к 2027 году чат-боты станут основным каналом обслуживания клиентов примерно четверти организаций. Чат-боты автоматизируют все необходимые процессы, а в случае резкого роста нагрузки их можно быстро адаптировать под любое количество операций и сохранить уровень сервиса. Наглядным примером здесь может служить сфера ритейла: после удачной маркетинговой кампании или запуска нового продукта нагрузка на клиентскую поддержку стремительно возрастает, и без роботизированного решения начинает страдать качество обслуживания.

Рынок чат-ботов

Рынок чат-ботов на сегодняшний день один из самых быстрорастущих – по данным Credence Research, на вторую половину 2023 года мировой спрос на чат-ботов оценивался в 4.9 миллиарда долларов, а в период с 2024 по 2032 год ожидается его рост до 37.4 миллиарда долларов. Немецкая компания Statista, специализирующаяся на изучении рынков и больших данных, прогнозирует к 2028 году увеличение общего количества устройств с виртуальными помощниками до 27 миллиардов.

Чат-боты уже применяются почти во всех сферах бизнеса, таких как транспорт, металлургия и IT. Однако лидирующие позиции занимают телеком, финансовые институты, ритейл и нефтегазовая отрасль, в которых больше половины компаний используют чат-ботов, и наиболее широко – в области продаж и поддержке. В 2023 году компания Naumen провела исследование по использованию голосовых и текстовых чат-ботов в клиентском сервисе ритейла. Было замечено, что количество организаций, использующих чат-боты и интегрировавших их с внутренними информационными системами, увеличилось до 48%. Это позволило клиентам управлять заказами, проверять количество баллов и статус карты, получать персонализированные данные прямо в диалоге и т.д.

Сфера чат-ботов имеет дело с естественным языком, из-за чего роль зарубежных ИТ-гигантов не столь высока, как в других технологических отраслях. Из-за различий в языках в работе с каждым из них нужен индивидуальный и точный подход. Кроме того, каждая страна имеет свои популярные сервисы и нишевые отрасли. Всё это открывает возможности для развития небольшим стартапам, которые могут конкурировать с IBM, Google и Amazon, превосходя их с точки зрения глубины проработки языковых и культурных особенностей. Также стартапы по природе своей более гибкие и позволяют найти решение под каждую сферу.

Мир чат-ботов переживает революцию, и в ее центре – генеративный искусственный интеллект (GenAI) и большие языковые модели (LLM), такие как GPT-4, PaLM 2, Llama 2 и другие. Аналитики McKinsey отметили, что на 2024 год уже 65% компаний используют GenAI хотя бы для одной бизнес-функции.

Согласно мнению экспертов The Boston Consulting Group, генеративный искусственный интеллект способен превратить общение с чат-ботами в нечто более полезное для потребителя, позволить бизнесу сэкономить ресурсы и увеличить количество собираемых для анализа данных.

Классификация диалоговых систем

Подходы и технологии, используемые при создании бота, зависят от типа и назначения системы. Традиционная классификация диалоговых систем опирается на 2 критерия:

• 

Ориентированность на задачу (goal-oriented) VS общее назначение.

• 

Закрытая VS открытая предметная область (домен).

Goal-oriented боты разрабатываются для решения конкретных задач ― выдачи информации по запросу, выполнения операций (проверка баланса, подключение тарифа и т.п.).

Диалоговые системы общего назначения (так называемые боты-«болталки») направлены исключительно на поддержание диалога и развлечение пользователя.

Системы с закрытым доменом выполняют задачи или ведут диалог, ограниченный узкой предметной областью, например, банковской или медицинской сферой.

Системы с открытым доменом предполагают универсальные возможности использования ― к ним относятся ассистенты типа Алексы от Amazon или Алисы от Яндекса. Большинство таких систем выполняют роль интерфейса к специализированным сервисам (например, фраза «Алиса, давай закажем билет в кино» вызывает специализированный сервис по бронированию билетов в сети кинотеатров). Открытый домен здесь – инструмент продвижения интерфейса на рынке пользователей.

Сложность разработки чат-бота возрастает по мере расширения его предметной области и генерализации назначения (или увеличения количества задач, которые он способен выполнять). На Рис. 1 приведен пример классификации некоторых чат-ботов по этим критериям.


Рис. 1. Пример классификации чат-ботов.

Для большинства бизнес-задач достаточно goal-oriented бота с ограниченной областью знаний; стремление охватить все предметные сферы и создать универсального собеседника (AI) в теории может привести к созданию «настоящего» искусственного интеллекта.

Технологии

Классическая архитектура

Рассмотрим архитектуру классического бота (Рис. 2).



Рис. 2. Архитектура классического бота.

Модуль понимания естественного языка

Модуль понимания естественного языка (Natural Language Understanding, сокращенно NLU, NLP Engine) – один из ключевых модулей любой диалоговой системы. Он обеспечивает структуризацию и «понимание» (интерпретацию) сообщений пользователя. Существует несколько способов коммуникации с ботом: предопределенные диалоговые кнопки (например, «Да» и «Нет»), ключевые слова (/start, /bye и т.д.) и общение в свободной форме с использованием произвольного текста на естественном языке. В общем случае свободу общения можно представить в виде Рис. 3.



Рис. 3. Свобода общения.

В современных системах наибольшую популярность получила свободная коммуникация в виде обмена сообщениями между клиентом и ботом. В связи с этим, основными задачами модуля NLU являются:

Классификация сообщений (Intent Classification). Она может производиться с применением как нейронных сетей (наиболее популярны архитектуры на основе рекуррентных ячеек GRU/LSTM), так и классических алгоритмов машинного обучения (наивный байесовский классификатор, логистическая регрессия), которые успешно применяются в случае небольшого количества обучающих данных. Любому сообщению пользователя должен соответствовать определенный класс (интент). Например, сообщения «привет», «хай», «добрый день» могут быть классифицированы в один класс intent_hello, а сообщения «до свидания», «пока», «удачи» – в класс intent_bye. Сообщения, класс которых с достаточной вероятностью определить не удалось, относятся к классу no_match. В общем и целом, все интенты разделяют на General intents (например, интенты приветствия и прощания) и Domain intents (например, интенты заказа конкретной пиццы или бронирования гостиницы на определенный день).

Выделение именованных сущностей (Named Entity Extraction, Named Entity Recognition, Slot Filling). Сущности представляют собой единый лексический элемент определенного типа (географическое название, имя, дата и т.п.). Так, в сообщении «Покажи расписание рейсов из Москвы в Париж 12 августа» именованными сущностями являются «Москва», «Париж» и «12 августа». Выделение сущностей может быть реализовано как на основе регулярных выражений (шаблонов, паттернов) и справочников, так и посредством NER Network – специально обученной нейронной сети с архитектурой many-to-many.

Модуль управления диалогом

Модуль управления диалогом (Dialog Management Module, сокращенно DM) – ядро чат-бота, которое управляет текущим контекстом и реализует требуемый функционал. Контекст представляет собой «память» бота обо всех (или последних) действиях и сообщениях. Не все диалоговые модули поддерживают контекст, и не всегда в нем есть необходимость. Например, в простых вопросно-ответных системах нет необходимости поддерживать контекст. В случае примитивных диалогов используют следующие типы DM: switch statement (т.е. полное отсутствие контекста, аналогично поисковым системам) или FSM (finite-state machine) – конечный автомат, представляющий собой однонаправленный диалог без сохранения полученных от клиента данных для других диалогов в рамках той же сессии. В случае goal-oriented чат-бота использование контекста обязательно, и тогда DM включает в себя:

Dialog State Tracking (DST) – компонент, отслеживающий текущее состояние (state) диалоговой машины и допустимые переходы между стейтами. Сохраняет и отслеживает все сообщения клиента и ответные действия системы, чтобы помочь компоненту Policy Learning оптимально выбрать следующий шаг.


Policy Learning (Dialog Policy, PL, DP) – компонент, определяющий дальнейшие действия бота на основе текущего состояния и контекста. Вариантами последующих действий могут быть: формирование ответного сообщения, обращение во внешнюю информационную систему за дополнительной информацией, условный переход в другой стейт (context switching) и тому подобное. Policy Learning может быть реализован на основе правил (rule based), на основе предобученной классической нейронной сети (supervised learning), которая сама определяет, что лучше делать дальше, либо с использованием подхода обучения с подкреплением (reinforcement learning). Первый вариант получил наибольшее распространение из-за простоты реализации и отсутствия необходимости обучения на большом объеме дата-сетов.

Бесплатный фрагмент закончился.

Текст, доступен аудиоформат
199 ₽
Бесплатно

Начислим +6

Покупайте книги и получайте бонусы в Литрес, Читай-городе и Буквоеде.

Участвовать в бонусной программе