Почему BSS считает, что всем банкам необходимо использовать голосовые технологии, но не всегда надо развивать в этой области собственные компетенции? Почему выгоднее отдать эту задачу на аутсорсинг и что банк получит вместе с промышленным решением? Об этом и других аспектах развития ИИ и голосовых технологий — в интервью с генеральным директором BSS Георгием Кравченко.
— 40% компаний не используют в своей работе искусственный интеллект и не задумываются о его внедрении. Это данные социологического исследования ВЦИОМ по использованию искусственного интеллекта и решений на его основе российским бизнесом. Как вы думаете, почему так происходит? Какие есть проблемы с распространением ИИ в РФ?
— На самом деле эти цифры означают, что 60% компаний РФ либо уже используют искусственный интеллект и решения на его основе, либо задумываются о внедрении, что не просто неплохо, а отлично. Потом, я думаю, по сравнению с остальным миром в России нет каких-то специфических ограничений в части готовности компаний использовать искусственный интеллект и машинное обучение. Эти вызовы имеют одинаковую природу и схожи во всех странах, включая и РФ.
Если не затрагивать тему готовности самой организации к использованию ИИ, главный вопрос — в какой области эти технологии могут создать для компании дополнительную стоимость. Следующий вопрос —наличие в компании данных для обучения ИИ. Обычно наличие, качество и сложность подготовки данных является серьезным сдерживающим фактором, реально ограничивающим многие варианты применения.
Третий вопрос — наличие квалифицированных специалистов, которые в состоянии обеспечить развитие этих технологий. Людей с соответствующим образованием на рынке пока немного, а экспертов с опытом успешных решений и того меньше, похоже, единицы.
И конечно, бюджет — еще один важный вопрос в этой теме, который для многих может стать ограничением. Самостоятельное внедрение ИИ подразумевает большой объем исследовательской работы, разработки, настройки, обучения и развития. Многие ли компании готовы к таким объемам инвестиций?
Сегодня мы видим, что большинство успешных примеров использования ИИ и машинного обучения реализованы крупными компаниями на базе собственных R&D-команд. Как правило, это корпорации, которые имеют доступ к огромному количеству данных, возможность найти и нанять высококлассных специалистов и все это успешно финансировать.
Тем не менее, несмотря на эти ограничения, практика применения ИИ и машинного обучения расширяется, в орбиту этих технологий вовлекаются новые компании. Решения на основе ИИ распространяются на новые отрасли. Увеличивается число успешных кейсов. Появляются стандартные кейсы применения. Растет число специалистов по искусственному интеллекту и машинному обучению.
Все это способствует распространению технологий, переходу их в разряд более доступных, интересных для широкого круга бизнесов. Развивается рынок компаний, специализирующихся на внедрении технологий ИИ и машинного обучения. Рынок активно растет. Он динамичен, изменчив и открывает все новые возможности. Уже есть промышленные решения в этой области, и во многом они предпочтительнее, чем инхаус-разработка. Я ожидаю, что доля последней будет со временем снижаться.
— Среди основных причин, ограничивающих распространение ИИ, называют отсутствие «понятных кейсов», доказывающих эффективность ИИ. Известно, что BSS активно развивает голосовые решения на основе искусственного интеллекта. У вас есть такие кейсы? Поделитесь своим опытом внедрения?
— Вариантов применения технологий множество. Есть и совсем очевидные. Например, на нашем счету внедрение нескольких голосовых помощников в компаниях и организациях разных отраслей. Вот два наиболее ярких примера. Первый — решение для автоматизации контакт-центра в БПС-Сбербанке (Республика Беларусь) — виртуальный помощник «Алеся». Она отвечает на вопросы клиентов в режиме 24/7 более чем по 20 тематикам. И зона ответственности «Алеси» расширяется.
Второй пример — МФЦ Новосибирской области, для которого мы сделали голосового помощника —цифрового интеллектуального госслужащего «Николая». Этот нейробот-консультант обрабатывает до 70% входящих звонков в контакт-центре МФЦ, что позволило в три раза сократить продолжительность стандартного звонка, а также сократить время ожидания ответа оператора. Он, кстати, стал лауреатом премии «Проектный лидер» в 2019 году.
Я не скажу, что эти решения уникальны. Похожие технологии применяются по всему миру и используются для сервисов самообслуживания или для коммуникаций с клиентами. Их привлекательность и актуальность в том, что они реально ведут к снижению издержек и увеличению удовлетворенности клиентов. И если с первым все понятно, то второе стоит пояснить. Во-первых, роботом гораздо проще обеспечить неизменно высокий уровень обслуживания в обычные и пиковые часы. Во-вторых, робот в отличие от человека никогда не теряет самообладания, не делает ошибок, не устает, не отвлекается, не болеет. Всегда устойчив к стрессам, вежлив, тактичен, приветлив, настойчив. Идеальный помощник. Тем не менее за рамками своей специализации современный голосовой ассистент не может конкурировать с живым оператором.
— Но системы ведь самообучаемые, учатся со временем. Все равно получается, что живые люди пока умнее?
— Обучаемость ИИ и делает эту технологию настолько перспективной. При этом я бы не использовал понятие «ум» в отношении искусственного интеллекта. Например, знание расписания работы офисов — это же показатель информированности, а не ума. Думаю, правильнее говорить, что живые операторы гораздо более разносторонне развиты.
ИИ знает только то, чему его обучили. Тестировать и пользоваться им нужно, учитывая это. Я с непониманием отношусь к попыткам «сломать» робота, задавая ему нелепые и неожиданные вопросы, явно выходящие за рамки его задач. Ну хорошо, выяснится, что есть вопросы, на которые робот не подготовлен отвечать. Что же тогда самому себе или живому оператору контакт-центра никто не загадывает шарады или не задает вопросы в духе клуба «Что? Где? Когда?»? Всегда найдутся вопросы, на которые и такой «тестировщик» не готов ответить.
Проверять эффективность ИИ необходимо в условиях, для которых он предназначен. Проверяйте его способность решать именно целевые задачи. Используйте для этого примеры естественной речи из реальной практики живых операторов, и тогда вы увидите, чего он действительно стоит.
ИИ в своей узкой предметной области может быть эффективнее человека. Легко «вспомнит» содержание предыдущей беседы, быстрее предоставит информацию, не ошибется в фактах, не оборвет разговор, потому что закончился рабочий день.
— Какие задачи должен решать разработчик при создании решений на основе ИИ?
— Если мы говорим о голосовом ассистенте, то первая задача, стоящая перед ним, — разобраться с тем, что хочет собеседник. Это, кстати, бывает не так просто сделать. Особенно когда собеседник находится в состоянии стресса. Более того, эта задача не заканчивается переводом сказанного голосом в текст. Для ее решения необходимо понять, о какой проблеме собеседника идет речь. Понять, какая релевантная этой проблеме информация уже была получена. Каких данных пока не хватает. При этом еще надо понимать и тематику беседы, а часто и контекст, в котором было произнесено конкретное слово.
В общем, задача непростая. Стоимость и качество ее решения зависят от используемых технологий. Например, компании, использующие общедоступные или неадаптированные модели распознавания речи, вынуждены фокусироваться и на корректировке распознанного текста, и на его последующем анализе.
Мы же используем собственные технологии распознавания речи. Адаптируем и обучаем систему на данных клиента таким образом, что она, понимая тематику конкретного обращения и учитывая контекст, распознает сказанное точнее, чем общедоступные модели. Это дает нам преимущество даже при решении задачи распознавания свободной речи, не говоря уже о преимуществе в точности классификации обращений.
— А вторая задача?
— Поддерживать диалог в автоматическом режиме. Самый простой подход — запрограммировать систему на ведение разговора по нескольким, но фиксированным сценариям. При условии, что первая задача уже решена, сделать это, на первый взгляд, несложно. Все бы так, если бы клиенты, решая свои проблемы, с удовольствием следовали вашему небольшому набору сценариев.
Но реальность, как всегда, вносит свои коррективы. Появляется потребность в реализации, для удобства пользователя, новых сценариев разговора по той же проблеме. Выявляются случаи, сценарием пока еще не предусмотренные. По мере увеличения числа тематик возникает необходимость предусматривать межтематические переходы. Короче говоря, то, что в начале пути не требует практически никаких усилий, по мере развития начинает требовать серьезных человеческих ресурсов. Я знаю компании, в которых непрерывным совершенствованием такой диалоговой системы уже несколько лет занимается более полусотни человек.
Принципиально другой подход, когда диалог конструируется автоматически системой, построенной с использованием технологии машинного обучения. Система обучается на диалогах, и, как результат, разговор с ней с самого начала может быть очень похож на общение с живым человеком. Понятно, что для построения такой технологии требуется больше усилий на начальном этапе. Однако, если вы умеете использовать уже предобученные модели, эта проблема в значительной степени сглаживается. Особенно по мере роста объема данных, с которым вы имеете дело.
— То есть система, основанная на машинном обучении, более перспективна?
— Стратегически, я считаю, будущее именно за вторым направлением. Но для этого еще многое предстоит сделать. Сегодня в своей работе мы комбинируем оба подхода.
Если их сравнивать, то к преимуществам первого нужно отнести легкий старт и возможность быстрого внесения изменений. К плюсам второго — преимущество в работе с большим числом тематик и более сложными диалогами.
Реализация второго подхода требует наличия достаточного объема данных, что, как я уже говорил, является типичным вызовом для любой системы машинного обучения.
— Как вы думаете, когда голосовые решения с использованием ИИ станут актуальны для малого и среднего бизнеса? По данным ВЦИОМ, сейчас основные потребители таких решений в РФ — крупный бизнес.
— Как я уже говорил, на стороне крупного бизнеса, как правило, есть два преимущества: наличие финансовых ресурсов и данных.
Благодаря первому у крупного бизнеса появляется искушение инвестировать во внутреннюю разработку таких решений. Однако самостоятельная разработка далеко не всегда является рациональным выбором. В большинстве отраслей, в частности в области голосовых технологий, существуют компании-лидеры, обладающие и масштабируемой технологией, и необходимой экспертизой, и развитым инструментарием. Использование готовых решений от таких компаний позволяет гарантированно достичь результата в короткие сроки. Так что сегодня наличие больших бюджетов на собственную разработку уже не является ключевым фильтром.
С наличием достаточного объема данных дело тоже обстоит совсем не безнадежно. Во всем мире задача снижения объема данных, требуемых для машинного обучения, уже давно привлекает внимание научных и прикладных исследовательских коллективов. Я, например, уже говорил, что мы достигаем высокой точности распознавания речи, дообучая систему на данных заказчика. Но я не упомянул, что объем данных, требуемых нам для этого, на два-три порядка ниже, чем объем данных, на которых обучается, например, система распознавания речи Google. Аналогичным образом объем клиентских данных, требуемых для обучения систем управления диалогом на ИИ, тоже не настолько велик, как можно было бы ожидать.
В качестве примера могу упомянуть задачу, которую мы решили для компании Rent-a-Ride — стартапа, предоставляющего в краткосрочную аренду автомобили частных владельцев.
У этой компании, несмотря на наличие удобного веб-сайта и приложения, 25% клиентов предпочитают оформлять заявки по телефону. Операторы аутсорсингового контакт-центра ошибались или передавали не всю полученную информацию сотрудникам Rent-a-Ride. Во время передачи информации клиенты ждали на линии.
Для увеличения выручки, сокращения расходов и устранения ошибок компания Rent-a-Ride внедрила нейробота BSS, способного работать с ретроспективными данными для качественного сегментирования клиентов. Цель — выделить клиентов, собирающихся сделать заказ и быстро перевести звонок на менеджера для закрытия сделки. Информация по заявке немедленно появляется в CRM, где менеджер видит все необходимые данные. Робот информирует об ограничениях по аренде, например, для таксистов, определяя их по ключевым словам и фразам («автомобиль для работы», «большой пробег» и так далее). Нейробот также генерирует поток структурированных данных по всем звонкам, постоянно улучшая эффективность аналитики.
Как результат, достигнут полуторакратный рост выручки по заявкам, полученным по телефону. Нагрузка на менеджеров снизилась более чем на 20%. Были устранены ошибки в сегментировании клиентов. Время на выявление потребности клиента и передачи заявки менеджеру сократилось до двух минут.
В целом если у вас в контакт-центре от десяти операторов и есть типовые вопросы, на которые приходится 5–10% звонков, то собственных данных уже достаточно для дообучения и настройки голосового помощника на ИИ. Если у вас всего один-два оператора, то своих данных действительно мало. Однако надо помнить, что типовые вопросы обычно схожи для всей индустрии. Так что мы неизбежно вскоре будем свидетелями появления отраслевых решений на уровне стандарта, пригодных для немедленного использования малым бизнесом.
— У BSS есть такое готовое промышленное решение, с которым вы можете предложить не только внедрение, но и контроль, поддержку, развитие?
— Мы уже предлагаем банкам простое и легкое вхождение в тему голосовых технологий и управления диалогом. У нас есть интересное предложение в части дистанционного банковского обслуживания.
Фактически мы предлагаем не что иное, как новый канал ДБО. Дело в том, что, невзирая на наличие интернет-банка, мобильного банка, чатов с банком и тому подобного, значительная доля клиентов, как ни странно, продолжает звонить в банк. Банки автоматизируют все больше функций ДБО и одновременно тратят огромные деньги на содержание и развитие контакт-центров, в которых обслуживание осуществляется в ручном режиме. Как правило, 30–40% звонков в контакт-центр касаются типовых вопросов, уже давно решенных в ДБО: какой остаток на счете, курс валют, размер задолженности, где ближайшее отделение, статус исполнения платежа и тому подобное. Так вот, все такие голосовые или текстовые запросы уже сейчас можно быстро автоматизировать с помощью нашего решения Digital2Speech.
Digital2Speech принимает звонки, понимает разговорную речь, автоматически обслуживает. Возможен вариант, при котором система будет при необходимости подключать компетентного оператора, при этом предоставляя ему уже собранные данные о запросе клиента. В общем, решение обеспечивает клиенту максимально комфортный и естественный способ общения с банком, а на стороне банка убирает ненужные затраты.
— В чем его конкурентное преимущество?
— Во-первых, голосовой банк BSS не требует интеграции с контакт-центром банка, что значительно сокращает время и бюджет внедрения. Digital2Speech — это организованный в контуре ДБО голосовой и текстовый канал. Он может обслуживать как физических, так и юридических лиц. Если банк уже использует ДБО BSS Digital2Go, то внедрение системы и запуск ее в работу займет до трех недель.
Во-вторых, Digital2Speech — это решение on-premise, а значит, соблюдаются требования информационной безопасности и закона о персональных данных, а данные о клиентском опыте — полностью под контролем банка. Для финансового сектора это чувствительный вопрос.
В-третьих, простое сопровождение. К тому же у банка есть возможность самостоятельно улучшать и развивать систему. Для этого от сотрудников банка не требуется специальных навыков в области машинного обучения и работы с данными.
В-четвертых, легкая масштабируемость. В решении используются наработанные модели общения с клиентами.
Важен и экономический эффект. Digital2Speech позволяет снижать затраты на операторов, разработчиков и инженеров. Способствует росту позитивного потребительского опыта клиентов банка. Решение может быть развернуто и как самостоятельный сервис, без платформы Digital2Go.
Основной массе банков не надо забывать, что банки-лидеры уже активно используют системы распознавания речи — и голосовых помощников, и речевую аналитику. Если игнорировать этот факт, отставание от лидеров будет увеличиваться и в будущем может стать критическим для бизнеса. Уже сейчас голосовой помощник в контакт-центре становится обязательным условием качественного банковского обслуживания. Роль и значение голосовых технологий в банках из года в год будет только расти. Например, совсем недавно Альфа-Банк объявил, что использование голосовых технологий и других элементов ИИ уже позволило нарастить продажи в контакт-центре на 9–12%.
— Примерно треть опрошенных (28%) не видят перспектив внедрения ИИ в своей отрасли. В России ИИ активно внедряется только в банках, ретейле и телекоме. Это коррелирует с вашей статистикой и опытом внедрения? Какие отрасли, по вашему мнению, перспективны?
— Да, в этих областях по определению много клиентского взаимодействия и данных о клиентах. Естественно, что мы видим первые примеры использования ИИ именно здесь. Но ИИ применяется и в других отраслях. ИИ может очень помочь, например, в медицине. Много усилий тратится на развитие экспертных систем, обученных диагностике на базе результатов тяжелых аппаратных исследований. Есть другие интересные примеры. Технологии, сходные с голосовой биометрией, могут использоваться для первичного диагностирования разнообразных респираторных или пульмонологических заболеваний. Примеры такого рода уже можно встретить и в сельском хозяйстве.
— Есть и другие данные. Опубликовано исследование MIT Sloan Management Review и BCG, в котором опрошено более 2,5 тысячи руководителей компаний в 27 отраслях по всему миру. В итоге 90% предпринимателей так или иначе инвестируют в ИИ. Глобальный рынок более оптимистичен. Как вы к этому относитесь? Какие планы в сфере ИИ у BSS?
— В отношении этой сферы у меня очень большие ожидания. Мы серьезно инвестировали в направление ИИ и на данный момент в состоянии конкурировать даже с технологическими гигантами.
При этом мы не ограничиваемся банками. Смотрим в ретейл, есть интересные проекты в других областях. Я пока не буду их называть, но планов много. Думаю, совсем скоро BSS покажет рынку новые интересные внедрения в области ИИ и голосовых технологий.
— И в заключение нашей беседы несколько слов о ситуации в мире, сложившейся в связи с пандемией. Есть здесь место для ИИ?
— Сейчас все страны переживают беспрецедентные ограничения личного передвижения и перевод на удаленную работу огромного числа людей. Оценивая вызовы, которые в связи с этим возникают, я хотел бы отметить следующее.
Во-первых, не рассматривайте применение ИИ исключительно как меру по снижению затрат или сглаживанию пиков обращений клиентов. Подумайте о пользе, которую это может принести вам в экстремальных случаях —например, в нынешней чрезвычайной ситуации.
Во-вторых, не откладывайте изменения, но не пытайтесь за один шаг достичь максимума. Начинайте с малых шагов и идите к результату последовательно. Думаю, это верно для любого дела, но особенно верно для ИИ.
В-третьих, привязка к фактическому расположению офисов все больше из преимущества превращается в обузу. Главное в бизнесе — команда и ваши уникальные технологии. Для успеха в современном мире ваш собственный ИИ должен стать частью этого главного.