Яндекс.Метрика
  • Петр Николаев

ВТБ: к 2027 году каждое третье онлайн-совещание будет расшифровываться при помощи ИИ-алгоритмов

Российскую аудиторию сервисов видеоконференцсвязи (ВКС) банк оценивает в 20 миллиона пользователей

К 2027 году каждое третье онлайн-совещание будет в режиме реального времени преобразовываться в текстовую расшифровку при помощи алгоритмов искусственного интеллекта. В режиме записи будут преобразовываться из речи в текст более 95% всех онлайн-встреч, в которых участвуют более трех человек. Такой прогноз сделали аналитики ВТБ.

Заместитель президента – председателя правления банка ВТБ Вадим Кулик отметил, что сейчас из всех онлайн-совещаний в реальном времени расшифровывается не более 1% онлайн-конференций и до 10% в записи.

«Всю аудиторию сервисов видеоконференцсвязи (ВКС) мы оцениваем в 20 миллионов пользователей в РФ. Из них регулярно функцией преобразования речи в текст пользуется порядка 1% аудитории. К 2027 году, прогнозируем мы, этот показатель вырастет до 10% всех пользователей сервисов видеоконференций. Он может вырасти и до 20% – но в случае развития не только сервисов транскрибации, но в целом сегмента цифровых ассистентов», – сказал Вадим Кулик.

Инструмент преобразования речи в текст (speech-to-text), основанный на алгоритмах искусственного интеллекта, доступен сотрудникам банка при использовании видеохостинга DION Видео, который является частью платформы унифицированных коммуникаций DION, используемой в банке с 2022 года.

Алгоритм преобразует все, что говорят участники видеовстречи, в письменные сообщения, разбитые на реплики. Для реализации этого решения были использованы модели, созданные ИТ-специалистами департамента анализа данных и моделирования банка. Эти модели постоянно совершенствуются. Например, сейчас на их основе тестируется функция саммаризации, которая позволяет пользователям получать краткое изложение прошедшей онлайн-конференции. В дальнейшем появится функция автопротоколирования, которая будет автоматически генерировать перечень поручений по итогам онлайн-встречи.

Вадим Кулик добавил, что банк сейчас активно смотрит на развитие алгоритмов генеративных моделей, их апробацию в используемых в кредитной организации сервисах. В целом направлению искусственного интеллекта уделено отдельное внимание в стратегии развития банка до 2026 года. Кроме того, банк ведет большую работу по совершенствованию внутренних сервисов, которыми пользуются сотрудники. Это также является одним из элементов стратегии.

В банке создана единая внутренняя платформа для безопасных коммуникаций, основанная на решении от российской UC-платформы DION. Одним из ключевых компонентов этой платформы является видеохостинг DION Видео, для которого была реализована интеграция инструмента speech-to-text.

Аналитики кредитной организации подсчитали, что компания со штатом в 10 тысяч человек может сэкономить до 7,5 тысячи часов в год, если вместо расшифровки онлайн-совещаний вручную будут использоваться нейросетевые алгоритмы.

Банк видит большой потенциал в использовании генеративных моделей для развития вспомогательных сервисов, таких как голосовые помощники и цифровые ассистенты. Банк планирует продолжать изучение возможностей внедрения этих моделей в свою инфраструктуру, учитывая, что сами модели будут работать все результативнее при меньшем объеме затрачиваемых ресурсов.

 DION Видео – UGC (user generated content) – платформа по работе с аудио- и видеоконтентом: позволяет создавать, хранить, редактировать файлы, а также обмениваться ими между пользователями и комментировать. DION Видео составляет часть платформы корпоративных коммуникаций DION, внедренной в банке (продукт технологического партнера банка – холдинга Т1).