Yandex.Cloud запустил сервис для создания фирменных голосов компаний

By rb.ru On Июл 12, 2021

Платформа Yandex.Cloud запустила сервис для создания фирменных голосов Yandex SpeechKit Brand Voice. Теперь компании смогут создать собственный голос для сложных диалоговых сценариев с клиентами, а также для автоматизации работы колл-центров, проведения опросов, телемаркетинга и контроля.

Yandex.Cloud запустил сервис для создания фирменных голосов компаний Анастасия Марьина

Yandex SpeechKit Brand Voice разработан на базе речевых ML-моделей, которые обучаются с использованием записей голоса реального человека, сообщили RB.ru в пресс-службе компании. В итоге с помощью искусственного интеллекта создается практически полная цифровая копия голоса.

Yandex SpeechKit Brand Voice представлен в двух версиях: Adaptive и Full. Первая версия Adaptive — это доступное и быстрое решение преимущественно для исходящих звонков. Версия Full нацелена на создание умных голосовых помощников, таких как «Алиса», способных помогать клиентам с любыми вопросами.

SpeechKit Brand Voice Adaptive

В основе версии Brand Voice Adaptive лежит синтез переменных — не имеющая аналогов в мире разработка Yandex.Cloud. Она может синтезировать цифровую копию голоса конкретного человека по заданным заранее шаблонам за несколько часов, а затем персонализировать речь: добавлять нужное обращение, данные конкретного заказа, сумму и так далее. При этом синтезированный голос звучит так же естественно, как если бы фразу произносил реальный человек.

Уникальный голос в Brand Voice Adaptive создается за 1 месяц и стоит 150 тысяч рублей в месяц. Технология лучше всего показывает себя там, где заранее определены сценарии:прием входящих звонков на первой линии или исходящие звонки клиентам.

SpeechKit Brand Voice Full

Версия Brand Voice Full — это полная цифровая копия голоса реального человека без ограничений. С помощью Brand Voice Full можно создать полноценного голосового ассистента, который сможет отвечать на любые вопросы клиентов компании. Она обучается на базе 50 часов записей реального человека, а после способна воспроизводить его голосом любой текст.

Время внедрения голоса составляет примерно 6 месяцев, а стоимость разработки модели определяется индивидуально, в зависимости от сложности задач клиента.

Подписывайтесь на наш TG-канал, чтобы быть в курсе всех новостей и событий!

Источник: rb.ru