Yandex.Cloud запустил сервис для создания фирменных голосов компаний
Платформа Yandex.Cloud запустила сервис для создания фирменных голосов Yandex SpeechKit Brand Voice. Теперь компании смогут создать собственный голос для сложных диалоговых сценариев с клиентами, а также для автоматизации работы колл-центров, проведения опросов, телемаркетинга и контроля.
Yandex.Cloud запустил сервис для создания фирменных голосов компаний Анастасия Марьина
Yandex SpeechKit Brand Voice разработан на базе речевых ML-моделей, которые обучаются с использованием записей голоса реального человека, сообщили RB.ru в пресс-службе компании. В итоге с помощью искусственного интеллекта создается практически полная цифровая копия голоса.
Yandex SpeechKit Brand Voice представлен в двух версиях: Adaptive и Full. Первая версия Adaptive — это доступное и быстрое решение преимущественно для исходящих звонков. Версия Full нацелена на создание умных голосовых помощников, таких как «Алиса», способных помогать клиентам с любыми вопросами.
SpeechKit Brand Voice Adaptive
В основе версии Brand Voice Adaptive лежит синтез переменных — не имеющая аналогов в мире разработка Yandex.Cloud. Она может синтезировать цифровую копию голоса конкретного человека по заданным заранее шаблонам за несколько часов, а затем персонализировать речь: добавлять нужное обращение, данные конкретного заказа, сумму и так далее. При этом синтезированный голос звучит так же естественно, как если бы фразу произносил реальный человек.
Уникальный голос в Brand Voice Adaptive создается за 1 месяц и стоит 150 тысяч рублей в месяц. Технология лучше всего показывает себя там, где заранее определены сценарии:прием входящих звонков на первой линии или исходящие звонки клиентам.
SpeechKit Brand Voice Full
Версия Brand Voice Full — это полная цифровая копия голоса реального человека без ограничений. С помощью Brand Voice Full можно создать полноценного голосового ассистента, который сможет отвечать на любые вопросы клиентов компании. Она обучается на базе 50 часов записей реального человека, а после способна воспроизводить его голосом любой текст.
Время внедрения голоса составляет примерно 6 месяцев, а стоимость разработки модели определяется индивидуально, в зависимости от сложности задач клиента.
Подписывайтесь на наш TG-канал, чтобы быть в курсе всех новостей и событий!
Comments are closed.