Custom Neural Voice, часть службы Azure AI, позволяет разработчикам создавать собственные синтетические голоса. Компании могут использовать эту технологию для таких вещей, как умные помощники и устройства с голосовым управлением, чат-боты, онлайн-обучение и чтение аудиокниг или новостей.
По словам Microsoft, эта технология может обеспечить более естественное звучание голосов, чем многие другие сервисы преобразования текста в речь. Пользовательские голоса используют банк звуков для создания голосовых шрифтов. Пользовательский нейронный голос использует несколько нейронных сетей, пытаясь обеспечить точность просодии (тон и продолжительность каждой фонемы) и произношения. Это помогает ИИ правильно имитировать голос актера.
Некоторые компании уже используют эту технологию, в том числе AT&T и Warner Bros. В магазине AT&T Experience Store в Далласе люди могут взаимодействовать с Bugs Bunny. Используя комбинацию Custom Neural Voice, дополненной реальности и 5G, мультяшный кролик может общаться с покупателями в реальном времени и перемещаться по магазину, чтобы помочь им найти спрятанную золотую морковку.
Эрик Бауза, актер, который в настоящее время озвучивает Bugs Bunny записал более 2000 строк и фраз для создания голосового шрифта. Warner Bros. и Microsoft работали вместе, чтобы создать собственный голос, который отражает личность и интонации персонажа. Duolingo также использовала Custom Neural Voice для создания причудливых персонажей, помогающих людям изучать новые языки, в то время как Progressive занималась разработкой технологии для своего чат-бота Flo.
Источник: robogeek.ru