Технологію, імовірніше, одразу почнуть використовувати в продуктах компанії, передає Ukr.Media.
Система перетворення тексту в голосове мовлення справляється із завданнями значно якісніше за попередників - Tacotron і WaveNet. Останні мали ряд недоліків: WaveNet видавала дуже різкі звуки, а Tacotron краще справлявся з інтонаціями, але не міг продукувати якісний "мовний продукт".
Tacotron 2 працює завдяки 2 нейронним мережам. Друкована версія трансформується в спеціальну Tacotron-спектрограму, в якій правильно розподіляють ритм і наголоси в словах, пише nv.ua.
Аудіозапис дійсно нагадує мову живої людини, а не машини. Темп, інтонація і наголоси звучать переконливо. Основні запинки відбуваються на словах з нетрадиційною вимовою.
У коментарях окремі користувачі стверджують, що деякі слова система вимовляє досить "ламано" і неправильно. Один з основних недоліків нової системи — відсутність регулятора тону мови. Не можна передбачити, яку фразу програма проговорить піднесено, а яку - грубо.
Зразки аудіозаписів нового синтезатора мовлення Tacorton 2 можна прослухати на офіційному сайті Google.