Google навчився розмовляти людським голосом. Google розробила надсучасний синтезатор мови нового покоління - Tacotron 2.

Технологію, імовірніше, одразу почнуть використовувати в продуктах компанії, передає Ukr.Media

Система перетворення тексту в голосове мовлення справляється із завданнями значно якісніше за попередників - Tacotron і WaveNet. Останні мали ряд недоліків: WaveNet видавала дуже різкі звуки, а Tacotron краще справлявся з інтонаціями, але не міг продукувати якісний "мовний продукт".

Tacotron 2 працює завдяки 2 нейронним мережам. Друкована версія трансформується в спеціальну Tacotron-спектрограму, в якій правильно розподіляють ритм і наголоси в словах, пише nv.ua.

Аудіозапис дійсно нагадує мову живої людини, а не машини. Темп, інтонація і наголоси звучать переконливо. Основні запинки відбуваються на словах з нетрадиційною вимовою.

У коментарях окремі користувачі стверджують, що деякі слова система вимовляє досить "ламано" і неправильно. Один з основних недоліків нової системи — відсутність регулятора тону мови. Не можна передбачити, яку фразу програма проговорить піднесено, а яку - грубо.

Зразки аудіозаписів нового синтезатора мовлення Tacorton 2 можна прослухати на офіційному сайті Google.