В Google научили компьютер лучше говорить по-человечески
Принцип новой технологии в том, что искусственный интеллект повторяет звуки, а не сопоставляет записи слов с текстом.
Лондонская компания DeepMind, которую Google приобрел в 2014 году за 400 миллионов фунтов стерлингов, разработала новую технологию компьютерного генерирования речи, результат которой более близок к тому, как люди говорят на самом деле, информирует enovosty.com/news.

Об этом сообщает Business Insider, добавляя, что новая программа получила название WaveNet.
Ее принцип отличается от привычной для пользователей системы ТТЅ, которая предусматривает сопоставление текста с записями различных слов. Теперь компьютер учится повторять реальные звуки, а не озвучивать слова. В основе WaveNet лежит технология нейронных сетей, суть которой заключается в повторении работы человеческого мозга.
Читайте: Японские мотоциклы оснастят искусственным интеллектом
Программа анализирует, живые звуковые волны и аудио сигналы, а потом пытается их воспроизвести. Так у нее получается речь, близкая к человеческой.
«Повторение реального разговора всегда было большим вызовом для современных компьютерных систем с огромным количеством сложных разветвлений модулей. Машина все равно не повторяла в совершенстве то, как естественно люди говорят. Наши исследования показали, что только технология нейронных сетей может научиться генерировать реальную человеческую речь. Однако сократить разрыв между человеческой и машинной манерой говорить все равно удается лишь на 50%», — пояснил ученый с DeepMind Аарон ван ден Ооорд.
В это же время, разработчики сомневаются, что Google начнет использовать их продукт в ближайшее время, поскольку программа требует очень значительных ресурсов компьютера.