Говорит и показывает: «Яндекс» выпустил переводящее речь в текст приложение
«Яндекс» представил 30 октября на ежегодной конференции для разработчиков технологию по распознаванию и синтезу речи. Она уже была доступна сторонним разработчикам: теперь ей могут пользоваться в мобильном приложении «Яндекс.Диктовка» обычные пользователи.
Песню группы "Пикник" "Говоит и показывает" можно послушать здесь: http://www.audiopoisk.com/track/piknik/mp3/govorit-i-pokazivaet/.
Технология называется Yandex SpeechKit и с ее помощью можно, в частности, активировать разные команды голосом, переводить речь в текст и наоборот - озвучивать тексты, причем выбирая интонацию, управлять устройством с помощью голоса.
Кроме того, в технология умеет выделять смысловые объекты ,то есть выделить в распознанном тексте стандартные понятия- например, дату, время, фамилию или адрес. Это используется, чтобы управлять устройствами простыми фразами, которые не нужно заучивать. Например, для сервиса автоматизированного заказа такси: пользователь голосом заказывает такси, технология переводит речь в текст и выделяет такие объекты как адрес и время подачи, дальше - идет оформление заказа.
Пока система распознает русский и турецкий языки, в планах - английский. Она встроена в мобильное приложение "Яндекс.Диктовка". Это только демо-версия: распознвать спонтанную речь оно не может, только тексты произвольной тематики от одного человека. Подробнее: http://www.rbc.ru/rbcfreenews/5451ea9fcbb20f340d3062c2#xtor=AL-[internal_traffic]--[top.rbc.ru]-[lenta_body]-[freenews].
Песню группы "Пикник" "Говоит и показывает" можно послушать здесь: http://www.audiopoisk.com/track/piknik/mp3/govorit-i-pokazivaet/.
Технология называется Yandex SpeechKit и с ее помощью можно, в частности, активировать разные команды голосом, переводить речь в текст и наоборот - озвучивать тексты, причем выбирая интонацию, управлять устройством с помощью голоса.
Кроме того, в технология умеет выделять смысловые объекты ,то есть выделить в распознанном тексте стандартные понятия- например, дату, время, фамилию или адрес. Это используется, чтобы управлять устройствами простыми фразами, которые не нужно заучивать. Например, для сервиса автоматизированного заказа такси: пользователь голосом заказывает такси, технология переводит речь в текст и выделяет такие объекты как адрес и время подачи, дальше - идет оформление заказа.
Пока система распознает русский и турецкий языки, в планах - английский. Она встроена в мобильное приложение "Яндекс.Диктовка". Это только демо-версия: распознвать спонтанную речь оно не может, только тексты произвольной тематики от одного человека. Подробнее: http://www.rbc.ru/rbcfreenews/5451ea9fcbb20f340d3062c2#xtor=AL-[internal_traffic]--[top.rbc.ru]-[lenta_body]-[freenews].