Россияне учат iPhone записывать SMS с голоса
В этом году на рынке появится первое приложение для трансляции русской разговорной речи в текст, сообщил CNews его разработчик «Центр речевых технологий». Первые «диктовочные» решения ориентированы на работу с SMS, чатами и соцсетями, и будут доступны для различных мобильных платформ, включая iPhone.
До конца 2011 г. на рынок выйдет первое приложение класса «диктовочный блокнот», предназначенное для преобразования надиктованной русской речи в текст. Об этом рассказал CNews директор питерского «Центра речевых технологий» Михаил Хитров. Приложение будет выпущено для нескольких мобильных платформ, включая и iOS.
Сама система для распознавания русской слитной речи «Руссограф» была создана в «Центре речевых технологий» (ЦРТ) еще в 2008 г., появление массовых решений на ее основе тормозилось необходимостью создания словаря словоформ. Как говорит рукодвитель группы в ЦРТ Алексей Рыбаков, если для создания англоязычного продукта достаточно словарной базы размером 5 тыс. словоформ, то для русскоязычного требуется 500 тыс.
Михаил Хитров добавляет, что, помимо накопления словарей, «речь шла о придании платформе большей интеллектуальности, способности правильно обрабатывать множество похожих форм слов и учитывать правила русского языка».
Сейчас в мире существуют только два математических ядра для работы со слитной русской речью, одно из которых принадлежит разработчикам ЦРТ, а другое — компании из Массачусетса Nuance Communications.
Nuance хорошо известна своими «диктовочными» продуктами из семейства Dragon, выпущенными, в том числе и для мобильных платформ. Они адресованы, главным образом, англоговорящим пользователям. «Диктовального блокнота», основанного на «русском» ядре, у Nuance пока нет.
Интерес к мобильным «распознавалкам речи» усилился, когда Google запустил голосовой поиск
Интересно, что в процессе разработки своих продуктов, и в Nuance, и в ЦРТ пришли к выводу, что наиболее простым для разработки и одновременно актуальным для рынка являются приложения, ориентированные на применение в медицине. Это обусловлено, с одной стороны, высокой стоимостью рабочего времени западного врача, а с другой — с высокой регламентацией профессиональной речи медицинского работника, что позволяет со сравнительно небольшими усилиями создавать специализированные словарные базы.
Помимо «медицинского» приложения, в ЦРТ существуют наработки для диктовки новостей: «Более того, даже внутри новостной тематики мы выделяем различные тематики: спорт, экономика, политика», - говорит Михаил Хитров.
Однако, в первую очередь, по словам руководителя ЦРТ, на рынке появится мобильное приложение разговорной тематики, востребованной у конечных пользователей, для работы с SMS, электронной почтой, чатами, сообщениями в социальных сетях и блогах.
Насколько известно CNews, сейчас осуществляется как минимум одно промышленное внедрение «диктовочного» решения ЦРТ - в медицинских учреждениях Санкт-Петербурга по заказу городского правительства. ЦРТ, подтверждая сам факт внедрения, не раскрывает по этому поводу никаких подробностей.
До конца 2011 г. на рынок выйдет первое приложение класса «диктовочный блокнот», предназначенное для преобразования надиктованной русской речи в текст. Об этом рассказал CNews директор питерского «Центра речевых технологий» Михаил Хитров. Приложение будет выпущено для нескольких мобильных платформ, включая и iOS.
Сама система для распознавания русской слитной речи «Руссограф» была создана в «Центре речевых технологий» (ЦРТ) еще в 2008 г., появление массовых решений на ее основе тормозилось необходимостью создания словаря словоформ. Как говорит рукодвитель группы в ЦРТ Алексей Рыбаков, если для создания англоязычного продукта достаточно словарной базы размером 5 тыс. словоформ, то для русскоязычного требуется 500 тыс.
Михаил Хитров добавляет, что, помимо накопления словарей, «речь шла о придании платформе большей интеллектуальности, способности правильно обрабатывать множество похожих форм слов и учитывать правила русского языка».
Сейчас в мире существуют только два математических ядра для работы со слитной русской речью, одно из которых принадлежит разработчикам ЦРТ, а другое — компании из Массачусетса Nuance Communications.
Nuance хорошо известна своими «диктовочными» продуктами из семейства Dragon, выпущенными, в том числе и для мобильных платформ. Они адресованы, главным образом, англоговорящим пользователям. «Диктовального блокнота», основанного на «русском» ядре, у Nuance пока нет.
Интерес к мобильным «распознавалкам речи» усилился, когда Google запустил голосовой поиск
Интересно, что в процессе разработки своих продуктов, и в Nuance, и в ЦРТ пришли к выводу, что наиболее простым для разработки и одновременно актуальным для рынка являются приложения, ориентированные на применение в медицине. Это обусловлено, с одной стороны, высокой стоимостью рабочего времени западного врача, а с другой — с высокой регламентацией профессиональной речи медицинского работника, что позволяет со сравнительно небольшими усилиями создавать специализированные словарные базы.
Помимо «медицинского» приложения, в ЦРТ существуют наработки для диктовки новостей: «Более того, даже внутри новостной тематики мы выделяем различные тематики: спорт, экономика, политика», - говорит Михаил Хитров.
Однако, в первую очередь, по словам руководителя ЦРТ, на рынке появится мобильное приложение разговорной тематики, востребованной у конечных пользователей, для работы с SMS, электронной почтой, чатами, сообщениями в социальных сетях и блогах.
Насколько известно CNews, сейчас осуществляется как минимум одно промышленное внедрение «диктовочного» решения ЦРТ - в медицинских учреждениях Санкт-Петербурга по заказу городского правительства. ЦРТ, подтверждая сам факт внедрения, не раскрывает по этому поводу никаких подробностей.
Ещё новости по теме:
18:20