Google запускает распознавание речи в режиме офлайн
Всем известно, что Google предоставляет сервисы распознавания речи, но для этого требуется интернет-подключение для связи с искусственным интеллектом, однако скоро всё может поменяться.
Компания Google анонсировала систему офлайн распознавания речи, пока только для смартфонов Pixel. Благодаря отсутствию необходимости передавать данные, распознавание должно проходить быстрее и точнее. В своём блоге фирма сообщила, что она хочет создать новую систему распознавания, «достаточно компактную для размещения в телефоне», и работоспособную при отсутствии сети.
Клавиатура Gboard
Традиционная схема распознавания речи представляет собой разделение слов на маленькие части под названием фонемы. Затем система распознавания анализирует порядок, палитру и контекст фонем, чтобы собрать предложение. Всё это приводит к задержкам в распознавании, поскольку зачастую ПО ожидает полного произношения предложения.
Однако в блоге Google сообщила, что её новый офлайн AI использует модель «вывода символов одного за другим, по речи, с пробелами в нужных местах». Иными словами, клавиатура Gboard будет распознавать отдельные буквы при произношении слов, а не фонемы.
Сравнение распозавания речи на сервере и в офлайн режиме
Пока обновление Gboard работает лишь на смартфонах Pixel и поддерживает «Американский английский» язык. В будущем же количество поддерживаемых языков должно увеличиться.
Компания Google анонсировала систему офлайн распознавания речи, пока только для смартфонов Pixel. Благодаря отсутствию необходимости передавать данные, распознавание должно проходить быстрее и точнее. В своём блоге фирма сообщила, что она хочет создать новую систему распознавания, «достаточно компактную для размещения в телефоне», и работоспособную при отсутствии сети.
Клавиатура Gboard
Традиционная схема распознавания речи представляет собой разделение слов на маленькие части под названием фонемы. Затем система распознавания анализирует порядок, палитру и контекст фонем, чтобы собрать предложение. Всё это приводит к задержкам в распознавании, поскольку зачастую ПО ожидает полного произношения предложения.
Однако в блоге Google сообщила, что её новый офлайн AI использует модель «вывода символов одного за другим, по речи, с пробелами в нужных местах». Иными словами, клавиатура Gboard будет распознавать отдельные буквы при произношении слов, а не фонемы.
Сравнение распозавания речи на сервере и в офлайн режиме
Пока обновление Gboard работает лишь на смартфонах Pixel и поддерживает «Американский английский» язык. В будущем же количество поддерживаемых языков должно увеличиться.
Ещё новости по теме:
18:20