Новости бизнесаСтатьиНоу ХауАналитикаДеньгиБизнес технологииКурс валют
Главная > Новости бизнеса > Hi-Tech > Патент недели: как правильно распознать формулу

Патент недели: как правильно распознать формулу

Понедельник, 28 ноября 2016 г.

Следите за нами в ВКонтакте, Facebook'e и Twitter'e

Несмотря на эволюцию систем оптического распознавания печатных документов, алгоритмы распознавания математических формул до сих пор оставляют желать лучшего. Каждый, кто сталкивался хотя бы с началами анализа, знает, какими сложными и многоуровневыми могут быть те же самые уравнения или функции. И их корректное воспроизведение в электронной версии печатного документа — проблема, над решением которой до сих пор бьются разработчики.





При непосредственном участии Федеральной службы по интеллектуальной собственности («Роспатента») мы ввели на сайте рубрику «Патент недели». Еженедельно в России патентуются десятки интересных изобретений и усовершенствований — почему бы не рассказывать о них в числе первых.

Патент: RU 2596600

Патентообладатель: «Аби Девелопмент»

Авторы: Дмитрий Исупов, Антон Масалович

Сегодняшние программы оптического распознавания (OCR), которые используются даже на бытовом уровне — с ними работал каждый, у кого дома есть компьютер и сканер, за несколько лет достигли невероятного прогресса. С их помощью можно автоматически преобразовывать в электронные редактируемые документы изображения сложных документов с картинками, рамками, линиями и другими нетекстовыми элементами, распознавать текстовые символы практически любого из существующих языков.

Но если с буквами программисты практически справились, с цифрами и формулами в математических выражениях до недавнего времени они справиться не могли. Это означало, что, например, экономическое прогнозирование, научная и исследовательская литература, в том числе патентная документация с описаниями изобретений, требовали много времени на сравнение печатной и электронной версии, сверку и корректуру документов.

Американские программисты, которые ранее подступались к решению данной проблемы, предлагали алгоритм распознавания математических формул с помощью системы оценочных баллов. С помощью баллов отображалась вероятность принадлежности к тексту или к математическому выражению для каждого из слов в распознанном документе. Элементы математического выражения проверялись на факт того, являются ли они символами на базовой линии, надстрочными символами (степень) или подстрочными символами.

Решение их российских коллег, изложенное в патенте 2596600, основано на принципиально ином алгоритме. Математическое выражение при его распознавании делится на блоки, каждый из которых распознается отдельно, а затем составляется в единую формулу. К изображению или фрагменту изображения, содержащему математическое выражение, попеременно и рекурсивно применяют горизонтальное и вертикальное разбиение до тех пор, пока полученные при разбиении блоки низшего уровня не будут соответствовать символам, распознаваемым способами распознавания символов. Анализ распознанных символов в виде графа обеспечивает основу для преобразования эквивалентного представления математического выражения, содержащегося на изображении или фрагменте изображения, в цифровую форму. Это позволяет выбрать наиболее оптимальный и точный вид компоновки результатов распознавания, который учитывает варианты распознавания каждого из символов.

Следите за нами в ВКонтакте, Facebook'e и Twitter'e


Просмотров: 234
Рубрика: Hi-Tech
(CY)

Архив новостей / Экспорт новостей

Ещё новости по теме:

18: 20
Угадайте свободную память в iPhone 8. Получите 5000 рублей |
18: 20
Признаки плохого и хорошего UX-дизайна для рядовых пользователей |
18: 20
Nest Secure — домашняя система безопасности стоимостью 500 долларов |
17: 40
Осторожно! Эта ссылка может убить ваш iPhone |
17: 40
Принять метрическую систему мер американцам помешали пираты |
17: 40
Avast: Взлом приложения CCleaner был атакой на крупные ИТ-компании |
17: 20
В браузере Opera появилась поддержка сферического VR-видео |
17: 00
LG привезла в Россию дешевого конкурента iPhone X на Android |
16: 40
Древняя гигантская лягушка могла пожирать динозавров |
16: 40
Зиявудин Магомедов с партнёрами инвестировали в Hyperloop One ещё $85 млн |
16: 20
Ford запатентовал стол с подушкой безопасности |
16: 00
Blackberry вернулась в Россию со смартфоном за 39 990 рублей |
16: 00
Уже в следующем году AMD выпустит обновлённые CPU Ryzen и GPU Vega, созданные при использовании 12-нанометрового техпроцесса |
15: 40
ЦБ оценил «дыру» в капитале «Бинбанка» в 250-350 млрд рублей |
15: 20
Selectel запустил виртуальную лабораторию для бесплатного тестирования новых серверных технологий |
15: 20
Volvo представила сервис подписки на автомобили Care by Volvo с заменой машин каждые два года |
15: 20
«Клиентоориентированность — не для всех» |
15: 00
Ура! Для Игры Престолов снимут предысторию |
15: 00
Apple признала проблему с LTE у новых Apple Watch |
14: 40
Первую автономную сеть доставки медикаментов дронами запустят в Швейцарии |
14: 20
Горячий дайджест: 5 первых приложений с поддержкой ARKit |
14: 00
Зачем Google купили часть HTC за 1,1 миллиарда долларов? |
14: 00
В watchOS 4 не отображается музыка с iPhone |
14: 00
Англоязычный проект AdMe вошёл в пятёрку самых популярных авторов видео в Facebook |
13: 40
Лучший момент для внедрения дизайн-системы в продукт |
13: 20
Tesla работает над собственным процессором для автомобилей. Возможно, в партнёрстве с AMD |
13: 00
Зак Снайдер снял короткометражку на iPhone |
13: 00
Google приобрела часть сотрудников HTC и лицензию на интеллектуальную собственность этой компании |
13: 00
Релиз процессоров Intel Cannonlake отложен до конца 2018 года |
12: 40
Цифра дня: Сколько заплатит Google за часть смартфонного подразделения HTC? |
12: 40
Baidu выделила $1,5 млрд на развитие технологий беспилотного вождения |
Новости бизнесаСтатьиНоу ХауАналитикаДеньгиБизнес технологииКурс валют
Rating@Mail.ru
Условия размещения рекламы

Наша редакция

Обратная связь

RosInvest.Com не несет ответственности за опубликованные материалы и комментарии пользователей. Возрастной цензор 16+.

Ответственность за высказанные, размещённую информацию и оценки, в рамках проекта RosInvest.Com, лежит полностью на лицах опубликовавших эти материалы. Использование материалов, допускается со ссылкой на сайт RosInvest.Com.

Skype: rosinvest.com (Русский, English, Zhōng wén).

Архивы новостей за: 2017, 2016, 2015, 2014, 2013, 2012, 2011, 2010, 2009, 2008, 2007, 2006, 2005, 2004, 2003