Новости бизнесаСтатьиНоу ХауАналитикаДеньгиБизнес технологииКурс валют
Главная > Новости бизнеса > Hi-Tech > Патент недели: как правильно распознать формулу

Патент недели: как правильно распознать формулу

Понедельник, 28 ноября 2016 г.

Следите за нами в ВКонтакте, Facebook'e и Twitter'e

Несмотря на эволюцию систем оптического распознавания печатных документов, алгоритмы распознавания математических формул до сих пор оставляют желать лучшего. Каждый, кто сталкивался хотя бы с началами анализа, знает, какими сложными и многоуровневыми могут быть те же самые уравнения или функции. И их корректное воспроизведение в электронной версии печатного документа — проблема, над решением которой до сих пор бьются разработчики.





При непосредственном участии Федеральной службы по интеллектуальной собственности («Роспатента») мы ввели на сайте рубрику «Патент недели». Еженедельно в России патентуются десятки интересных изобретений и усовершенствований — почему бы не рассказывать о них в числе первых.

Патент: RU 2596600

Патентообладатель: «Аби Девелопмент»

Авторы: Дмитрий Исупов, Антон Масалович

Сегодняшние программы оптического распознавания (OCR), которые используются даже на бытовом уровне — с ними работал каждый, у кого дома есть компьютер и сканер, за несколько лет достигли невероятного прогресса. С их помощью можно автоматически преобразовывать в электронные редактируемые документы изображения сложных документов с картинками, рамками, линиями и другими нетекстовыми элементами, распознавать текстовые символы практически любого из существующих языков.

Но если с буквами программисты практически справились, с цифрами и формулами в математических выражениях до недавнего времени они справиться не могли. Это означало, что, например, экономическое прогнозирование, научная и исследовательская литература, в том числе патентная документация с описаниями изобретений, требовали много времени на сравнение печатной и электронной версии, сверку и корректуру документов.

Американские программисты, которые ранее подступались к решению данной проблемы, предлагали алгоритм распознавания математических формул с помощью системы оценочных баллов. С помощью баллов отображалась вероятность принадлежности к тексту или к математическому выражению для каждого из слов в распознанном документе. Элементы математического выражения проверялись на факт того, являются ли они символами на базовой линии, надстрочными символами (степень) или подстрочными символами.

Решение их российских коллег, изложенное в патенте 2596600, основано на принципиально ином алгоритме. Математическое выражение при его распознавании делится на блоки, каждый из которых распознается отдельно, а затем составляется в единую формулу. К изображению или фрагменту изображения, содержащему математическое выражение, попеременно и рекурсивно применяют горизонтальное и вертикальное разбиение до тех пор, пока полученные при разбиении блоки низшего уровня не будут соответствовать символам, распознаваемым способами распознавания символов. Анализ распознанных символов в виде графа обеспечивает основу для преобразования эквивалентного представления математического выражения, содержащегося на изображении или фрагменте изображения, в цифровую форму. Это позволяет выбрать наиболее оптимальный и точный вид компоновки результатов распознавания, который учитывает варианты распознавания каждого из символов.

Следите за нами в ВКонтакте, Facebook'e и Twitter'e


Просмотров: 273
Рубрика: Hi-Tech
(CY)

Архив новостей / Экспорт новостей

Ещё новости по теме:

10: 00
Смартфон Huawei Mate 10 Pro использовали для управления автомобилем Porsche Panamera |
09: 40
Мне надоел iPhone X |
08: 20
Беспроводная зарядная станция AirPower поступит в продажу в марте |
07: 20
За полгода функция SOS в iOS 11 успела достать службу 911 |
07: 00
Apacer пополняет линейку оперативной памяти Commando новыми комплектами DDR4 |
17: 40
Четыре китайские компании поддержали стандарт Micro Four Thirds |
17: 40
Microsoft разработала VR-систему для слепых |
17: 00
На данном этапе беспилотный летательный аппарат Airbus способен продержаться в воздухе не более 10-11 минут |
16: 40
Аналитики Gartner впервые зафиксировали сокращение рынка смартфонов |
16: 40
Беспроводные наушники Apple AirPods 2 выйдут в нынешнем году и не принесут значимых новшеств |
16: 40
Как делают автомобильные шины? |
16: 00
Любители торрентов оказались под угрозой взлома |
16: 00
Студенты не замечают депрессию у соседей по общежитию |
16: 00
Volvo представила универсал V60 нового поколения |
15: 00
Видеокарты Asus Cerebrus GeForce GTX 1050 и пара GTX 1050 Ti защищены металлическими пластинами с тыльной стороны |
15: 00
Доходы трех основных поставщиков серверной памяти DRAM в прошлом квартале выросли на 14% |
14: 40
Большая часть владельцев умных акустических систем не использует и половины возможностей этих устройств |
12: 20
В OpenBSD исправлена уязвимость Meltdown. Вышло стабильное обновление микрокода Intel |
12: 00
Цифра дня: Сколько получат победители чемпионата ВКонтакте по программированию? |
12: 00
У Минобороны появились засекреченные мобильники за 115 тыс руб |
11: 40
Есть ли жизнь на Марсе: насколько близки учёные к решению этого вопроса |
10: 20
Рынок принтеров, МФУ и копиров за год сократился на 1% |
10: 20
В России за предзаказ Meizu M6s подарят Pixelphone S1 |
10: 20
По прогнозу DSCC, рынок материалов OLED у 2022 году вырастет до 2,56 млрд долларов |
09: 20
За две недели HomePod заняла 3% рынка умных колонок |
08: 20
Новая Apple TV может получить расширенные игровые возможности |
08: 20
Компания Apple решила оставить конкурентов без батарей |
07: 20
Тим Кук: «Нас интересуют продукты и люди» |
07: 00
Air Hogs Supernova имеет элементы управления движением рук |
07: 00
Splave показал пару рекордов в категориях Cinebench-R15 и Geekbench3-Multi Core |
07: 00
Озвучены характеристики и стоимость смартфонов Sony Xperia XZ2 и XZ2 Compact |
Новости бизнесаСтатьиНоу ХауАналитикаДеньгиБизнес технологииКурс валют
Rating@Mail.ru
Условия размещения рекламы

Наша редакция

Обратная связь

RosInvest.Com не несет ответственности за опубликованные материалы и комментарии пользователей. Возрастной цензор 16+.

Ответственность за высказанные, размещённую информацию и оценки, в рамках проекта RosInvest.Com, лежит полностью на лицах опубликовавших эти материалы. Использование материалов, допускается со ссылкой на сайт RosInvest.Com.

Skype: rosinvest.com (Русский, English, Zhōng wén).

Архивы новостей за: 2017, 2016, 2015, 2014, 2013, 2012, 2011, 2010, 2009, 2008, 2007, 2006, 2005, 2004, 2003