Новости бизнесаСтатьиАналитические колонкиДеньгиКурс валютБизнес технологии
Главная > Новости бизнеса > Hi-Tech > Патент недели: как правильно распознать формулу

Патент недели: как правильно распознать формулу

Понедельник, 28 ноября 2016 г.

Следите за нами в ВКонтакте, Facebook'e и Twitter'e

Несмотря на эволюцию систем оптического распознавания печатных документов, алгоритмы распознавания математических формул до сих пор оставляют желать лучшего. Каждый, кто сталкивался хотя бы с началами анализа, знает, какими сложными и многоуровневыми могут быть те же самые уравнения или функции. И их корректное воспроизведение в электронной версии печатного документа — проблема, над решением которой до сих пор бьются разработчики.





При непосредственном участии Федеральной службы по интеллектуальной собственности («Роспатента») мы ввели на сайте рубрику «Патент недели». Еженедельно в России патентуются десятки интересных изобретений и усовершенствований — почему бы не рассказывать о них в числе первых.

Патент: RU 2596600

Патентообладатель: «Аби Девелопмент»

Авторы: Дмитрий Исупов, Антон Масалович

Сегодняшние программы оптического распознавания (OCR), которые используются даже на бытовом уровне — с ними работал каждый, у кого дома есть компьютер и сканер, за несколько лет достигли невероятного прогресса. С их помощью можно автоматически преобразовывать в электронные редактируемые документы изображения сложных документов с картинками, рамками, линиями и другими нетекстовыми элементами, распознавать текстовые символы практически любого из существующих языков.

Но если с буквами программисты практически справились, с цифрами и формулами в математических выражениях до недавнего времени они справиться не могли. Это означало, что, например, экономическое прогнозирование, научная и исследовательская литература, в том числе патентная документация с описаниями изобретений, требовали много времени на сравнение печатной и электронной версии, сверку и корректуру документов.

Американские программисты, которые ранее подступались к решению данной проблемы, предлагали алгоритм распознавания математических формул с помощью системы оценочных баллов. С помощью баллов отображалась вероятность принадлежности к тексту или к математическому выражению для каждого из слов в распознанном документе. Элементы математического выражения проверялись на факт того, являются ли они символами на базовой линии, надстрочными символами (степень) или подстрочными символами.

Решение их российских коллег, изложенное в патенте 2596600, основано на принципиально ином алгоритме. Математическое выражение при его распознавании делится на блоки, каждый из которых распознается отдельно, а затем составляется в единую формулу. К изображению или фрагменту изображения, содержащему математическое выражение, попеременно и рекурсивно применяют горизонтальное и вертикальное разбиение до тех пор, пока полученные при разбиении блоки низшего уровня не будут соответствовать символам, распознаваемым способами распознавания символов. Анализ распознанных символов в виде графа обеспечивает основу для преобразования эквивалентного представления математического выражения, содержащегося на изображении или фрагменте изображения, в цифровую форму. Это позволяет выбрать наиболее оптимальный и точный вид компоновки результатов распознавания, который учитывает варианты распознавания каждого из символов.

Следите за нами в ВКонтакте, Facebook'e и Twitter'e


Просмотров: 171
Рубрика: Hi-Tech
(CY)

Архив новостей / Экспорт новостей

Ещё новости по теме:

07: 00
Анонсирован непривязанный джейлбрейк для iOS 10.3 |
16: 20
Rust 1.16 |
16: 00
В Китае нашли "мухоморы" мелового периода |
16: 00
Российский Uber начал показывать цвет машины |
15: 40
Пользователи домашнего помощника Google Home пожаловались на аудиорекламу |
15: 40
Появились первые изображения 3D-карты AMD Radeon RX Vega |
15: 40
Внутреннее соединение Infinity Fabric в процессоре AMD Ryzen работает на частоте памяти |
15: 00
Как упорство позволило совместить увлечение всей жизни с программированием — Разработчик Игорь Гриценко о создании просмотрщика файлов в формате Sketch |
14: 40
«Одноклассники» сделают просмотр видео платным |
14: 40
10 самых крутых автомобилей из фильма "Безумный Макс: Дорога ярости" |
14: 40
Американцы показали секретные ядерные испытания |
14: 40
Учёные научились находить клетки, где прячется ВИЧ |
14: 20
Выключите уже эту вспышку! |
14: 20
Зацените новейший iPhone в ретро-стиле |
14: 20
Samsung Galaxy S8 с 6 ГБ ОЗУ выйдет только в Китае |
14: 20
Samsung Galaxy Note 5 начал обновляться до Android 7.0 Nougat |
14: 20
Приснится же |
14: 20
Артемий Лебедев создал дизайн кроссовок для конкурса Nike |
14: 00
Mail.Ru Group договорилась с «дочкой» Alibaba о совместном распространении мобильных игр |
13: 40
Разнообразие игровых слотов в онлайне |
13: 40
Денежные ставки в интернете |
13: 40
Лучшие слоты от проверенных создателей |
13: 40
Евросеть разваливается |
13: 40
Это обзор отвёртки Xiaomi WOWStick 1FS. Отвертка. От Xiaomi. |
13: 00
Blizzard хочет оштрафовать разработчика читов на $8,5 млн |
13: 00
ФРИИ проинвестирует 15 млн рублей в сервис по поиску нянь KidsWay |
12: 40
Sony прекращает производство консоли PS3 |
12: 40
Новая модель камеры Samsung Gear 360 появилась в базе данных FCC |
12: 40
Apple подняла цены на музыку в iTunes в России |
12: 40
ColorWare создала винтажный iPhone 7 Plus Retro Edition за 1899 долларов |
12: 40
Apple построит два дополнительных центра исследований и разработок в Китае |
Новости бизнесаСтатьиАналитические колонкиДеньгиКурс валютБизнес технологии
Rating@Mail.ru
Условия размещения рекламы

Наша редакция

Обратная связь

RosInvest.Com не несет ответственности за опубликованные материалы и комментарии пользователей. Возрастной цензор 16+.

Ответственность за высказанные, размещённую информацию и оценки, в рамках проекта RosInvest.Com, лежит полностью на лицах опубликовавших эти материалы. Использование материалов, допускается со ссылкой на сайт RosInvest.Com.

Skype: rosinvest.com (Русский, English, Zhōng wén).

Архивы новостей за: 2016, 2015, 2014, 2013, 2012, 2011, 2010, 2009, 2008, 2007, 2006, 2005, 2004, 2003