В OCR-системе Tesseract 3.00 появилась поддержка русского языка

Вторник, 5 октября 2010 г.

Следите за нами в ВКонтакте, Телеграм'e и Twitter'e

1 октября была анонсирована новая стабильная версия Open Source-системы распознавания текста (OCR) — Tesseract 3.00. В ней появилась поддержка множества языков, среди которых и русский.Начало разработки OCR-системы Tesseract было положено еще в 1985—1994 годах в лабораториях HP. Сейчас приложение работает в Linux, Mac OS X и Windows, распространяется под свободной лицензией Apache License 2.0.Среди изменений в релизе Tesseract 3.00 отмечаются: проведена подготовка для обеспечения безопасности работы потоков; новый модуль анализа разметки страницы; новый вывод HOCR; использование Leptonica в качестве основного средства ввода/вывода изображений и работы с ними; отказ от поддержки VC++ 6; появление поддержки множества новых языков, таких как русский и украинский. Файлы с релизом Tesseract 3.0 доступны на code.google.com.

Следите за нами в ВКонтакте, Телеграм'e и Twitter'e


Просмотров: 503
Рубрика: Hi-Tech


Архив новостей / Экспорт новостей

Ещё новости по теме:

RosInvest.Com не несет ответственности за опубликованные материалы и комментарии пользователей. Возрастной цензор 16+.

Ответственность за высказанные, размещённую информацию и оценки, в рамках проекта RosInvest.Com, лежит полностью на лицах опубликовавших эти материалы. Использование материалов, допускается со ссылкой на сайт RosInvest.Com.

Архивы новостей за: 2018, 2017, 2016, 2015, 2014, 2013, 2012, 2011, 2010, 2009, 2008, 2007, 2006, 2005, 2004, 2003