«Лаборатория Касперского» запатентовала технологию против графического спама
«Лаборатория Касперского» сообщила об успешном патентовании в США передовой технологии обнаружения спама в растровых изображениях.
Спамеры часто распространяют свои сообщения в виде изображений с целью затруднить детектирование. Для обнаружения такого спама требуется сначала выделить его из картинки. Чтобы усложнить детектирование еще больше, спамеры используют прием зашумления фона изображения, используют «прыгающие» буквы и разбивают сообщение рамками и линиями.
Обычный подход к выделению текста из изображений – использование систем оптического распознавания символов (OCR). Однако они, как правило, ресурсоемки и не обеспечивают требуемой точности детектирования. В отличие от них запатентованная технология гарантирует точное и быстрое выделение спама из изображений. Она устойчива к зашумлению и искажению, что значительно повышает уровень детектирования.
В основе технологии лежит вероятностно-статистический метод, согласно которому решение о том, содержит ли изображение текст, принимается на основании характера расположения вероятных графических образов слов и строк, а также содержания в них выявленных образов букв и слов. Автор изобретения – руководитель группы развития антиспам-технологий «Лаборатории Касперского» Евгений Смирнов. 27 апреля 2010 г. Патентное бюро США выдало на технологию два патента - №7706613 и №7706614.
4 мая 2010 г. был получен еще один патент №7711192 на усовершенствованный вариант технологии. В данном варианте оптимизировано выделение объектов, в результате чего они становятся лучше различимы, а также улучшена эффективность фильтрации обнаруженного спама.
Спамеры часто распространяют свои сообщения в виде изображений с целью затруднить детектирование. Для обнаружения такого спама требуется сначала выделить его из картинки. Чтобы усложнить детектирование еще больше, спамеры используют прием зашумления фона изображения, используют «прыгающие» буквы и разбивают сообщение рамками и линиями.
Обычный подход к выделению текста из изображений – использование систем оптического распознавания символов (OCR). Однако они, как правило, ресурсоемки и не обеспечивают требуемой точности детектирования. В отличие от них запатентованная технология гарантирует точное и быстрое выделение спама из изображений. Она устойчива к зашумлению и искажению, что значительно повышает уровень детектирования.
В основе технологии лежит вероятностно-статистический метод, согласно которому решение о том, содержит ли изображение текст, принимается на основании характера расположения вероятных графических образов слов и строк, а также содержания в них выявленных образов букв и слов. Автор изобретения – руководитель группы развития антиспам-технологий «Лаборатории Касперского» Евгений Смирнов. 27 апреля 2010 г. Патентное бюро США выдало на технологию два патента - №7706613 и №7706614.
4 мая 2010 г. был получен еще один патент №7711192 на усовершенствованный вариант технологии. В данном варианте оптимизировано выделение объектов, в результате чего они становятся лучше различимы, а также улучшена эффективность фильтрации обнаруженного спама.
Ещё новости по теме:
18:20