«Лаборатория Касперского»: «графический спам» можно победить
Компания «Лаборатория Касперского» сообщает об успешном патентовании в США передовой технологии обнаружения спама в растровых изображениях.
Спамеры часто распространяют свои сообщения в виде изображений с целью затруднить детектирование. Для обнаружения такого спама требуется сначала выделить его из картинки. Чтобы усложнить детектирование ещё больше, спамеры используют прием зашумления фона изображения, используют «прыгающие» буквы и разбивают сообщение рамками и линиями.
Обычный подход к выделению текста из изображений - использование систем оптического распознавания символов (OCR). Однако они, как правило, ресурсоёмки и не обеспечивают требуемой точности детектирования. В отличие от них запатентованная технология гарантирует точное и быстрое выделение спама из изображений. Она устойчива к зашумлению и искажению, что значительно повышает уровень детектирования.
В основе технологии лежит вероятностно-статистический метод, согласно которому решение о том, содержит ли изображение текст, принимается на основании характера расположения вероятных графических образов слов и строк, а также содержания в них выявленных образов букв и слов. Автор изобретения - руководитель группы развития антиспам-технологий Лаборатории Касперского Евгений Смирнов. 27 апреля 2010 года Патентное бюро США выдало на технологию два патента №№ 7706613 и 7706614.
4 мая 2010 года был получен ещё один патент № 7711192 на усовершенствованный вариант технологии. В данном варианте оптимизировано выделение объектов, в результате чего они становятся лучше различимы, а также улучшена эффективность фильтрации обнаруженного спама.
«Машинные методы оптического распознавания требуют единообразия размеров и расположения выделяемых символов. В отличие от них наша технология работает с различными вариантами наклоненных или искаженных букв и слов, что повышает точность детектирования. Кроме того, запатентованный метод предлагает более высокую скорость обработки изображений», - говорит руководитель отдела по управлению интеллектуальной собственностью Лаборатории Касперского Надежда Кащенко.
В настоящее время патентные организации США, России, Китая и Европы рассматривают более пяти десятков патентных заявок «Лаборатории Касперского», описывающих уникальные инновационные технологии в области информационной безопасности.
Ранее редакция THG сообщала, что «Лаборатория Касперского», представив отчет по спам-активности в апреле 2010 года, отмечает, что в прошлом месяце средняя доля спама в почтовом трафике составила 83%. Меньше всего спама - 79,2% - было зафиксировано 20 апреля, а максимальное значение было отмечено двумя днями ранее, 18 числа - 89,8%.
Спамеры часто распространяют свои сообщения в виде изображений с целью затруднить детектирование. Для обнаружения такого спама требуется сначала выделить его из картинки. Чтобы усложнить детектирование ещё больше, спамеры используют прием зашумления фона изображения, используют «прыгающие» буквы и разбивают сообщение рамками и линиями.
Обычный подход к выделению текста из изображений - использование систем оптического распознавания символов (OCR). Однако они, как правило, ресурсоёмки и не обеспечивают требуемой точности детектирования. В отличие от них запатентованная технология гарантирует точное и быстрое выделение спама из изображений. Она устойчива к зашумлению и искажению, что значительно повышает уровень детектирования.
В основе технологии лежит вероятностно-статистический метод, согласно которому решение о том, содержит ли изображение текст, принимается на основании характера расположения вероятных графических образов слов и строк, а также содержания в них выявленных образов букв и слов. Автор изобретения - руководитель группы развития антиспам-технологий Лаборатории Касперского Евгений Смирнов. 27 апреля 2010 года Патентное бюро США выдало на технологию два патента №№ 7706613 и 7706614.
4 мая 2010 года был получен ещё один патент № 7711192 на усовершенствованный вариант технологии. В данном варианте оптимизировано выделение объектов, в результате чего они становятся лучше различимы, а также улучшена эффективность фильтрации обнаруженного спама.
«Машинные методы оптического распознавания требуют единообразия размеров и расположения выделяемых символов. В отличие от них наша технология работает с различными вариантами наклоненных или искаженных букв и слов, что повышает точность детектирования. Кроме того, запатентованный метод предлагает более высокую скорость обработки изображений», - говорит руководитель отдела по управлению интеллектуальной собственностью Лаборатории Касперского Надежда Кащенко.
В настоящее время патентные организации США, России, Китая и Европы рассматривают более пяти десятков патентных заявок «Лаборатории Касперского», описывающих уникальные инновационные технологии в области информационной безопасности.
Ранее редакция THG сообщала, что «Лаборатория Касперского», представив отчет по спам-активности в апреле 2010 года, отмечает, что в прошлом месяце средняя доля спама в почтовом трафике составила 83%. Меньше всего спама - 79,2% - было зафиксировано 20 апреля, а максимальное значение было отмечено двумя днями ранее, 18 числа - 89,8%.
Ещё новости по теме:
18:20