Новости бизнесаСтатьиАналитические колонкиДеньгиКурс валютБизнес технологии
Главная > Новости бизнеса > Hi-Tech > В рунете запущена новая интеллектуальная поисковая система

В рунете запущена новая интеллектуальная поисковая система

Вторник, 12 апреля 2005 г.

Следите за нами в ВКонтакте, Facebook'e и Twitter'e

Интеллектуальная поисковая система Nigma.ru, результат работы студентов и аспирантов факультетов ВМиК и психологии МГУ им.М. В. Ломоносова, официально запущена в статусе альфа-версии.

Членами команды разработаны оригинальные алгоритмы ранжирования результатов, полученных от набора поисковых систем, с поддержкой русской морфологии и двухуровневой кластеризации. Морфология реализована через отсылку в поисковые системы дублирующих запросов, в которых приведены распространенные морфологические формы запрашиваемых слов. При этом, в отличие от имеющихся реализаций русской морфологии для поисковых систем, предлагаемый алгоритм не сокращает, а увеличивает количество найденных документов, т.к. морфологически измененный запрос объединяется с исходным. Релевантность также увеличивается, т.к. используются специальные алгоритмы объединения результатов. Позиция найденной ссылки в результатах поиска отображается в виде "Поисковая система: позиция" (например, Google: 5 означает, что ссылка находится на пятом месте в поисковой системе Google), а ссылки от морфологически измененных запросов - в виде "Поисковая система-M: позиция" (например, Google-M: 10 - десятая ссылка в морфологически измененном запросе).

Результаты поиска объединяются с помощью специального алгоритма, причем только те результаты, которые Nigma.ru успевает получить от поисковых систем за 1,5 секунды (в очень редких случаях - за 5 секунд). Соответственно, алгоритм не выделяет какие-то поисковые системы таким образом, что результаты поиска от них имеют большую значимость, чем от других, т.к. нет гарантии, что за это время система успеет обработать эти результаты. Вместо этого для их объединения используется статистическая информация о русскоязычном интернете, такая как посещаемость (на базе публичных счетчиков) и цитируемость сайтов. Кроме того, учитываются другие специфичные для рунета и русского языка особенности при объединении результатов.

В итоге, по утверждению разработчиков, на подавляющее большинство поисковых запросов Nigma.ru выдает на порядок больше найденных сайтов, чем, например, при простом поиске на сайте Google.ru. Для того чтобы пользователь не запутался в этих результатах, они группируются в так называемые кластеры. Каждый кластер - это группа сайтов, относящихся, по "мнению" поисковой системы, к общей тематике. Разработчики решили использовать частотную кластеризацию по ключевым словам, поэтому названия кластеров - это тоже ключевые слова, которые пользователь может применять для расширения своего запроса. В свою очередь, т.к. количество найденных кластеров также часто очень велико, интеллектуальный алгоритм объединяет кластеры в иерархию (пока - двухуровневую), которая позволяет представить их в более компактном виде. Например, введя очень общий запрос "новости", на который поисковая система Nigma.ru выдает порядка полумиллиарда документов, в левой колонке можно увидеть самые популярные темы новостей, которые встречаются в интернете. Нажав на тему (например, "спорт"), вы получите примеры новостных ресурсов, которые освещают эту тему. Если Вы хотите получить больше ресурсов о новостях спорта, нужно нажать на "Расширить запрос" - тогда система выдаст более двух миллионов ссылок о новостях спорта. Они, в свою очередь, тоже отклассифицированы по темам - футбол, хоккей и т.п.

Участники исследовательской группы планируют продолжить разработку кластеризующих алгоритмов. В ближайшее время поисковая система будет расширена экспертными системами, психологическими тестами, системами поведенческого анализа и другими методами, базирующимися на таких алгоритмах искусственного интеллекта как искусственные нейронные сети, генетические алгоритмы, алгоритмы нечеткой логики и т.п. После того как будет создана стабильная версия кода, планируется опубликовать его исходные тексты.

Следите за нами в ВКонтакте, Facebook'e и Twitter'e


Просмотров: 670
Рубрика: Hi-Tech
(CY)

Архив новостей / Экспорт новостей

Ещё новости по теме:

18: 41
В Galaxy S8 не будет двойной камеры |
18: 41
Представлены спецификации Bluetooth 5 |
18: 41
Французский видеосервис Molotov привлёк $22 млн от Михаила Фридмана и других инвесторов |
18: 41
Huawei приобрела израильскую компанию Toga Networks |
18: 41
Google назвала самые взрывные видео 2016 года на YouTube |
18: 21
Какие СМС-поздравления на iPhone сами превращаются в открытку |
18: 01
Bluetooth 5 с повышенной в четверо дальнобойностью появится на рынке в ближайшие полгода |
18: 01
Роскомнадзор назвал конструктивной встречу с представителями LinkedIn |
18: 01
«Вопрос с "живостью" трафика стоит довольно остро»: почему programmatic-компании должны проверять качество аудитории |
17: 41
Облако Mail.Ru для iOS и Android переориентировалось на фото и видео |
17: 41
Nintendo Switch показали на шоу Джимми Фэллона |
17: 41
Дом, который всегда с тобой: конструктор жилья из Китая |
17: 41
«Командир всегда обязан продумать худший вариант» — Автор книги «45 татуировок продавана» Максим Батырев о том, почему нужно прорабатывать плохой сценарий |
17: 21
Rockstar Games выпустила Bully для Android и iOS |
17: 01
Из-за тщательного тестирования выпуск безрамочного смартфона Samsung Galaxy S8 могут перенести на апрель 2016 |
17: 01
В Туве найден четвертый обломок космического аппарата «Прогресс» |
16: 41
Samsung представила глянцевый Galaxy S7 Black Pearl |
16: 41
Отхожие места оцелотов: социальная сеть животного мира |
15: 41
Компания Idemitsu Kosan расширит производство материалов для OLED в Южной Корее |
15: 21
Apple выпустила седьмую бета-версию iOS 10.2 для разработчиков |
15: 21
В Питере открылись бесплатные курсы SWIFT от Apple |
15: 21
Проблемы с графикой MacBook Pro исправили в macOS Sierra 10.12.2 |
15: 01
Haven -- система управления Docker |
15: 01
Опубликованы примеры снимков, сделанных объективом Meyer-Optik-Gorlitz 0,95/50 Nocturnus II |
14: 41
Сооснователь Maps.me Юрий Мельничек выпустил приложение для обработки фона фотографий с помощью нейросетей |
13: 21
Объем жестких дисков HGST Ultrastar He12 — 12 и 14 ТБ |
13: 21
Сингапурский предприниматель потратил $500 тысяч на отдых сотрудников на Мальдивах |
13: 01
Нейросеть делает 3D-маску по единственной фотографии |
12: 41
Представлены высокопроизводительные твердотельные накопители HGST Ultrastar SN200 NVMe и Ultrastar SS200 SAS |
12: 21
Final Fantasy XV очень плохо продается в Японии |
12: 21
Sony возвращает к жизни Wild Arms и Arc the Lad |
Новости бизнесаСтатьиАналитические колонкиДеньгиКурс валютБизнес технологии
Rating@Mail.ru
Условия размещения рекламы

Наша редакция

Обратная связь

RosInvest.Com не несет ответственности за опубликованные материалы и комментарии пользователей. Возрастной цензор 16+.

Ответственность за высказанные, размещённую информацию и оценки, в рамках проекта RosInvest.Com, лежит полностью на лицах опубликовавших эти материалы. Использование материалов, допускается со ссылкой на сайт RosInvest.Com.

Skype: rosinvest.com (Русский, English, Zhōng wén).

Архивы новостей за: 2016, 2015, 2014, 2013, 2012, 2011, 2010, 2009, 2008, 2007, 2006, 2005, 2004, 2003