Интеллектуальная поисковая система Nigma.ru обзавелась собственным индексом
Разработчики интеллектуальной поисковой системы Nigma.ru объявили о начале работ над собственным индексом, который позволит избежать обращений к другим поисковым системам и, тем самым, существенно улучшит скорость и качество поиска Nigma.ru. Предполагается, что до конца 2005 года закончится альфа-тестирование алгоритма поиска и будет заказано необходимое оборудование, чтобы проиндексировать весь российский Интернет, т.е. более 1 миллиарда документов. В данный момент около 25 тыс. наиболее популярных сайтов проиндексировано "в глубину" (по нескольку тысяч страниц с каждого сайта) и еще 200 тыс. — для полноты поиска. Владельцы сайтов, которые не попали в индекс, могут добавить свой сайт на специальной странице. Объем проиндексированной информации в тестовой базе составляет около 220 ГБ — это примерно 145 тыс. 500-страничных книг. Протестировать поиск можно, сняв "галочки" других поисковых машин с главной страницы, оставив только "Nigma". Команда разработчиков будет рада получить комментарии и предложения по улучшению функциональности сайта. В данный момент реализован поиск запросов с учетом близости слов, а также двухстадийный алгоритм морфологического поиска (на первой стадии ведется поиск точно тех словоформ, которые задал пользователь, а вторая стадия запускается только если на первой стадии найдено слишком мало документов). В ближайшее время будет расширен синтаксис запросов для поиска фраз (соответствующие алгоритмы уже реализованы). Виктор Лавренко: "Уверен, что работа нашей команды по внедрению технологий искусственного интеллекта в информационный поиск будет полезна не только для научного сообщества, но и позволит миллионам пользователей быстрее находить нужную им информацию в миллиарде русскоязычных документов."
Ещё новости по теме:
18:20