«Поиск@Mail.Ru» научился отличать книги от фильмов
Компания Mail.Ru сообщила о том, что сервис «Поиск@Mail.Ru» продолжает работать над распознаванием возможных значений запросов пользователей с целью выдачи максимально подходящих результатов. Очередным шагом в этом направлении стал запуск нового алгоритма обработки названий фильмов и книг, для которых такая задача особенно актуальна.
Поисковый робот GoGo.Ru, используемый на «Поиске@Mail.Ru», умеет корректно выделять фактологические данные из проиндексированной информации. В частности, он автоматически определяет все возможные объекты, которые обычно упоминаются под названием «Война и мир», и наиболее характерные для них слова – имена авторов, актеров и т.д. Также робот анализирует поведение пользователей, которые ищут информацию по тому или иному многозначному запросу, и определяет, какое именно значение чаще всего интересует людей.
Стоит отметить, что формат подсказки также учитывает наиболее часто встречающиеся желания пользователей. Например, в случае с книгой человек практически всегда хочет получить ее текст, поэтому любая справка по произведению, помимо имени автора и краткого описания, почти всегда (когда это возможно) содержит ссылку «Читать», которая отправляет пользователя на сайт одной из электронных библиотек. Если на сайте библиотеки робот обнаружил файл с текстом, то пользователю предлагается еще и скачать книгу. В случае с фильмами людей интересуют как трейлеры и ролики, так и сюжет, имена режиссера и актерского состава, поэтому все эти данные также агрегируются роботом.
В ряде случаев пользователю предлагается уточнить запрос наиболее подходящими словами, список которых, опять-таки, формируется на основании данных о поведении людей на поисковике. В случае с фильмом это может быть имя актера, исполнившего главную роль. Кликнув на уточняющий запрос, пользователь увидит справку по необходимой ему экранизации и результаты уточненного поиска.
Поисковый робот GoGo.Ru, используемый на «Поиске@Mail.Ru», умеет корректно выделять фактологические данные из проиндексированной информации. В частности, он автоматически определяет все возможные объекты, которые обычно упоминаются под названием «Война и мир», и наиболее характерные для них слова – имена авторов, актеров и т.д. Также робот анализирует поведение пользователей, которые ищут информацию по тому или иному многозначному запросу, и определяет, какое именно значение чаще всего интересует людей.
Стоит отметить, что формат подсказки также учитывает наиболее часто встречающиеся желания пользователей. Например, в случае с книгой человек практически всегда хочет получить ее текст, поэтому любая справка по произведению, помимо имени автора и краткого описания, почти всегда (когда это возможно) содержит ссылку «Читать», которая отправляет пользователя на сайт одной из электронных библиотек. Если на сайте библиотеки робот обнаружил файл с текстом, то пользователю предлагается еще и скачать книгу. В случае с фильмами людей интересуют как трейлеры и ролики, так и сюжет, имена режиссера и актерского состава, поэтому все эти данные также агрегируются роботом.
В ряде случаев пользователю предлагается уточнить запрос наиболее подходящими словами, список которых, опять-таки, формируется на основании данных о поведении людей на поисковике. В случае с фильмом это может быть имя актера, исполнившего главную роль. Кликнув на уточняющий запрос, пользователь увидит справку по необходимой ему экранизации и результаты уточненного поиска.
Ещё новости по теме:
18:20