«Браузер будущего обязан рекомендовать контент» — Руководитель рекомендательных сервисов «Яндекса» Виктор Ламбурт о «Дзене» и «Яндекс.Браузере»

Среда, 8 июня 2016 г.

Следите за нами в ВКонтакте, Телеграм'e и Twitter'e



8 июня 2016 года в «Яндекс.Браузере» появилась персональная лента с рекомендованным контентом, основанная на собственной технологии «Дзен». Руководитель разработки рекомендательной системы «Яндекса» Виктор Ламбурт рассказал vc.ru о работе «Дзена», монетизации сервиса и планах по развитию.



Как вы оказались в «Яндексе» и чем именно занимаетесь в компании, Виктор?

В основном я сфокусирован на сервисе «Дзен». Также я отвечаю за рекомендательную систему, которая используется в ряде других продуктов «Яндекса» — например, «Яндекс.Музыке» и «Яндекс.Радио», в «Яндекс.Маркете». До этого года три назад я работал в «Афише-Рамблер», до этого просто в «Афише», в РБК, а ещё раньше я учился на на механико-математическом факультете.

Эта рекомендательная система под вашим руководством появилась? Или она уже была, когда вы пришли в «Яндекс»?

Она появилась под моим продуктовым руководством. Впрочем, математической стороной заведуют свои специалисты.

А сколько вообще человек у вас работает над этими рекомендательными сервисами?

Это зависит от того, как считать — наша система рекомендаций, к примеру, работает в сервисе «Яндекс.Музыка». Итоговый продукт является результатом работы двух команд — нашей и музыкальной.

И с самой рекомендательной системой сколько людей работает?

Пятьдесят.

Я думал, больше.

Дело в том, что наша рекомендательная система «Диско» стоит на плечах гигантов. В частности, внутри «Диско» используется «Матрикснет» (метод машинного обучения, с помощью которого строится формула ранжирования «Яндекса» — прим. ред.), за разработкой которого стоит ещё пара десятков человек. То есть если бы те несколько десятков человек, которые сделали «Диско», собрались где-то вне «Яндекса», то они бы «Диско» не сделали.

Наш «Дзен» надстраивается над «Диско» — он стоит ещё больше на плечах гигантов, потому что, например, опирается на поисковый индекс «Яндекса». Сколько человек делает его? Много — и те, кто пишет краулер, и те, кто пишет индексатор. В общем, это очень сложная система. Раз уж это сложная система, я вам предлагаю рассказать нашим читателям-гуманитариям, как она работает — на пальцах.

«Дзен» — это лента контента, подобранная индивидуально для каждого пользователя с просторов интернета. Очень важно, что лента формируется в соответствии с интересами пользователя.

«Дзен» опирается на глобальный веб-индекс «Яндекса», он у нас прямо очень большой. Речь идёт не только о рунете.

Дальше мы при помощи алгоритмов отбираем наиболее востребованный контент, анализируем его при помощи разных технологий искусственного интеллекта: мы используем много техник работы с естественным языком, компьютерное зрение для того, чтобы понять, о чём этот текст, отрубрицировать его, выделить из него объекты, понять, что на этой картинке нарисовано.

Информация, извлекаемая из документов, далее поступает в систему «Диско». А «Дзен», опираясь на известные «Диско» предпочтения пользователя, и формирует итоговый контент.

Как формируются предпочтения пользователя? Смотрим на то, куда человек кликает, что он делает на сайте паблишера: сразу вернулся или прочитал этот материал.

Подобные факторы используются для того, чтобы автоматически подстраивать ленту без необходимости со стороны пользователя как-то настраивать, управлять или какие-то колёсики крутить. Впрочем, если очень хочется, такую возможность «Дзен» предоставляет, и каждую карточку можно закрыть или убрать.

Выходит, я почти не могу влиять на выдачу сервиса, которая формируется лично для меня? Нет, например, категорий, которые я могу выбирать?

Категоризация есть глубоко внутри системы, и там прямо много маленьких категорий. Но для пользователя мы их не выводим. Может быть, когда-нибудь в дальнейшем будем выводить и давать возможность подстройки. Но мы, в целом, верим, что человеку проще сказать про конкретный материал, нравится он ему или не нравится, чем подписываться на какую-то конкретную категорию контента.

Поэтому мы старались максимально упростить настройку. Система сама начинает понимать, нравится ли эта тема или, может быть, не нравится формат материала. Какой-то нудный текст, а, а мне бы картиночек побольше. Это миллион факторов. Или, может быть, страница с рекламным баннером, и его очень сложно воспринимать. Это всё факторы, которые учитываются при построении итоговой выдачи.

Где я могу сейчас использовать «Дзен»?

Мобильный и настольный «Яндекс.Браузер», а также Yandex Launcher.

Вы не хотите отдельное приложение выпустить?

Всё-таки мы стараемся делать нативную реализацию. Вот что важно: рекомендации становятся хорошими тогда, когда ими пользуются. Про приложение нужно вспомнить, нужно его отдельно запустить —, а мы встраиваем «Дзен» в те места, которыми человек и так пользуется каждый день. Чем он пользуется? Браузером и лончером. Браузер будущего обязан рекомендовать контент. Это будет неотъемлемое свойство браузера будущего.

В «Дзене» пользователи переходят на сайт паблишера, другими словами, вы не забираете себе контент. Это тоже осознанное решение?

Да. Мы не планируем что-нибудь вроде того, что делал когда-то Surfingbird, мы не планируем верстать у себя контент как Instant Articles, и вообще мы верим в открытый доступ. Паблишеры способны лучше монетизировать трафик, чем какие-то сторонние системы, через нативную рекламу, которую паблишер сделает максимально эффективно. Редакции всё больше и больше становятся креативными агенствами.


Да, это мы на своей шкуре ощущаем. Но хорошо, если у паблишера есть такая реклама, то что с неё вы получаете?

Ничего. Та реклама, которую паблишер разместил на своих страницах, — это деньги паблишера. Он сделал контент, затратил на это средства, душу, вот он и получает таким образом вознаграждение.

Наша добавочная ценность в том, что мы подобрали этот контент под пользователя, то есть, скомбинировали ленту из разных карточек, которые ему могут быть интересны. Мы монетизируем именно эту ленту, размещаем рекламу между карточками.

Это «Директ»?

Да. Могут быть разные рекламные сети, но в России «Директ» самый хороший, поэтому мы в России размещаем именно его.

Могут быть разные? То есть, Adwords тоже можете поставить?

В России Adwords мы ставить не хотим, потому что «Директ» лучше зарабатывает. А за пределами России, конечно, ставим Google Adwords.

За пределами России «Дзен» тоже работает? На каких языках?

Он доступен на 26 языках в 30 странах.

А как соотносится количество русскоязычных и иностранных пользователей?

В текущий момент количество пользователей на русском языке, конечно же, намного больше. Однако мы работаем над тем, чтобы в других странах «Дзен» стал так же велик. В странах, где наш бренд известен, мы самостоятельно распространяем наши продукты, такие как браузеры и лончеры. В других странах, где наш бренд неизвестен, мы партнёримся с самыми разными партнёрами — производителями телефонов, операторами — и делимся рекламой.

А сколько в России пользователей у «Дзена» самого?

Здесь очень тонкий вопрос в том, кого считать пользователями «Дзен», а кого не считать. Поэтому я бы сказал так: «Дзеном» пользуются десятки процентов от аудитории браузеров. Месячная аудитория настольного браузера — 29 миллионов человек, мобильного — 14,7 млн. За год количество минут, которые пользователи проводят в «Дзене», выросло в среднем в четыре раза. С 5 минут до 20.

А сколько людей просто заходит на домен zen.yandex.ru через другие браузеры?

Я затрудняюсь ответить, я на это никогда не смотрел, потому что у нас не было такой цели — раскрутить этот домен. Это очень неестественный сценарий использования. Сценарий использования «Дзена» внутри браузера намного приятнее, чем на отдельном домене, через «Сафари».

Получается, это не совсем отдельный продукт.

Именно. Это не отдельный сервис. Вы, зайдя на список сервисов «Яндекса», не увидите там ссылку на «Яндекс.Дзен». Можно найти этот домен через поиск, но это не тот сценарий использования, который мы пропагандируем.

Какие планы на «Дзен»? Какие-то, может быть, планируете в интерфейсе планируете большие изменения или в способе сбора и передачи контента, либо в монетизации?

Мы традиционно свои планы по развитию не раскрываем. Причина этому крайне незатейлива: мы проводим миллионы экспериментов, и что из этого мы решим воплотить, заранее не всегда понятно.

Миссия «Дзена» состоит в том, чтобы сделать потребление медиа для людей интереснее. И мы всё будем делать для этого. Мы будем улучшать наши алгоритмы. Если мы поймём, что какие-то пользователи готовы оставлять более регулярный фидбек, мы сделаем соответствующие инструменты. Мы будем улучшать представление контента. Это не значит, что там появится превью. Кстати, что тоже важно (что называется, для истории): в первых версиях «Дзена» был ещё дополнительный шаг с превью.

Да, я помню.

Мы его отпилили, потому что увидели, что так люди больше читают. Если суммировать то время, которое люди проводят непосредственно в сервисе, с тем временем, которое люди проводят на страницах, найденных в общей сетке, — оно увеличилось.

И после этого мы отпилили превью. Потому что на страницах паблишера контент представлен более органично, чем в превью. Мы очень заботимся о карточках, чтобы они были хорошие. Хочется, чтобы карточка в рамках этого формата максимально объективно и адекватно отражала содержимое материала, не разочаровывала пользователя.

Кого вы считаете основным конкурентом «Дзена» в России и в мире? Например, можно назвать тот же Surfingbird, а можно назвать Facebook, где я получаю информацию каждый день, потому что там друзья, которые делятся интересными ссылками, и я там провожу много времени и оттуда часто перехожу на сайты. Мне уже привычно оттуда получать информацию, и не факт, что мне понадобится ещё один сервис для того, чтобы что-то новое для себя находить.

Возвращаюсь к нашей мысли. Мы хотели бы сделать медиапотребление людей интересным, и мы боремся за сценарий пассивного употребления контента. Пассивного не в том смысле, что я сижу в кресле и пускаю пузыри, упершись взглядом в телевизор. А пассивное в том смысле, что я не ищу что-то конкретное — как в случае если я пишу диссертацию, и мне надо найти какую-то конкретную статью.

Имеется в виду такой «инфотейнмент» — потребление контента в соответствии с моими реальными интересами, не интересами моих друзей, как это часто бывает, а именно моими. Соответственно, наши конкуренты — это те, кто способен удовлетворять эти сценарии.

В первую очередь, это социальные сети. Во вторую очередь это рекомендательные сервисы типа Flipboard. А в третью очередь это браузеры, которые постепенно начинают интегрировать к себе какой-то медиаконтент.

Может ли ваша работа вылиться в создание какого-то интеллектуального помощника, вроде модных сейчас Google Now и Siri? Эта тема набирает обороты, но у «Яндекса» пока ничего подобного нет.

Шанс увидеть что-то подобное всегда есть. Я бы вот что сказал: безусловно, «Дзен» предоставляет очень много необходимого для такого помощника. Потому что, по-видимому, такой помощник, в том числе, должен организовывать инфотейнмент, и «Дзен» с этим неплохо справляется.

Однако помощник должен уметь ещё много чего такого, что для «Дзена» противоестественно, ну, например, «Дорогой помощник, напомни, пожалуйста, что мне надо не забыть купить молока и яиц» или «Дорогой помощник, когда у Кати день рождения?», «Дорогой помощник, а где тут ближайшая заправка». Для «Дзена» это очень нерелевантно. Твитнуть Поделиться Поделиться

В избр.

Ком. Статьи по теме

Следите за нами в ВКонтакте, Телеграм'e и Twitter'e


Просмотров: 975
Рубрика: Hi-Tech


Архив новостей / Экспорт новостей

Ещё новости по теме:

RosInvest.Com не несет ответственности за опубликованные материалы и комментарии пользователей. Возрастной цензор 16+.

Ответственность за высказанные, размещённую информацию и оценки, в рамках проекта RosInvest.Com, лежит полностью на лицах опубликовавших эти материалы. Использование материалов, допускается со ссылкой на сайт RosInvest.Com.

Архивы новостей за: 2018, 2017, 2016, 2015, 2014, 2013, 2012, 2011, 2010, 2009, 2008, 2007, 2006, 2005, 2004, 2003