Читать
Читать

Читать

разбор

Как работает рекомендательный алгоритм YouTube

Кристос Гудроу, вице-президент по инженерии в YouTube, рассказал, как развивался алгоритм рекомендаций и что он представляет из себя сейчас. Приводим частичный пересказ статьи.

В 2008 году, когда система рекомендаций только создавалась, всё было просто. Допустим, вы в основном смотрите видео о кулинарии. Ведь вам бы не понравилось, если бы ваша домашняя страница рекомендовала вам только последние спортивные и музыкальные клипы с наибольшим количеством просмотров? Но таким был YouTube. Система ранжировала видео на основе популярности, чтобы создать одну большую страницу «Тренды». Немногие люди смотрели эти видео, а большая часть зрителей приходила из поисковых запросов или по ссылкам за пределами платформы.

Сейчас алгоритм работает так: сначала смотрит за уникальными привычками, которые есть у каждого. Затем сравнивает ваши привычки просмотра с похожими на вас и использует эту информацию, чтобы предложить другой контент, который вы, возможно, захотите посмотреть. Так, если вам нравятся видео о теннисе и система замечает, что другим пользователям нравятся те же видео о теннисе, что и вам, и им также нравятся видео о джазе, вам могут быть рекомендованы видео о джазе, даже если вы не смотрели ни одного такого видео ранее (для таких категорий, как новости и информация, это может работать по-другому).

Сегодня система сортирует миллиарды видео, чтобы рекомендовать контент, соответствующий вашим конкретным интересам. Например, система распознала, что вы смотрели классический футбольный матч команды Калифорнийского университета, и нашла для вас другие спортивные моменты вашей юности. Без рекомендаций вы бы никогда не узнали, что эти видео доступны. В отличие от других платформ YouTube не подключает зрителей к контенту через их социальные сети. Вместо этого успех рекомендаций YouTube зависит от точного прогнозирования видео, которые вы захотите посмотреть.

Но, конечно, в YouTube знают, что не все хотят делиться этой информацией. Поэтому здесь есть элементы управления, которые помогут вам решить, сколько данных вы хотите предоставить. Вы можете в любой момент приостановить, отредактировать или удалить свой поиск на YouTube и просмотреть историю.

Чтобы обеспечить индивидуальную подстройку, алгоритм рекомендаций не основывается на «книге рецептов» того, что делать. Он постоянно развивается, ежедневно извлекая уроки из более чем 80 млрд единиц информации, которые в YouTube называют сигналами. Сигналы дополняют друг друга, чтобы помочь системе сообщить, что вас устраивает: клики, время просмотра, ответы на опросы, шеры, лайки и дизлайки.

Клики. Казалось бы, нажатие на видео убедительно свидетельствует о том, что оно вам понравится. В конце концов, вы бы не нажали на то, что не хотите смотреть.

Но еще в 2011 году в YouTube поняли, что нажатие на видео не означает, что вы его действительно смотрели. Допустим, вы искали самые яркие моменты матча Уимблдона какого-то года. Вы прокручиваете страницу и нажимаете на одно из видео, у которого есть миниатюра и заголовок, предполагающий, что в нем показаны кадры матча. Вместо этого человек в своей спальне говорит о матче. Вы нажимаете на видео, которое наша система рекомендует на панели «Далее», только для того, чтобы найти другого фаната, говорящего о матче. Снова и снова вы просматриваете эти видео, пока наконец вам не порекомендуют видео с кадрами матча, которые вы и хотели посмотреть. Вот почему в 2012 году в YouTube ввели такую метрику, как время просмотра.

Время просмотра. Какие видео вы смотрели и как долго — эта информация дает системе персонализированные сигналы о том, что именно, скорее всего, вы хотите посмотреть. Так что, если теннисный фанат просмотрел 20 минут основных роликов Уимблдона и всего несколько секунд видео с анализом матча, можно с уверенностью предположить, что он счел просмотр этих ярких моментов более ценным.

Когда время просмотра было впервые включено в рекомендации, количество просмотров сразу упало на 20%. Но в YouTube посчитали, что важнее приносить больше пользы зрителям. Иногда вы не ложитесь спать допоздна, просматривая случайные видео, хотя вместо этого могли бы выучить новый язык на YouTube или отточить свои кулинарные навыки с помощью учебного пособия. Чтобы зрители не сожалели о тех видео, которые они смотрят, в компании решили сделать еще больше.

Ответы на опросы. Чтобы действительно убедиться, что зрители довольны контентом, который они смотрят, измеряется «ценное время просмотра» — время, потраченное на просмотр видео, которое вы считаете ценным. Если вы оцениваете видео от одной до двух звезд, YouTube спрашивает, почему вы поставили такую низкую оценку. Так же, если вы поставите от четырех до пяти звезд, YouTube тоже спросит почему: было ли оно вдохновляющим или значимым? Время просмотра засчитывается только для видео, получивших четыре или пять звезд.

Конечно, не все заполняют анкеты при просмотре каждого видео. На основе полученных ответов специалисты обучили модель машинного обучения предсказывать потенциальные ответы на опросы для всех.

«Поделиться», «Понравилось», «Не понравилось»: в среднем люди с большей вероятностью будут удовлетворены видео, которыми они делятся или которые им нравятся. Система использует эту информацию, чтобы попытаться предсказать вероятность того, что вы поделитесь или лайкнете другие видео.

Однако, как и ваши рекомендации, важность каждого сигнала зависит от вас. Если вы делитесь любыми видео, которые вы смотрите, в том числе теми, которым вы поставили одну или две звезды, система не будет вам особенно полезна. Всё это причины, по которым система не следует определенной формуле, а динамично развивается по мере изменения ваших привычек просмотра.

Новое для вас

В большинстве случаев «Главная» страница YouTube отлично справляюется с тем, чтобы рекомендовать вам полезные видео. Однако алгоритм может повторяться, и YouTube хочет решить эту проблему с помощью вкладки «Новое для вас». Как сообщает платформа, новый фид появился на десктопной и мобильной версии YouTube. Контент, отображаемый в этой вкладке, позволит «зрителям исследовать видео, выходящие за рамки их типичных рекомендаций». Но и здесь существует определенный уровень персонализации c опорой на обучаемый алгоритм.

Источник: YouTube Blog, 9to5Google

icon

Рекомендуем прочитать главная цифра инсайт формат тренды

icon

Будьте в тренде, получайте нашу рассылку с эксклюзивными исследованиями о YouTube.

Мы не используем куки. Будьте осторожны: сайт может содержать контент, не предназначенный для лиц младше 16 лет.

Partnership with +GP Agency

YouTube+Insider — интернет-сайт о видеохостинге YouTube

Как музыка развивалась на YouTube в пандемию