ТЕХНОЛОГИИ

Автоматизируй как BuzzFeed. Как медиагигант использует технологии в дистрибуции контента

Vector 5 декабря 2018, 13:01

Как выглядит техническая сторона BuzzFeed? Как компания использует ИИ и автоматизацию для публикаций? Что делать, чтобы рецепт хот-дога не оказался в разделе «Животные»? На эти и другие вопросы ответил вице-президент и глава отдела данных в BuzzFeed Гилад Лотан на встрече с группой GEN Study Tour в Нью-Йорке.
Материал для Vector перевели в бюро переводов «Профпереклад».

Соцсети BuzzFeed

BuzzFeed вложил много денег в соцсети: Twitter, Facebook, Snapchat, Instagram, Youtube и Pinterest. У них 100 разных страниц в Facebook, 300 млн подписчиков на YouTube, а сайт каждый месяц посещают 200 млн уникальных пользователей.
Разные площадки используют не только для просмотра контента, но и чтобы сделать материалы на других платформах эффективнее.
«Это работает только если вы действительно собираете данные об аудитории. Мы создали конвейер по обработке запросов и технологии. Он помогает нам проанализировать каждый материал, который мы публикуем на стороннем сайте: что с ним происходит, как с ним взаимодействуют люди, и как это меняется со временем», — сказал Лотан.
Потом мы используем эту информацию внутри компании, чтобы каждая единица контента могла охватить нужную аудиторию.

Информационные панели

У BuzzFeed есть несколько внутренних информационных панелей, которые используют информацию из конвейера обработки запросов.
Одна из самых простых — El Dashboard. Она позволяет любому сотруднику компании видеть показатели эффективности контента с разных платформ.
Например, El Dashboard может отслеживать видео и его версию на YouTube. Затем можно получить доступ и сравнить показатели эффективности для обоих. Это помогает команде понять, где продвигали и публиковали материал, и как на него отреагировала аудитория.

El Dashboard выдает основные показатели эффективности: охват аудитории, количество просмотров и репостов


Dashbird — более визуальная и консервативная информационная панель. Она рассчитывает социальный подъем — соотношение между вирусными просмотрами (просмотры вне продвижения BuzzFeed) и просмотрами источника (просмотры от собственной рекламы BuzzFeed на их сайте и в соцсетях).
Dashbird показывает, когда и на каких страницах опубликовали статью. Это помогаем понять, что работает, а что нет.

Dashbird показывает количество вирусных просмотров, просмотров источника и рассчитывает соотношение между ними


«Доступ к этим данным есть у всех сотрудников BuzzFeed. Я знаю, что некоторые медиакомпании не хотят, чтобы авторы статей знали об эффективности материалов. Но думаю, важно понять, на что реагирует аудитория», — сказал Гилад.

С чем может помочь автоматизация

У BuzzFeed есть набор моделей на основе машинного обучения, которые помогают управлять процессом публикации материалов на сайте и в соцсетях.

1. Статьи для перевода

«Мы много думаем о том, как адаптировать контент на международном уровне: как определить контент, который сработает, если мы его переведем?» — сказал Лотан.
BuzzFeed много лет собирала данные, чтобы предсказать тип статьи, которая «зайдет» на других языках. Например, чтобы понять, что понравится португальской аудитории, система проанализирует данные, в том числе динамику, разбитую по странам, все исторические статьи и все статьи, которые переводили с английского на португальский раньше.
В итоге модель рассчитает «показатель популярности». Чем он выше, тем у статьи больше шансов на успех. Затем бот Slack дает рекомендации а редакторы решают, переводить текст или нет.

Бот показывает, что у бразильской аудитории были популярны материалы «24 подтверждения того, что Лондон – самый странный город», «Закажите кучу осенних вкусняшек, и мы расскажем, какая новинка Netflix вам понравится» и «22 человека, чей день сложился горааааздо хуже вашего»

2. Заголовки и картинки

А/В тестирование — еще один помощник BuzzFeed. Этот инструмент встроен в систему управления контентом. Авторы могут протестировать разные варианты названий и изображений для любой статьи. Результаты приходят им в Slack, где они видят, что работает хорошо, а что нет.

3. Лента новостей

Чтобы показывать на главной странице новостной ленты самые популярные тексты, BuzzFeed использует алгоритм «многорукий бандит» на основе машинного обучения.
Он берет статью и на какое-то время выводит ее на главную страницу раздела, чтобы увидеть, как отреагирует аудитория: сколько раз кликнут, как долго будут читать, сколько раз нажмут «поделиться».
Потом проделывает то же самое со следующим материалом, и так пока не узнает, какой контент нравится читателям. Самые читаемые тексты он оставляет на главной странице ленты новостей.

4. Похожие материалы

Чтобы группировать близкие по содержанию тексты, BuzzFeed адаптировали под себя Word2vec – программный инструмент, который через нейронные сети анализирует тексты, присваивает каждому слову вектор и объединяет похожие.
Для этого Word2vec изучает контекст: если два слова часто встречаются рядом, значит, они схожи по смыслу. Они будут иметь близкие координаты векторов.
Свой вариант Word2vec BuzzFeed назвали recipe2vec. Его используют в категории «Tasty»,чтобы собрать вместе похожие рецепты.
Recipe2vec обрабатывает кулинарные тексты и изучает слова в них. Система не просто объединяет рецепты с одними и теми же ингредиентами, а сортирует их по способу приготовления, вкусу и даже запаху.

Recipe2vec присваивает каждому слову вектор. «Дельфин», «белуха» и «морской мир» близки по контексту, поэтому находятся рядом

5. Место публикации

Еще один внутренний инструмент BuzzFeed ― Social Mission Control. Он автоматически определяет, на какой странице Facebook лучше публиковать определенный контент.
«Некоторые наши страницы действительно крупные, на них подписаны миллионы людей. Поэтому мы анализируем данные, и только потом решаем», — сказал Лотан.

Social Mission Control показывает, сколько человек просмотрело посты

6. Курирование страниц

BuzzFeed использует классификаторы, которые объединяют похожие слова. Сначала они изучают слова во всех категориях BuzzFeed, потом ищут свободное место на страницах, где можно опубликовать текст, и выдают рекомендацию редактору. Он может принять или отклонить ее.
Если у BuzzFeed нет куратора для какой-то страницы в соцсети, или она не очень важна, этот процесс автоматизируют.

7. Релевантные материалы

Чтобы сделать публикации более эффективными, BuzzFeed использует оптимизацию релевантности. Например, в текстах из раздела BuzzFeed Животные часто встречаются слова «собака» и «милый». Поэтому статьи, в которых они есть, могут автоматически попадать в этот раздел. Как убедиться, что рецепт хот-дога не окажется там же?

Нейронные сети понимают не только слова, но и связи между ними. Слова в статье о хот-доге не связаны со словами в статье о животных. Они нерелевантны. Поэтому у хот-дога с соусом чили нет шансов оказаться среди историй о домашних любимцах.

8. Повторная публикация

Рекомендации по текстам, которые популярны всегда, тоже автоматизированы. Поэтому, если редактору нужно опубликовать полностью готовый текст прямо сейчас, система быстро найдет подходящий материал.
«Повторная публикация материалов дает BuzzFeed большое преимущество в этой многоплатформенной экосистеме. Много раз про этот контент просто забывали, потому что каждый день у нас выходит много статей. Когда есть много платформ, где можно публиковать тексты, этот прием действительно работает», — сказал Лотан.
Вместе с тем, люди могут контролировать и менять решения системы, говорит Лотан. По его словам, технологии не заменят сотрудников BuzzFeed. Система берет на себя самую скучную часть работы, и у людей остается больше времени на творчество.

Читайте также

Что (не)так с Black Friday. Откуда пошла традиция и почему не стоит бояться больших скидок

Открыть бизнес за границей. Как получить средства на новое дело в ЕС

Как купить USDT через обменник. Подробная инструкция

TemplateMonster — 20 лет. История компании от маленькой вебстудии до маркетплейса из 175 000 продуктов

Международная IT-компания Astound Commerce набирает людей в команду. Кого именно ищут и почему вы захотите там работать

Сохранение позиций на рынке, йога онлайн, покупка Starlink. Как Govitall работает во время войны

Еще один «Дон Кихот». Как беларус создал приложение для высмеивания путинской пропаганды и почему это вызывает дежавю

Новые услуги и поддержка Украины. Как в FAVBET адаптировали работу и продукт военные реалии

30 докладов об IT и сбор средств на ВСУ. Что будет на международной IТ-конференции NIX MultiConf

Калиновый венок и символы войны. Morphy.vision создала AR-фильтр в рамках open call от Banda и Brave.ua