Twitter опубликовала исходный код алгоритма рекомендаций

Компания Twitter выложила на GitHub часть исходных кодов алгоритма рекомендаций, влияющего на появление твитов во вкладке «Для вас».

Владелец соцсети Илон Маск предупредил, что исходный код может показаться «оскорбительным» и пообещал исправить ошибки «как можно скорее».

Продвижение твитов Илона Маска

В первые часы после публикации исходного кода энтузиасты обнаружили переменные, вероятно, повышающие твиты Маска в ленте для всех пользователей.

Судя по всему, алгоритм сравнивал между собой, как распространяются твиты владельца соцсети, республиканцев и демократов. Однако из кода неясно, имеются ли в виду только политики или все сторонники обеих партий.

Когда Маска спросили об этом аспекте в аудиокомнате, он сказал:

«Я согласен, что этого не должно быть […], это определенно не должно делить людей на республиканцев и демократов, это не имеет смысла».

Позже инженер Twitter объяснил, что категории предназначены «исключительно для отслеживания статистики и не имеют ничего общего с алгоритмом». По его словам, это было необходимо, чтобы «убедится в непредвзятом отношении ко всем группам». Однако никто из них не объяснил, почему целая категория посвящена Маску.

«Я думаю, что это странно. […] Это был первый раз, когда я узнал об этом», — сказал миллиардер.

Аудиокомната завершилась менее чем через минуту после обсуждения этого вопроса.

Рейтинги твитов

Исходный код содержит вес действий с контентом, влияющий на попадание твитов в ленту «Для вас». Выяснилось, что для алгоритма наибольшее значение имеют лайки — 30 баллов. За ними следуют ретвиты — 20 пунктов. Подписчики Twitter Blue могут получить от двух до четырех баллов.

Критерии, влияющие на ранжировку твитов в ленте «Для вас». Данные: Twitter.

Также лента «Для вас» показывает чаще записи из «Ближнего круга» и посты с фото или видео.

Пустым или содержащим всего лишь ссылку твитам система занижает рейтинг.

«Украинский кризис» и выборы

Изучившие файлы пользователи обнаружили, что в исходном коде содержатся строки, касающиеся «украинского кризиса» (UkraineCrisisTopic). Эта категория находится в разделе «маркировка безопасности» (safety labels) и соседствует с темами вроде фейков, травли и контента для взрослых.

«Украинский кризис» в списке маркеров безопасности. Данные: Twitter.

Из-за отсутствия комментариев к коду нельзя сказать, в каких случаях применяются эти метки. Судя по их содержанию, они могут влиять на общий рейтинг твита.

Аналогичные лейблы использовали во время выборов в Бразилии, США, Филиппинах и Франции, а также в отношении вакцины против коронавируса. На данный момент на них стоит отметка «устаревший» (deprecated).

«Устаревшие» метки, связанные с выборами и вакциной. Данные: Twitter.

Открытие исходного кода алгоритма рекомендаций было одним из основных обещаний Маска перед покупкой Twitter. В мае 2022 года миллиардер обвинил систему ранжирования твитов в манипуляции пользователями.

Напомним, в октябре 2022 года Маск закрыл сделку по покупке Twitter за $44 млрд.

В марте 2023 года он анонсировал публикацию исходного кода алгоритма рекомендаций.

Главное, Новости