Кое-что о морде

ЕЛЕНА КОСТЫЛЕВА попыталась разобраться, как устроены рейтинги на главной странице «Яндекс-блогов»

Чтобы ответить на вопрос «как настроение?», мне нужно сначала посмотреть, что в новостях. Бывает, разрешат человеконенавистнический марш, а каких-нибудь нежненьких цветочков в очках арестуют. И вот сидишь, пока не выпустят, переживаешь. Тут же дают о себе знать наследственные заболевания — демшиза то есть.

В том году плохих новостей было больше, чем хороших. Я стала даже заходить по ночам на сайт «Эха Москвы» и читать транскрипты разговоров Гельмана с Павловским. Кризис был, зима; зимой люди злые вообще. А потом как-то распогодилось, Дмитрий Анатольевич завел ЖЖ и приснился мне в эротическом сне — оттепель, в общем, пришла.

И только главная страница blogs.yandex.ru не давала мне покоя — в просторечии «морда».

 

© Twist Idea 

Зайдешь туда, а там главная новость дня — день рождения комсомола. Какого комсомола? 

Жалуюсь друзьям, а они говорят: портал федерального значения, что ты хочешь. Зеркало блогосферы. Шесть миллионов посетителей в день. 

Я пристально следила за этой мордой, по ночам особенно. Помню, однажды был якобы самый популярный пост — о концерте никому не известного заезжего музыканта, а в топе — юзер dubva1, чей журнал уже к тому времени был засуспенжен. 

Сам же сервис утверждал, что цветная революция в Молдавии породила 7900 записей, а главной новостью все равно было Благовещенье, постов — 1560. 

И по запросу «Христос воскрес» были разные данные: число свидетельств данного события было разным на разных страницах поиска. Я чуть с ума не сошла. 

Пришлось ехать на семинар «Яндекса» для разработчиков сайтов, смешиваться с толпой и выслушать там такие слова, как «кластер», «аппроксимация» и «механизмы релевантности». 

После семинара я подошла к заслуженным работникам «Яндекса» Роману Иванову и Антону Волнухину со скриншотами: объясните, мол, пожалуйста, почему комсомол, что происходит с количеством записей и откуда берутся все эти поводы выпить типа «дня железнодорожника»? 

— А, — говорят, — это у нас из «Яндекс-календаря». Когда робот приносит слова, он ищет совпадения в «Яндекс-календаре», а из «Яндекс-афиши» еще берет названия популярных фильмов. 

— А заезжий музыкант, как его там? 

— Покажите-ка… Это очевидная накрутка. Мы с этим боремся, как и со спамом, но не всегда получается вовремя заметить накрутчиков. 

— А «дубва»? 

— Топ юзеров высчитывается за полгода. Мы могли бы, конечно, его оттуда убрать, но не убираем специально. Сам уйдет со временем. Мы ничего не убираем вручную, у нас к минимуму сведен человеческий фактор. Это наша принципиальная позиция. 

— А что делают контент-редакторы? 

— Роботы приносят главные темы, ну представьте, какие. Проснулся юзер, не с той ноги встал, сходил в магазин — представляете, да, какие робот нам приносит слова. Наши контент-редакторы это все, конечно, вычищают. То есть могут, например, поправить название темы, для которой робот выбрал не нейтральный заголовок. Но вообще склеивать темы в одну и определять, что тема, а что нет, может только робот. Контент-менеджеры могут лишь решить, сделал он эту работу хорошо или нет. 

— Как определяются популярные слова?

— Робот видит только резкие всплески популярности того или иного слова или словосочетания за последние сутки. В принципе, мем распространяется за шесть часов, а потом начинает перемещаться из главных тем дня во второстепенные. Если грубо, то темой дня считается то, о чем сегодня, то есть в последние сутки, внезапно стали говорить больше, чем обычно.

— А что же, — спрашиваю, — с самыми популярными запросами? Это же какой-то рак мозга. Почему ваши пользователи ищут в интернете «рассвет», «анаблепс» и «чак-чак»? 

— А это, — говорит Роман, — те запросы из веб-поиска, про которые в блогах пишут чаще, чем в веб-поиске. Мы согласны, что странно получается. Мы вообще давно хотели это убрать. Слышишь, Антон, когда мы уже уберем с морды популярные запросы? 

— Ни за что, — отвечает Волнухин, улыбаясь. — И никогда. 

— Убирать, — объясняет Роман, — мы это не хотим, так как эти запросы иногда отражают картину быстрее, чем «темы дня». Но улучшать будем обязательно.

— А вот, — говорю, — перед прошлым Новым годом группа «Война» заварила дверь в ресторан «Опричник». 1 января по этому поводу было 1700 записей, а к 7 января уже только 800 — что их, съели, эти записи, куда они могли подеваться? 

— А это, — говорит Роман, — у нас вообще неправда. 

— То есть как, — говорю, — неправда? 

— А так — неправда. Запрос, заданный пользователем, отображается неточно. Там вначале только кэшированные страницы считаются. 

Спросить, что такое кэширование, значило выдать себя. Зато Роман рассказал, что с ним делать:

— Если вам нужно точно знать количество записей, вот вам маленький секрет: зайдите на шестую страницу результатов, на ней кэширование отключается.

— Ну хорошо, а что делать, если хочется выяснить, что происходит на самом деле? 

— Вообще, blogs.yandex — наша любимая игрушка, и с ее помощью можно многое узнать. Но у нас семь миллионов блогов, триста тысяч постов в день и семьсот тысяч комментариев. Думать, что на морде blogs.yandex отражена картина дня в блогах, по меньшей мере странно. Кроме того, есть нерешенные проблемы с поиском и выдачей результатов. Если вас интересует, кто популярнее — Путин или Медведев или там панки или эмо, — есть такая кнопка, «Пульс блогосферы». Наберите там эти слова, вам покажут реальную картину, усредненную, за несколько месяцев. 

Тут демшиза моя прошла. (Я попрощалась и ушла.) 

Задумалась я: а чем так сильно медийная картина дня, то есть то, что мы видим в новостях, отличается от блогов с их роботами, почему она должна на мое настроение влиять и как я вообще дошла до такого? Ясно, что и новости, и «зеркало блогосферы» blogs.yandex — кривые зеркала. 

С этой мыслью поехала я как можно дальше от интернета, на дачу, и там обратилась к книгам. 

Прочла, наконец, биографию Хармса, в серии «ЖЗЛ» которая. Так вот Хармс газет не читал, считал, что в них мир «вымышленный, а не созданный». «Это только жалкий, сбитый типографский шрифт на плохой, занозистой бумаге», — писал он в письме актрисе Клавдии Пугачевой, «пустой и вздорной женщине», по словам биографа. А стихи — можно «снять с бумаги и бросить в окно, окно разобьется». «Созданный» мир, искусство, приравнивался Хармсом к «первой реальности», то есть к моим головокруженным дачным соснам и живым белкам — и он реальнее был для Даниила Ивановича, чем разделяемая большинством людей тоска газетная. 

Но потом ему пришлось начать прессу читать, поскольку даже из советских газет можно было понять, к чему идет. Он понимал, что будет война. И что многие умрут с голоду, тоже понимал. 

А я вот ничего не понимаю. 

К чему идет-то? Похоже, что ни морда яндекса, ни новостная картина дня, ни какая-либо другая вымышленная реальность не могут нам этого сказать. 

Кстати, в тот день, когда мне Дмитрий Анатольевич в приятном контексте приснился, я пересказала сон подружке. Она мне знаете что ответила? «Твой Дмитрий Анатольевич сегодня у себя в блоге написал что-то в том духе, что Ерофееву с Самодуровым надо по 12 лет дать». 

Кроме шуток: мне еще никогда не было так неловко.

Поделиться
Комментировать

Популярное в разделе