И все-таки она шевелит мозгами!

У Всемирной Паутины обнаружился еще один способ самоорганизации

Интернету в том виде, как мы его знаем сегодня – то есть прежде всего в виде Всемирной Паутины, World Wide Web, – 13 марта исполнилось ровно 20 лет. Именно в этот день англичанин Тим Бернерс-Ли передал руководству Европейского центра ядерных исследований (ЦЕРН) меморандум со своими предложениями по архитектуре компьютерной сети в ЦЕРНе. Примерно через год появилось то, что мы сегодня называем «браузер». 

Все, что случилось потом, вы хорошо знаете… 


Сегодня некоторые эксперты считают, что интернет-поисковики станут первыми полноценными представителями искусственного интеллекта (ИИ). Так это или не так – можно спорить. Но то, что интернет – www, Сеть, Всемирная Паутина – уже стал объектом самостоятельной области исследований, факт свершившийся. Другое дело, может так получиться, что это не мы – мы, в смысле, ученые – наблюдаем за этим объектом, а сама сеть пристально, но ненавязчиво изучает нас. Наблюдение за наблюдателем, так сказать… 

Между прочим, в связи с такими перспективами во всей своей свинцовой серьезности встает вопрос: а не попадает ли пользователь в явную или неявную зависимость от того, как та или иная поисковая машина трактует интернет? Еще один повод задуматься над этим дает исследование Йохана Боллена с коллегами из Лос-Аламосской национальной лаборатории в Нью-Мексико (США), опубликованное в научном интернет-журнале PLoS ONE. 

До сих пор науковеды строили так называемые карты взаимосвязи различных научных дисциплин, используя информацию о цитируемости статей (число ссылок на данную статью в другой работе) в научных журналах. В итоге получалось своеобразное кластерное поле: журналы по родственным отраслям науки (например, по химии и химической физике) располагались в одном или в близких кластерах. 

Исследователи, опубликовавшие свою работу в PLoS ONE, применили другую методику. Они построили карту взаимосвязи научных дисциплин, исходя из данных о переходах от статьи к статье, совершенных читателями сетевой научной периодики. Таким образом, авторы исследования изначально предполагали, что большинство современных ученых сначала знакомятся с интересующей их информацией в интернете и лишь позднее – в печатных вариантах научных изданий. Портал Nature News приводит краткое изложение этой методики. 

При подготовке карты Йоханом Болленом и его коллегами были проанализированы почти 1 млрд. запросов за период с 2006 по 2008 год в 35 тыс. журналов. Но при этом они рассматривали не число ссылок, а количество совершенных переходов от статьи в журнале «А» к статье в журнале «B», от статьи в журнале «B» к статье в журнале «С» etc. На основании полученной карты перемещений читателей (учитывалась частота и направление переходов) ученые и составили кластерное поле сетевых научных журналов. Естественно, и здесь журналы-родственники располагались близко. То есть между ними было минимальное число кликов. 

Но полной неожиданностью стало другое: оказалось, что роль кратчайших «мостиков» между совершенно далекими кластерами выполняют… журналы по социальным наукам. Другими словами, через журналы по психологии и социологии читатели перепрыгивали из кластера в кластер: из химии – в математику, из физики – в археологию, из биологии – в астрономию... К примеру, неожиданно был выявлен повышенный уровень обмена данными между специалистами, занимающимися экологией и архитектурой. 

«Действительно, есть проблема в отношении как оценки роли и значения общественных и гуманитарных наук, а также искусствоведения в мировой науке вообще, так и в отношении изучения специфики оценки вклада отдельных стран, научных коллективов и ученых, работающих в этих науках, – подчеркнул в беседе с корреспондентом «НГ» директор представительства крупнейшего в мире издательства научной литературы – компании Elsevier в России Олег Уткин. – Общеизвестными и ставшими уже банальными фактами являются три обстоятельства. Во-первых, количество журналов в области общественных и гуманитарных исследований существенно уступает естественным, техническим наукам и медицине. Во-вторых, гораздо большую роль в общественных, гуманитарных исследованиях и искусствоведении играют книги (монографии) как с точки зрения формы публикации результатов, так и с точки зрения изучения всей массы накопленных знаний. И, наконец, как результат – цитирование научных статей в журналах не признается как главный фактор оценки результатов научных исследований в этих областях». 

Вот и авторы публикации в PLoS ONE подчеркивают: у журналов, посвященных социальным наукам, цитируемость заметно ниже, чем у естественно-научных журналов, поэтому они и не попадали в старые карты взаимосвязи различных научных дисциплин. Ученые отмечают: проведенное ими исследование показало, что значимость работ по «низкоцитируемым» социальным и гуманитарным дисциплинам на самом деле весьма высока. 

«По сути дела, это, во-первых, стремление повысить роль и значение общественных и гуманитарных наук, а также искусствоведения в мировой науке, а во-вторых, попытка дать наукометрический алгоритм оценки их эффективности, – так оценивает цели статьи в PLoS ONE Олег Уткин. – Однако, с моей точки зрения, это исследование хотя и небезынтересно само по себе, но не решает поставленных задач. Результативность и эффективность исследования в науке, хотя и могут быть в принципе измерены количественно, но сам принцип измерения, безусловно, должен выходить за рамки подсчета числа кликов на ссылки между страницами в интернете. Например, статистически известно, что более 30% всех посещений крупнейшей в мире электронной библиотеки Science Direct осуществляется на основании переходов со страниц результатов поиска, полученных через поисковик Google. Если следовать логике Йохана Боллена и его соавторов, то Google является очень близким к Science Direct с точки зрения его научной роли. При этом сам по себе Google не содержит научных статей вообще».  

Любопытно, что как раз ровно год назад новостная служба Nature опубликовала сообщение о работе группы ученых исследовательского центра Microsoft в Редмонде. Они экспериментально установили, что среднее расстояние между двумя пользователям в сети составляет 6,6 шага (если считать шагом непосредственный обмен сообщениями между двумя пользователями). Тоже, не бог весть, какое большое расстояние. А в 2004 году российские ученые С.А.Крашаков и Л.Н.Щур показали, что популярность веб-серверов интернета хорошо описывается немного модифицированным гиперболическим распределением (так называемый закон Ципфа). 

В этом-то, кстати, и заключается одна из фундаментальных проблем современной науки – как «сконструировать» такую динамику, которая формировала бы иерархию в исходно беспорядочной среде (например, такой, как интернет). 

«Что интересно, эта проблема возникает во многих областях современной физики: в физике спиновых стекол, в физике полимеров, в биофизике, – поясняет доктор физико-математических наук, заведующий лабораторией Объединенного Института химической физики им. Н.Н.Семенова РАН Владик Аветисов. – Эта проблема возникает в связи с развитием глобальных информационных систем. Мы являемся свидетелями рождения глобальной иерархически организующейся системы – интернет. Это исключительно интересно: наблюдать, как она эволюционирует, хотя и понятно, что в конце концов все это есть результат деятельности человека. Несколько шокирует, что подобные иерархические системы могут возникать и без участия живого, вполне самопроизвольно». 

И с этой точки зрения сам принцип изучения взаимосвязей между публикациями, цитируемостью и эффективностью научных исследований является очень полезным, считает Олег Уткин. «Графическое решение, которое предложили Йохан Болен с коллегами, удачно и может быть использовано в дальнейшем. Таким образом, данная работа является интересным заделом в направлении количественного анализа общественных и гуманитарных наук, а также искусствоведения, но нуждается в продолжении и доработке». 

В ХХ веке, в основном в связи с развитием квантово-механических представлений о структуре окружающей нас физической реальности, постепенно сложилось понимание, что человек познает не самое природу как таковую, а только контакт с нею. Сегодня, в XXI веке, нам в любом случае не стоит забывать, что поисковые машины – это вовсе не отражение того, чем является сеть. Мы наблюдаем не интернет как он есть, а интернет плюс воздействие поисковой машины, которой пользуемся в данный момент. 

И еще неизвестно, что эта поисковая машина думает о нас…

Андрей Ваганов

Независимая газета
Поделиться
Комментировать

Популярное в разделе