Site icon Троицкий вариант — Наука

Электронный arXiv науки

Подспорье традиционным журналам или альтернатива?

Алексей Левин

В недавней статье о многоканальной астрономии [1] я отметил, что новые методы получения информации о космических событиях меняют социальную структуру науки о Вселенной. В этом нет ничего удивительного — подобные сдвиги, как правило, влияют и на характер научных институтов, и на коммуникацию членов научных сообществ. Эту тенденцию легко проиллюстрировать на примере эволюции открытых электронных хранилищ научных статей, не прошедших сквозь редакционные фильтры традиционных журналов.

Эти фильтры возникли очень давно. Первыми научными периодическими изданиями были парижский Journal des sçavans («Журнал ученых») и лондонские Philosophical Transactions of the Royal Society («Философские труды Королевского общества»), почти одновременно дебютировавшие в 1665 году. Поначалу они публиковали рукописи без всякого отбора (за редким исключением), но это продолжалось недолго. В 1702 году Journal des sçavans начал практиковать рецензирование манускриптов, а Phil. Trans. — полувеком позднее. Со временем рецензирование стало чуть ли не главным критерием академического престижа журнала, хотя и осуществлялось оно в разных формах. Интересно, что самый авторитетный общенаучный журнал Nature ввел обязательное рецензирование поступающих материалов лишь в 1967 году — до того оно было лишь выборочным.

Как бы то ни было, система жесткого скрининга заявок на научные публикации в ее нынешних формах вполне надежно функционирует с давних времен. Автор (а чаще — авторы) после выполнения всех необходимых формальностей отправляет рукопись в журнал, откуда ее пересылают одному или нескольким специалистам в данной области, чьи имена в норме никогда не разглашаются. Анонимные рецензенты делают замечания и предложения (порой весьма критические) и возвращают рукопись в редакцию. Авторам предоставляется возможность ответить на критику и внести в текст изменения в духе сделанных замечаний (конечно, если статью сразу не отклонили). Они могут дискутировать с рецензентами и оспаривать их замечания, что, естественно, затягивает скрининг.

По завершении этих процедур редактор либо направляет работу в печать, либо возвращает ее авторам. В первом случае они получают верстку статьи, куда еще могут в последний момент внести незначительные изменения и исправления. В целом этот процесс занимает не меньше нескольких месяцев (иногда и больше года). Лишь после публикации профессиональное научное сообщество имеет формальное подтверждение того, что некая группа исследователей предположительно получила такие-то научные результаты. Если они выглядят интересными, то почти всегда тщательно проверяются коллегами, но это уже другая история.

Эта процедура в целом весьма благотворна для науки. Она хорошо отсеивает сомнительные заявки на новое знание и в конечном счете улучшает качество публикаций. Однако есть у нее и несомненные слабости. Например, когда в какой-то области происходят быстрые изменения и новые материалы льются в редакции бурным потоком, обостряется проблема установления приоритета, что подчас ведет к серьезным конфликтам. Эта проблема отчасти — но только отчасти — решается тем, что на первой странице опубликованной статьи стоит дата получения рукописи. Еще одна проблема состоит в том, что рецензенты могут воспользоваться полученной информацией для быстрого продвижения собственных исследовательских проектов, что создает опасность недобросовестной конкуренции (примеры этому имеются). В любом случае, неспешный темп журнальных публикаций препятствует формированию картины текущего состояния исследований в реальном масштабе времени.

Научное сообщество уже давно нашло способ ускорить распространение информации рассылкой препринтов. Мне не удалось выяснить, когда это началось, но в 1950-е годы эта практика применялась достаточно широко — по крайней мере, в физике. Например, знаменитая работа Джона Бардина, Леона Купера и Роберта Шриффера с изложением микроскопической теории сверхпроводимости летом 1957 года разошлась среди специалистов именно в виде препринта статьи для журнала Physical Review (который авторам вполне в духе времени было запрещено пересылать в СССР и страны советского блока).

Однако эта практика, не говоря уже о почтовых расходах и трате личного времени исследователей на печать и рассылку текстов (профессора могли рассчитывать на услуги секретарей, но у постдоков такой привилегии не было), обеспечивала выход лишь на довольно узкий круг коллег по профессии. В эпоху господства электронных коммуникаций об этих сложностях смешно даже вспоминать, но в свое время они были вполне реальными.

От бумаги к рабочим станциям

Philosophical Transactions of the Royal Society

Продвижение к первым свободно заполняемым (т. е. не требующим предварительного рецензирования) общедоступным электронным архивам научных статей заняло около тридцати лет. Оно началось, как мне кажется, с инициативы замечательного физика-экспериментатора Вольфганга Панофского. В 1961 году он возглавил проект М, предусматривавший строительство вблизи кампуса Стэнфордского университета двухмильного линейного ускорителя электронов. Панофский понимал, что эта уникальная машина станет мировым исследовательским центром и поставщиком огромного количества экспериментальных данных.

Уже в 1962 году, когда только начались работы по прокладке туннеля для будущего ускорителя, он распорядился, чтобы при проекте была создана первоклассная библиотека, предназначенная, в частности, для сбора и хранения препринтов статей по физике высоких энергий (high energy particle physics, HEP) и смежным дисциплинам. Официальное открытие ускорителя состоялось 9 сентября 1967 года, и тогда же в Стэнфорде приступили к формированию компьютерного ресурса для электронного хранения препринтов.

К этой работе подключился немецкий ускорительный центр DESY, совместно с которым в 1974 году была запущена единая база данных по физике высоких энергий SPIRES-HEP. В декабре 1991 года ее подсоединили к Всемирной сети (созданной двумя годами ранее в ЦЕРНе), причем модуль, через который осуществлялась эта связь, стал первым интернет-сервером в США (и вообще за пределами Европы). В 2012 году у SPIRES-HEP появился преемник — цифровая библиотека с открытым доступом INSPIRE-HEP.

Эти репозитории внесли немалый вклад в информационное обеспечение блестящего прогресса теоретической и экспериментальной физики элементарных частиц в течение последних десятилетий. Однако у них почти не было подражателей среди других областей физики и прочих наук, которые больше полагались на традиционные способы распространения информации. В ретроспективе это не слишком удивляет. Физика высоких энергий в послевоенные годы развивалась очень быстро и, если так можно выразиться, обеспечивала социальный заказ на оперативную информационную поддержку (что очень рано понял Панофский). Остальные ветви физической науки эволюционировали много спокойней.

Следующий подобный заказ поступил тридцать лет назад, на сей раз от физики сверхпроводников. В течение 1970–1985 годов она развивалась вполне спокойно, и мало кто ожидал от нее революционных открытий. В 1973 году сотрудник исследовательских лабораторий фирмы Westinghouse Джон Гавалер выяснил, что тонкие пленки соединения ниобия с германием превращаются в сверхпроводники при 23,2 К, и за последующие 13 лет этот рекорд так и не был перекрыт. Многие считали, и отнюдь не без оснований, что поиски сверхпроводников с более высокими критическими температурами вообще малоперспективны.

А потом произошла сенсация. В сентябре 1986 года сотрудники цюрихского исследовательского центра корпорации IBM Йоханнес Георг Беднорц и Карл Алекс Мюллер сообщили об открытии первого высокотемпературного сверхпроводника. Поначалу их статью в не слишком читаемом ежемесячнике Zeitschrift für Physik мало кто заметил. Однако вскоре результаты швейцарских ученых подтвердили физики из США и Японии, погоня за новыми сверхпроводниками развернулась по всему миру и породила великое множество препринтов. Чтобы помочь коллегам справиться с этим информационным бумом, профессор университета Айовы Джон Клем в апреле 1987 года основал чрезвычайно успешный бюллетень High Tc update, где очень оперативно публиковал и комментировал новые материалы в этой области.

Первое время он издавался на бумаге, но вскоре сделался электронным и в этой форме просуществовал до 2000 года.

Решающий шаг

Пол Джинспарг. Фото с сайта cornell.edu

В 1987 году на подходе была цифровая революция, которая несколькими годами ранее заявила о себе появлением первых интернет-провайдеров. В ретроспективе очевидно, что в этой ситуации можно было ожидать скорого создания электронных хранилищ научных препринтов, подключенных ко Всемирной сети. Первый шаг в этом направлении сделал сотрудник Лос-Аламосской национальной лаборатории Пол Джинспарг (Paul H. Ginsparg).

В августе 1991 года (т. е. еще до появления в Стэнфорде первого американского интернет-сайта) он написал и разместил на своем рабочем компьютере несложную программу, которая архивировала полученные по электронной почте препринты и открывала доступ к ним для всех желающих. Соответствующий адрес hep-th@xxx.lanl.gov давно вошел в историю научных коммуникаций. Интересно, что Джинспарг тогда не имел никакого представления об Интернете (и узнал о нем лишь годом спустя).

Джинспарг первоначально хотел всего лишь упростить коммуникации между физиками-теоретиками, которые, как и он сам, занимались квантовой теорией поля и теорией струн. Первые полгода его репозиторий работал только на них. Однако в 1992 году в новый архив начали поступать препринты статей по астрофизике, теории конденсированных сред, космологии, общей теории относительности, ядерной физике и даже по алгебраической геометрии. В 1993–1994 годах добавились работы по экспериментальной физике высоких энергий, химической физике, программированию.

К августу 1992 года число пользователей достигло пяти тысяч, а еще через два года превысило двадцать тысяч и продолжало быстро увеличиваться. В общем, процесс пошел. Он продолжал набирать темпы и после 2001 года, когда Джинспарг покинул Стэнфорд ради профессорства в Корнеллском университете. Именно тогда его детище получило свое нынешнее славное имя arXiv. В сентябре 2011 года репозиторий полностью перешел в ведение сотрудников университетской библиотеки.

arXiv.org уже давно превратился в информационный центр планетарного масштаба. К двадцатилетнему юбилею (августу 2011 года) он накопил почти 700 тыс. текстов, ежегодно получал порядка 75 тыс. новых материалов и каждую неделю обслуживал около 400 тыс. пользователей. Сейчас среднее ежемесячное количество новых поступлений превышает 10 тысяч, а общий объем архивированных материалов на конец ноября 2017 года превысил 1,3 миллиона.

Однако успехи репозитория не исчерпываются этой впечатляющей статистикой. Он стал мощным фактором демократизации науки, а также значительно способствовал быстрому распространению новых научных идей и методов и улучшению компьютерной грамотности пользователей. Вопреки некоторым пессимистическим прогнозам, его работа не обернулась ухудшением качества научных исследований.

Большая часть архивируемых препринтов со временем находит место в престижных журналах, а доля сомнительных материалов составляет меньше одного процента. Хотя репозиторий, как и раньше, обходится без рецензентов, у него есть сотни добровольных помощников, которые просматривают и рубрифицируют поступающие материалы. Важно, конечно, что arXiv существует на фоне нормальных журналов с рецензированием. Основная масса значимых статей выходит в журналах, при этом маркер «статья принята в такой-то престижный журнал» — один из ключевых для читателей архива. В общем, arXiv не только исполнил значительную роль в революционном обновлении информационных технологий науки, но и способствовал прогрессивной трансформации ее социальной структуры.

Алексей Левин

1. Левин А. Новый виток науки о космосе: пришествие многоканальной астрономии // ТрВ-Наука, № 242 от 21 ноября 2017 года.

Exit mobile version