С.Рябчук. Живая статистическая машина
"Независимая
газета", 28.11.07 (приложение "НГ Наука")
В России создан
новый открытый национальный ресурс-индекс цитирования научных статей
Индекс цитирования - принятая в научном мире мера значимости научной работы какого-либо ученого или научного коллектива. Величина индекса цитирования определяется количеством ссылок на публикацию или фамилию автора в других источниках. Однако для точного определения значимости научных трудов важно не только количество ссылок на них, но и качество этих ссылок. На статью может ссылаться авторитетное академическое издание, популярная брошюра или развлекательный журнал. Значимость у таких ссылок разная.
Для расчетов индекса цитирования приходится создавать мощную поисковую систему, которая использует свои алгоритмы для подсчета индекса цитирования. В индексе цитирования заинтересованы ученые и студенты, чиновники, управляющие научными программами и издатели, издающие книги, научные и производственные журналы. Без индексов цитирования трудно себе представить наукометрию - дисциплину, занимающуюся статистикой науки в ее живом развитии.
Неустранимый английский акцент
На мировом рынке научной информации представлены два мощных международных индекса цитирования. Это давно уже ставший известным англоязычный продукт Института научной информации в Филадельфии Web of Science (бывший ISI), который мониторит более 8700 изданий на английском и отчасти на немецком языках. И его конкурент, молодой и агрессивный индекс компании Elsevier под названием Scopus. Его объем обработки более 15 000 действующих журналов. И в первой, и во второй базе данных явно доминируют публикации на английском языке, издания на других европейских языках представлены в этих индексах скорее точечно и не отражают весь национальный публикационный поток. Пользующийся заслуженным международным авторитетом Web of Science играет ключевую роль в мире науки, однако есть в нем нечто такое, что многих не до конца устраивает. Это "нечто" - английский язык. Для попадания в него надо писать и публиковать статьи по-английски. Но вот, например, китайцы или японцы вовсе не собираются все публиковать по-английски. Так же думают многие французские, испанские или российские авторы. Кроме простого удовольствия писать и читать на родном языке, есть и другие соображения. Гуманитарная часть науки, например, вообще плохо переводима. Научные работы по социальным наукам обращены к нуждам того общества, на языке которого они с ним разговаривают.
Это осознано многими культурами, которые целенаправленно защищаются от англоязычного давления. Именно поэтому достойные национальные индексы цитирования есть в Японии и в Китае. Но на пути создания национальных индексов цитирования есть успехи, есть и неудачи. Неудачей, например, закончилась попытка испанцев создать национальный индекс научного цитирования. Причины разные - от отсутствия финансирования до слабой квалификации специалистов. А ведь это была очень заманчивая задача - охватить весь научный испано-язычный мир.
А теперь - на русском
В 2005 году Федеральное агентство по науке и инновациям (Роснаука) объявило конкурс "Разработка системы статистического анализа российской науки на основе данных Российского индекса цитирования". Конкурс проводился в рамках федеральной целевой научно-технической программы "Исследования и разработки по приоритетным направлениям развития науки и техники". Весной 2005 года, одержав победу в этом конкурсе, Научная электронная библиотека (НЭБ) подписала с Роснаукой контракт N 02.447.11.7001 и стала головным исполнителем проекта по созданию Российского индекса научного цитирования (РИНЦ).
РИНЦ - это весьма амбициозный проект. Его цель - систематическое продвижение в сети интернет российских научных изданий. Он накрепко завязан на создание национальной библиографической базы данных по научной периодике, с разработкой инструментария и сервисов для аналитики, науко- и библиометрических исследований, а также индексов и цифровых показателей для измерения результатов научной деятельности.
Сегодня можно сказать: эта задача решена. РИНЦ рожден, явлен публике в декабре 2006 года, и он работает. Вход в РИНЦ бесплатный: достаточно пройти персональную регистрацию на eLIBRARY (опять-таки бесплатную) - и индекс перед вами. Почему бесплатный? Ведь хорошо известно, что англоязычные индексы цитирования стоят очень хороших денег. Именно поэтому. Подписка на WEB Of Science, Scopus стоит многие тысячи долларов, цена слишком высокая для научных организаций в России. Другая мысль сделать ресурс бесплатным и профинансировать его из средств программы заключалась в том, что государство через свои уполномоченные институты само заинтересовано в правильном понимании ситуации в науке.
"Должен оцениваться уровень научных исследований, - заявил в одном из своих интервью министр образования и науки РФ Андрей Фурсенко. - Причем критерии хорошо известны в мировой науке. Среди них - число публикаций и индекс цитирования научных статей. В России объем ассигнований на науку за 8 лет вырос в 2 раза в сопоставимых ценах, но число публикаций снизилось с 18 тысяч до 14 тысяч в год. Доля публикаций российских ученых в мировой научной прессе - 2,4%, но по индексу цитирования мы стоим ниже - 0,85%. По числу публикаций российская наука находится на 9-м месте, по индексу цитирования - на 15-м. Но самый грустный показатель другой - 120-е место в мире по числу ссылок на одну опубликованную статью".
В приведенной министром статистике содержится и хорошая новость. "Недоцитируемость" отечественных ученых и организаций происходит не только оттого, что их результаты недостаточно интересны. А еще и потому, что отсутствует доступный национальный индекс цитирования.
По пути в электронный рай
Специалисты знают: в англоязычных индексах цитирования очень слабо представлены российские журналы. В редакции 2005 года знаменитый продукт Томсона Journal Citation Reports представлял 113 отечественных периодических изданий. Причем если в точных и естественных науках их было хотя бы 107, то общественно-научная часть была представлена всего шестью наименованиями. И это при том, что в России выходит около 3400 научных и научно-производственных изданий. Сейчас, когда РИНЦ уже создан, он "расписывает" более 1000 отечественных журналов - треть. И это очень большой успех. Индексы цитирования сильны именно количеством наименований, потому что это принципиально статистические машины. Это первое их свойство. А второе - индекс научного цитирования - это развивающая рынок машина. Она вынуждает перестраивать рынок научной периодики. И даже саму науку подвигает к более мобильному образу действий. Ведь РИНЦ изначально был задуман как база данных и поисковик, способный обеспечить "ковровое", полноценное покрытие отечественного научного пространства. Сделать это возможно, только используя мощности IT-технологий. И тут обнаружилось, что лишь третья часть русскоязычных журналов готова предоставлять свои статьи в электронном виде. Остальные просто привыкли публиковаться на бумаге в надежде, что некто этот бумажный продукт где-то почему-то найдет и прочитает.
Неожиданно обнаружилось, что даже рутинная процедура перевода научных результатов в электронный формат - едва ли самая острая задача российской научной периодики. Между тем среднее число библиографических ссылок на печатную статью - 2,74; среднее число ссылок на бесплатную электронную версию - 7,3. То есть в 2,6 раза больше, чем на печатную. Электронные статьи цитируются в 4,5 раза чаще печатных и это соотношение быстро возрастает. Присутствие РИНЦ на поле научных публикаций скоро вынудит издателей дополнять бумажный формат научных изданий электронными версиями. Но не только. РИНЦ меняет картину цитирования и указывает доступ к источнику, то есть меняет скорость обмена научной информацией в этой все еще слишком "вязкой" российской научной среде.
Изменение скорости научного информационного обмена - одно из принципиальных свойств хорошо построенного индекса цитирования. В задорно названной работе "Если этого нет в WWW, этого вообще не существует", опубликованной еще в 1997 году, написано: "...статья, недоступная в электронном формате, становится как бы статьей второго сорта не потому, что она худшего качества, а потому, что люди предпочитают доступность вещей, которые они могут получить прямо сейчас". (Rayburn S and E. N. Bouton. "If it's not on the Web, it doesn't exist at all": Electronic information resources - Myth and reality. 1997)
Наукометрия - из статистики
Как всякая хорошо задуманная и реализованная информационная система, Российский индекс научного цитирования обнаруживает новые полезные свойства. В него встроен модуль статистики. Это значит, что при его бесплатности он тем не менее просит входящего зарегистрироваться. То есть РИНЦ отслеживает, кто, когда и по какому запросу обращается к индексу. Это дает массу преимуществ - издателям, например. Войдя в систему, они могут видеть, какие научные издания вызывают интерес, а какие нет. Ученые тоже видят динамику обращений. Они понимают, какие издания становятся престижными, то есть в них стоит публиковаться, а какие сходят. Встроенный блок статистики позволяет видеть закольцованные цитирования, когда один и тот же коллектив варится в своем соку и ссылается на свои же работы. Становится ясно также, кто из зарубежных коллег ссылается на работы наших ученых.
Тут-то, правда, и начинается то, что вызывает горячие споры в научной среде. Ведь из статистики вырастает наукометрия. А из ее выводов следуют решения по финансированию научных организаций. РИНЦ заказывался государством и заранее задуман и разработан так, чтобы в нем зашивались большие сведения, чем в традиционных индексах цитирования.
Например, отправив в РИНЦ поисковый запрос с местом работы автора, можно получить список его сослуживцев. Упорядоченный по числу публикаций, он даст возможность увидеть наиболее продуктивных коллег, а по числу цитирований - наиболее цитируемых.
В РИНЦ поддерживается, например, различение между текущим местом работы ученого и той организацией, в которой он работал на момент написания статьи. Эта непростая задача различения решена, и можно получить список статей (и их цитирований), подписанных той или иной организацией, "по праву" принадлежащих ей.
Рейтинг цитирования авторов неизбежно приводит и к рейтингу научных изданий. Так же, как для отдельного автора или научного коллектива, можно вывести рейтинг российских журналов. Он может быть общим или сведенным к отдельной тематике, упорядоченным по общему числу полученных журналом цитирований. Можно выстраивать издания по "импакт-фактору РИНЦ" - показателю, повторяющему соответствующий индикатор ISI.
Конечно, такая наукометрия немедленно вызывает протест. Если есть возможность видеть, какая группа, лаборатория, кафедра эффективно работает, а какая жует и самоцитирует работы десятилетней давности, это не всем нравится. РИНЦ с самого начала задумывался как многоуровневая поисковая машина на технологической платформе "Научной электронной библиотеки" eLIBRARY.RU. Это известная в научном мире библиотека, еще с 1998 года она начала размещать научные издания. К настоящему времени на ней размещены архивы более 6, 5 тыс. журналов ведущих зарубежных издательств. Это ценно: такой ресурс позволяет привязывать ссылки не только к российским, но и зарубежным источникам. Автор любой научной публикации может отыскать в РИНЦ свою работу и сразу увидеть, сколько раз цитировалась эта его работа в статьях других авторов. Это простейшая часть электронного сервиса. Но РИНЦ предоставляет и услугу более высокого информационного уровня: список всех статей, включенных в базу РИНЦ, в которых цитируется или имеется ссылка на ваши работы. Но и это еще не все. Поскольку в "Научной электронной библиотеке" на eLIBRARY.RU в полном тексте представлены более 300 журналов (причем половина из них - в открытом доступе), появляется хороший шанс сразу посмотреть публикацию, в которой содержится ссылка на вашу работу.
* * *
Что дальше? В близкой перспективе - появление дополнительных сервисов, ориентированных не только на российского пользователя. Например, поиск по различным вариантам транслитерации русских фамилий. Или автоматизированный расчет публикационной составляющей показателя результативности научной деятельности, который учитывается при определении академических надбавок для российских ученых.
Значительно увеличивается и полнотекстовая коллекция российских журналов. В марте 2007 года был подписан контракт с компанией Pleiades Publishing. А это значит, что скоро среди изданий, доступных через РИНЦ, появятся дополнительно 78 подписных журналов издательства "Наука". Следующий шаг - за электронными версиями книг.