Канн С.К. Модели развития библиотечных сайтов в свете вебометрики
Навигация
«11-е Макушинские чтения» | ОГЛАВЛЕНИЕ СБОРНИКА  
 
Обложка
 
УДК 02:004.738.1
 
DOI 10.20913/2618-6691-2018-14-125-137
 
Модели развития библиотечных сайтов
в свете вебометрики
 
Сергей Константинович Канн
кандидат исторических наук, старший научный сотрудник отделения Государственной публичной научно-технической библиотеки Сибирского отделения Российской академии наук (Новосибирск)
В данной статье рассматриваются четыре коммуникативные модели развития библиотечных сайтов, описывающие способы их продвижения и взаимодействия с внешней средой. Проведенная типологизация моделей позволяет разработать индивидуальные планы действий и необходимые рекомендации по наращиванию и продвижению веб-ресурсов, а также по повышению эффективности библиотечного обслуживания в интернете.
 
Ключевые слова: библиотечный сайт, эффективные модели развития, продвижение, веб-ресурсы, индикаторы развития, вебометрика, веб-аналитика, библиотеки Сибири и Дальнего Востока.
 
This article discusses four communicative models of library sites development, describing the ways of their promotion and interaction with the external environment. The typology of these models allows us to develop individual action plans and necessary recommendations for building up and promoting web resources, as well as for improving the efficiency of library services in the Internet.
 
Keywords: library website, effective models of development, promotion, web resources, development indicators, webometrics, web analytics, libraries of Siberia and the Russian Far East.

Среди разных атрибутов, описывающих специфику сайтов, особый интерес представляют способы их взаимодействия с внешней средой – своего рода коммуникативные модели поведения, объективно складывающиеся в процессе эволюции. Очевидно, что в настоящее время, в силу объективно-исторических причин, еще преждевременно говорить о каких-то осмысленных «стратегиях» развития библиотечного интернета и о достижении каких-либо заранее намеченных целей.

Прежде всего стоит отметить, что только единицы сайтов декларируют понятную и ясно сформулированную «политику» развития. Очевидно, что ее реализация – это вопрос особый, и в рамках данной статьи мы его разбирать не будем. Но помимо этого есть еще одно обстоятельство, препятствующее выработке долговременной стратегии, – быстрая эволюция самой сети. Вместе с ней меняются инструменты, технологии, условия привычного бытования сайтов. В результате любые попытки постулировать некую устойчивую «стратегию» развития библиотечного веба устаревают так же быстро, как и появляются. Рациональный взгляд на проблему подсказывает, что в данный момент можно стремиться лишь к тому, чтобы выработать более эффективные подходы к развитию интернета в библиотеках.

В данном случае большую практическую пользу могла бы принести типологизация существующих моделей библиотечных сайтов. Рассматривая такое моделирование как основу для создания планов в условиях неопределенности, можно корректировать цели сетевого развития, повышать эффективность его отдачи. При этом для изучения количественных и качественных аспектов управления веб-ресурсами можно привлекать весь арсенал имеющихся и новых средств вебометрики, ориентированной на технологии будущего.

С учетом названных обстоятельств, начиная с осени 2015 г. мы проводили разностороннее исследование библиотечных сайтов с целью собрать различные метрики их развития (открытые данные о размере и динамике обновления, источниках и структуре трафика, аудитории, посещаемости, времени и глубине просмотра страниц и пр.). Затем, после выявления некоторых закономерностей развития, можно было создать примерную типологию библиотечных сайтов, основываясь на определенных критериях и схожести характеристик. Для сбора данных использовались бесплатные инструменты SEO-анализа и вебометрики, позволяющие по единой схеме провести массовую оценку индикаторов сразу у многих сайтов.

В частности, привлекались онлайновые инструменты XTool (xtool.ru), позволяющие проводить регулярный мониторинг и SEO-аудит сайтов. Средства XTool взаимодействуют с инструментами «Яндекса» и получают от него информацию об индексации ресурсов (визуализируется на графиках), о скорости обновления страниц, показателях тИЦ (тематического индекса цитирования) и других метриках (табл.1). XTool может извлекать и воспроизводить сведения о ключевых словах, приводящих пользователей на сайты.

Таблица 1
Веб-метрики сайтов центральных научных библиотек
по данным XTool и Яндекса на 25.01.2018 г.
 
БиблиотекаURLВозраст сайта (дней / лет)Страниц на
сайте (Яндекс)
Скорость
обновления
(страниц в сутки)
тИЦ
РГБ   rsl.ru7414 / 20,353 228 0,80
ГПНТБ России   gpntb.ru7479 / 20,535 688 0,044100
РНБ   nlr.ru7422 / 20,37 814 669 0,015300
БЕН РАН   benran.ru5686 / 15,624 299 0,592600
ГПНТБ СО РАН   spsl.nsc.ru7287 / 20,027 066 0,022300
ГПИБ   shpl.ru7141 / 19,62 831 1,231500
ЦНМБ   scsml.rssi.ru7593 / 20,8142 02200
НПБ   gnpbu.ru6873 / 18,8294 0,192000
Вологодская ОУНБ   booksite.ru6611 / 18,1399 185 0,173000
Отделение ГПНТБ СО РАН   prometeus.nsc.ru7443 / 20,432 631 0,012100

Кроме того, XTool в режиме онлайн проверяет внешние ссылки (backlinks) с любого сайта и генерирует полный список с указанием позиций ссылок, URL доноров и акцепторов, тИЦ доноров, уровня вложенности страниц и анкоров. Одновременно система оценивает степень доверия к сайту и «авторитетность» ресурсов (траст XT). Хорошие, «трастовые», ресурсы получают XT = 8-10, «середняки» – 4-7, а некачественные и откровенно плохие сайты – ниже 3. Правда, надо подчеркнуть, что эта оценка – чисто технологическая, то есть связанная исключительно с процедурами SEO-оптимизации. Она имеет мало общего с критериями библиотечной оценки контента.

Самая существенная часть показателей внешнего трафика, посещаемости и веб-аудитории была получена с помощью вебометрической платформы SimilarWeb, созданной еще в 2009 г. Этот инструмент позволяет структурировать трафик сайтов по его источникам – прямому, ссылочному (реферальному) и поисковому, а также по заходам из социальных сетей и почтовых рассылок. Во всем мире SimilarWeb широко используется для выполнения разнообразных бизнес-исследований и глубокого вебометрического анализа данных. О возможностях системы говорит хотя бы тот факт, что она обрабатывает до 5 миллиардов событий в сутки без существенного ущерба для точности данных.

В процессе работы по сбору вебометрических данных о сайтах библиотек мы сформировали две выборки. В первую вошли сайты центральных научных библиотек, извлеченные из top-10 «Яндекс-Каталога» (представлены в табл.1). Во второй выборке были собраны 26 сайтов региональных библиотек Сибири и Дальнего Востока, выявленные из самых разных источников, включая и профессиональный справочник ГПНТБ СО РАН «Научные библиотеки Сибири и Дальнего Востока (областные, краевые, национальные, окружные универсальные)» [1].

Отдельно по каждой выборке определялись максимальные и минимальные значения показателей, а затем в границах найденных интервалов каждая выборка делилась на четыре группы, сходные по параметрам развития. Таким образом стало возможно, хотя бы в первом приближении, получить типологию библиотечных сайтов, сгруппированных по некоторому способу существования этих сайтов в веб-среде. Разумеется, включение каждого сайта конкретно в одну из «моделей развития» очень условно и, как будет показано ниже, не лишено изъянов. Тем не менее проведенное нами деление позволяет судить как о некоторых важных тенденциях, так и о свойствах сайтов, полезных для их самоидентификации.

В качестве главного критерия группировки был выбран способ взаимодействия сайтов с внешней средой – то есть преобладающие для каждого сайта структура и источники веб-трафика, включая трафик из социальных сетей. Понятно, что метрики, полученные от сайтов центральных библиотек, заметно отличаются от таковых же у небольших и сравнительно молодых региональных сайтов Сибири и Дальнего Востока. Так, например, сильно разнятся имеющиеся данные о размерах сайтов. Даже у центральных библиотек число страниц на сайтах может различаться на порядки (от полутора сотен у ЦНМБ до 8 млн у РНБ (см. табл.1). Кроме того, бросается в глаза большой разброс цифр в индексах поисковых систем по каждой библиотеке в отдельности. Причины такой нестабильности подробно разобраны в аналитической статье по вебометрике академических институтов РАН [1, с.1018-1021].

В таблице 2 представлены критерии группировки и отнесения сайтов к некоторым моделям развития, выработанные в процессе исследования. Точного совпадения проектированной схемы с реальностью, естественно, не получилось, особенно у региональных библиотек. Да и трудно было ожидать чего-то другого в таком изменчивом деле, как развитие интернета. Однако данный шаблон послужил некоторым ориентиром в проведенной работе.

Таблица 2
Критерии группировки библиотечных сайтов по структуре трафика
 
МодельИсточники трафика (%)
поискссылкисоцсети
Ц*РЦРЦР
Поисковаявыше 75выше 755-100-52-30-2
Реферальная25-4030-50выше 20выше 150-20-2
Социальная40-5050-7015-2010-15выше 5выше 2
Диверсифицированная50-7570-8010-155-103-52
*Ц – центральные библиотеки; Р – библиотеки Сибири и Дальнего Востока.

Весьма условная группировка и дальнейший анализ позволили разработать четыре ведущих модели библиотечных сайтов:

  1. поисковую;
  2. реферальную (ссылочную);
  3. социальную;
  4. переходную (диверсифицированную).

У первых двух отчетливо видны противоположные подходы к генерации трафика с точки зрения открытости и закрытости представленной информации. У остальных наблюдается сбалансированное распределение визитов по всем источникам трафика. Из них развитая социальная модель эволюционирует, главным образом за счет продвижения ресурсов в социальных сетях, уделяя большое внимание созданию новых продуктов и услуг. А диверсифицированная модель, по существу, является переходной ступенью от открыто-закрытых форм сайтов (№ 1-2) к развитой социальной модели (№ 3).

В рамках первой модели доминирующим источником трафика является органический поиск, то есть приход пользователей из поисковых выдач «Яндекса», «Гугла» и других поисковиков. Ресурсы таких сайтов свободно индексируются поисковыми машинами и без излишне затянутых процедур (аутентификации, настройки сессий) предоставляются всем пользователям. Это и позволяет назвать эту модель открытой, так как она базируется на открытой индексации страниц, статическом коде и сессиях вида open access.

Вторая модель опирается на пользователей, приходящих на сайт преимущественно по ссылкам. Главным источником трафика для подобного «закрытого» сайта [2], как и главным фактором роста его посещаемости, являются известные, тематически близкие ему «доноры» ссылок. Как правило, сайты такого типа сокращают до минимума ту часть своего трафика, которая связана с поисковыми и социальными источниками. В то же время постоянно растущую часть визитов (до 20-50% и более) начинают занимать рефералы [3] и прямые заходы на сайт с «домашних» страниц, закладок и вводов URL. Сайт как будто «изолируется» от внешнего мира, переходя в автономный режим «только для своих», хорошо знакомых гостей.

Третья модель носит самый продвинутый характер. Ее можно охарактеризовать как открытую общественную модель с развитой ссылочной частью трафика и очень высокой долей визитов из социальных сетей. Библиотечные сайты этого типа являются результатом длительного и устойчивого развития. Они отличаются большой клиентской базой, стабильным и надежным трафиком, широкими технологическими возможностями, разнообразными веб-ресурсами с большим количеством специализированных баз данных и коллекций полнотекстовых документов.

Наконец, четвертая модель характеризуется распределенной и не всегда устойчивой структурой всех видов трафика – прямого, ссылочного, поискового и социального [4]. При этом крупные, давно существующие сайты центральных библиотек способны сохранять относительную стабильность в течение долгого времени, тогда как региональные сайты часто мигрируют в соседние группы – к более продвинутой социальной (№ 3) или к абсолютно «закрытой» реферальной (№ 2) модели. По многим материально-техническим и организационным причинам им трудно поддерживать длительную устойчивость, поэтому их показатели наиболее изменчивы.

Разбиение десятки сайтов центральных научных библиотек по источникам трафика выделило по три поисковых и переходных модели и по две реферальных и социальных (табл.3).

Таблица 3
Группировка сайтов десяти центральных научных библиотек*
 
URLПоиск (%)Ссылки (%)Соцсети (%)Прямой (%)
1) поисковая модель
  spsl.nsc.ru81,034,740,6613,34
  gnpbu.ru72,725,372,319,1
  booksite.ru77,935,862,3113,51
2) реферальная модель
  benran.ru35,6433,650,6530,06
  scsml.rssi.ru28,9921,92,147,01
3) социальная модель
  nlr.ru49,1318,573,8726,32
  shpl.ru45,1218,616,5927,43
4) переходная модель
  rsl.ru62,4111,892,1322,05
  gpntb.ru69,4610,40,8217,52
  prometeus.nsc.ru73,1410,913,5212,43
 *По данным, полученным от SimilarWeb 25.01.2018 г.

Подчеркнем еще раз, что распределение сайтов по названным группам весьма условно и относится только к одной стороне их функционала, а именно, к структуре трафика. При этом границы групп крайне размыты и непостоянны. Длительный мониторинг за ряд лет выявил способность сайтов не только наращивать, но и терять накопленный «вес» показателей. Тем не менее результаты выполненной работы позволяют видеть некоторые закономерности и прогнозировать будущие тенденции (переходы сайтов от одного типа развития к другому).

Более детальный анализ показателей посещаемости, несмотря на некоторый разброс цифр в пределах групп, показывает схожесть ключевых характеристик по каждой модели (табл.4).

Таблица 4
Показатели посещаемости сайтов центральных научных
библиотек по оценке SimilarWeb от 25.01.2018 г.
*
 
URLВизитов
(в месяц)
Время на
сайте
Глубина
(страниц)
Доля
отказов (%)
  spsl.nsc.ru219 400     3:252,2762,79
  gnpbu.ru118 870     2:063,7656,33
  booksite.ru659 740     1:051,8975,91
среднее по 1-й модели332 670     2:122,6465,01
  benran.ru *4 600     1:383,5440,60
  scsml.rssi.ru *18 400     0:441,4332,80
среднее по 2-й модели11 500     1:112,4936,70
  nlr.ru370 280     5:296,9344,21
  shpl.ru212 520     5:0317,3648,19
среднее по 3-й модели291 400     5:1612,1546,20
  rsl.ru1 770 000     3:255,2559,36
  gpntb.ru113 910     1:452,7157,45
  prometeus.nsc.ru *31 300     0:371,4650,20
среднее по 4-й модели638 400     1:563,1455,67
 *По трем отмеченным сайтам использованы данные за 30.10.2017 г.

Последняя оценка метрик посещаемости с помощью SimilarWeb от 25.01.2018 г. не позволила получить данные по трем сайтам (БЕН РАН, ЦНМБ и Отделения ГПНТБ СО РАН). По этой причине в таблицу 4 включены более ранние замеры сайтов за октябрь 2017 г. В каком-то смысле, они должны быть менее полными, чем январские, так как, например, данные SimilarWeb по источникам трафика у Отделения ГПНТБ СО РАН за 25.01.2018 г. заметно улучшились, что позволило сайту переместиться из группы поисковых (1-я модель) в группу диверсифицированных (4-я модель). Показатели поискового трафика prometeus.nsc.ru за три месяца снизились на 2,76% (с 75,9 до 73,14%). В то же время реферальный трафик увеличился на 1,71% (с 9,2 до 10,91%), а социальный – на 2,7% (с 0,82 до 3,52%). Исходя из этой оценки, все показатели, внесенные в таблицу 4 по трем названным библиотекам, также должны были улучшиться.

Здесь бросаются в глаза высокие метрики глубины просмотра и времени присутствия у сайтов 3-й (социальной) модели и низкий уровень отказов у 2-й (реферальной) модели. Оба результата вполне объяснимы с точки зрения способов, по которым идет развитие. «Социальные» сайты РНБ и ГПИБ располагают большим объемом качественных полнотекстовых ресурсов, отличаются скоростью обновления и эффективным продвижением в социальных сетях (табл.1, 3). С другой стороны, специфика сайтов «реферального» типа (БЕН РАН, ЦНМБ), выраженная в их ресурсной базе, навигации и веб-аудитории, усиливает прямой и ссылочный трафик (табл.3), а он, в свою очередь, подразумевает множественность переходов, не связанных с одной страницей.

Во второй выборке сайтов региональных библиотек Сибири и Дальнего Востока исследование выявило намного более пеструю и малопредсказуемую картину, чем у центральных библиотек. Сбор показателей, как и по первой выборке, производился с интервалом в три месяца – 30.10.2017 и 25.01.2018 г. Но данные за январь обнаружили не только значительные колебания по ряду параметров, но и совершенно необъяснимые «всплески» значений отдельных метрик, прежде всего в сфере социального трафика.

Известно, что взаимодействие с социальными сетями крайне противоречиво и может быть как позитивным, так и негативным, что, по мнению С.Ю.Комарова, может исказить картину доступов к сайтам научных библиотек [2]. Вместе с тем согласимся, что «сегодня социальные сети постепенно превращаются в своеобразные поисковые системы, так как многие пользователи с их помощью проводят поиск информации» [3, с.11]. Для развития сайтов социальный трафик считается наиболее перспективным.

В нашей схеме критериев группировки (табл.2) его высокий уровень определяет отнесение сайтов к 3-й социальной модели. С учетом влияния этого фактора, а также того, что работа библиотек, а следовательно, и отражающая ее веб-статистика в январе не носят репрезентативного характера, было решено провести группировку сайтов региональных библиотек по более стабильным данным, полученным 30.10.2017 г. (табл.5).

Таблица 5
Группировка сайтов научных библиотек Сибири и Дальнего
Востока по данным SimilarWeb от 30.10.2017 г.
 
Нахождение
библиотеки [URL]
Страниц на
сайте (Яндекс)
Поиск (%)Ссылки (%)Соцсети (%)
 
1) поисковая модель
  Анадырь [library-chukotka.ru]626     63,782,01     2,01
  Биробиджан [bounb.eao.ru]19 092     86,715,37     0,10
  Магадан [mounb.ru]1 070     76,573,05     1,88
  Петропавловск-Камчатский [kamlib.ru]1 695     79,743,72     0,54
  Тюмень [tonb.ru]34 064     91,42,76     0,02
  Ханты-Мансийск [okrlib.ru]4 980     77,553,46     0,90
  Чита [zabunb.ru]1 517     76,763,43     1,61
2) реферальная модель
  Кемерово [kemrsl.ru]27 034     54,9917,73     0,52
  Кызыл [lib.rtyva.ru]265     81,2518,75     0,00
  Новосибирск [ngonb.ru]18 699     53,8921,35     2,38
  Омск [omsklib.ru]4 929     37,5126,04     6,13
  Салехард [libraries-yanao.ru]3 939     54,4422,87     1,41
  Якутск [nlrs.ru]14 585     50,5021,04     1,90
3) социальная модель
  Абакан [nbdrx.ru]14 186     54,5113,93     2,95
  Барнаул [akunb.altlib.ru]50 271     80,515,85     3,41
  Иркутск [irklib.ru]39 505     52,6812,6     3,47
  Сургут [slib.ru]2 247     73,079,06     3,49
  Томск [lib.tomsk.ru]7 344     64,1613,56     2,80
4) переходная модель
  Благовещенск [libamur.ru]7 638     63,374,21     1,24
  Владивосток [pgpb.ru]1 453     72,448,01     1,93
  Горно-Алтайск [nbra.ru]2 912     74,1914,38     0,56
  Красноярск [kraslib.ru]2 664     74,549,43     1,05
  Нижневартовск [mubis.ru]6 924     77,5011,31     0,19
  Улан-Удэ [nbrb.ru]3 817     75,096,52     0,36
  Хабаровск [fessl.ru]2 711     72,8114,55     1,80
  Южно-Сахалинск [libsakh.ru]12 749     72,756,79     0,78

Из таблицы 5 видно, что для сайтов научных библиотек Сибири и Дальнего Востока не существует правил без исключений. Так, Национальная библиотека Республики Тыва (lib.rtyva.ru) попала во вторую (реферальную) группу с необычайно высоким поисковым трафиком, а Омская областная научная библиотека (omsklib.ru) в той же самой группе отличилась высоким показателем социального трафика. Следовательно, в отношении региональных сайтов отбор, сделанный по какому-то одному формальному признаку (например, по доминированию одного из источников трафика) совершенно не исключает присутствия аномальных значений по другим параметрам – вопреки схеме, представленной в таблице 2.

В каждой группе можно выделить, условно говоря, типичных представителей своего направления. Для поисковой модели – это Тюменская областная библиотека (tonb.ru), для реферальной – Национальная библиотека Республики Саха (Якутия) (nlrs.ru), для социальной – Иркутская областная библиотека (irklib.ru) и для «смешанного» типа – библиотеки Владивостока (pgpb.ru) и Красноярска (kraslib.ru).

Сильная зависимость региональных сайтов от организационно-технических условий и административных решений обусловливает большую изменчивость метрик и непрерывную миграцию сайтов из одной группы в другую. При этом генерация новых ресурсов как бы уходит на второй план, не играя решающей роли для развития большинства из региональной выборки. Более того, проведенные замеры обнаружили, что некоторые сайты, видимо, даже не архивируют свой контент и периодически избавляются от части страниц. При очередных замерах размер таких сайтов оказывался меньше предыдущего. Наверное, последующий мониторинг может принести еще немало сюрпризов.

В завершение статьи отметим, что моделирование развития библиотечных сайтов показало возможности вебометрики для создания типологии сайтов, основанной на анализе структуры их трафика. Будущие прогнозы развития сайтов библиотек могут опираться на выявленные тенденции перехода сайтов от простых поисковых и «закрытых» реферальных моделей ко все более сложным и открытым социальным моделям. Выработанный подход и использованные инструменты позволят разрабатывать конкретные меры для развития и продвижения новых библиотечных ресурсов и услуг, достигая при этом наиболее эффективных результатов.

 

Примечания

[1] Западная Сибирь. URL: http://www.spsl.nsc.ru/win/zap_sbr.htm;
Восточная Сибирь. URL: http://www.spsl.nsc.ru/win/vost_sbr.htm;
Дальний Восток. URL: http://www.spsl.nsc.ru/win/daln_vostk.htm (дата обращения: 16.02.2018 г.).
[2]В случае некоторых библиотечных сайтов можно говорить даже о своего рода «изоляционизме» и закрытости от внешнего мира.
[3]Мы используем расширительную трактовку этого термина (от англ. to refer – посылать, направлять) – как всякого посетителя, приходящего на сайт по внешним ссылкам. Вместе с тем главное, более узкое значение термина отсылает к зарегистрированным пользователям разного рода коммерческих проектов, участвующим в реферальных программах, приносящих денежный доход.
[4]В случае прямого (direct) трафика, как правило, речь идет о внутренних заходах сотрудников и читателей с компьютеров библиотеки или по ранее сделанным закладкам в браузерах.
 

Список литературы

[1] Косяков Д.В., Гуськов А.Е., Быховцев Е.С. Академические институты России в зеркале вебометрики // Вестн. Рос. акад. наук. 2016. Т.86. № 11. С.1015-1025.
[2]Комаров С.Ю. «Позитивный» и «негативный» внешний трафик из социальных сетей к сайтам научных библиотек // Информационные технологии в гуманитарных исследованиях. Новосибирск, 2017. Выпуск 22: Очерки по науковедению. С.128-134.
[3]Третьякова О.В., Маковеев В.Н., Чугреев В.Л. Повышение посещаемости веб-сайтов научной организации и их продвижение в сети Интернет // Социал. пространство. 2016. № 5. С.1-19.
 

Опубликовано: Одиннадцатые Макушинские чтения: материалы науч. конф. (Томск, 29-30 мая 2018 г.). - Новосибирск, 2018. - С.125-137: табл. - Библиогр.: с.137 (3 назв.).
 
XI Макушинские чтения | Презентация доклада | Статья в pdfПубликацииПубликации С.Канна
[О библиотеке | Академгородок | Новости | Выставки | Ресурсы | Библиография | Партнеры | ИнфоЛоция | Поиск | English]
  Пожелания и письма: branch@gpntbsib.ru
© 1997-2024 Отделение ГПНТБ СО РАН (Новосибирск)
Статистика доступов: архив | текущая статистика
 

Документ изменен: Wed Feb 27 14:57:30 2019. Размер: 68,134 bytes.
Посещение N 2175 с 04.06.2018