Канн С.К. Методологические подходы к оценке посещаемости библиотечных сайтов
Навигация
«БИБЛИОТЕКИ В КОНТЕКСТЕ ТРАНСФОРМАЦИЙ» | ОГЛАВЛЕНИЕ СБОРНИКА  
 
 
Обложка
 
 
УДК 02:004.738.1:001.8
 
DOI 10.20913/2618-7515-2018-2-252-263
 
Методологические подходы к оценке посещаемости библиотечных сайтов
 
Сергей Константинович КАНН
 
канд. ист. наук, старший научный сотрудник лаборатории развития электронных ресурсов, Государственная публичная научно-техническая библиотека Сибирского отделения Российской академии наук, Новосибирск
 
Предлагаются методологические подходы к оценке посещаемости сайта научной библиотеки и мониторингу использования библиотечных веб-ресурсов. Принципиальное значение отводится целям изучения веб-статистики, накладывающим отпечаток на полноту сбора и анализа данных. Единство терминологии, инструментария и методических подходов позволяет сравнивать цифровые показатели различных сайтов.
 
Ключевые слова: сайт научной библиотеки, веб-аналитика, метрики посещаемости, методология оценки.
 
Methodological approaches to assessing the attendance of the scientific library site and monitoring the use of library web resources are proposed. Fundamental importance is given to the objectives of studying web statistics, which affect the completeness of data analysis. Consistency of terminology, tools and methodological approaches makes it possible to compare digital indicators of different websites.
 
Keywords: scientific library website, web analytics, attendance metrics, assessment methodology.

Проблема учета производственных показателей библиотечных сайтов год от года становится все более насущной. И дело здесь не столько в необходимости предоставления отчетности органам управления, сколько в усложнении всего библиотечного интернет-хозяйства. Сайты библиотек, длительное время развивавшиеся достаточно стихийно, в какой-то момент почувствовали дефицит. эффективности и рациональности своего развития. Очевидно, что переход на более высокий уровень сайтостроения должен опираться не только на накопленный потенциал и современные возможности, но и на подробную информацию о разных сторонах функционирования веб-ресурсов - об их объемах, структуре, особенностях аудитории пользователей, посещаемости и интеграции в окружающую интернет-среду [1, с.2].

Необходима «положительная обратная связь», ускоряющая соответствующий ответ информационных систем (сайтов) на изменение внешних параметров (активности пользователей). Набор стандартных процедур помогает вести сбор и обработку необходимых веб-метрик и контролировать успешность производственных процессов. Устойчивое развитие сайтов должно опираться на регулярный мониторинг, так как известно, что положительная обратная связь может усиливать динамическую неустойчивость систем. Отсюда напрашивается вывод о необходимости усиливать внимание к библиотечной веб-аналитике как отрасли, углубляющей современные представления об информационных обменах. Вместе с тем все чаще предлагается поднять на соответствующий уровень и подготовку библиотечных специалистов: «включать в учебные программы не только вопросы сайтостроения, но и веб-аналитики, оптимизации сайтов, интернет-маркетинга, разработки технологической и методической документации» [2, с.145-146].

Опыт сайта отделения ГПНТБ СО РАН prometeus.nsc.ru убеждает, что система учета показателей текущей деятельности сайта должна опираться на три блока количественных данных, характеризующих: 1) объемы электронных ресурсов собственной генерации (контент); 2) показатели обслуживания пользователей (посещаемость) и 3) степень интеграции сайта в интернет-среду (веб-репутация). Решающее значение, естественно, имеют данные о посещаемости сайта, но и оба оставшихся блока (о контенте и ссылочном ранжировании) также имеют важное значение, так как описывают специфику сайтов и в значительной степени влияют на индивидуальные особенности формирования аудитории и трендов посещаемости.

Многоплановый характер сетевой коммуникации, где оперируют библиотечные сайты, требует соответствующих комплексных подходов и в статистике. На наш взгляд, блок информации о размерах контента, который входит в отчеты под рубрикой «Фонд», может включать в себя не только количество страниц на одном или нескольких сайтах библиотеки и объем каталогов и баз данных, но и приблизительный размер удаленных ресурсов лицензированного доступа. Все эти ресурсы, так или иначе, присутствуют в составе библиотечного фонда и участвуют в обслуживании пользователей. Используя эту информацию, библиотеки создают инструкции, методические рекомендации и тематические веб-навигаторы с аннотациями и ссылками, раскрывающие содержание и возможности удаленных ресурсов.

Впрочем, ограничивать активно используемый фонд библиотеки одними лишь удаленными лицензионными документами, доступными по сетке IP-адресов, кажется нам далеко не достаточным. Нужно учитывать еще и большой массив открытой библиотечной веб-информации, доступной в режиме open access. Библиотеки чаще всего организуют навигацию и по этим ресурсам. Здесь нам представляется существенно важным подчеркнуть необходимость продолжения, а может быть и усиления, профессиональной разработки общих и специализированных веб-навигаторов по широкому кругу предметов библиотечного обслуживания (справки, библиографии и т.д.). Несмотря на мнение о «малой перспективности» и «несовременности» этих продуктов в библиотеках, нам оно кажется слишком поспешным. Совершенно очевидно, что никакие поисковики и автоматизированные технологии в обозримое время не смогут заменить квалифицированный труд информационных специалистов, а потенциал веб-навигаторов еще далеко не исчерпан. О том же свидетельствуют и сотни отечественных и зарубежных библиотечных сайтов, позиционирующих этот вид ресурсов на своих самых посещаемых, в том числе и стартовых, страницах.

За 20 лет на сайте prometeus.nsc.ru создан целый ряд веб-навигаторов. Один из первых отечественных библиотечных навигаторов «ИнфоЛоция» содержит более 4,3 тыс. ссылок и помогает пользователям ориентироваться среди открытых научно-образовательных ресурсов. Навигатор положительно оценивается в профессиональной печати [3]. Другой навигатор - «SciGuide» - включает около 400 ссылок на ресурсы популярной научно-технической информации. Ссылки на него размещены на сайтах целого ряда научно-образовательных учреждений: Забайкальского, Самарского и Кемеровского госуниверситетов, Российского национального исследовательского медицинского университета (РНИМУ) им. Н.И.Пирогова, Российского университета дружбы народов и многих других. В марте 2018 г. «SciGuide» получил государственную регистрацию (свидетельство «Роспатента» № 2018620419). Кроме того, особые разделы под рубрикой «Интернет-ресурсы» включены в более чем 60 выставок и библиографий, размещенных на сайте. Они являются специализированными веб-навигаторами и создаются теми же сотрудниками, которые выполняют справки и готовят выставки литературы. По статистике Google Analytics, веб-навигаторы сайта prometeus.nsc.ru дают ежегодно более 20 тыс. просмотров.

Ключевое значение для количественного учета размеров сайта имеет показатель «Электронные ресурсы собственной генерации». Он включает все ресурсы библиотеки, созданные ею как правообладателем информации. Здесь учитываются не только статические веб-документы, но и динамический контент электронных каталогов, базы данных разной тематики, страницы учреждения в социальных сетях (аккаунты, группы). Для сбора и обработки всего этого материала, постоянно увеличивающегося в объеме, естественно, требуется большое количество различных инструментальных средств, как внутренних, так и внешних (счетчики, анализаторы, «Яндекс.Метрика» и пр.). Без высокого уровня автоматизации этих процессов веб-статистика сайтов будет неполной и недостоверной.

Рассмотрим вопрос, связанный с единицами учета создаваемой информации: предлагается учитывать объем динамических каталогов и баз данных (БД) собственной генерации (библиографических, реферативных, полнотекстовых, фактографических) в количестве записей, включенных в эти массивы. Одновременно предусматривается, что учет по сайтам библиотеки будет вестись только на основе общего количества страниц и полнотекстовых документов. Но разве установленные на сайте справочники, навигаторы, библиографические списки и указатели (статический контент) не содержат в себе сотни записей, подобных тем, что размещены в каталогах и базах данных? Почему же их нельзя учитывать аналогичным образом - как общий вклад библиотекарей в информационное обслуживание пользователей сайта?

Переходим к самому важному разделу веб-статистики, связанному с обслуживанием пользователей, - показателям посещаемости. Здесь нужно отметить диверсифицированное многообразие потребителей библиотечной информации, которые получают ее не только со страниц сайта, но и по другим каналам - через МБА, ММБА, ИРИ, рассылки и личные кабинеты, подписку в аккаунтах и группы социальных сетей. Комплексный сбор и обработка сводной информации базируются на унификации показателей и сопоставлении результатов разных систем (счетчиков, анализаторов лог-файлов и удаленных систем веб-аналитики). Совокупные данные «позволяют извлекать ценную библиометрическую информацию о востребованности публикаций, отдельных журналов и авторов, а также обычные для библиометрии сведения о направлениях работы и трендах» [4, с.22].

Как показывает практика, самой существенной проблемой являются границы достоверности данных и различие в подходах к интерпретации статистических результатов. Безусловно, все индикаторы, попадающие в отчеты, должны очищаться от цифр, накрученных ботами. Вместе с тем удобных инструментов для надежной фильтрации «мусорного» бот-трафика все еще не придумано. В лог-файлах сервера собирается вся информация об обращениях к сайту, в том числе и об автоматических доступах. По самым общим оценкам, доля такого рода обращений к сайту prometeus.nsc.ru составляет не менее 85%. Если от «мусорной» статистики нельзя очиститься, то самым правильным было бы использовать данные, полученные от «Яндекса» и (или) Google Analytics, настроенных на фильтрацию бот-трафика. Достоверность цифр нужна в первую очередь для проведения сравнений с предыдущими показателями или аналогичной статистикой других сайтов.

В подпункте 3.2.2.2 проекта методики учета библиотечных показателей в научных библиотеках ФАНО говорится, что «показатель "Обращения к базам данных, установленным на сайте" отражает количество обращений пользователей к совокупности баз данных, включая электронные каталоги (без обращений роботов поисковых систем и корпорации ИРБИС). Учет обращений осуществляется в лог-файлах автоматизированных систем». Обратим внимание на очевидную путаницу в понятиях «посещение» и «обращение» с далеко не тождественными значениями. В названном проекте их фактически используют на равных, определяя, что «показатель "посещения (обращения)" включает количество посещений библиотеки читателями и посетителями мероприятий, обращений удаленных пользователей к ее электронным ресурсам, доступным в электронном режиме и обращений в библиотеку через средства коммуникации».

Путаница проистекает из вполне понятного желания иметь сводную статистику виртуальных и реальных процессов потребления библиотечных продуктов и услуг. Но различие состоит в том, что в реальной жизни нужно обязательно посетить библиотеку, а в глобальной сети достаточно одного клика (обращения). При использовании временного интервала нахождения на странице (15-30 секунд) обращение считают просмотром. Виртуальные посещения правильнее называть визитами или сессиями, как это, собственно, и трактуется в системах веб-аналитики («Яндекс.Метрика» и Google Analytics). Один визит обычно состоит из ряда обращений к страницам, аккаунтам и т.д.

Без разграничения понятий «посещение» и «обращение» теряется сама возможность правильного сопоставления веб-статистики сайтов, показатели которых считаются по-разному. В уже названном проекте учета статистики указано, что «показатель "обращения к сайту библиотеки" отражает число сеансов взаимодействия пользователей с сайтом, включающих просмотр не менее одной страницы и являющихся совокупностью обращений ко всем страницам сайта библиотеки. Учет обращений к сайту библиотеки осуществляется при помощи инструментов web-аналитики "Яндекс-Метрика" (показатель "Визит / сессия")». Беда только в том, что в системах веб-аналитики уже давно используется терминология, входящая в противоречие с понятиями традиционного библиотековедения.

Типичный пример смешения понятий связан с использованием термина «отказ», который в сети приобрел значение, отличное от библиотечного. В библиотеках «отказом» называли требование читателя, не удовлетворенное из-за отсутствия изданий в фонде, выдачи на руки другому читателю или по другим причинам (ветхость, ремонт и пр.). Такое понимание закрепилось в ГОСТе по библиотечной статистике, введенном в действие с 01.01.2015, где «отказ» определяется как «неудовлетворенный запрос пользователя на ресурсы и услуги по профилю библиотеки» [5, поз. 3.17]. Терминологически это определение соответствует английскому слову failure («невыполнение») [6]. Статистика отказов является важным отчетным показателем в процессе комплектования библиотек, в справочно-информационном обслуживании и деятельности МБА [7, 8]. Доля отказов по требованиям в общем количестве запросов, как правило, составляет 2,5–7%.

В 2000-х гг. в быстро развивавшейся веб-аналитике, независимо от библиотечной среды, возникло понятие bounce rate («степень отскока»), которое сразу же было переведено на русский язык как «отказ». Устоявшуюся библиотечную терминологию никто не принимал во внимание, но смысл новых «отказов» категорически отличался от прежних. Уровень bounce rate фиксирует не столько неудовлетворенный спрос пользователей, сколько их нежелание углубляться в контент сайта, ограниченность пребывания всего лишь одним доступом. Другими словами, в веб-аналитике «отказом» считают сессию пользователя, где страница «входа» на сайт (entry page) совпадает со страницей «выхода» (exit page). Показатель отказов по сайту рассчитывается в процентах как доля «одностраничных» визитов в общем количестве посещений. Масштаб цифр по новому показателю сильно отличается от традиционных и составляет в среднем 50-85% (табл. 1).

Традиционный показатель отказов применяется в традиционной деятельности библиотек (комплектование, СБО, МБА), а показатель bounce rate - только в процессах управления сайтом, при отслеживании развития ресурсов. При этом показатель отказов по сайту никак не свидетельствует об уровне удовлетворенности пользователей, так как единственный доступ к сайту может быть и максимально эффективным, и совершенно бесполезным. Разница в применении двух видов отказов позволяет надеяться, что их смыслы не перепутаются. Но чисто методологически следует иметь в виду, что речь идет о разных понятиях и в случае необходимости использовать уточняющие определения - «отказ по требованию» или «отказ по сайту».

Таблица 1
Некоторые показатели сайта prometeus.nsc.ru по видам ресурсов
(данные Google Analytics с 01.01.2017 по 31.12.2017)
 
Вид ресурса Доля по просмотру
страниц
(в процентах)
Показатель отказов
(в процентах)
  Полнотекстовый9,8        83,6
  Библиографический35,0        81,7
  Комплексный34,7        75,4
  Фактографический3,0        56,4
  Навигатор17,5        50,3
  В целом по сайту100,0        69,5 (среднее)
 

Наконец, следует акцентировать внимание еще на одном замечании. В отличие от традиционной статистики библиотек показатели веб-аналитики используются главным образом для текущего управления сайтом. Это важный инструмент для рационального размещения и структурирования ресурсов, конструирования эффективной навигации, развития адаптивного дизайна и пр. Регулярный мониторинг веб-метрик нужен для грамотного продвижения ресурсов. Что касается содержательной стороны, оценки качества, значения и даже популярности библиотечной информации, то в этом отношении цифры веб-аналитики мало что говорят. Применять их для сравнения библиотечно-библиографических ресурсов, на наш взгляд, было бы неправильно. Несмотря на это, в современных публикациях по веб-аналитике технологические и содержательные составляющие продвижения, как правило, не разделяются (см., например, [1, с.15]).

Поясним выдвинутый тезис с помощью того же показателя bounce rate. Самый высокий уровень отказов (80-85%) на сайте библиотеки наблюдается у библиографических ресурсов открытого доступа - списков литературы, библиографических справок и указателей (табл.2).

Таблица 2
Некоторые показатели посещаемости сайта prometeus.nsc.ru по видам ресурсов
(данные Google Analytics с 01.01.2017 по 31.12.2017)
 
Название ресурсаURLКоличество
просмотров
Показатель
отказов
Полнотекстовые
  Оглавления (содержание) книг и журналов/contents/23 621        83,55
  Электронная библиотека/elibrary/11 268       81,76
  Труды сотрудников/works/4701       85,50
Библиографические
  Библиографические ресурсы/biblio/77 441       85,51
  Выставка новых поступлений/acquisitions/62 654       85,72
  Выставки (библиография)/exhibit/940       84,29
  Библиография по гендеру/women/353       75,12
  Библиография по гендеру/gender/196       79,14
Комплексные
  Ресурсы по науке и науковедению/science/52 163       75,41
  Архивы сайта (новостей, выставок)/archives/27 484       86,99
  Ресурсы партнеров сайта/partner/15 276       83,18
  Ресурсы об Академгородке/akademgorodok/12 410       66,67
  Разные библиотечные ресурсы/resource/8142       77,67
  Мемориальная библиотека В.А.Коптюга/koptyug/6136       80,73
  Патентные ресурсы/patent/4904       82,38
  История Новосибирска/gorod/4799       81,78
  Зал ВМИ и математические ресурсы/math/4240       74,37
  Ресурсы МБА/mba/3422       30,08
  Ресурсы Музея книги/museum/1764       90,58
Фактографические
  О библиотеке (контакты, структура)/about/3932       48,80
  Новости/news/370       43,13
  Подразделения/subdiv/1620       41,35
  День библиотек/day/359       89,36
  Услуги библиотеки/service/252       57,14
  ЛРЭР и научная деятельность/lab/245       63,64
  Ресурсы научного читального зала/zal/152       65,00
Навигаторы
  Домашняя страница/40 575       49,97
  SciGuide/sciguide/23 946       63,71
  Поиск по сайту/search/5059       31,04
  ИнфоЛоция/guide/1522       56,29
 

Технологически этот факт объясняется очень просто и никак не связан с содержательными (предметно-тематическими) достоинствами отдельных ресурсов. Большинство списков и указателей сайта prometeus.nsc.ru состоят из одной страницы. Вполне естественно, что пользователь, попав на такую страницу из поисковой выдачи «Гугла» или «Яндекса», либо находит, либо не находит то, что ему нужно. Функционал сайта не позволяет «подгрузить» дополнительные материалы - другие библиографии или, что еще лучше, полнотекстовые материалы. Если бы это было возможно, то текущий уровень отказов мог бы быть значительно снижен. Таким образом, в данном случае bounce rate указывает прежде всего на несовершенство функционала сайта и необходимость доработки с технологической (операционной) точки зрения.

Сформулируем ряд базовых методологических принципов, определяющих подходы к оценке посещаемости библиотечных ресурсов. Их соблюдение поможет повысить эффективность управленческих действий и избежать ошибок в развитии и продвижении сайта.

Выводы

  1. Самым важным представляется четкое разделение веб-статистики на технологическую и информационную составляющие, чтобы оценки вебометрических показателей сайта (структуры, навигации и дизайна) не затрагивали содержательной стороны (контента) и популярности ресурсов, которые нужно измерять другими способами.
  2. Однозначное понимание ключевых терминов вебометрики позволит создать систему устойчивых и бесспорных единиц учета статистики. Практическая значимость веб-показателей зависит также от четкого представления инструментов, с помощью которых они получены.
  3. Получение данных веб-аналитики должно носить сквозной характер по всем сайтам и ресурсам, включенным в библиотеку. Сфера учета должна охватывать не только статические и динамические ресурсы сайта, но и внешние ресурсы открытого и лицензионного доступа. Сводная статистика складывается из трех блоков информации: данных о контенте, посещаемости и веб-интеграции.
  4. Необходимо обеспечить эффективную очистку данных статистики и их достоверность, верифицированную различными инструментами и методиками и очерченную доверительными интервалами.

Список литературы

[1] Третьякова О.В., Маковеев В.Н., Чугреев В.Л. Повышение посещаемости веб-сайтов научной организации и их продвижение в сети Интернет // Социал. пространство. 2016. № 5. С.1-19.
[2]Расшивалова Е.Г. Управление качеством содержания портала: на примере Челябинской областной универсальной научной библиотеки // Тр. С.-Петерб. гос. ин-та культуры. 2015. Т.211. С.137-148.
[3]Нещерет М.Ю. Путеводители по интернет-ресурсам: их назначение в библиотечно-информационном обслуживании // Библиография. 2016. № 5. С.68-78.
[4]Земсков А.И., Колосов К.А. Библиометрия в библиотеках // Науч. и техн. б-ки. 2016. № 11. С.5-23.
[5]ГОСТ Р 7.0.20-2014. Библиотечная статистика: показатели и единицы исчисления. Москва, 2014. 20 с. (Система стандартов по информационному, библиотечному и издательскому делу).
[6]Radford N.A. Failure in the Library: A Case Study // The Library Quarterly: Information, Community, Policy. 1983. Vol.53, № 3. P.328-339. DOI 10.1086/601395.
[7]Инструкция по работе с отказами и неудовлетворенными запросами абонентов МБА // Организационно-управленческая документация ЦКО. Ч.4: Межбиблиотечный абонемент. Новосибирск, 2002. С.58-66.
[8]Работа с отказами // Организационно-технологическая документация ГПНТБ СО РАН. Основные документы, регламентирующие обслуживание пользователей. Новосибирск, 2012. С.54-70.
 

Опубликовано: Библиотеки в контексте социально-экономических и культурных трансформаций: материалы всерос. науч.-практ. конф. (Кемерово, 25-29 сент. 2017 г.). Т.2. - Новосибирск, 2018. - С.252-263. - (Труды ГПНТБ СО РАН; Вып.13).
 
Библиотеки в контексте социально-экономических и культурных трансформаций Статья в pdfПубликацииПубликации С.Канна
[О библиотеке | Академгородок | Новости | Выставки | Ресурсы | Библиография | Партнеры | ИнфоЛоция | Поиск | English]
  Пожелания и письма: branch@gpntbsib.ru
© 1997-2024 Отделение ГПНТБ СО РАН (Новосибирск)
Статистика доступов: архив | текущая статистика
 

Документ изменен: Wed Jan 17 11:24:18 2024. Размер: 56,381 bytes.
Посещение N 1220 с 23.01.2019