Канн С.К. Повышение достоверности библиотечной веб-статистики
Навигация
НАУКА И ОБРАЗОВАНИЕ В ЖИЗНИ СОВРЕМЕННОГО ОБЩЕСТВА*30.12.2014  
 
Титул

КАНН С.К. (ГПНТБ СО РАН, Новосибирск)
 
ПОВЫШЕНИЕ ДОСТОВЕРНОСТИ
БИБЛИОТЕЧНОЙ ВЕБ-СТАТИСТИКИ

Ориентация библиотечных учреждений на охват самой широкой аудитории приводит к устойчивому росту посещаемости библиотечных сайтов. Если используются универсальные технические решения, не ограничивающие посетителей по типу платформ или браузеров, то наблюдается очевидная корреляция между количеством и разнообразием представленных ресурсов и числом посетителей сайта. Но, как говорится, есть и плохая новость. В отличие от традиционных библиотек, цифры библиотечной веб-статистики огромны, поэтому в условиях открытого информационного пространства их сложно контролировать, а еще труднее отвечать за их достоверность.

Главная цель сбора и анализа статистики на библиотечном сайте состоит в максимально эффективном управлении ресурсами. При этом решаются задачи определения аудитории пользователей, изучения их поведения, проводится мониторинг посещаемости, выявляются проблемы в структуре, навигации и контенте сайта, оценивается эффективность трудозатрат и принимаются решения по развитию функционала. Во вторую очередь выявляются общие направления развития ресурсов (делаются анализ и прогноз) и осуществляются разного рода исследования - библиометрические и «веблиотековедческие» (библиотековедческие в вебе). И только в самую последнюю очередь сбор и анализ веб-статистики служит целям бюрократической отчетности и участия в рейтингах. Таким образом, без повышения достоверности библиотечной веб-статистики, эффективное управление сайтом невозможно.

Уровень достоверности задается в каждом из трех главных блоков веб-статистики сайта: 1) в блоке контента, где аккумулируются количественные показатели структуры и наполнения; 2) блоке посещаемости, отражающем количественные показатели обращения к ресурсам и 3) блоке веб-репутации, характеризующем степень интеграции сайта в глобальную веб-среду. Точность статистики повышается, если по каждому из ключевых показателей в каждом из трех блоков установлен доверительный интервал, в границах которого могут находиться истинные значения показателей. Так как в процесс сбора и анализа библиотечных показателей включены очень большие массивы информации, а повышенная «математическая» точность не требуется, да и инструментально невозможна [1], то речь, по сути, идет о выявлении наиболее существенных фактов и тенденций (трендов) веб-статистики сайта. Эту несложную истину подтверждают и авторитетные специалисты из Google Analytics.

В последнее время самой трудной проблемой и главным фактором искаженного восприятия библиотечной веб-статистики стали автоматические средства обработки информации - различные инструменты слежения, роботы (поисковые и индексаторы), технологии отладки веб-алгоритмов и копирования сайтов, автономные, интеллектуальные и пользовательские агенты, валидаторы, верификаторы, линк-чекеры и масса других. Многие из них ведут себя крайне некорректно, игнорируют обращения к файлу robots.txt, скрывают или подделывают служебную информацию в поле user-agent. Обращения таких «ботов» крайне трудно идентифицировать и невозможно отделить от веб-статистики реальных пользователей. Создавая предельную нагрузку на сервер, роботы затрудняют использование сайта, в связи с чем звучат предложения о модерации и ограничении их деятельности [2, с.49-51].

На наш взгляд, регулирование активности роботов и многих других средств автоматизации (за исключением откровенно вредоносных), не может быть продуктивным. Мало того, что тормозится продвижение веб-ресурсов, но, в случае неумелой фильтрации доступов, администратор может «отрезать» от сайта значительное количество легальной аудитории. Так, например, блокируя определенный IP-адрес, по поведению похожий на «автомат», но на самом деле являющийся рядовым прокси-сервером, возникает риск лишиться множества лояльных посетителей, работающих через этот порт.

По-видимому, нужно свыкнуться с мыслью или принять как данность, что в новую электронную эпоху сетевая деятельность библиотек навсегда уходит от традиционных форм обслуживания. В новой библиотечной среде применение разных средств автоматизации становится абсолютно будничным, можно сказать, рутинным компонентом библиотечного бытия.

Так, например, для работы с библиотечными ресурсами, скачивания книг, статей, видеороликов и пр. пользователи сайтов применяют различные инструменты, ускоряющие и облегчающие загрузку больших массивов информации менеджеры закачек (Download Master, Free Download Manager, TeleportPro), различные утилиты или плагины к браузерам (FlashGot, DownloadHelper, NetVideoHunter) и др. Действие этих инструментов в лог-файлах сервера выглядит как доступы роботов, то есть обращение в течение секунды ко множеству файлов. Сам процесс обработки и загрузки материалов может занимать продолжительное время, но это не противоречит тому, что за «роботизированными» действиями на сайте скрывается обычный пользователь библиотеки, правда, оснащенный уже по-другому не как «кустарь-копатель» информации, а как «оператор» современных машин и механизмов.

Таким образом, правильная постановка задачи улучшения библиотечной веб-статистики состоит не в том, чтобы всемерно отсекать «технологический» трафик многочисленных автоматических инструментов, что, вероятнее всего, практически невозможно. Гораздо разумнее включить его туда, но максимально точно отделить от «пользовательской» составляющей, хотя бы на уровне приблизительных оценок и доверительных интервалов, и исключить из статистики вредоносные действия и «накрутку» счетчиков. В любом случае, на данный момент представляется, что процесс совершенствования статистики библиотечных сайтов, скорее всего, зависит больше от опыта и искусства, чем от сформировавшихся научных представлений.

 
...
 
[1] Макаров А. Точность данных в Google Analytics // CMS Magazine [сайт]. 2013, 6 ноября. URL: http://www.cmsmagazine.ru/library/items/web-analytics/accuracy-of-data-in-google-analytics/ (дата обращения: 30.12.2014).
[2]Ковязина Е.В. Оценка работы библиотеки с помощью веб-метрик // Вестник БАЕ / Библиотечная Ассамблея Евразии. 2012. N 4. С.47-51.
 

Опубликовано в сборнике:Юком НАУКА И ОБРАЗОВАНИЕ В ЖИЗНИ СОВРЕМЕННОГО ОБЩЕСТВА: Сборник науч. тр. по материалам Междунар. науч.-практ. конф. 30.12.2014 г.: в 12 частях. Часть 7 / Министерство образования и науки РФ. - Тамбов: Изд-во ООО «Консалтинговая компания Юком», 2015. - С.62-64.
 
 ПубликацииПубликации С.Канна
[О библиотеке | Академгородок | Новости | Выставки | Ресурсы | Библиография | Партнеры | ИнфоЛоция | Поиск | English]
  Пожелания и письма: branch@gpntbsib.ru
© 1997-2024 Отделение ГПНТБ СО РАН (Новосибирск)
Статистика доступов: архив | текущая статистика
 

Документ изменен: Wed Feb 27 14:57:28 2019. Размер: 17,756 bytes.
Посещение N 1253 с 25.01.2015