_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» №10-2/2016 ISSN 2410-700Х_
Материалы международной научно-практической конференции «Перспективные инновации в науке, образовании, производстве и транспорте 2012». Выпуск 2. Том 6. - Одесса: КУПРИЕНКО, 2012 - С.32-34.
4. Суровцева, О.А. Решение задач технологической подготовки производства обуви с использованием потенциала машиностроительной САПР ТП [Текст] / О.А. Суровцева // Сборник научных трудов по материалам международной научно-практической конференции «Наука сегодня: проблемы и перспективы развития» (25 ноября 2015 г.) - Вологда, 2015, Ч.1, С. 65-67.
5. Суровцева, О.А. Адаптация машиностроительной САПР ТП для улучшения качества технологической подготовки производства [Текст] / О.А. Суровцева // Современные тенденции развития науки и технологий. IV Междунар. Научно-практич. конференция, сб. науч. трудов (31 июля 2015) - Белгород, 2015, Ч.1, С 137139.
© Шишкина Г.И., Суровцева О.А., 2016
УДК 51-7
Якунин Александр Васильевич
кандидат филологических наук, доцент Санкт-Петербургский государственный университет
г. Санкт-Петербург
КАЧЕСТВЕННАЯ ОЦЕНКА ВЕБ-УЗЛА В КИБЕРМЕТРИИ: ВОЗМОЖНОСТИ УСОВЕРШЕНСТВОВАНИЯ АЛГОРИТМА HITS
Аннотация
Статья посвящена вопросам усовершенствования технологической основы информационного поиска - алгоритма HITS, являющегося основой современных поисковых систем. Автором предложено дополнение к основному алгоритму ранжирования, способное вовлечь в индексацию качественный критерий - параметры визуальной организации веб-сайта.
Ключевые слова
вебометрика, алгоритмы ранжирования, поисковая индексация, инфометрия, киберметрия
Работа выполнена при финансовой поддержке гранта РФФИ 15-01-06105 А «Разработка вебометрических и эргономических моделей и методов анализа эффективности присутствия в Вебе информационных веб-пространств крупных организаций».
Методам оценки эффективности присутствия организации в глобальной сети в последнее десятилетие уделяется значительное внимание. Особое значение эти методы имеют для развития крупных образовательных учреждений, типичными представителями которых являются университеты [1, с. 117— 131; 4, с. 25—28]. Именно для них созданы и совершенствуются специализированные поисковые программно-аппаратные комплексы - краулеры, анализ деятельности которых составляет предмет одного из разделов киберметрии - вебометрики.
Алгоритмическую основу большинства краулеров составляют математические модели информационного поиска, ориентированные на представление взаимосвязей между документами сети в виде гиперссылочной архитектуры. Главная задача при этом - обеспечение автоматической оценки авторитетности соответствующей веб-страницы, т.е. определение её вебометрического ранга (Webometrics Rank — WR). Одним из ключевых принципов расчета индекса авторитетности является алгоритм HITS, основанный на упорядочивании страниц по убыванию значений индекса входящей центральности (in-degree) и исходящей активности (out-degree). Первый индекс актуален для страниц, которые можно назвать
_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» №10-2/2016 ISSN 2410-700Х_
целевыми («страница-автор») - они в максимальной степени соответствуют поисковому запросу и при этом принимают на себя рекордное количество гиперссылок со стороны других документов. Второй индекс актуален для страниц-посредников («хаб-страницы»), содержащих большое количество ссылок на целевые документы. Структура алгоритма HITS предусматривает расчет для каждой страницы индекса авторитетности и посреднической оценки одновременно, при этом первая формируется на основе оценок указывающих на «автора» «хаб-страниц», а вторая - на основе рейтинга «страниц-авторов», на которые данная страница отсылает через гиперссылки.
Однако, как свидетельствуют некоторые исследования [3], алгоритмы наиболее авторитетных поисковых систем Яндекс и Google не ограничиваются моделированием гиперссылочной структуры вебсайта. В поисковой индексации все большее значение приобретает оценка поведения пользователя, непосредственно связанная с опытом его взаимодействия с интерактивной информационной системой. В связи с этим возникает вопрос: можно ли шагнуть еще дальше - возможна ли интеграция в алгоритм информационного поиска автоматической оценки визуальной архитектуры веб-сайта?
В рамках реализации грантового проекта РФФИ 15-01-06105 А «Разработка вебометрических и эргономических моделей и методов анализа эффективности присутствия в Вебе информационных веб-пространств крупных организаций» мы предприняли попытку интеграции критериев оценки дизайна вебстраницы в структуру алгоритма HITS. Основой нашего подхода является концепция когнитивных режимов Б.М.Величковского [2, с. 440-446], согласно которой характер задачи (поиск или рассматривание) обуславливает и определенные познавательные процессы, проявляющиеся в двух основных паттернах глазодвигательной активности. Паттерн, связанный с рассматриванием целевого элемента на странице, отражает процесс пристальной концентрации внимания и деятельности по распознаванию. Будучи характерен для процессов глубокого чтения («чтения-изучения»), он имеет особое значение для «страниц-авторов»: именно на них приоритетом ранжирования должны стать качество типографики, интерлиньяж и контрастность изображений. Его можно отождествить с микроуровнем композиционно-графической модели страницы [5, с. 226-231]. Второй паттерн, связанный с процессом пространственной ориентации на плоскости страницы, отражает поисковый режим распределения внимания и в большей степени характерен для страниц-посредников, «хабов». Он в большей степени характерен для макроуровня визуальной организации.
Таким образом, интегральный алгоритм индексации предполагает определение соответствия режима когнитивной активности вебометрическому статусу веб-страницы. Если страница имеет высокий статус в качестве «автора», ее визуальная организация должна соответствовать паттерну фокального режима обработки информации - ведь на ней восприятие информации становится более глубоким и детализированным. Соответственно, при высокой значимости страницы как посредника в ее дизайне особое значение приобретают средства эффективной навигации для взора - распределение контента по площади, контрастное зонирование, определенность модульной структуры и визуальная плотность.
Список использованной литературы
1. Антопольский А.Б., Поляк Ю.Е. Измерение присутствия в Интернете образовательных учреждений // Проблемы современного образования. — 2012. — № 4.
2. Величковский Б. М. Исследование когнитивных функций и современные технологии // «Вестник РАН», 2010, 80(5-6).
3. Ландэ Д.В., Снарский А.А., Безсуднов И.В. Интернетика. Навигация в сложных сетях: модели и алгоритмы. — Либроком, 2009. — 264 с.
4. Печников А.А., Илюкевич О.Г. Рейтинг официальных web-сайтов университетов России и Финляндии: сравнительный анализ // Информационные ресурсы России. — Москва: Российское энергетическое агентство Министерства энергетики Российской Федерации, 2008. — № 3.
5. Якунин А.В. Композиционно-графическая модель веб-сайта как фактор его эстетической привлекательности // Проблемы, перспективы и направления инновационного развития науки: Сборник статей международной научно-практической конференции (1 октября 2016, Уфа). В 2 ч. Ч.2 / - Уфа: АЭТЕРНА.
© Якунин А.В., 2016