Научная статья на тему 'Система персонализации данных для сайтов электронной коммерции'

Система персонализации данных для сайтов электронной коммерции Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
236
68
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шереметьев К. П., Царев А. Г.

Шереметьев К.П., Царёв А.Г. СИСТЕМА ПЕРСОНАЛИЗАЦИИ ДАННЫХ ДЛЯ САЙТОВ ЭЛЕКТРОННОЙ КОММЕРЦИИ. В данной работе описаны существующие методы персонализации данных. Рассматривается, разработанная авторами статьи, система персонализации данных и оценивается её эффективность.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Sheremetev K.P., Tsarev A.G. SYSTEM OF PERSONIFICATION OF DATA. In this work existing methods of personification of data are described. And it is considered, developed by authors of article, the system of personification of data and is estimated its efficiency.

Текст научной работы на тему «Система персонализации данных для сайтов электронной коммерции»

СИСТЕМА ПЕРСОНАЛИЗАЦИИ ДАННЫХ ДЛЯ САЙТОВ ЭЛЕКТРОННОЙ КОММЕРЦИИ

К.П. ШЕРЕМЕТЬЕВ, доц. каф. автоматизации и управления МГУЛ, канд. техн. наук, А.Г. ЦАРЕВ, студент ФЭСТМГУЛ

С момента распространения Интернета по всему миру появилось и быстро развивается новое направление коммерческой деятельности - электронная коммерция (ЭК). Конкуренция в электронном бизнесе постоянно растет, одновременно с этим усложняется структура и увеличивается объем наполнения сайтов электронной коммерции (СЭК). Посетителям становится сложнее ориентироваться, находить и выбирать необходимую им информацию. Отсюда низкие показатели посещаемости, популярности и продаж у многих СЭК. До недавнего времени эти проблемы решали только посредством улучшения навигации и механизмов поиска на СЭК. Однако в настоящее время большую популярность приобретают систе-

мы, реализующие индивидуальный подход к каждому посетителю. В данной работе описывается система персонализации данных (СПД), разработанная авторами статьи, и оценивается ее эффективность.

Постановка задачи

Необходимо разработать и реализовать систему персонализации данных (СПД), повышающую посещаемость сайта электронной коммерции.

Описание существующих методов персонализации данных

Обычно под персонализацией понимается способность сайта, учитывая некую модель оценки требований пользователя, предоставлять страницы, удовлетворяющие

172

ЛЕСНОЙ ВЕСТНИК 6/2005

его по своему информационному наполнению. Существует два способа персонализа-ции [4]:

Customization (ручная настройка) Находится под контролем пользователя, т.е. пользователь явно выбирает определенные опции: создает сайт с заголовками статей например, из New York Times или из Wall St. Journal; вводит символы акций, чьи котировки ему хочется отслеживать.

Personalization (автоматическая настройка) Осуществляется компьютером, который пытается выдавать пользователю определенные страницы, основываясь на некой модели оценки его требований.

Необходимость персонализации данных диктуется постоянным увеличением информационного контента. Персонализа-ция предоставляемого информационного наполнения - одно из важнейших условий популярности сайта. За счет персонализации можно существенно сократить время, затрачиваемое для поиска на сайте нужной информации, что всегда положительно воспринимается посетителями и вызывает привыкание к сайту [5].

Известны следующие методы персонализации данных (МПД) [3]:

Методы, основанные на определенных правилах

В данном случае страницы генерируются как на основе предпочтений, пожеланий пользователя, так и на основе правил, заданных владельцами сайта. Подобных правил может быть множество, в зависимости от тематики сайта и его предназначения - информационного, коммерческого, рекламного и т.п.

Методы, основанные на групповой фильтрации посетителей Этот способ персонализации основан на идентификации группы людей, имеющих одинаковые предпочтения. При групповом типе персонализации сначала собирают данные на простом уровне, либо путем опроса посетителей, либо сервер фиксирует, какие страницы пользователи посетили, и тем самым создается профиль посетителя с его привычками и интересами. Когда пользова-

тель вернется на сайт, сервер определит, к какой из групп он относится на основе сравнения его «профиля» с «профилями» всех групп, и в зависимости от этого ему порекомендуют просмотреть ту или иную страницу. Если предпочтения посетителя изменяются, то он переходит в другую группу.

Методы, основанные на мгновенной персонализации

Наиболее сложный, но и наиболее эффективный способ. Как правило, такими услугами занимаются специализированные компании. Составляются большие базы данных, получаемые из разных источников - провайдеров, баннерных сетей, различных сайтов, сервисов бесплатной электронной почты. Когда пользователь путешествует по Сети, он неоднократно посещает таких поставщиков информации, вся информация о нем заносится в обезличенный аккаунт, т. е. известны наиболее посещаемые места пользователя, его интересы, но неизвестны личные данные.

Также МПД различаются по способам сбора информации о посетителях. Большое количество современных систем персонализа-ции используют прямой опрос посетителей -анкетирование. Такой подход затрагивает сферу защиты личной информации. Ведь «для того, чтобы данный сайт мог подготовить для посетителя хотя бы подборку новостей, последний должен сообщить подробные сведения о своих интересах, и нет никаких гарантий, что утечки данной информации не произойдет» [2]. В дополнение к вопросам защиты личной информации существует парадокс активного пользователя [4] - широко известный феномен в дизайне пользовательских интерфейсов. Люди чаще предпочитают быстрее начать пользоваться системой, чем проводить время за обучением или настройкой ее параметров. Данная проблема остро стоит в Интернете, где у пользователей есть возможность покинуть сайт и без затруднений воспользоваться услугами других сайтов. Web-пользователи желают получить что-то полезное сразу, не затратив времени на настройку и сложный доступ к персонализации. Это одна из причин провалов многих проектов [4]. Согласно исследованию, проведенному Jupiter

Research, компании, старающиеся персонализировать свой сайт, «отпугивают» клиентов [6]. Однако персонализация привлекает покупателей, пример тому - сайт Amazon.com [8]. Успех достигнут за счет того, что персонали-зация не возлагает никакого дополнительного бремени на пользователей [4]. Этот факт доказывает эффективность персонализации и опровергает высказывание Jupiter Research [6].

Основная задача персонализации -привлечение новых и сохранения старых клиентов. Эта задача упрощается по мере упрощения пользованием сервиса. Поэтому, чтобы персонализация эффективно решала возложенные на нее задачи, она, в первую очередь, должна быть простой и ненавязчивой. В связи с этим, в последнее время широкую популярность приобретают МПД, использующие скрытые методы сбора информации о пользователе, так называемые методы косвенного наблюдения [3]. Существует определенное количество источников информации для формирования личного профиля посетителя ИС:

- страницы и разделы, которые он посещает;

- слова, которые посетитель ищет в поисковых механизмах;

- тематика конференций и других средств общения, в которых он участвует.

Большая часть существующих СЭК имеет узконаправленный подход к персонали-зации: используют или технологию простых совпадений, или список предыдущей истории поведения пользователя. Технология простых совпадений недостаточно гибка, чтобы дать возможность сайту предсказать, какие из статей для пользователя являются самыми важными. Кроме того, необходимо учитывать, что каждый день интересы пользователя могут меняться. Список предыдущей истории поведения не способен предоставить рекомендации, отвечающие специфическим интересам пользователя на данный момент. Многие владельцы сайтов пренебрегают персонализацией и вкладывают значительную часть средств на создании только удобной системы навигации и локального поиска. Однако при объеме сайта в несколько тысяч, а тем более десятков ты-

сяч страниц, обойтись улучшением навигации и поиска на сайте невозможно, т. к. посетитель при столь большом объеме информации физически не сможет просмотреть и, соответственно, выбрать более подходящую для него информацию.

Основной недостаток многих СПД, заложенный изначально, - это непонимание психологии пользователя. Каким бы ни был алгоритм рекомендаций, его эффективность зависит только от пожеланий самого посетителя. Согласно выпуску Business 2.0 за август 2000 г., средняя продолжительность просмотра страницы составляет 50 секунд [1], т. е. чтобы убедить посетителя продолжить просмотр и завершить визит заказом, отводится меньше одной минуты. Если персона-лизации на сайте нет, то пользователь, скорее всего, ограничит свое посещение просмотром текущей страницы. Это еще одна причина, по которой не следует полагаться только на навигацию и поиск для увеличения посещаемости. В том случае, если персонализация на сайте есть, но для доступа к ней необходимо зарегистрироваться и оставить какие-то личные сведения, пользователь уйдет на другой сайт - это сделать проще, чем вводить личную информацию; тем более, если зарегистрироваться не получится с первой попытки.

Таким образом, наличие какой-то персонализации не гарантирует повышения посещаемости. Чтобы персонализация была эффективной, ей необходимо:

- быть удобной в использовании,

- быстро и своевременно реагировать на действия пользователя.

- использовать предыдущую историю поведения посетителя с учетом поведения остальных посетителей.

Система персонализации данных (СПД)

Предлагаемая СПД построена на следующих принципах:

- не требуется регистрации посетителя;

- мгновенная персонализация;

- структурирование товаров по схожим признакам (выполняется администратором);

- использование приоритетов при выводе рекомендуемых товаров;

- просмотренные товары повторно не рекомендуются.

Идея предлагаемой СПД состоит в рекомендации товаров посетителю, который будет просматривать их список в текущем сеансе. При выводе товары ранжируются в соответствии с рейтингом популярности Rp, который рассчитывается по формуле Rp = CRT * Pc / Pp, где CRT - так называемый «click ratio», отношение показов к кликам на ссылку товара;

Pp - количество сеансов, в которых была показана ссылка на товар;

Pc - количество сеансов, в которых был произведен клик по ссылке на товар.

Рассмотрим возможные случаи работы СПД:

1. Посетитель зашел на сайт посредством ввода URL в окне браузера или просматривает содержимое рубрик или подруб-рик сайта, т. е. в данный момент просматривает не товар. В этом случае происходит чередование рекомендаций: посетителю через одного предлагаются товары с наибольшим и наименьшим рейтингом популярности (Rp). Благодаря такому подходу происходит постепенное увеличение показов всех имеющихся товаров. Выбор производится из товаров, предложенных администратором сайта.

2. Посетитель просматривает страницу с искомым товаром. В этом случае так же, как и в предыдущем случае, происходит чередование рекомендаций товаров с наибольшим и наименьшим рейтингом популярности Rp соответственно. Выбор производится из товаров той же группы, что и просматриваемый товар, из числа рекомендованных администратором сайта. И если таковых меньше, чем отведено мест для показа, то эти места заполняются ссылками товаров той же группы, но не предложенных администратором.

СПД начинает работать сразу после входа посетителя на сайт и не требует регистрации.

Использование мгновенной персона-лизации позволяет удержать посетителя, заинтересовав его товарами, близкими к тематике просматриваемой страницы.

Для оценки предложенного метода СПД используется процент отклика на рекомендуемые товары (СТЯ), определяемый отношением кликов к показам ссылок на товар.

Результаты эксплуатации системы

Исследование проводились с 01.12.04 по 05.01.05 на сайте фирмы ООО «Альдера» [7], специализирующейся на продаже стоматологического оборудования. Эффективность предлагаемой СПД оценивалась на основе сравнения основных показателей посещаемости СПД с показателями системы отображения популярных товаров (Топ 10). Рекомендуемые товары и товары Топ 10 выводились сверху и сбоку страницы сайта соответственно.

Таблица Сравнения основных показателей посещаемости СПД и показателей

системы отображения популярных товаров (Топ 10)

Сравнительные коэффициенты Топ 10 «Ключевое слово»

количество кликов по 10 товарам 443 287

количество показов по 10 товарам 147227 2218

средний показатель CRT по тем же товарам 0,3 12,93

Вывод

Предлагаемая СПД повышает процент отклика в 43,1 раза по сравнению со

списком Топ 10.

Библиографический список

1. Эффективный Web-сайт: Учеб. пособие. - М.: Изд. ТРИУМФ, 2004. - 560 с.

2. Персонализация сайтов // Мир Интернет. - 2001. - XII(62).

3. Персонализация ресурса Интернет путем формирования психологического портрета посетителя. URL:http://nit.itsoft.ru/ 26.11.03.

4. О персонализации веб-сайта. URL:http:// www. webmascon. com/ 14.11.2003.

5. Персонализация URL:http:// www.aspect.spb.ru /library/portal/sx/art/255503/cp/1/br/

6. Персонализированные сайты отпугивают клиентов URL: http: //promo. by/articles/ personalization _myth.html.

7. Сайт ООО «Альдера» URL:http://www.aldera.ru.

8. Сайт компании «Амазон» URL:http:// www. amazon. com.

i Надоели баннеры? Вы всегда можете отключить рекламу.