Научная статья на тему 'Эвристический метод группирования объектов на основе статистических данных'

Эвристический метод группирования объектов на основе статистических данных Текст научной статьи по специальности «Математика»

CC BY
227
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭВРИСТИЧЕСКИЙ МЕТОД / СТАТИСТИЧЕСКИЙ АНАЛИЗ / ГРУППИРОВАНИЕ ОБЪЕКТОВ / КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ / КОЭФФИЦИЕНТ СХОЖЕСТИ / HEURISTIC METHOD / STATISTICAL ANALYSIS / OBJECT POOLING / CORRELATION COEFFICIENT / COEFFICIENT OF SIMI-TIN

Аннотация научной статьи по математике, автор научной работы — Борисов Александр Николаевич

На основе примеров демонстрируется эвристический метод группирования «схожих» объектов, использующий измененное представление графических результатов обработки статистических данных на базе табличного процессора Ms Excel.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

HEURISTIC METHOD OF GROUPING OBJECTS ON THE BASIS OF STATISTICAL DATA

On the basis of examples illustrates the heuristic method of grouping "similar" sites that uses the modified view graphic results of statistical data processing on the basis of the table processor Ms Excel.

Текст научной работы на тему «Эвристический метод группирования объектов на основе статистических данных»

УДК 336.717.1

ЭВРИСТИЧЕСКИЙ МЕТОД ГРУППИРОВАНИЯ ОБЪЕКТОВ НА ОСНОВЕ СТАТИСТИЧЕСКИХ ДАННЫХ

А.Н. Борисов

На основе примеров демонстрируется эвристический метод группирования «схожих» объектов, использующий измененное представление графических результатов обработки статистических данных на базе табличного процессора Ms Excel.

Ключевые слова: эвристический метод, статистический анализ, группирование объектов, коэффициент корреляции, коэффициент схожести.

Эвристические методы - последовательность предписаний или процедур обработки информации, выполняемая с целью поиска более рациональных и новых конструктивных решений.

Ранее в работе [1] для выявления групп «схожих» по какому либо признаку объектов было предложено использование коэффициента схожести с целью анализа графического представления значений этого коэффициента для рассматриваемых объектов. В работах [1, 2, 3] было показано использование такого подхода к группированию однородных («схожих») объектов, что приводило к росту коэффициента корреляции внутри групп, повышению эффективности регрессионного анализа внутри групп и экономическим рекомендациям для перевода объектов из «слабых» в более «успешные» группы.

Предлагаемый эвристический метод группирования объектов сводится к повышению наглядности графического представления значений коэффициента схожести объектов. Проиллюстрируем его на примере анализа безработицы в областях Центрального федерального округа в 2009г.

, Безработные, тыс .чел. , ,

Ксх =-х 100 = Уровень безработицы,/о

Численность экономически активного населения, тыс.чел.

Коэффициент корреляции числа безработных и численности экономически активного населения составляет к=0,942. Величина коэффициента корреляции, характеризующая степень взаимосвязи двух наборов данных, на физическом плане характеризует уровень однородности сравниваемых объектов.

Коэффициент корреляции числа безработных и численности экономически активного населения составляет к=0,942. Величина коэффициента корреляции, характеризующая степень взаимосвязи двух наборов данных, на физическом плане характеризует уровень однородности сравниваемых объектов.

Исходные данные и рассчитанные значения коэффициента схожести представлены в Таблице 1.

Таблица 1

Исходные данные и значения ксх

№ Области Численность экономически активного населения -всего, тыс. чел. Безработные тыс. чел. Уровень безработицы, % ( ксх )

1 Белгородская 793 38 4,8

2 Брянская 638 68 10,7

3 Владимирская 755 66 8,7

4 Воронежская 1141 99 8,7

5 Ивановская 551 59 10,7

6 Калужская 565 35 6,2

7 Костромская 372 31 8,3

8 Курская 588 52 8,8

9 Липецкая 610 34 5,6

10 Орловская 416 41 9,9

11 Рязанская 575 53 9,2

12 Смоленская 548 42 7,7

13 Тамбовская 549 50 9,1

14 Тверская 745 58 7,8

15 Тульская 795 48 6,0

16 Ярославская 719 57 7,9

17 Московская 3739 182 4,9

Как и в работе [1], используя возможности табличного процессора Ms Excel, построим точечную диаграмму (вкладка Вставка/ группа Диаграммы/ Точечная/ Точечная с маркерами) для Уровня безработицы по областям (см. диаграмма 1).

С целью повышения однородности объектов в группах здесь выделены три группы областей по принципу близости значений коэффициента схожести этих областей. Указанные значения коэффициента корреляции свидетельствуют о высокой степени однородности объектов внутри групп.

Диаграмма 1.Уровень безработицы по областям

Далее покажем предлагаемую в рамках эвристического метода модификацию Диаграммы 1, повышающую наглядность разгруппировки объектов.

Для этого выполним сортировку (вкладка Главная/ группа Редактирование/ Сортировка и фильтр/ Настраиваемая сортировка) Таблицы 1 по возрастанию Уровня безработицы (см. Табл.2).

Таблица 2

Результаты сортировки по возрастанию Ксх

№ Области Численность экономически активного населения -всего, тыс. чел. Безработные тыс. чел. Уровень безработицы, % ( Ксх )

1 Белгородская 793 38 4,8

17 Московская 3739 182 4,9

9 Липецкая 610 34 5,6

15 Тульская 795 48 6,0

6 Калужская 565 35 6,2

12 Смоленская 548 42 7,7

14 Тверская 745 58 7,8

16 Ярославская 719 57 7,9

7 Костромская 372 31 8,3

4 Воронежская 1141 99 8,7

3 Владимирская 755 66 8,7

8 Курская 588 52 8,8

13 Тамбовская 549 50 9,1

11 Рязанская 575 53 9,2

10 Орловская 416 41 9,9

2 Брянская 638 68 10,7

5 Ивановская 551 59 10,7

Для Таблицы 2 построим График с маркерами:

1) вкладка Вставка/ группа Диаграммы/ График/ График с маркерами;

2) удалим Легенду, графики Численности экономически активного населения и Безработные, оставив только график Уровень безработицы;

3) правый щелчок по графику Уровень безработицы и выбираем команду Формат ряда данных контекстного меню;

4) выбираем Параметры маркера, Заливка маркера, Цвет линий: Нет линий;

5) можно изменить подписи горизонтальной оси (контекстная вкладка Работа с диаграммами - Конструктор/ группа Данные / Выбрать данные / Подписи горизонтальной оси Изменить).

Диаграмма 2. Уровень безработицы по областям.

В отличие от Диаграммы 1 группы объектов в таком представлении, как правило, визуально сопровождаются разрывом «непрерывности» (отмечены стрелками). Поскольку для областей 12 - 10 к=0,978, то в результате получим три группы областей:

Диаграмма 3. Группы «однородных» областей

Список литературы

1.Борисов А.Н. Роль предварительной подготовки исходных данных для статистического анализа// Известия ТулГУ. Экономические и юридические науки. Вып.1. Ч.1.-Тула: Изд-во ТулГУ, 2012. - с. 296 - 313.

2.Борисов А.Н., Коршунова Д.М. Статистический анализ вкладов физических лиц// Известия ТулГУ. Экономические и юридические науки. Вып.2. Ч.1.-Тула: Изд-во ТулГУ, 2013. - с. 240 - 244.

З.Борисов А.Н., Бибишев Д.О. Статистический анализ оплаты труда на предприятиях центрального федерального округа// Известия ТулГУ. Экономические и юридические науки. Выт.5. Ч.1. Тула: Изд-во ТулГУ, 2013. с.207 -211.

Борисов Александр Николаевич, д-р техн. наук, проф., профессор кафедры «Финансы и менеджмент», [email protected] , Россия, Тула, Тульский государственный университет

HEURISTIC METHOD OF GROUPING OBJECTS ON THE BASIS OF STATISTICAL DATA

A.N. Borisov

On the basis of examples illustrates the heuristic method of grouping "similar" sites that uses the modified view graphic results of statistical data processing on the basis of the table processor Ms Excel.

Key words: heuristic method, statistical analysis, object pooling, correlation coefficient, coefficient of Simi-Tin.

Borisov Alexandr Nikolaevich , doctor technical science, professor, professor of finance and management department, [email protected], Russia, Tula, Tula State University

УДК 336.71

О КОНЦЕПЦИИ МОНОПОЛЬНО-СОВЕРШЕННОЙ БАНКОВСКОЙ

КОНКУРЕНТНОЙ СРЕДЫ

Ю.С. Эзрох

В статье обосновывается концепция монопольно-совершенной банковской среды как теории, описывающей изменение реального конкурентного состояния современной российской банковской системы с учетом её неоднородности, которая обуславливается наличием субъектов конкурентной среды с частично монопольными возможностями и чистых конкурентов.

Ключевые слова: конкуренция, банк, монопольно-совершенная концепция, конкурентность банковской среды

Научный анализ конкуренции становится возможным лишь после того, как

познана внутренняя природа К. Маркс, «Капитал»

Конкуренция, конкурентная борьба - это практически неотъемлемый атрибут современной рыночной системы хозяйствования. Как экономическая категория и экономическое явление «конкуренция» исследовалась экономистами, труды которых стали впоследствии классическими (А. Смит, Д. Рикардо, Дж. Робинсон, Э. Чемберлин и др.). Вместе с тем конкуренция на банковском рынке имеет существенные отличия от анало-

i Надоели баннеры? Вы всегда можете отключить рекламу.