Научная статья на тему 'Социально-экономическая стратификация домохозяйств по потребительскому поведению'

Социально-экономическая стратификация домохозяйств по потребительскому поведению Текст научной статьи по специальности «Экономика и бизнес»

CC BY
99
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Учет и статистика
ВАК
Область наук
Ключевые слова
HOUSEHOLD'S BUDGET / КОНЕЧНОЕ ПОТРЕБЛЕНИЕ / БЮДЖЕТ ДОМОХОЗЯЙСТВА / КЛАССИФИКАЦИЯ / ДВУХШАГОВЫЙ МЕТОД КЛАСТЕРНОГО АНАЛИЗА / FINAL CONSUMPTION / CLASSIFICATION / TWO-STEP METHOD OF CLUSTER ANALYSIS

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Арженовский Сергей Валентинович, Мажара Виталий Вячеславович

Разработана на основе оригинального двухшагового метода кластерного анализа, позволяющего использовать ранговые переменные, типология домашних хозяйств по социально-экономическим характеристикам, отличающаяся комплексным учетом полного множества социальных, экономических, поселенческих признаков и позволяющая выявлять основной тип потребительского поведения для домохозяйств с заданными характеристиками.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On the basis of the original two-step method of cluster analysis with using of range variables it is constructed typology of households under the social and economic characteristics. It differ by complex account of full set social, economic, settlement factors and allowing to reveal the basic type of consumer behaviour for household with the concrete characteristics.

Текст научной работы на тему «Социально-экономическая стратификация домохозяйств по потребительскому поведению»

Арженовский С.В., Мажара В.В.

СОЦИАЛЬНО-ЭКОНОМИЧЕСКАЯ СТРАТИФИКАЦИЯ ДОМОХОЗЯЙСТВ ПО ПОТРЕБИТЕЛЬСКОМУ ПОВЕДЕНИЮ

Непо средственными характеристиками жизненного уровня населения является величина и структура потребления. В потребительском поведении населения произошли за последнее время значительные изменения, сопровождающиеся социальными потерями, цена которых возросла за счет увеличения неравномерного распределения доходов, усиления дифференциации, роста масштабов бедности и углубление социальной несправедливости в обществе. Выявление особенностей и масштабов потребления домохозяйств, анализ тенденций и закономерностей его развития как элементов системы рыночной организации национальной экономики имеют большое значение для разработки мероприятий социальной политики государства.

Целью настоящей работы являлось построение социально-экономической типологии домохозяйств по их потребительскому поведению.

Информационную базу составили данные ежеквартального обследования бюджетов домашних хозяйств (ОБДХ) Рос-стата,1 поскольку они имеют расширенный набор переменных, в частности, доступна информация о социальной помощи и доступе в Интернет. Нами использованы исходные данные для 11331 домохозяйства, которые образуют панель для 2007 года и значения переменных по домохозяйствам для последнего квартала 2007 года.

Для построения классификации использованы следующие характеристики домохозяйств: пол, образование, возраст главы домохозяйства (характеристика главы домохозяйства), наличие автомобиля, персонального компьютера, доступа в Интернет (материальные активы домохозяйства), наличие в жилье горячего водоснабжения, газоснабжения, телефона, центрального отопления (характеристика жилищной инфраструктуры), размер домохозяйства, чис-

1 Обследование бюджетов домашних хозяйств [Электронный ресурс]. — М.: Росстат, 2009. — Режим доступа: http://www.micro-data.ru, свободный.

ло пенсионеров по старости, число неработающих членов домохозяйства, число детей до 16 лет, тип поселения, получение социальных пособий (характеристика домохозяйства), логарифм душевых расходов на конечное потребление, расходы на табак, расходы на оплату услуг ЖКХ, расходы на образование, расходы на здравоохранение, расходы на досуг (потребительские расходы). Всего 22 переменные, часть из кото -рых количественные, а часть категориро-ванные.

Так как имеющаяся выборка содержит переменные как количественные, так и категорированные, и достаточно большое количество наблюдений, то воспользуемся для построения классификации домохо-зяйств двухшаговым методом кластерного анализа - масштабируемая процедура кластерного анализа, позволяющая работать с данными различных типов. На первом этапе работы алгоритма наблюдения предварительно кластеризуются в большое количество подкластеров. На втором этапе полученные подкластеры группируются в необходимое количество кластеров. Если необходимое количество кластеров неизвестно, процедура его определяет на основе байесовского информационного критерия. Для классификации используется алгоритм Birch (Balanced Iterative Reducing and Clustering using Hierarchies), предложенный Т.Зангом и его коллегами [2], в котором, благодаря обобщенным представлениям кластеров, процедура кластеризации множества данных выполняется быстрее и при этом обладает большим масштабированием. Сначала формируется предварительный набор кластеров, а затем к этому набору для выявления «истинных кластеров» применяются другие - пригодные для работы в оперативной памяти - алгоритмы кластеризации. В некотором смысле кластер соответствует области повышенной плотности объектов. В Birch эта идея нашла отражение в выделении обобщенного представления совокупности объектов, описываемое так называемой кластерной характеристи-

кой (CF — cluster feature). Кластерная характеристика представляет собой тройку, состоящую из следующих компонентов: число точек в кластере, «центр тяжести» и радиус, где радиус кластера определяется как среднеквадратичное отклонение точек кластера от его центра тяжести. При добавлении новой точки в кластер новое значение CF можно вычислить на основе старого значения; нет необходимости учитывать параметры всех точек в кластере. Инкрементальный алгоритм Birch использует это свойство CF и поддерживает только характеристики кластеров, а не множества точек во время сканирования данных. Использование идеи кластерных характеристик оказывается эффективным по двум причинам. Они удобны для вычисления всех внутри-кластерных и межкластерных параметров, которые используются при принятии решений относительно кластеров. Более того, эти вычисления выполняются значительно быстрее, чем при использовании всех объектов в кластере. Например, расстояние между кластерами, радиусы кластеров, кластерные характеристики (и, следовательно, другие свойства) объединенных кластеров очень эффективно вычисляются по значениям CF для отдельных кластеров. В дальнейшем П.Бредли и его коллеги [10] использовали идеи CF для разработки целого класса масштабируемых интерактивных алгоритмов кластеризации ^-средних. Стартуя с некоторого первоначального разбиения множества данных, в этих итерационных алгоритмах кластеризации точки многократно переносятся из одного кластера в другой, пока не будет найдено распределение, соответствующее оптимальному значению некоторой критериальной функции. Функционирование данной модели основано на выделении множеств сокращаемых (discardable) точек, сжимаемых (compressible) точек и точек основной памяти. Реальная точка является сокращаемой, если ее вхождение в кластер может быть восстановлено; алгоритм удаляет реальные точки и вместо всех них сохраняет только значением CF. Точка является сжимаемой, если она не является сокращаемой, но принадлежит к так называемому компактному подкластеру (tight subcluster) — множеству точек, которые всегда делят членство в од-

ном кластере. Такие точки могут перемещаться из одного кластера в другой, но при этом всегда перемещаются вместе. Такой подкластер подменяется своим значением CF [10]. Точка относится к точкам основной памяти, если она не является ни сокращаемой, ни сжимаемой. Как следует из названия, точки этого типа сохраняются в оперативной памяти. Итерационный алгоритм кластеризации перемещает только точки основной памяти из CF сжимаемых точек между кластерами до тех пор, пока не будет найдено оптимальное значение критериальной функции.

Нами использовано расстояние между кластерами, вычисляемое по правилу логарифма правдоподобия, что позволяет включить в классификацию категорированные переменные. Вычисления выполнялись в пакете прикладных программ SPSS 17.

Результаты классификации описанным выше двухшаговым методом кластерного анализа, позволяющие определить профили кластеров, являются громоздкими и в статье не приведены. Численность кластеров дана в табл. 1. Самым многочисленным оказался кластер 3, далее идут 4, 5 и 6-й кластеры, самый малочисленный — первый кластер. Для интерпретации типов кластеров проанализированы профили кластеров. Далее дадим описание кластеров по убыванию средней величины логарифма расходов на конечное потребление внутри кластера.

Кластер №1. Содержит городские домохозяйства, во главе которых стоит мужчина, средний возраст которого 42 года, имеющий высшее образование. Домохозяйства этого кластера имеют в собственности автомобиль и компьютер, доступ в интернет. Жилищные условия характеризуются наличием всех бытовых услуг. В домохозяйствах нет или один неработающий, нет пенсионеров, нет или один ребенок при двух или трех членах домохозяйства. По расходам на конечное потребление, включая расходы на табак, здравоохранение, отдых, образование, ЖКХ находятся на первом месте. Таким образом, первый кластер образуют «элитные» домохозяйства, представляющие собой полные городские молодые семьи без детей или с одним ребенком.

Таблица 1. Распределение наблюдений по кластерам

Кластер Число наблюдений % от итога

1 627 5,5

2 1257 11,1

3 3294 29,1

4 2373 20,9

5 1557 13,7

6 1361 12,0

7 862 7,6

Итого 11331 100,0

Кластер № 4. Содержит городские домохозяйства, во главе которых стоит женщина, средний возраст которой 46 лет, имеющая среднее профессиональное образование. Домохозяйства этого кластера чаще не имеют в собственности автомобиля и компьютера, доступа в интернет. Жилищные условия характеризуются наличием всех бытовых услуг. В домохозяйствах нет неработающих, нет пенсионеров, нет или один ребенок при одном или двух членах домохозяйства. Высокие расходы на конечное потребление, включая расходы на здравоохранение, отдых, ЖКХ. Таким образом, кластер образуют неполные молодые семьи (женщина с ребенком).

Кластер № 5. Содержит городские домохозяйства, во главе которых стоит женщина, средний возраст которой около 72 лет, имеющая чаще среднее профессиональное образование или начальное. Домохозяйства этого кластера чаще не имеют в собственности автомобиля и компьютера, доступа в интернет. Жилищные условия характеризуются наличием всех бытовых услуг. Домохозяйства чаще являются получателями социальной помощи. В домохозяйствах этого кластера один неработающий, один пенсионер, нет детей, при одном члене домохозяйства. Характерны высокие расходы на конечное потребление, включая расходы на отдых, ЖКХ и низкие на табак, здравоохранение и образование. Таким образом, кластер образуют городские домохозяйства одиноких пенсионеров.

Кластер № 3. Содержит сельские домохозяйства, во главе которых стоит мужчина, средний возраст которого 44 года, имеющий чаще всего среднее профессио-

нальное образование. Домохозяйства этого кластера имеют в собственности автомобиль и компьютер, редко - доступ в интернет. Домохозяйства чаще являются получателями социальной помощи. Жилищные условия характеризуются наличием только газоснабжения. В домохозяйствах нет или один неработающий, нет пенсионеров, чаще всего нет детей или один ребенок, при двух или трех членах домохозяйства. По расходам на конечное потребление находятся в середине, характеризуются высокими расходами на табак, образование и низкими на отдых. Таким образом, кластер образуют «элитные» сельские домохозяйства, представляющие собой полные сельские молодые семьи без детей или с одним ребенком.

Кластер № 6. Содержит сельские домохозяйства, во главе которых стоит женщина, средний возраст которой около 70,7 лет, имеющая чаще начальное образование. Домохозяйства этого кластера чаще не имеют в собственности автомобиля и компьютера, доступа в интернет. Жилищные условия характеризуются отсутствием бытовых услуг. В домохозяйствах этого кластера один неработающий, один пенсионер, нет детей, при одном члене домохозяйства. Характерны низкие расходы на конечное потребление, включая расходы на отдых, ЖКХ, табак, образование. Таким образом, кластер образуют сельские домохозяйства одиноких пенсионеров.

Кластер № 2. Содержит городские домохозяйства, во главе которых стоит мужчина, средний возраст которого 60 лет, имеющий среднее профессиональное образование. Домохозяйства этого кластера чаще всего имеют в собственности автомобиль и компьютер. Жилищные условия характеризуются наличием всех бытовых услуг. Домохозяйства получают социальную помощь. В домохозяйствах два или один неработающий, больше одного пенсионера, нет детей при двух или трех членах домохозяйства. Характеризуются высокими расходами на отдых, ЖКХ, здравоохранение. Таким образом, кластер образуют домохозяйства, представляющие собой полные городские семьи пенсионеров с, возможно, живущим вместе с ними одним взрослым ребенком.

Кластер №7. Содержит сельские домохозяйства, во главе которых стоит мужчина, средний возраст которого 68 лет, имеющий начальное образование. Домохозяйства этого кластера чаще не имеют в собственности автомобиля и компьютера, доступа в интернет. Жилищные условия

зяйств по тем же самым переменным, причем в качестве переменной принадлежности к классу была использована полученная в результате кластерного анализа переменная классификатор. Получена следующая таблица сопряженности, характеризующая качество дискриминации (табл. 2).

Таблица 2. Результаты дискриминантного анализа

Группа Процент корректных классификаций Группа

1 (0,055) 2 (0,111) 3 (0,291) 4 (0,209) 5 (0,137) 6 (0,120) 7 (0,076)

1 71,92 451 18 20 127 8 2 1

2 83,51 24 1049 1 69 108 4 1

3 85,97 46 25 2832 261 7 66 57

4 97,09 37 0 22 2304 10 0 0

5 97,81 1 19 2 2 1523 10 0

6 87,58 0 10 21 2 136 1192 0

7 79,81 0 31 32 0 4 107 688

Итого 88,60 559 1152 2930 2765 1796 1381 747

характеризуются отсутствием бытовых услуг, кроме газоснабжения. В домохозяйст-вах этого кластера два неработающих, больше одного пенсионера, нет детей, при двух членах домохозяйства. Характерны низкие расходы на конечное потребление в целом. Таким образом, кластер образуют домохозяйства, представляющие собой полные сельские семьи пенсионеров.

Таким образом, нами построена типология домохозяйств по их потребительским и другим социально-экономическим характеристикам. В целях проверки качества построенной типологии нами осуществлен дискриминантный анализ этих же домохо-

В скобках приведены апостериорные вероятности попадания в группы. По строкам наблюдаемая классификация, по столбцам — предсказанная.

В целом по выборке правильно классифицированы в кластеры около 87% наблюдений, что можно считать приемлемым.

Таким образом, полученное разбиение домохозяйств на кластеры можно использовать как в целях прогнозирования класса для новых домохозяйств с имеющимся набором характеристик, так и в целях определения типов потребительского поведения домохо-зяйств, что, несомненно, важно для разработки социальной политики.

i Надоели баннеры? Вы всегда можете отключить рекламу.