УДК 371.263(07)
В.Г. Каширин, А.А. Захаров, Т.Г. Сенокосова, Е.Н. Калашникова
ФОРМИРОВАНИЕ ДАННЫХ СОЦИОЛОГИЧЕСКОГО ОПРОСА МЕТОДОМ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Рассматривается возможность применения математического аппарата линейного программирования для проектирования структуры данных социологического опроса.
Социологический опрос, симплекс-метод, структура данных
V.G. Kashirin, A.A.Zaharov, T.G. Senokosova, E.N. Kalachnikova DESIGNING OF STRUCTURE OF DATA FOR THE SOCIOLOGICAL INQUIRY BY MEANS OF A LINEAR PROGRAMMING PROBLEM
The possibility of applicability of a mathematical apparatus of a linear programming for shaping of sociological sample is considered, basing on the set conditions and restrictions.
Sociological Inquiry, simplex-method, tructure of data
В современной методологической литературе обычно рассматривают существование трех основных методов сбора первичной социологической информации. К ним относят метод опроса, метод прямого наблюдения и метод анализа документов.
В настоящее время из перечисленных социологических методов наиболее популярен опрос. В основе опросного метода лежит совокупность предлагаемых опрашиваемым вопросов, ответы на которые и образуют первичную информацию. В каждом опросе немаловажную роль играет структурный состав опрашиваемой группы.
Классификация групп, как правило, базируется на предметной области анализа, в которой выделяется основной признак, определяющий устойчивость данного группового образования.
В результате некоторого опроса, направленного, например, на выявление потребительского рынка определенного товара, может быть создана обширная база данных, основанная на опросе, допустим, 1000 человек. Представим, что классификация респондентов в ней выполнена по следующей схеме:
- возраст опрашиваемых: средний возраст (18-50 лет), зрелый возраст (50-60 лет), пожилой возраст (61-74 лет);
- пол (мужской / женский);
- вид опроса (интервьюирование / анкетирование).
Число градаций по первому признаку может быть более детальным и доходить до 7-8, однако это значительно усложнит задачу.
Основываясь на приведенной классификации, всех респондентов можно поделить по группам, обусловленным совпадением значений параметров описания. Таким образом, все 1000 участников опроса могут быть поделены на 12 групп, основываясь на сочетании таких параметров как их возраст, пол, а также по виду пройденного ими опроса. Данные конкретного опроса приведены ниже.
5Ш = 59 - средний возраст, мужчины, анкетирование; s112 = 75 - средний возраст, мужчины, интервьюирование; s121 = 103 - средний возраст, женщины, анкетирование; s122 = 66 - средний возраст, женщины, интервьюирование; s211 = 53 - зрелый возраст, мужчины, анкетирование; s2l2 = 117 - зрелый возраст, мужчины, интервьюирование; s22l = 101 - зрелый возраст, женщины, анкетирование; s222 = 73 - зрелый возраст, женщины, интервьюирование; s311 = 69 - пожилой возраст, мужчины, анкетирование; s312 = 94 - пожилой возраст, мужчины, интервьюирование s321 = 145 - пожилой возраст, женщины, анкетирование; s322 = 45 - пожилой возраст, женщины, интервьюирование.
Для представленной выше классификации по группам относительно каждого из параметров в отдельности и полной совокупности получим следующие соотношения:
- по возрасту опрашиваемых респондентов (средний возраст / зрелый возраст / пожилой возраст - 30.3%/34.4%/35.3%);
- по половому признаку (мужской / женский - 46.7%/53.3%);
- по виду пройденного опроса (анкетирование / интервьюирование - 53%/47%).
Для более точного охвата рынка исследуемого товара необходимо, чтобы данные соответствовали следующей структуре:
- по возрасту опрашиваемых респондентов (средний возраст / зрелый возраст / пожилой возраст - 25%/20%/55%);
- по половому признаку (мужской / женский - 65%/35%);
- по виду пройденного опроса (анкетирование / интервьюирование - 50%/50%). Необходимо преобразовать условия исходной задачи для применения симплекс-
метода. Введем вместо sijk новые обозначения для создаваемой структуры: x111; x112;
■*12^ x122; ^П; ^12; ^21; ^22; ^п'; ^12; ^21; ^22.
По методологии, разработанной и описанной в [1-3] сформулируем и решим представленную задачу.
Целевая функция Б (общее число данных опросов в искомой структуре) примет вид:
Б - хш + хт + х121 + х122 + Х211 + Х212 + Х221 + Х222 + Х311 + + Х312 + Х321 + Х322 — таХ
Зададим первичные ограничения:
Х111 Х112 Х121 Х122 Х211 Х212 Х221 Х222 Х311 Х312 ■*321 Х322
<<<<<<<<<<<<
59 75 103 66 53 117 101 73 69 94 145 45
Для вторичных условий получим следующие уравнения:
По возрасту опрашиваемых
средний возраст / зрелый возраст / пожилой возраст - 25%/20%/55%:
Х111 +Х112 +Х121 +Х122
Х 211 + Х212 + Х221 + Х222
Х311 + Х312 + Х321 + Х322
25 20
пол (мужской / женский) - 65%/35%:
55
Х111 + Х112 + Х 211 + Х212 + Х311 + Х 312
Х121 + Х122 + Х221 + Х222 + Х321 + Х322
65 35
вид опроса (анкетирование / интервьюирование) - 50%/50%:
Х111 + Х121 + Х 211 + Х221 + Х311 + Х321
Х112 + Х122 + Х212 + Х222 + Х312 + Х322
(2)
(3)
(4)
(5)
50 50
Для преобразования системы неравенств в систему уравнений введем дополнительные неотрицательные переменные x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12 (остаточные переменные). В результате получим условие задачи в канонической форме:
^11 x112 x121 ^22 x211 x212 x221 x222 ^11 x312 21 3 К x322
+ + + + + + + + + + + +
x1 x3 x4 x6 x8 x9 *10 x11 x12
59 75 103 66 53 117 101 73 69 94 145 45
(6)
20:х,111 + 20xll2 + 20л;121 + 20xl22 25x2ll 25x2l2 25x22l 'l5x222
0
5 5x211 + 55^12 + 55x221 + 55x222
111 65x
312
35x1ц + 35x112 65x121 65x122 + 35x2ц + 35x212
^221
65x222 + 35x3ц + 35x312
20x311
11 65x
20x
20x
321
20-^322 = 0
50x111 - 50x112 + 50x121
50x122 + 50-^211
321
65-^322 = 0 50-^212 +
+ 50x221 - 50x222 + 50x311 - 50x312 + 50x321 - 50x322 = 0
Для построения искусственного базиса введем четыре базисных переменных Z1, Z 2, Z3
Z1 = 20x111 + 20x112 + 20x121 + 20x
122
Z 2 = + 55x212 + 55x221 + 55 -^222
Z3 = 35х111 + 35х
412
65x1
121
25x211 - 20 x
65x
25x.
212
311
20 x
312
25x221 20 x
25x.
321
222 20 x
322
65x221 65x222 + 35^11 + 35x312 65x321 65x322
Z 4 — 5 0xl 11
+ 50x
50x112 + 50x121
122 + 35x211 +
22
50x
50x122 + 5 0x211
221
5 0x222 + 50x311 5 0x312 + 50x321
= Zl + Z 2 + Z 3 + Z 4 —— таХ
50x
212
322
W = 105x111 + 5x112 + 5x121 - 95x122 +115x211 + 15x212 +
+ 15x
221
85-*222 + 65^11
35x312 - 35x
321
135x
322
(7)
Z 4:
(8)
(9)
(10)
(11)
(12)
(13)
л.
На основании полученной целевой функции Г , искусственной базисной функции W и системы условий задачи в канонической форме решается задача линейной оптимизации симплекс-методом. Для этого по алгоритму симплекс-метода составляются и пересчитываются симплекс-таблицы.
Таблица 1
Первоначальная симплекс-таблица, сформированная на основе заданных ограничений
Базис БП Х1 1 1 Х11 2 Х121 Х122 Х211 Х21 2 Х221 Х222 х31 1 Х31 2 Х321 Х322 Х1 х2 Х3 х4 х5 х6 Х7 х8 х9 Х10 Х11 Х12
Х1 59 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
Х2 75 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
Х3 103 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
х4 66 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
х5 53 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
х6 117 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
х7 101 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
х8 73 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
х9 69 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
Х10 94 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0
Х11 145 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0
Х12 45 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1
0 20 20 20 20 -25 -25 -25 -25 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
^ 2 0 0 0 0 0 55 55 55 55 -20 -20 -20 -20 0 0 0 0 0 0 0 0 0 0 0 0
^ 3 0 35 35 -65 -65 35 35 -65 -65 35 35 -65 -65 0 0 0 0 0 0 0 0 0 0 0 0
^ 4 0 50 -50 50 -50 50 -50 50 -50 50 -50 50 -50 0 0 0 0 0 0 0 0 0 0 0 0
W 0 105 5 5 -95 115 15 15 -85 65 -35 -35 -135 0 0 0 0 0 0 0 0 0 0 0 0
В результате 17 итераций пересчета из симплекс-таблицы получим первую возможную структуру данных по опросам:
хі її — 52, Хі 12 — 75, Х121 — 0, Хі22 — 33,
Х211 — 53; Х212 — 74; Х221 — 2; Х222 — 0; (14)
Х311 — 69; Х312 — 94; Х321 — 145; Х322 — 45
Эта структура - не единственная возможная на основе принятых ограничений. Если продолжить итерации пересчета симплекс таблиц, то получатся и другие. Для ограничения числа возможных решений могут приняты дополнительные условия-ограничения, задающие более узкоспециализированные рамки расчитываемоей структуры.
ЛИТЕРАТУРА
1. Каширин В.Г. Создание программной оболочки для расчета плана выборки объектов с множественной организацией систем параметров при помощи симплекс-метода /
В.Г. Каширин, А.А. Захаров, Е.Г Каширин // Радиотехника и связь: материалы Междунар.
науч.-техн. конф. / СГТУ. Саратов, 2006. С. 116-120.
Каширин Валерий Геннадьевич -
аспирант кафедры «Электронные приборы и устройства» Саратовского государственного технического университета
Захаров Александр Александрович -
доктор технических наук, заведующий кафедрой «Электронные приборы и устройства» Саратовского государственного технического университета Сенокосова Татьяна Гурьевна -
кандидат экономических наук, доцент кафедры «Экономика и управление в строительстве» Саратовского государственного технического университета
Калашникова Елена Николаевна -
электроник I категории кафедры «Электронные приборы и устройства» Саратовского государственного технического университета
Статья поступила в редакцию 25.09.09, принята к опубликованию 25.11.09