[(I
МЕТОДОЛОГИЯ
и
Анализ надежности результатов мониторинга: первые опыты
1. Вводные замечания. Вряд ли нужно обосновывать необходимость проведения специальных исследований, связанных с обеспечением надежности результатов социологического мониторинга*. Как нам представляется, такие исследования должны решать две главные задачи. Первая — какой уровень надежности, качества информации о настроениях, мыслях и установках населения и различных групп нужен обществу в связи с проведением реформ? Вопрос этот интегрирует в себе некоторые элементы культуры принятия управленческих (в широком смысле) решений и отражает существенные стороны процесса взаимоотношения власти, науки (социологии) и общественного мнения. Вторая задача более инструмен-тальна: каким образом достичь, обеспечить, га-
рантировать необходимый уровень качества информации?
В свете сказанного ниже мы попытаемся очертить особенности пока только начинающихся методологических изысканий, хотя они еще фрагментарны и носят разведывательный, поисковый характер. Кратко рассмотрим содержание необходимых методологических поисков.
Во-первых, они должны оценить способность мониторинга надежно измерять изменения структуры мнений населения России во времени. Для этого логика и инструментарий должны: а) фиксировать тренды, если они имеют место; б) не вносить в результаты измерений таких возмущений, которые могли бы "на выходе" интерпретироваться как изменение мнений, хотя в действительности ситуация стабильна. В частности, предстоит ответить на кардинальный для мониторинге! вопрос о том, как часто следует производить замеры состояний социального процесса, чтобы адекватно отражать происходящие в сознании людей изменения.
Второй кластер объединяет методические задачи, вытекающие из необходимости построения социального и физического (географического) пространства изменений и связанные с конструированием измерительного инструментария, обладающего должной разрешающей способностью.
В качестве третьего направления методических исследований отметим шкалограммный анализ. Речь идет об определении качества (надежности) проецирования общественного мнения на шкалу, созданную социологами и могущую не отвечать внутренней структуре и метрике сознания респондентов. Наконец, в четвертую группу отнесем плохо освоенные отечественной социологией теоретико-математические задачи обработки информации, отражающей процес-суальность предмета мониторинга.
Три следующих сюжета раскрывают некоторые грани исследования названной выше проблематики.
2. Выборка. Учитывая, что подробное описание процедуры построения Всероссийской выборки для опросов населения опубликовано*, заметим лишь, что по своему строению и организации она классифицируется как многошаговая, территориальная с элементами квотирования и случайного отбора единиц. В качестве генеральной совокупности выступает население России от 16 лет и старше.
Объем выборки определяет величину случайной погрешности, т.е. меру точности. Общий объем выборки
— 4000 респондентов — может обеспечивать точность порядка 1,5-2%. В региональном и урбанистическом аспектах выборка делится на страты численностью 700-1000 респондентов, и на этом уровне точность данных оценивается величиной 4-5%. Численности основных демографических групп (по полу, возрасту, образованию) находятся в интервале 1000-2000 человек; поэтому результаты, характеризующие их, определяются с точностью до 3-4%.
В результате специальной процедуры "взвешивания" единиц наблюдения выборка дает хорошее приближение к параметрам генеральной совокупности, что показано в следующей статье**.
По контролируемым при "взвешивании” параметрам отклонение от генеральных значений не превышает 2%, по свободным параметрам — отклонения больше, но, безусловно, и эти параметры в полной мере представляют качественное своеобразие состава населения России. "Недобор" респондентов нерусской национальности объясняется сложностью организации опросов в ряде автономных республик и тем, что опрос осуществляется на русском языке.
В целом, можно заключить, что выборка мониторинга удовлетворяет современным требованиям и позволяет получить достаточно надежную информацию.
3. Методический анализ распределений. Опрос завершен, обработан, получены эмпирические распределения ответов на вопросы анкеты. Содержательный анализ распределений имеет своей целью получение характеристик состояния общественного мнения, а методический ориентирован на определение уровня надежности результатов измерения. Подобное исследование в отдельных случаях позволяет выявить логические погрешности правильности (квазипогрешности), но в первую очередь — погрешности инструментальной природы. Первые опыты методического анализа распределений осуществлены на материалах, полученных в первых трех волнах мониторинга (март
— апрель — май).
Ниже приводимые рассуждения основываются на итогах специальной обработки ответов на вопросы NN 1-4, 6-22, 24, 28-40***. Эти 35 вопросов обращены ко
*3аславская Т.И. Социологический мониторинг эко-
номических и социальных перемен в России //Инфор-
мационный бюллетень. 1993. N1.0. 3-9.
*Козеренко Е.В., Новиков С.Г., Шнейдер М.Г. Методы построения и реализации выборки //Экономические и социальные перемены: мониторинг общественного
мнения. 1993. N1. С. 9-10.
**Козеренко Е.В., Новиков С.Г. Выборка мониторинга — апостериорный контроль //Экономические и социальные перемены: мониторинг общественного мнения. 1993. N5. С. 8-10
*** Список вопросов анкеты опубликован в ИБМ N1.0. 40-41.
всем опрашиваемым, характеризуют именно мнения респондентов по тем или иным вопросам и предполагают один выбор из конечного числа градаций.
3.1. Анализ частоты ответов "не знаю, затрудняюсь ответить". В 33-х из 35-ти анализируемых вопросов респондент мог выбрать градацию "не знаю" и (или) "затрудняюсь ответить". В одних вопросах эта градация выбиралась крайне редко, при ответе на другие
— многие из респондентов отмечали именно ее. Общая
макросреды; фактор же рефлексии мало заметен. Иная ситуация обнаруживается в механизмах выбора обсуждаемого типа ответов на вопросы, предлагавшие респондентам оценить деятельность властных структур по выведению России из кризиса. Здесь женщины выбирали ответ "не знаю" в 1,7 раза чаще, чем мужчины, а частоты выборов этого суждения респондентами с высшим, средним и ниже среднего образованием соотносятся как 10:16:19. Таким образом, естественно предположить, что суммарное количество
Таблица 1.
Частоты выбора ответов "не знаю" и (или) "затрудняюсь ответить" в трех первых опросах мониторинга 1993 г.
Месяц опроса Всего вопросов Число вопросов в ответах, на которые доля (%) ответов "не знаю, затрудняюсь ответить", составила:
до 5% 5,1-10 10,1-15 15,1-20 20,1-30 30,1 и более
март 33 6 8 6 3 6 4
апрель 33 8 5 7 5 5 4
май 33 4 8 7 6 4 4
Таблица 2
Примеры вопросов с частым выбором ответов "затрудняюсь ответить" (доля выбравших этот ответ, %)
Вопросы 1993 1993,апрель
март апрель май Пол Образование
муж. жен. высшее среднее ниже среднего
Как Вы поступите с ваучером? 38 34 36 31 37 35 34 34
Способствует ли выходу из кризиса деятельность Ельцина? 28 28 27 19 36 18 29 32
—"—"—"—Хасбулатова 33 33 32 23 41 19 33 37
—"—"—"—Верховного Совета 33 34 32 24 42 19 33 41
—"—"—"—правительства 38 37 37 27 45 25 37 42
—"—"—"—местных властей 27 28 29 23 32 19 28 31
картина выбора рассматриваемого типа ответов представлена таблицей 1. Относительно редкий выбор его (до 5%) не требует специального выяснения причин. Напротив, выбор позиций "не знаю" и (или) "затрудняюсь ответить" многими респондентами требует дополнительного рассмотрения, ибо может детерминироваться разными факторами и вести к значительному "сдвигу" в распределении ответов. Другими словами, к снижению правильности измерения.
Выбор градаций "не знаю" и (или) "затрудняюсь ответить" может провоцироваться двумя обстоятельствами. В одном случае, своим вопросом социолог "обращает" респондента к знакомой ему проблеме, и реакция "не знаю" свидетельствует о том, что в силу определенных причин человек еще плохо ориентируется в ней, ему трудно сделать свой выбор. В других случаях формулировка, конструкция вопроса заставляет респондента "окунуться" в проблему, далекую от его повседневности, и потому, отвечая на вопрос, ему сначала приходится понять, "куда он попал", а затем уже выбирать направление движения. Анализ некоторых вопросов, в которых изучаемая градация указывалась более чем пятой частью респондентов (см. табл. 2), иллюстрирует сказанное.
Вопрос о размещении ваучера в большей или меньшей степени обдумывается очень многими, причем значительная часть людей своего решения еще не сделала. Поскольку выбор градации "не знаю" оказался не зависящим от пола, возраста и образования респондентов, постольку можно думать, что сегодня эта реакция детерминируется главным образом особенностями
(или доля) выбравших неопределенный ответ, складывается из тех, кто видит "плюсы" и "минусы" деятельности той или иной властной структуры, но не может их соотнести и вывести интегральную оценку, и тех, кто, по сути, не способен к решению подобной экспертной задачи. Скажем иначе: вопрос анкеты затрагивает сферу реальности, которая в принципе незнакома многим респойдентам. И если реакции первой группы действительно могут классифицироваться как незнание правильного ответа, то позиции вторых скорее следовало бы характеризовать как отсутствие ответа. Методически корректным было бы введение определенных поправок в эмпирические распределения ответов и разработка процедуры учета этого вывода при интерпретации результатов опросов.
<■
3.2. Анализ распределений типа "все или ничего".
Распределения ответов, в которых одна "супермодаль-ная" градация собирает значительно большее количество голосов респондентов, чем все другие вместе взятые, в мониторинговом исследовании должны привлечь особое внимание социологов. На наш взгляд, во многих случаях подобная ситуация может затруднить своевременное обнаружение возникающих трендов, намечающихся изменений. Грубость шкалы, предлагаемой респондентам для ответа на вопрос, способна или подтолкнуть отвечающего на сокрытие истинного мнения или ситуации, или не позволить ему артикулировать свое мнение. Так, ответы на вопрос: "Имели ли Вы или кто-нибудь из членов Вашей семьи в прошлом месяце доходы в иностранной валюте? "в % распределились следующим образом:
март апрель май
да 2,1 1,3 2,5
нет 97,5 98,0 96,6
нет ответа 0,4 0,7 0,9
На наш взгляд, эти распределения фиксируют не только наличие в семье валютных поступлений, но и ожидание имеющих их людей к возможным последствиям своего заявления. Другими словами, распределение содержит смесь, в которой объективное положение (наличие валюты) и субъективное отношение к этому факту сочетаются в неизвестной нам пропорции. Поэтому, например, увеличение частоты выбора градации "да" могло бы интерпретироваться не только как рост доли семей, имеющих валютные доходы, — в крупных городах это достаточно распространенное явление — но и как рост терпимости общественного мнения к подобной форме получения доходов, ослабление социального контроля.
Еще один пример: "Как, на Ваш взгляд, будут меняться денежные доходы Вашей семьи, по сравнению с ценами в следующем месяце?" (в % к числу опрошенных):
в среднем по трем опросам
доходы будут опережать рост цен 2,3
доходы будут расти примерно так же,
как цены 8,2
доходы будут отставать от роста цен 71,9
затрудняюсь ответить 17,6
То, что более 70% респондентов выбрали одну градацию и около 18% — затруднились в ответе, может расцениваться как указание на некоторую "грубость" шкалы, не позволяющей людям нюансировать их взгляды на проблему соотношения роста доходов и роста цен. По некоторым прикидкам, относительная погрешность в оценке частоты выбора приведенных градаций может достигать 20-25%. По-видимому, было бы правильнее дезинтегрировать эту градацию, например, разделить ее на две: "доходы будут несколько отставать от роста цен" и "доходы будут значительно отставать от роста цен”.
Количество малонаполненных (до 5%) градаций ответов на анализируемые 35 вопросов видно из следующих данных:
Доли Количество градаций, выбранных
респондентов соответствующей долей респондентов
март апрель май
менее 1% 9 7 8
1.0-1,9% 3 5 3
2.0-2,9% 7 6 5
3.0-3,9% З З 1
4.0-4,9 %________________________________________________2__2_3_
Всего (до 5%) 24 23 20
При суммарном объеме выборки в 4000 респондентов на один процент приходится около 40 человек. Следовательно, в трех первых опросах 1993 г. каждый раз получались от 20 до 24 групп численностью от 20-30 до 200 человек, придерживающихся одной малораспространенной в обществе точки зрения. Наличие таких небольших групп — а далее они дробятся по социально-демографическим переменным — становится известным тормозом на пути осуществления многофакторного математического и содержательного анализа. Как результат, снижается вероятность своев-
ременного обнаружения и объяснения изменений в отношении людей к социально-экономической ситуации и политике*.
3.3. Статистический анализ трендов. Поиск, изучение изменений в мнениях населения является главной целью мониторинга, поэтому вопрос о технологии подобных операций становится одним из ключевых. Отсутствие соответствующих методов отыскания трендов влечет за собой возникновение двух типов ошибочных выводов. Первый — симуляционное псевдоинформирование, когда социолог утверждает, что сложилась новая структура мнений, хотя в действительности изменений не произошло. Второй тип классифицируется как диссимуляционное псевдоинформирование: исследователь не фик-
сирует изменений, несмотря на их существование.
Оставляя в стороне многие проблемы анализа изменений, отметим лишь два его существенных аспекта. Во-первых, он весьма трудоемок; необходимо сопоставить множество распределений и вынести заключение об их сходстве или различии. Во-вторых, если не используются статистические критерии, то анализ не обретает должной объективности, и выводы начинают зависеть от исследовательского внимания и установок.
Довольно простая и эффективная процедура поиска трендов может быть реализована, если использовать критерий Фишера для сравнения двух частот ответов на вопросы. Произведенные расчеты показывают, что при разности в частотах выбора конкретной градации в 4% и выше можно говорить о значимом различии в результатах двух опросов.
Первый опыт прослеживания результатов трех последовательных опросов позволяет предложить простейшую классификацию процессов изменения мнений. Обозначим через ”0" ситуацию, в которой статистический критерий не обнаруживает значимого различия в выборе сравниваемых градаций ответов в двух опросах. Пусть "-" означает, что частота выбора градации во втором опросе стала ниже, чем в первом, а "+" — что она увеличилась. Ситуация, обнаруженная при сопоставлении результатов трех опросов, схематически предствлена в табл. 3.
*От редактора: признавая важность рассматриваемого автором вопроса и необходимость его последующей разработки, не могу полностью согласиться с тем, что градации ответов, выбираемые сравнительно небольшим числом респондентов, представляют "безусловное зло"; и от них надо освобождаться. Против этого можно выдвинуть ряд аргументов. Во-первых, современное российское общество характеризуется возникновением многих новых явлений как в социально-экономических отношениях, так и в массовом сознании. Отслеживание и анализ этих явлений составляет одну из задач мониторинга. Сказанное относится, например, к развитию предпринимательства, отношений кредита, распространению акций, валютных доходов и проч. Во-вто-рых, есть такие системы взглядов, которые, несмотря на ограниченную распространенность, тем не менее представляют большую опасность для общества и проводимых реформ. Таковы, например, с нашей точки зрения, национал-социалистические, а также неоком-мунистические взгляды. Обществу важно знать, какая доля людей разделяет сейчас эти взгляды, распространяются они или сходят на нет, какие группы являются их носителями. И здесь увеличение доли сторонников, скажем, с 3 до 5% очень существенно.
Таблица 3
Теоретические типы динамики показателей при трех временных точках.
Тип Различие между опросами Характеристика соотношения Количество ситуаций
апрель и март май и апрель май и март
1 0 0 0 стабильность, неизменность 122
2 + 0 + сохранившееся увеличение 7
3 _ 0 сохранившееся снижение 5
4 + + + усилившееся увеличение 0
5 . . __ усилившееся снижение 3
б + . 0 возврат через снижение 0
7 . + 0 возврат через увеличение 0
8 0 + + начавшийся рост 4
9 0 _ _ начавшееся снижение 5
10 0 0 + постепенный рост 4
11 0 0 ■- постепенное снижение 5
В сравниваемых нами 35 вопросах насчитывается 156 градаций, т.е. различных видов ответов. Частоты выборов 122 из них в течение трех опросов статистически не менялись. В 33 случаях наблюдались различные комбинации трендов (см. табл. 3). Приведем некоторые иллюстрации (в % к числу опрошенных):
Тип Содержание март апрель май
2 В последние дни испытываю нормальное состояние 35 40 41
3 Экономическое положение России очень плохое 25 21 21
5 Политическая ситуация в России критическая 37 29 23
9 В прошлом месяце денежные доходы моей семьи отставали от роста цен 85 84 80
11 Скорее всего, я приму участие в митинге против роста цен 26 24 21
Только дальнейшее использование этого метода, его развитие покажут, насколько он эффективен при изучении трендов, при обосновании краткосрочных прогнозов изменения мнений. *'
Выборка мониторинга — апостериорный контроль
1. Процедура апостериорного контроля и коррекции выборки мониторинга. Надежность результатов социологического мониторинга в большой степени зависит от репрезентативности выборки. Один из способов апостериорной проверки качества выборки — это сравнение полученных в результате исследования данных с точной информацией об изучаемой генеральной совокупности. Такую информацию можно по-
лучить из источников, не связанных с проведенным исследованием: демографических справочников, сводок официальной государственной статистики, отчетов об эконом-географических исследованиях и т.п. При представлении информации в такого рода источниках обычно выделяются группы населения, специфические по территориальному расселению, демографическим признакам (пол, возраст, национальность), социальнопрофессиональному статусу, доходам и т.п. При этом сообщаются данные о распределении населения по вышеперечисленным группам.
Анкета, по которой проводится опрос, обычно содержит вопросы, ответы на которые позволяют расчитывать выборочное распределение респондентов по некоторым из упомянутых групп. Тем самым появляется возможность сравнить это распределение с представленными в "общепризнанном" источнике и оценить различия между ними.
При оценке следует иметь в виду, что используемая в нашем мониторинге выборка, охватывающая 4000 респондентов, обеспечивает погрешность, обусловленную "вероятностными" причинами, до 3% от доли населения в той или иной группе. Однако при проведении опроса (или, как говорят, при "полевых работах" по сбору информации) могут возникать отклонения от проекта выборки, приводящие к более значительным погрешностям в распределении респондентов.
Предположим, что на некоторой территории не удалось организовать опрос сельской части населения, а вместо этого опрошены жители районного центра, не являющегося селом; в другом городе вследствие недобросовестности интервьюера, грубо нарушившего предлагаемые инструкции, в качестве респондентов использована группа студентов, что увеличило выборочную долю населения с неполным высшим образованием. Кроме того, в разных частях страны доступ к различным социальным группам может иметь специфические особенности, так что общие инструкции по отбору респондентов могут оказаться неадекватными случайной модели.
Понятно, что причин отклонений от проекта при практической реализации выборки может быть множество, и хотя важнейшие из них "блокируются" грамотно составленными инструкциями по проведению полевых работ, различия между выборочными и точными долями социальных групп населения обычно превышают 3-х процентную общевероятностную погрешность. При этом, очевидно, оказываются смещенными и те оценки, получение которых является целью исследования.
Чтобы исключить существенные смещения таких оценок, обычно используется техника "взвешивания" ответов респондентов. Это означает, что каждой анкете присваивается некоторый условный коэффициент, или "вес", который при обработке результатов опроса рассматривается как доля в выборке респондентов, характеризующихся именно таким сочетанием признаков (для невзвешенного массива данных "вес" каждой анкеты равен единице, разделенной на объем выборки). Ставится задача подобрать "веса" анкет так, чтобы выборочные доли, по крайней мере, контролируемых социально-демографических групп возможно лучше совпадали с их точными долями в изучаемом населении.
В том случае, когда для контроля можно подготовить непересекающиеся группы населения, — например, в распределении жителей каждого из эконом-географических регионов между городскими и сельскими
поселениями* — то задача "взвешивания" анкет решается весьма просто: "вес" каждой анкеты принимается равным точной доле той контролируемой группы (в данном примере — "горожан" либо "селян" в определенном экономическом регионе), к которой принадлежит анкета, деленной на число анкет выборки, попавших в данную группу.
Когда выборка контролируется по большому числу признаков, — например, кроме местожительства респондентов рассматривается их пол, возраст, образование и т.п., то группы анкет, формируемые для взвешивания последних по такому правилу, будут "многомерными". В частности, для каждого региона должны быть построены группы "молодые мужчины-горожане с высшим образованием", "молодые женщины-горо-жанки с высшим образованием", "мужчины-горожане среднего возраста с высшим образованием" и т.д. Объединение всех таких групп составляет изучаемую совокупность, а представители каждой группы не могут принадлежать другим группам.
Однако, чтобы использовать эти группы для расчета "весов" анкет, нужно знать точные значения их долей в генеральной совокупности. Большинство же официальных источников не предлагает совместных распределений населения по необходимо большому набору признаков. Поэтому точные значения долей "многомерных" групп оказываются неизвестными, и изложенное выше простое правило взвешивания анкет использовать невозможно. В то же время государственная статистика предлагает довольно много распределений населения либо по отдельным признакам (например, по группам образования), либо совместных распределений по небольшому числу признаков (например, отдельные распределения по возрасту мужчин и женщин). В этом случае задача определения "весов" анкет логически представляет собой пересечение набора аналогичных задач для отдельных признаков и, в общем случае, является противоречивой. Дело в том, что группы населения, определяемые по разным признакам, между собой могут пересекаться: в частности, группа респондентов, имеющих высшее образование, может иметь представителей в каждой возрастной группе как мужчин, так и женщин. При этом, определяя "веса" так, чтобы уменьшить смещение по образованию, мы тем самым можем увеличить смещение в поло-возрастной структуре населения.
Простейший способ убрать это противоречие — определять "веса" анкет таким образом, чтобы уменьшить сумму отклонения долей по всем контролируемым группам. Это означает, что удельные смещения по всем таким группам принимаются равными между собой.
В системе коррекции выборки социологического мониторинга экономических и социальных перемен в России используются два типа контролируемых групп: а) группы жителей поселений разного уровня урбанизации в рамках каждого эконом-географического региона, между собой не пересекающиеся и б) прочие группы, среди которых могут быть пересекающиеся между собой (когда они выделены по разным признакам). Принята следующая процедура определения весов. Сначала веса анкет каждого эконом-географического региона (раздельно для каждой контролируемой группы типа "а") определяются так, чтобы минимизировать сумму отклонений долей для всех
* Житель города некоторого региона не может оказаться ни жителем села, ни жителем другого региона.
групп типа "б". А затем эти веса уточняются путем умножения каждого из них на точную долю соответствующей группы "а" и деления на число анкет в данной группе.
2. Результаты контроля и коррекции выборки мониторинга. В анкету мониторинга включены вопросы (показатели), по которым существует информация в ГОСКОМСТАТе России. Такими показателями являются: пол, возраст, образование, урбанистический тип поселения, семейное положение, сфера занятости, должностной статус респондента. Информация ГОСКОМ-СТАТа о распределении взрослого населения России по каждому из перечисленных показателей регулярно (раз в год) обновляется. Четыре показателя — пол, возраст, образование и место жительства респондента используются для выделения контролируемых групп при определении весов. Показатели семейного положения, сферы занятости и должностного статуса респондента в определении весов не участвуют и служат для дополнительного контроля выборки. В таблице 4 приведено распределение взрослого населения России по группам всех перечисленных показателей в изучаемых генеральной и выборочной совокупностях. В пер-
Таблица 4
Группы населения (1-11) — контрольные при взвешивании Всего по России, (доля, %)
Офици- альные данные Выборочные данные
невзвешенные взвешенные
март [ июнь март I июнь
ПОЛ
1. Мужской 45,1 39,5 39,8 45,4 45,6
2. Женский 54,9 60,5 60,2 54,6 54,4
ВОЗРАСТ
3. До 29 лет 26,9 25,6 23,7 25,3 25,4
4.30-54 года 44,5 49,8 50,7 47,2 45,9
5. 55 лети старше 28,6 24,6 25,6 27,5 28,6
ОБРАЗОВАНИЕ
6. Высшее и незаконченное высшее 13,7 24,5 25,5 14,7 14,3
7. Среднее и среднее специальное 47,6 50,0 51,7 47,3 43,0
8. Неполное среднее 38,7 25,5 22,8 38,0 42,7
ТИП ПОСЕЛЕНИЯ
9а. С.-Петербург, Москва 9,3 20,6 20,8 8,9 9,3
96. Большие города 26,4 23,4 24,4 26,6 28,6
10. Средние и малые города 38,5 32,8 31,8 38,1 36,6
11. Сельские поселения 25,8 23,2 23,0 26,4 25,5
СЕМЕЙНОЕ ПОЛОЖЕНИЕ
12. Холост (незамужем) 16,1 16,2 17,2 16,7 16,4
13. Женат (замужем) 65,3 65,6 64,1 64,6 63,1
14. Разведен (разведена) 7,2 8,4 8,4 7,9 7,6
15. Вдовец (вдова) 11,1 9,8 10,3 10,8 12,7
СФЕРА ЗАНЯТОСТИ
16. Промышленность 49,4 41,8 45,3 43,9 48,8
17. Сельское хозяйство 13,4 12,2 10,8 14,4 13,7
18. Торговля, снабжение 13,5 15,7 15,4 15,5 14,7
19. Культсфера 19,8 21,6 21,2 18,0 16,7
20. Органы управления 3,2 4,0 3,7 3,1 2,7
21. Армия, милиция, МВД, МГБ 0,7 3,1 2,5 3,1 2,7
22. Другая отрасль — 1,6 1,1 — 1,2
ДОЛЖНОСТНОЙ СТАТУС РАБОТНИКА
23. Руководитель 6,6 13,4 11,3 9,0 7,4
24. Специалист 38,5 47,9 51,8 40,3 36,8
25. Квалифицированный рабочий 39,8 31,1 30,1 37,1 41,4
26. Неквалифицированный рабочий 9,7 7,7 6,8 10,1 12,1
27. Прочие 5,4 — — 0,0 2,3
вом столбце таблицы расположены данные официальной статистики, во втором и третьем — выборочные данные ежемесячных мониторинговых опросов, рассчитанные по невзвешенному массиву анкет, в четвертом и пятом — те же данные, расчитанные на взвешенном массиве. Опросы проходили в марте и июне 1993 г. соответственно.
Сравнивая приведенные в таблице данные, полученные на первичном, невзвешенном материале, с данными официальной статистики, мы видим значительные расхождения. Сразу отметим, что увеличение доли г. Москвы и С.-Петербурга было запроектировано на этапе планирования исследования (см. информационный бюллетень мониторинга, выпуск 1), с тем, чтобы получать репрезентативные данные об общественном мнении столиц. Таким образом, анализу подлежат отклонения, возникшие в ходе проведения полевых работ. Особенно сильные смещения наблюдаются в распределении респондентов по уровню образования и полу. Это объясняется тем, что женщины и люди с высшим образованием больше времени проводят дома и легче идут на контакты с интервьюерами, т.е. являются легкодостижимой группой по сравнению с мужчинами и людьми "необразованными". В принципе, эту погрешность можно было бы сократить, увеличив число повторных посещений с 3-х до 8-9-ти, как делают западные социологи. Однако это привело бы, во-первых, к значительному увеличению расходов на проведение полевых работ, а во-вторых, — к увеличению сроков проведения поля.
Расхождения между выборочной и генеральной совокупностями в распределении респондентов по показателю "должностной статус работника", вероятнее всего, объясняются тем, что при анкетировании ответ на вопрос дается на основе самоопределения респондентов, многие из которых склонны несколько завышать свой статус.
Сопоставление данных, полученных на взвешенном массиве анкет, с данными государственной статистики, показывает, что максимальное отклонение значений показателей в выборочной совокупности от соответствующих значений в изучаемой составляет 3,1%. Это дает основание полагать, что погрешности оценок,
расчитанных на откорректированной выборке, имеют вероятностную природу и составляют для выборки мониторинга аналогичную величину.
В заключение заметим, что весовые коэффициенты анкет, а соответственно и респондентов, распределены следующим образом:_____________________________________
месяц опроса показатель "веса" анкет
до 0,5 0,5-1,5 1,5-3,0 более 3,0 итого
март число анкет 1035 2443 418 94 3990
% анкет 25,9 61,2 10,5 2,4 100,0
июнь число анкет 1123 2223 399 173 3918
% анкет 28,7 56,7 10,2 4,4 100,0
Заметим, что совокупность "весов" анкет можно рассматривать как набор параметров к функциональному преобразованию результатов опроса при расчете оценок исследуемых характеристик населения. В нашем случае "веса" определяются по отклонениям некоторых из выборочных распределений респондентов от соответствующих точных распределений. Предполагая, что значительные отклонения обусловлены причинами не вероятностного характера, можно поставить вопрос: насколько восстановленное преобразование увеличивает ошибку искомых оценок, связанную со случайным характером отбора, т.е. их дисперсию. Для бинарных признаков, предполагающих ответы "да— нет" на вопросы анкеты, предположение о не вероятностном характере деформации выборочных распределений позволяет установить, что дисперсия оценки, вычисленной для взвешенных анкет, умноженная на квадрат суммы "весов", равна дисперсии этой оценки для невзвешенных, умноженной на сумму квадратов "весов" и на объем выборки. Принимая во внимание тот факт, что дисперсия оценки обратно пропорциональна объему соответствующей выборки, увеличение дисперсии при взвешивании можно понимать как некоторое уменьшение объема выборки, приводящее к этому увеличению.
Для выборок мониторинга такое уменьшение составляет:
— для опроса, проведенного в марте, 25%;
— для опроса, проведенного в июне, 30%.