о
бзоры
УДК 51-7
УЧЕТ НЕОДНОРОДНОСТИ В ОБОЛОЧЕЧНОМ АНАЛИЗЕ ДАННЫХ
В.В. Петрущенко
Рассмотрена классическая модель оболочечного анализа данных (ОАД), широко применяющаяся при оценке эффективности в самых разных экономических отраслях. Проанализированы области ее применимости. Изучено влияние неоднородности оцениваемой выборки объектов на значения эффективности, получаемые с помощью ОАД. Дан обзор методов, позволяющих получать более точные оценки эффективности в случае неоднородной выборки.
Ключевые слова: эффективность, оболочечный анализ данных, неоднородность выборки.
ВВЕДЕНИЕ
Обсудим основную проблему, возникающую при попытке оценить эффективность множества компаний. Подразумевается, что каждая фирма в выборке производит какое-то количество результатов q1, ..., qM, используя ресурсы нескольких типов x1, ..., xN (M и N фиксированы для данной выборки). Естественным подходом здесь было бы агрегировать количество потраченных ресурсов и результатов и принять за эффективность i-го объекта величину
= Aggregated Output = u - q - ¡ + . . . + uMqMi ' Aggregated Input v1x1 i + ... + vNqNi'
Однако информация о том, как выбирать весовые коэффициенты (их также можно интерпретировать как важность соответствующих результатов или ресурсов) u1, ..., uM, v1, ..., vN, отсутствует. Оболочечный анализ данных (ОАД, англ. — Data Envelopment Analysis, DEA) как раз и представляет собой аппарат, позволяющий автоматически выбрать данные коэффициенты.
Начнем с базовой мультипликативной формулировки, введенной в работе [1]. Авторы развили и обобщили предложенную в работе [2] модель и показали, что проблема оценки эффективности
может быть сформулирована в терминах математического программирования: найти
(
max
u, v
0/ =
u t q i t + • . . + uOaOi
v i x • ¿ + . . . u voU m
(1)
при ограничениях
u • qtt+••. + uMuMi
v i x v i + . • • + Vddm
m 1, i = 1,
L;
u. l 0, j = 1, uk l 0, k = 1,
M;
N,
(2)
где L — число оцениваемых фирм, q.. — j-й выходной параметр (j = 1, ..., M) i-й фирмы, xki — k-й входной параметр (k = 1, ..., N) i-й фирмы, u и v — векторы неизвестных подходящей размерности. Наконец, значение 9г- е (0, 1] представляет собой эффективность i-й компании.
Оптимизационная задача (1), (2) может быть представлена в виде задачи линейного программирования в форме, которая в литературе носит название оболочечной формы (от англ. envelopment form):
найти
min В,.
(3)
при ограничениях
-q + QX l 0;
Q.x. - XX l 0;
(4)
X l 0,
где q. — (M s 1)-вектор выходных параметров i-й фирмы, x¡ — (N s 1)-вектор входных параметров i-й фирмы, Q — (M s Х)-матрица выходных параметров всех L фирм, X — (N s Х)-матрица выходных параметров всех фирм, X — (L s 1)-вектор весов, которые можно интерпретировать как теневые цены (см. работу [3]). Как и ранее, значение 9г- — эффективность i-й фирмы.
Формулировка (3), (4) является фундаментальной. Данная версия модели ОАД также носит название CCR (по инициалам авторов-разработчиков). Область применимости данной версии ОАД ограничивается случаем, когда все фирмы из оцениваемой выборки оперируют на оптимальном (постоянном) для себя масштабе. Поэтому в англоязычной литературе модель также часто называется CRS DEA (от англ. Constant Returnto Scale — постоянная отдача от масштаба).
Несложно адаптировать модель к случаю переменной отдачи от масштаба, т. е. к ситуации, когда некоторые фирмы ведут производство в неоптимальном для них объеме. Для этого необходимо добавить к ограничениям дополнительное ограничение
1TX = 1,
(5)
где 1 — единичный вектор размера 1 s L.
Модель (3)—(5) носит название VRS DEA (от англ. Variable Returnto Scale). Данная модификация была введена в работе [4].
С помощью мультипликативной формы (1), можно установить важную геометрическую интерпретацию обсуждавшихся сформулированных двух моделей в трех простейших случаях: один ресурс — один результат (рис. 1); два ресурса — один результат (рис. 2, а); один ресурс — два результата (рис. 2, б).
Под границей эффективности, или просто границей, подразумевается множество1 в ресурсно-результативном пространстве, которое «обволакивает» все множество альтернатив2.
Фирма A эффективна в смысле обеих моделей, фирмы C и D эффективны только в смысле VRS-версии модели ОАД. Эффективность фирмы B
1 Состоящее в общем случае из пересечения нескольких ги-повер
2 По фирмы.
/ VRS-граница
CRS-граница V /
D /
-1-
A
/С
ВС / - B
------V---i ■---- -------•
/1 BV i
• 1
/ 1 i •
/ 1 • 1
/ 1 1 •
С-•-1 -•-в-
O
BC Bv
x x
Bx X
перповерхностеи.
Под альтернативами здесь понимаются оцениваемые
Рис. 1. Интерпретация модели ОАД в случае N = M = 1:
x — ресурс; q — выпуск
(см. рис. 1) в УЯЗ- и СЯ^-модификациях рассчи-
V с
тывается как отношение | ОВХ |/| ОВХ| и | ОВХ |/| ОВх\,
соответственно. Такая мера полностью совпадает с интуитивным суждением о том, как должна быть устроена модель оценки относительной эффективности. Заметим, что именно с помощью границы эффективности оценивается все множество альтернатив.
Чуть более сложно выглядят диаграммы для двух остальных простейших случаев (см. рис. 2).
Эффективность фирмы F3 измеряется в случае N = 2, М = 1 как отношение |ОР3|/|О^3|, в случае N = 1, М = 2 как отношение |ОР3|/|ОР3|. Формальная точка Р3 также называется проекцией фирмы F3 на границу эффективности.
Отметим, что отдача от масштаба далеко не единственное ограничение области применимости моделей ОАД. Таковыми могут быть, например, наличие неуправляемых в кратковременном периоде параметров, которые необходимо включать в оценку. Примером может служить оценка эффективности фермерских хозяйств. В данном случае площадь земельных угодий, амбаров и др. — неуправляемый в краткосрочном периоде параметр. С другой стороны, очевидно, что этот параметр влияет на эффективность ферм, поэтому его необходимо включать в качестве ресурсной переменной. Приведенные постановки ОАД не в силах справиться с такой задачей. Для подобных случаев существует исчерпывающее решение, подробно изложенное в работе [3].
Гораздо более серьезное ограничение на применение моделей оболочечного анализа данных заключается в разнородности оцениваемой вы-
q
x2/q
СИЗ-граница
x1/q
x2/q
Р3 СИЗ-граница
ql/x
а)
б)
Рис. 2. Интерпретация модели ОАД:
N = 2, М = 1 (а); N = 1, М = 2 (б)
3
5
О
борки. Данная проблема представляет интерес также и потому, что она не имеет единого общепризнанного решения. Далее будем рассматривать различные адаптации модели ОАД к ситуации, когда оцениваемые альтернативы существенно неоднородны.
Продолжение работы организовано следующим образом. Сначала дается краткий обзор различных применений модели ОАД на практике. Затем обсуждаются различные виды неоднородности, строятся содержательные примеры ситуаций, когда выборка неоднородна и стандартный метод ОАД неприменим. Дается четыре базовых подхода к решению данной проблемы. Далее обсуждается обобщение классического ОАД, основанное на том, что оцениваемые фирмы имеют различные цели и приоритеты. Последняя часть работы посвящена изложению подхода к решению проблемы неоднородных выборок, предложенному в работе [5].
1. ПРИМЕНЕНИЯ МЕТОДА 0Б0Л0ЧЕЧН0Г0 АНАЛИЗА ДАННЫХ
На практике модель ОАД приобрела широкую известность. Затронем лишь некоторые экономические сферы, в которых она успешно используется. Прежде всего, отметим активное применение описанных моделей к оценке эффективности в области высшего образования различных государств, например, в Великобритании [6—9], Австралии [10, 11], Греции [12], Германии [13, 14], Китая [15], Нидерландов [16].
Список отечественных работ, описывающих применение метода ОАД для оценки эффективности вузов довольно ограничен, укажем лишь на работу [17]. Подробный обзор, посвященный оценке эффективности в высшем образовании, можно найти в работе [18].
В большинстве работ авторы строят оригинальные модификации модели ОАД, чтобы обеспечить ее работу в каждом конкретном случае. Однако их объединяет ряд общих признаков, например, выбор ресурсных и результативных параметров (см. таблицу).
Еще одно поле применения метода ОАД — анализ эффективности различных энергетических предприятий, примером служат работы [19, 20]. Авторы используют стандартную модель ОАД, а также разрабатывают оригинальные модификации для применения в конкретной ситуации.
Различные виды издержек предприятия (совокупные, операционные) часто выбираются в качестве единственного входного параметра. В качестве результативных показателей обычно принимают:
— количество сгенерированной энергии;
— количество переданной энергии;
— количество распределенной энергии;
Критерии оценки в сфере высшего образования
Входные переменные Входные переменные
Совокупные издержки Расходы на научные проекты Численность студентов бакалавриата Численность студентов магистратуры Численность студентов аспирантуры Рейтинг научной деятельности Численность сотрудников университета Качество исследовательской работы Число диссертаций Число статей в рецензируемых журналах Численность выпускников Процент отчисленных студентов Успеваемость студентов Доходы от исследований
— общий объем производства;
— потребление топлива;
— длина сети.
В работах [21, 22] демонстрируется другой подход к анализу эффективности энергетического сектора — за основу берутся параметры, связанные с экологией:
— количество выброшенного в атмосферу углекислого газа (ресурс);
— потери электроэнергии (ресурс);
— эффективность использования природных ископаемых (результат).
В данном случае можно говорить о расчете экологической эффективности энергетических предприятий.
Мы перечислили лишь некоторые области применения модели ОАД, хотя данная методика также применяется для оценки эффективности банковского сектора, систем здравоохранения и городского транспорта, государственного управления и других отраслей экономики. Интересующегося читателя мы отсылаем к обзору [23].
2. НЕОДНОРОДНОСТЬ ПРИ ОЦЕНКЕ ЭФФЕКТИВНОСТИ
Рассмотрим причины, по которым может быть вызвана неоднородность. Главные из них, согласно авторам работы [24], это:
— различия в типе управления (государственный или частный);
— наличие государственных привилегий у некоторых фирм;
— особенности расположения оцениваемых объектов (город или сельская местность, плотность населения в месте расположения фирмы);
— различные цели организаций (для университетов — исследовательская и педагогическая направленности);
— различия в законодательстве.
Даже такой краткий список показывает, что существует довольно много причин, ведущих к тому, что выборка может быть неоднородной. Стандартная модель ОАД не способна учесть разнородность объектов.
В обозначениях рис. 1 приведем пример работы модели ОАД на неоднородном наборе альтернатив. В случае с единственным параметром входа и выхода существует возможность, что некоторое подмножество всех фирм будет сосредоточено «далеко» от обеих границ (множество из четырех безымянных точек на рис. 1). Пусть эти точки характеризуют, например, университеты. Экономически это означает, что данные четыре университета находятся в крайне неблагоприятной обстановке (например, из-за малой плотности населения в ок-
руге или из-за недостаточного государственного финансирования).
Применив ОАД, мы увидим, что значения эффективности для некоторых фирм ничтожно малы, что не отражает существующую ситуацию в отрасли. Таким образом, оценки оказываются несправедливо заниженными.
Рассмотрим решения, которые наиболее часто встречаются в работах, посвященных применению ОАД для оценки неоднородной выборки [3].
2.1. Разбиение выборки по категориям
Если значения переменной, отвечающей за неоднородность, могут быть упорядочены от меньшего к большему в зависимости от влияния на эффективность, то можно воспользоваться подходом, апробированным в работе [25]. Эффективность 1-й фирмы оценивается только относительно тех фирм, для которых значение параметра разнородности не выше, чем у 1-й фирмы.
Рассмотрим случай оценки эффективности ресторанов быстрого питания. Какие-то из них располагаются в центре города, какие-то — на окраинах, наконец, остальные располагаются в сельской местности. Ясно, что преимущество у тех, кто ближе к городскому центру. В этом случае оценка проводится в три этапа: 1) сравниваются только рестораны из сельской местности; 2) сравниваются рестораны из сельской местности и из пригородов; 3) наконец проводится оценка всей выборки, включая рестораны, расположенные в центре города. Эффективностью сельских ресторанов считаются значения, полученные на первом этапе, пригородных — на втором, расположенных в городских центрах — на третьем.
Таким образом, не сравниваются объекты, один из которых имеет конкурентное преимущество перед другим.
Отметим, что цель работы [25] состояла не в учете неоднородности выборки, а во внесении в стандартную модель ОАД коррективов с учетом невозможности контроля некоторых ресурсов или результатов. Однако нельзя не учитывать при оценке, что рестораны, находящиеся ближе к центру города, получают конкурентное преимущество, поэтому и был разработан описанный прием. В качестве иллюстрации в работе [25] проводится оценка шестидесяти ресторанов быстрого питания.
2.2. Проективный метод оболочечного анализа данных
Может случиться так, что не существует естественного упорядочения значений параметра среды в зависимости от влияния на эффективность. Примером такого параметра может служить тип уп-
равления — государственный или частный. Тогда применяется метод, предложенный в работе [26]. Он состоит из трех основных шагов:
— выборка делится на подвыборки относительно выбранного параметра неоднородности; внутри каждой подвыборки используется стандартная модель ОАД;
— находятся проекции всех фирм на соответствующие им границы эффективности;
— применяется стандартный метод ОАД для полученных на предыдущем шаге проекций.
Оба описанных метода [25, 26] обладают рядом ограничений и недостатков. Прежде всего, поскольку множество, с которым мы сравниваем объекты, уменьшается, это ведет к тому, что многие объекты станут эффективными. Далее, только одна переменная среды может быть включена в анализ. Оба метода требуют, чтобы переменную, отвечающую за неоднородность, можно было разбить на различные категории (это не всегда возможно, особенно при учете социальной, культурной или политической неоднородности). Наконец, первый из этих методов подразумевает, что «знак» влияния переменной на эффективность известен априори, что не всегда верно.
Поэтому область применения данных методов довольно сильно ограничена.
2.3. Включение неоднородностей в задачу линейного программирования
Другой возможный метод — включить параметры среды непосредственно в задачу линейного программирования, составляющую суть метода ОАД [27, 28]. Это возможно сделать либо зная, какие переменные имеют отрицательное влияние на эффективность, а какие — положительное, либо не зная «знаков» влияния переменных среды на эффективность.
Рассмотрим первый вариант. Пусть имеется K параметров среды, имеющих положительное влияние на эффективность оцениваемой выборки, Zj = (z1P ..., ZK) — вектор значений этих переменных для i-й фирмы, Z — (K s Х)-матрица значений параметров среды для всех фирм выборки. Модель ОАД в данном случае примет форму:
найти min 9. при ограничениях
-q + QX l 0;
9гx. - XX l 0;
Zj - ZX l 0;
X l 0,
где все обозначения взяты из выражений (3), (4).
Если K переменных среды имеют отрицательное влияние на значения эффективности, то похожим образом можно включить их в ОАД:
найти max 9г- при ограничениях
X, 0(
-q + QX l 0;
Q.x. - XX l 0;
-z + ZX l 0;
X l 0.
Если имеются переменные среды, влияющие на эффективность как положительно, так и отрицательно, то итоговая формулировка задачи ОАД представляет собой объединение этих двух задач линейного программирования.
Если тип влияния параметров среды на эффективность исследуемой выборки неизвестен, то предлагается сформулировать задачу линейного программирования в виде:
найти min 9. при ограничениях
X, 01 '
-q + QX l 0;
9гх. - XX l 0; z, - ZX = 0;
X l 0.
К недостаткам данного подхода можно отнести то, что параметры среды должны быть непрерывны. Кроме того, дополнительные ограничения существенно увеличивают значения эффективности для всех фирм.
Наконец, для определения знаков влияния параметров среды на эффективность можно воспользоваться эконометрическими методами. Включение категорийных переменных непосредственно в задачу линейного программирования также возможно, по этому поводу см. работу [29].
2.4. Кластерный метод
Существует и другой метод, главная идея которого — соединить кластерный анализ, нейронные сети и ОАД [30—37], применяются две его версии. Согласно одной из них необходимо разбить исследуемую выборку на кластеры в зависимости от полученных значений эффективности, затем применить стандартный ОАД к кластерам. В соответствии с другой версией объекты сначала разбиваются на кластеры в зависимости от значений входных и выходных переменных. После этого стандартный метод ОАД применяется для каждого кластера отдельно.
Рассматривая более подробно описанные методы, становится ясно, что все они связаны либо
с разбиением исходной выборки на кластеры, либо с четким определением параметров, которые непосредственно воздействуют на эффективность. Без сомнения, представленные техники хорошо зарекомендовали себя на практике, однако они не учитывают двух обстоятельств. Прежде всего, возможна ситуация, когда сложно выделить конкретные параметры среды. Такое происходит, когда необходимо учесть влияние на эффективность сложных социальных или политических процессов. Описанные методы не годятся для этого случая.
Кроме того, рассмотренные способы учета неоднородности не подразумевают, что исследуемые объекты могут иметь различные цели в рамках одной отрасли. Прекрасный пример ситуации такого рода — университеты, одни из которых могут быть нацелены на проведение исследовательской деятельности, другие — на обучение специалистов в определенной области.
Далее рассмотрим метод, позволяющий учесть возникающую из-за разности в приоритетах разнородность.
3. МНОГОЗАДАЧНЫЙ ОБОЛОЧЕЧНЫЙ АНАЛИЗ ДАННЫХ
Данный метод впервые был представлен в работе [7] и применялся для оценки эффективности английских университетов. Рассмотрим простейший случай двух возможных приоритетов.
Пусть по-прежнему имеется N ресурсов, М результатов и Ь фирм. Пусть х1 с {хр ..., хN — ресурсы, используемые только для достижения первой цели, х12 — ресурсы, используемые для достижения
двух целей, х2 — ресурсы, годные только для вто-
1 12 2
рой цели. Очевидно, что {х1, ..., х^} = х и х и х , где и — квантор несвязного объединения. Аналогичным образом множество результативных параметров разбивается на три группы ..., #м} =
— 1 I I 12 | | 2
= q и q и q .
12
Для у-го ресурса из множества х ведем коэффициент а}. — вес, с которым данный ресурс используется для достижения первой цели. Соответственно, 1 — а}. — вес, с которым ресурс х. используется для достижения второй цели. Аналогично, для у-го результата из множества q12 вводится коэффициент р..
Таким образом, формулируется следующая задача математического программирования:
найти
тахп У г1 0/ + У2 б2
и, V, а, в
при ограничениях
X1 и. + I ив.
{}к,- е q} {} к- е д }
X }}+
{}' I х- е х }
X
I -I 12,
{} I X] е х }
т 1, I = 1,
Ь;
X + х }1 - Р.) }
{} I?- е ? }
I -I 12,
{} I?,- е 5 }
X }}•; + X }1 - х}1
т 1, I = 1, ..., Ь;
{}. |х,- е х2}
12
{} I X,- е х }
и 1 0; V 1 0, (7)
где и — (М х 1)-вектор весовых коэффициентов для выходных результатов, V — (^ х 1)-вектор весовых констант для ресурсных параметров, а —
(|х12| х 1)-вектор коэффициентов, определяющих распределение ресурсных параметров по двум
приоритетам, р — (|q12| х 1)-вектор коэффициентов, определяющих влияние каждого вида деятельности на результаты, В1 е (0, 1] — значение эффективности 1-й фирмы по первому направлению,
В2 е (0, 1] — аналогичная величина для второго направления деятельности, Вг — средняя эффективность. Величины у1 и у2 определяют важность каждого из двух направлений деятельности для 1-й фирмы.
Отметим, что задача (6), (7)представляет собой уже существенно нелинейную оптимизационную задачу из-за коэффициентов, определяющих важность направлений развития фирм.
12
В такой постановке величины y¡ и уг должны быть выбраны заранее и удовлетворять условию
у1 + у2 = 1. Данный подход работает, если априори известна стратегия фирм, принадлежащих выборке. Однако исследователь не всегда располагает такой информацией, в этом случае необходимо добавить к ограничениям (7) тождества
V а ,х..
X 7"
1 {}' I х, е х }
Уг
X }} 12
{} I х- е х }
1 д. 2 _ Уг + Уг = 1
(8)
(6)
здесь индекс I фиксирован в соответствии с формулой (6).
Таким образом, согласно выражению (8),при-оритеты 1-й фирмы распределяются в соответствии с тем, как эта фирма распределяет ресурсы между ее целями.
Данная модель предлагает решение проблемы оценки эффективности при неоднородности выборки, связанной с наличием разных целей у разных объектов. Она нашла широкое применение в литературе, (см., например, [38—41]).
4. МЕТОД ПОСЛЕДОВАТЕЛЬНОГО ИСКЛЮЧЕНИЯ АЛЬТЕРНАТИВ
Рассмотрим модель, предложенную в работе [5]. Основное ее отличие от рассмотренных заключается в абстрагировании от конкретных показателей, отвечающих за влияние среды. Предлагается каждой выборке поставить в соответствие число ц е (0, 1], интерпретирующее неоднородность, т. е. чем ближе данное число к единице, тем исследуемая выборка более неоднородная. Данный параметр может быть найден с помощью простого алгоритма, предложенного в работе [5], однако можно воспользоваться экспертной оценкой.
4.1. Простейшие случаи
Рассмотрим работу алгоритма в простейшем случае, когда отрасль характеризуется единственным ресурсным и единственным результативным параметром. В данном случае 1-я фирма может
быть представлена как точка (хг., #г) е 1К. . Геометрическая интерпретация алгоритма оценки фирм F1, ..., И6 представлена на рис. 3.
Согласно модели ОАД с постоянной отдачей от масштаба, F1 — единственная эффективная фирма. На первом этапе алгоритма в обычном геометрическом смысле рассчитывается центр масс
всей выборки — точка В1 = (л:, q), где черта означает среднее значение. Новая граница эффективности строится с помощью введенного коэффи-
СИЗ-граница
Центр масс
циента неоднородности ц. Для этого вычисляются координаты фирмы, генерирующей новую границу Ох = цВ + (1 - ц)/\.
После того, как новая граница сконструирована, относительно нее оцениваются фирмы, которые показали меньшую эффективность, чем генерирующая фирма й1. На рис. 3 роль таких фирм играют фирмы F3, ..., Р6. В данном случае фирму невозможно оценить относительно фирмы й1, так как компания F2 более эффективна. Для того, чтобы произвести оценку F2, уже оцененные с помощью новой границы фирмы F3, ..., F6 удаляются из рассмотрения. Строится новый центр масс В2 и формируется генерирующая условная фирма С2, оценивается фирма F2.
Алгоритм останавливается тогда, когда оценены все неэффективные в смысле стандартного ОАД фирмы. В случае, представленном на рис. 3, потребуется сделать всего два шага. По построению сходимость алгоритма гарантирована, кроме того, эффективными окажутся лишь те фирмы, которые были эффективными в смысле стандартной ОАД-модели.
Существует несложная связь между оценками эффективности, полученными с помощью модели последовательного исключения и с помощью стандартного метода ОАД. Предположим, некоторое множество фирм на данном шаге алгоритма оценивается при помощи вспомогательной фирмы й, где / — номер шага алгоритма. Пусть компания F принадлежит данному множеству фирм, тогда
т^СЯЯ _ ^СЯЯ ^Ыеы
(9)
Рис. 3. Графическая интерпретация алгоритма в случае N=М = 1
где нижний индекс отвечает за фирму, а верхний — за метод оценки эффективности. Формула (9) немедленно следует из геометрической интерпретации модели ОАД, представленной на рис. 1.
В соответствие с формулой (9), построенный алгоритм оценивает неэффективные фирмы менее строго, чем стандартный ОАД (это ясно из рис. 3). Более того, чем фирма эффективнее в смысле стандартного ОАД, тем строже ее оценивает алгоритм последовательного исключения. Это следует
из того, что Ь0 увеличивается с увеличением
числа проделанных шагов I, так как чем ближе алгоритм к завершению, тем больше неэффективных фирм было удалено из рассмотрения.
Рассмотрим, как работает алгоритм в случае с двумя входными параметрами и одним показателем ресурса (рис. 4).
Здесь F1, F2 — эффективные в смысле стандартного ОАД фирмы. Алгоритм работает похожим
Новая граница
Центр масс СИЗ-граница
О
V?
Рис. 4. Графическая интерпретация алгоритма в случае N = 2, М = 1
образом, но теперь сдвигать к центру масс необходимо не одну фирму как на рис. 3, а две:
= ^ + (1 - ц)^,
И2 = ^ + (1 - ц)^.
Эффективность фирмы в новой модели рассчитывается как отношение | ОР3' |/| ОИ3' |. Все фирмы последовательно оцениваются относительно новых границ эффективности, полученных с помощью центра масс. Алгоритм также сходится для любой выборки и сохраняет множество эффективных фирм.
4.2. Произвольное число переменных
В данном случае 1-я фирма характеризуется с помощью вектора входных переменных модели хг = (х1г, ..., хм) и вектора результатов q¡ = ^1г, ..., qM). Как и ранее, мы определяем ресурсную и результативную части центра масс анализируемой выборки Ьх = (х1, ..., хы) и Ь? = (ql, ..., qN), где, как обычно, черта означает среднее значение параметра.
Пусть оцениваемая выборка определена как множество индексов I = {1, ..., Ь}. Обозначим группу 100 %-эффективных в смысле стандартной ОАД модели фирм как 1е = {¡х, ..., 15} с I. Напомним, что N и М — числа входных и выходных параметров соответственно. Пусть Хе означает матрицу входных параметров всех эффективных фирм из множества 1е (ее размер N х и Qe — аналогичная матрица размера М х содержащая параметры результата всех фирм из I. Также вводится матрица
К = || ьТ , ..., ьТ , х! ^
где Ьх представляет собой транспонированную ресурсную часть центра масс, она повторяется ^ раз, х. — вектор ресурсов какой-нибудь неэффективной компании, т. е. I е I\1. Схожим образом определяется матрица размера М х (£ + 1)
в? = ||ьх,
хх
Ьх, qi||
где Ьх представляет собой транспонированную результативную часть центра масс, а qi — выходной вектор 1-й неэффективной фирмы, т. е. I е Д1е.
Пусть X; и Qle будут матрицы Хе и Qe с одной до-
хх
бавленной к ним справа колонкой х; и qi соответственно. Поскольку главная идея данного метода заключается в том, чтобы сдвинуть границу эффективности в сторону центра масс, сформируем две матрицы
X = ц вх + (1 - ц) х; и а1 = ц в; + (1 - ц) Qei.
(10)
Заметим, что матрицы(10) определены только для неэффективных фирм, т. е. I е 1\1е. Последними колонками матриц X. и Qi являются колонки
хх
х; и qi соответственно.
Можно сформулировать алгоритм последовательного исключения альтернатив в общем случае. Его первый шаг заключается в решении задачи линейного программирования для всех неэффективных фирм I е 1\1:
шп В* (11)
м,-
при ограничениях
-qi + 1 0;
В*х; - Х{\ 1 0; 1 1 0,
где матрицы Х{ и Qi определены выражением (10), X — ((^ + 1) х 1)-вектор неизвестных констант, х. и qi — векторы входных и выходных параметров
для 1-й неэффективной фирмы. Наконец, В* представляет собой оценку эффективности 1-й фирмы с поправкой на неоднородность оцениваемой выборки.
При вычислении значения В* может быть два различных исхода. А именно, оно может быть строго меньше единицы и может быть равно единице.
4
Если i-я неэффективная в смысле стандартной ОАД модели фирма получает в результате нахождения минимума (11) значение 9*, мы исключаем такую фирму из рассмотрения. Алгоритм можно сформулировать следующим образом.
Шаг 1. Вычисляется центр масс всей выборки.
Шаг 2. Для всех i е I\Ie вычисляются матрицы X. и Q..
Шаг 3. Для всех неэффективных компаний вычисляются новые оценки эффективности согласно модели (11), (12). Все фирмы, получающие значения 9* < 1 исключаются из рассмотрения.
Шаг 4. Если какие-то из фирм получают оценку эффективности 9* = 1, то для них процедура повторяется, начиная с шага 1.
На данный момент остался неучтенным лишь один случай. Теоретически возможна ситуация, когда матрицы (10) организованы таким образом, что при запуске модели (11), (12) все неэффективные компании получают значения 9* = 1. Это означает, что изначальная граница эффективности, определенная с помощью стандартной модели DEA, отодвинута слишком далеко. В таком случае необходимо уменьшить значение показателя неоднородности ц и начать процедуру сначала. В качестве алгоритмического решения новое значение показателя неоднородности может вычисляться,
например, как ц2.
Отметим важные свойства построенной модели. Прежде всего, сходимость алгоритма обеспечена по построению для любой выборки. Далее, множество le эффективных фирм по отношению к стандартному ОАД не меняется. Наконец, хотя в многомерном случае и не удается сохранить свойство (9), однако его прямой аналог сохраняется. Поскольку на каждом этапе мы используем модель ОАД, то можно вычислить координаты проекции каждой неэффективной фирмы из множества i е I\Ie на соответствующую границу эффективности, определенную с помощью модели (11), (12). Тогда
vCRS _ j-iCRS j-i New Е р = Ер Ер ,
где E<RS — эффективность фирмы F в стандартной модели ОАД, E<RS — эффективность проекции P фирмы F на границу, определенную с помощью модели (11), (12). Наконец, Ер!™ — оценка
эффективности фирмы F согласно построенному алгоритму.
В качестве иллюстрации модели в работе [5] приведен расчет эффективности пилотной выборки, состоящей из 29-ти российских университетов.
ЗАКЛЮЧЕНИЕ
Рассмотрена модель оболочечного анализа данных и ее модификации для случая, когда оцениваемая выборка неоднородна. Представлен обзор основных подходов к определению неоднородности. В частности, рассмотрены четыре метода, основанные на знании параметров среды, которые оказывают существенное влияние на эффективность. Такие методы могут лишь ограниченно применяться для оценки эффективности неоднородного множества альтернатив, поскольку не всегда удается выделить круг причин, вызывающих неоднородность.
Подход, предложенный в работе [5], базируется на том, что неоднородность возникает из-за разницы в приоритетах оцениваемых компаний. Как показывает многочисленная практика, с этим аспектом неоднородности модель справляется успешно. Однако разница в целях далеко не единственная причина неоднородности выборки.
Наконец, рассмотрен наиболее общий подход к экзогенному определению неоднородности [7]. Предложенный алгоритм основан на последовательном исключении неэффективных альтернатив и позволяет исключить влияние неоднородности на оценку эффективности в наиболее общем виде.
Автор признателен Международной лаборатории анализа и выбора решений НИУ — ВШЭ за финансовую поддержку при проведении исследований и особо благодарен Ф.Т. Алескерову за ценные советы и полезные комментарии.
ЛИТЕРАТУРА
1. Charnes A., Cooper W, Rhodes E. Measuring the Efficiency of Decision Making Units // European Journal of Operational Research. - 1978. - N 2. - P. 429-444.
2. Farrell M.J. The Measurement of Productive Efficiency // Journal of the Royal Statistical Society, Series A. — 1957. — N 3. - P. 253-290.
3. Coelli T.J, Rao D.S.P., O'Donnell C.J., Battese G.E. An Introduction to Efficiency and Productivity Analysis. - N.-Y.: Springer, 2005.
4. Banker R.D., Charnes A., Cooper W. Some Models for Estimating Technical and Scale Inefficiencies in Data Envelopment Analysis, Management Science. - 1984. - N 30. -P. 1078-1092.
5. Алескеров Ф, Петрущенко В. DEA by sequential exclusion of alternatives // HSE Working Paper WP7. - 2013. - N 02.
6. Athanassopoulos A.D., Shale E. Assessing the Comparative Efficiency of Higher Education Institutions in the UK by the Means of Data Envelopment Analysis, Education Economics. -1997. - N 5. - P. 117-134.
7. Beasley J.E. Determining teaching and research efficiencies, Journal of the Operational Research Society. - 1995. - N 46. -P. 441-452.
8. Flegg A., Allen D, Field K, Thurlow T. Measuring the Efficiency and Productivity of British Universities: An Application of DEA and the Malmquist Approach, unpublished, 2004.
9. Johnes J. Data envelopment analysis and its application to the measurement of efficiency in higher education // Economics of Education Review. - 2006. - N 25. - P. 273-288.
10. Abbott M, Doucouliagos C. The efficiency of Australian universities: a data envelopment analysis // Economics of Education Review. - 2003. - N 22. - P. 89-97.
11. Avkiran N.K. Investigating technical and scale efficiencies of Australian Universities through data envelopment analysis // Socio-Economic Planning Sciences. - 2001. - N 35. -P. 57-80.
12. Katharakis G, Katharaki M. A comparative assessment of Greek universities' efficiency using quantitative analysis // Intern. Journal of Educational Research. - 2010. - N 49. - P. 115-128.
13. Kempkesa G, Pohl C. The efficiency of German universities -some evidence from nonparametric and parametric methods // Applied Economics. - 2010. - N 42. - P. 2063-2079.
14. Warning S. Performance Differences in German Higher Education: Empirical Analysis of Strategic Groups // Review of Industrial Organization. - 2004. - N 24. - P. 393-408.
15. Johnes J, Yu L. Measuring the research performance of Chinese higher education institutions using data envelopment analysis // China Economic Review. - 2008. - N 19. -P. 679-696.
16. Cherchye L, Vanden Abeele P. On research efficiency A micro-analysis of Dutch university research in Economics and Business Management // Research Policy. - 2005. - N 34. -P. 495-516.
17. University efficiency evaluation with using its reputational component / I.V. Abankina, F.T. Aleskerov, V.Y. Belousova, et al. // Lecture Notes in Management Science. - 2012. - N 4. -P. 244-253.
18. Оценка результативности университетов с помощью Обо-лочечного Анализа Данных / И. Абанкина, Ф. Алескеров, В. Белоусова и др. // Вопросы образования. - 2013. - N 2 (в печати).
19. Farsi M., Filippini M. A benchmarking analysis of electricity distribution utilities in Switzerland // CEPE working paper. -2005. - N 43.
20. Goto M, Tsutsui M. A Multi-division Efficiency Evaluation of U.S. Electric Power Companies Using a Weighted Slacks-based Measure // Socio-Economic Planning Sciences. - 2009. -N 43. - P. 201-208.
21. Meyer R. Benchmarking Economies of Vertical Integration in U.S. Electricity Supply: An Application of DEA // Competition and Regulation in Network Industries. - 2011. - N 12. -P. 299.
22. Vaninsky A. Environmental Efficiency of Electric Power Industry of the United States: A Data Envelopment Analysis Approach, World Academy of Science // Engineering and Technology. - 2008. - N 40. - P. 584-590.
23. Murillo-Zamorano L. R. Economic efficiency and frontier techniques // Journal of Economic Surveys. - 2004. - N 18. -P. 33-77.
24. Fried H.O., Schmidt S.S., Yaisawamg S. Incorporating the Operating Environment into a Nonparametric Measure of Technical Efficiency // Journal of Productivity Analysis. - 1999. -N 12. - P. 249-267.
25. Banker R.D., Morey R.C. Efficiency Analysis for Exogenously Fixed Inputs and Outputs // Operations Research. - 1986. -N 34. - P. 513-521.
26. Charnes A., Cooper W., Rhodes E. Evaluating Program and Managerial Efficiency: An Application of Data Envelopment Analysis to Program Follow Through // Management Science. -1981. - N 27. - P. 668-697.
27. Bessent A.M., Bessent E.W. Comparing the Comparative Efficiency of Schools through Data Envelopment Analysis // Educational Administration Quarterly. - 1980. - N 16. -P. 57-75.
28. Ferrier G.D., Lovell C.A.K. Measuring Cost Efficiency in Banking: Econometric and Linear Programming Evidence // Journal of Econometrics. - 1990. - N 46. - P. 229-245.
29. Banker R.D., Morey R.C. The Use of Categorical Variables in Data Envelopment Analysis // Management Science. - 1986. -N 32. - P. 1613-1627.
30. Hirschberg J.G., Lye J.N. Clustering in a Data Envelopment Analysis Using Bootstrapped Efficiency Scores, Department of Economics // Working Papers Series 800 The University of Melbourne, 2001.
31. Lemos C.A.A., Lima M.P, Ebecken N.F.F. DEA Implementation and Clustering Analysis using the K-means algorithm, Data Mining VI - Data Mining // Text Mining and Their Business Applications. - 2005. - N 1. - P. 321-329.
32. Use of data envelopment analysis and clustering in multiple criteria optimization / M. Marroquin, M. Pena, C. Castro, et al. // Intelligent Data Analysis. - 2008. - N 12. - P. 89-101.
33. Meimand M, Cavana R.Y., Laking R. Using DEA and survival analysis for measuring performance of branches in New Zealand's Accident Compensation Corporation // Journal of the Operational Research Society. - 2002. - N 53. - P. 303-313.
34. Samoilenko S, Osei-Bryson K.M. Determining sources of relative inefficiency in heterogeneous samples: Methodology using Cluster Analysis, DEA and Neural Networks // European Journal of Operational Research. - 2010. - N 206. - P. 479-487.
35. Schreyogg J.C., von Reitzenstein C. Strategic groups and performance differences among academic medical centers // Health Care Management Review. - 2008. - N 33. - P. 225-233.
36. Sharma M.J, Yu S.J. Performance based stratification and clustering for benchmarking of container terminals // Expert Systems with Applications. - 2009. - N 36. - P. 5016-5022.
37. Shin H.W., Sohn S.Y. Multi-attribute scoring method for mobile telecommunication subscribers // Expert Systems with Applications. - 2004. - N 26. - P. 363-368.
38. Salerno C. Using Data Envelopment Analysis to Improve Estimates of Higher Education Institution's Per-student Education Costs // Education Economics. - 2006. - N 14. -P. 281-295.
39. Tsai P.F., Mar Molinero C. A Variable Returns to Scale Data Envelopment Analysis Model for the Joint Determination of Efficiencies with an Example of the UK Health Service // European Journal of Operational Research. - 2002. - N 141. -P. 21-38.
40. Yu M. Measuring the efficiency and return to scale status of multi-mode bus transit - evidence from Taiwan's bus system // Applied Economics Letters. - 2008. - N 15. - P. 647-653.
41. Cinar Y. Research and Teaching Efficiencies of Turkish Universities with Heterogeneity Considerations: Application of «Multi-Activity DEA» and «DEA by Sequential Exclusion of Alternatives' Models». - 2013. - HSE Working Paper WP7. -N 04.
Статья представлена к публикации членом редколлегии
Ф.Т. Алескеровым.
Всеволод Владимирович Петрущенко - стажер-исследователь,
Научно-исследовательский университет -
Высшая школа экономики, г. Москва,