Научная статья на тему 'Определение рейтинговых оценок на основе семантических пространств'

Определение рейтинговых оценок на основе семантических пространств Текст научной статьи по специальности «Математика»

CC BY
107
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
РЕЙТИНГОВАЯ ОЦЕНКА / ЛИНГВИСТИЧЕСКАЯ ПЕРЕМЕННАЯ / СЕМАНТИЧЕСКОЕ ПРОСТРАНСТВО / RATING POINT / LINGUISTIC VARIABLE / SEMANTIC SPACE

Аннотация научной статьи по математике, автор научной работы — Полещук О. М.

На основе семантических пространств определяются рейтинговые оценки в условиях разнородных качественных и количественных характеристик. Подобная задача всегда была нетривиальной, поскольку разнородные характеристики имеют разные шкалы, для которых не всегда корректны арифметические операции. Построение рейтинговых оценок в таких условиях стало возможным после появления понятия лингвистической переменной, которая позволила формализовать значения качественных характеристик, а физическим значениям количественных характеристик поставить в соответствие экспертные оценки их качественного восприятия. Результатом этого стала возможность оперирования разнородными характеристиками в рамках единой универсальной шкалы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A model of rating assessment on the basis of semantic spaces in terms of qualitative and quantitative characteristics is developed in the paper. This problem has been nontrivial for a long time because different characteristics have different scales not always with correct arithmetic operations. Solution of the problem in such conditions became possible after the appearance of the concept of linguistic variable which allowed to formalize the values of qualitative characteristics and to match quantitative values of physical characteristics the expert assessment of their quality perception. As a result of that it is appears a possibility of operating with different characteristics within a single universal scale.

Текст научной работы на тему «Определение рейтинговых оценок на основе семантических пространств»

УДК 517

определение рейтинговых оценок на основе

семантических пространств

О.М. ПОЛЕЩУК, проф., МГУЛ, д-р техн. наук(1)

poleshchuk@mgul. ас. ги (1) ФГБОУ ВО «Московский государственный университет леса» 141005, Московская обл., г. Мытищи-5, ул. 1-я Институтская, д. 1

На основе семантических пространств определяются рейтинговые оценки в условиях разнородных качественных и количественных характеристик. Подобная задача всегда была нетривиальной, поскольку разнородные характеристики имеют разные шкалы, для которых не всегда корректны арифметические операции. Построение рейтинговых оценок в таких условиях стало возможным после появления понятия лингвистической переменной, которая позволила формализовать значения качественных характеристик, а физическим значениям количественных характеристик поставить в соответствие экспертные оценки их качественного восприятия. Результатом этого стала возможность оперирования разнородными характеристиками в рамках единой универсальной шкалы.

Ключевые слова: рейтинговая оценка, лингвистическая переменная, семантическое пространство.

Задачи определения рейтингов и рейтинговых оценок возникают в самых разных областях деятельности человека - образование, экология, экономика, техника и т.д. Как правило, эти задачи усложняются разнородностью оцениваемых характеристик, которые носят количественный и качественный характер. Нахождения рейтингов в рамках количественных характеристик достаточно часто сводятся к нахождениям по векторам частных количественных оценок скалярных интегральных показателей [1]. При оценивании качественных характеристик достаточно часто используются вербальные шкалы. Уровням этих шкал в соответствие ставятся числовые баллы - элементы порядковых шкал. В теории экспертного оценивания задача определения наборов числовых баллов, поставленных в соответствие элементам порядковых шкал, является одной из основных задач. В случае использования необоснованного произвольного набора числовых баллов нарушается устойчивость окончательных выводов [1]. Из этого следует, что или в рамках каждой конкретной задачи должен быть обоснован выбор набора числовых баллов, поставленных в соответствие уровням вербальных шкал, или должен быть предложен новый подход (исключающий необходимость оперирования с конкретным набором числовых баллов) к нахождению рейтинговых результатов.

Согласно [2], нечетким множеством А называется множество пар вида

{(х,цл(х)):л;еХ}, где ^(х^Х-КОД] - функции принадлежности А.

Лингвистической переменной называется пятерка

{X, Т(Х), и, V, 5), где X - название переменной;

Т(Х)={Хп1=1,т} - терм-множество переменной X, то есть множество названий лингвистических значений переменной X (каждое из этих значений - нечеткая переменная со значениями из универсального множества Ц);

V - синтаксическое правило, порождающее названия значений лингвистической переменной X;

5 - семантическое правило, которое ставит в соответствие каждой нечеткой переменной с названием из Т(X) нечеткое подмножество универсального множества и.

Термы Хп!=1,т называют понятиями, образующими лингвистическую переменную. Функцию принадлежности нечеткого множества Х.,1=\,т, описывающего возможные значения нечеткой переменной с названием Хх,1=\т, традиционно называют функцией принадлежности понятия Хп1-1,т или функцией принадлежности терма Х{,1=\,т.

Семантическим пространством называется лингвистическая переменная с фиксированным терм-множеством.

Проведенные теоретические исследования свойств семантических пространств,

направленные на повышение адекватности моделей экспертного оценивания характеристик и их полезности для решения практических задач, позволили обоснованно сформулировать требования к функциям принадлежности |.х;(л),/=1,;я их терм-множеств [3].

1. Для каждого понятия Х{,1=\,т существует 0,^0, где г7/={хеС/:|а/(л;)=1} есть точка или отрезок.

2. Пусть ¿//={л:е?7:ц/(л:)=1}, тогда ц,(х),/=1,/и не убывает слева от 01 и не возрастает справа от Ц.

3. |о./(л:),/=1,/и имеют не более двух точек разрыва первого рода.

4. Для каждого

т /=1

Семантические пространства, функции принадлежности которых удовлетворяют сформулированным требованиям, получили название полных ортогональных семантических пространств (ПОСП).

Семантические пространства широко используются для формализации вербальных шкал, значениями которых являются слова [4]. Вербальные шкалы используются не только для оценки качественных характеристик, но и достаточно часто для описания физических значений количественных характеристик. Например, для описания параметра «давление пара на входе» (с областью изменения [1,1, 6,7] изделия «подогреватель высокого давления», которое предназначается для повышения КПД турбоустановки, используется вербальная шкала с уровнями «малое давление пара», «давление близкое к 4», «большое давление пара». Другим примером является вербальная шкала для описания вероятностей наступления события. Как известно, вероятность события выражается обычной числовой величиной и изменяется от нуля до единицы. Однако когда речь идет, например, о вероятности банкротства предприятия, то руководителя этого предприятия интересует не конкретное число, которое для него, скорее всего, мало информативно, а определение одного из вербальных уровней вероятности банкротства: «очень малая», «малая», «средняя», «высокая», «очень высокая».

1. Определение рейтинговых оценок в рамках количественных и качественных характеристик

Рассмотрим совокупность N объектов, у которых оцениваются количественные характеристики Хр} = \,1 и интенсивности проявления качественных характеристик Хч, V = 1 + 1,к. В совокупности оцениваемые характеристики оказывают существенное влияние на характеристику У - успешность функционирования объектов, которая оценивается в рамках шкалы: У1 = «предельно неуспешно», У2 = «неуспешно», У3 = «средне успешно», У4 = «относительно успешно», У5 = «предельно успешно».

Областями значений количественных характеристик Х},] = \,1 могут являться несчетные множества точек действительной прямой - Я ,у=177.

Построим, используя информацию экспертов, ПОСП с названиями Хр j = l,1 [5]. Если рост характеристики Хр у = 1,/ сопровождается ростом характеристики У, то «очень малое значение характеристики X», «малое значение характеристики X», «среднее значение характеристики X», «большое значение характеристики X», «очень большое значение характеристики X» являются термами ПОСП, а \х,у(х),/=1,5,7=1,/ их функциями принадлежности. Если рост характеристики Хр} = \,1 сопровождается уменьшением характеристики У, то «очень большое значение характеристики X», «большое значение характеристики X», «среднее значение характеристики X», «малое значение характеристики X», «очень малое значение характеристики X» являются термами ПОСП, а ц&.(л:),1=1,5,у=1,/ их функциями принадлежности.

Обозначим через х",и=1,-/У,у=1,/ значения характеристик хп ] = 1^ у п-го объекта, п=\,Ы, а через цгу(х"),г=175сте-пени принадлежности этих значений к термам ПОСП с названием хп j = й.

Пусть Хь, /=1,/и„ - уровни вербальных шкал, применяемых для оценивания соответственно характеристик Ху, у=1+\,к. Уровни расположены в порядке возрастания интенсивности проявления соответствующей

характеристики, если ее рост сопровождается ростом У, и в порядке убывания, если ее рост сопровождается уменьшением У.

Построим k - I ПОСП с названиями X , у-1+\,к, терм-множествами соответственно Хь, 1=\,т„,у=1+\,к и функциями принадлежности Ц/Дх),/=1,т„, г=/+1,£.В качестве универсальных множеств ПОСП выбирается и=[0,1]. Будем называть оценками объектов нечеткие числа Х1у, 1=1,111,^^=1+1^ или их функции принадлежности (¿/„(х), 1=\,т^, у=1+\,к. Обозначим через X" и ц"(*)=«, п-\,И,у-1+\,к, оценку п-го объекта в рамках характеристики Ху,л>=1+\,к. Нечеткое число X" с функцией принадлежности ц" (х) равно одному из нечетких чисел Х1у, 1=1,ту,у=1+1,к.

Обозначим через 8(.(х"),

п=\,Ы, у=/+1,£,г=1,5 функцию, которая принимает значение 1, если оценкой п-го объекта в рамках характеристики Хч, у—1+1,к является нечеткое число 1,5, и значение 0, если оценкой п-го объекта в рамках характеристики X , у-1+\,к является нечеткое число

Обозначим через

ш

:JJ=í,к, Хсоу.=1

>1

весовые коэффициенты оцениваемых характеристик. Вычислим коэффициенты

7=1

\>=Ы

Найдем сумму этих коэффициентов, используя свойства ПОСП и определение функций 8;(х"), п-\,Ы, у=/+1,£,г=1,5.

¡=1

+со/(ц1/(х/й)+ц2/(х/л)+...+ц5/(х/"))+ +шг+1(61(^1)+62«1)+...+85«+1))+...

7=1

Исходя из этого, коэффициенты А,",г=1,5, п=\,Ы можно считать весовыми коэффициентами термов характеристики У для п-го объекта, п=\,Ы. Нечеткая рейтинговая оценка п-го объекта, п=\,Ы в рамках характеристик Х^, 7=1, к определяется в виде нечеткого числа

с функцией принадлежности

V ¡=1 /=1 ¡=1 1=1

л=Ц\Г

где %={ал,аа,а^а^ЫХ^.

__ Дефаззифицируем нечеткое число ^,«=1,.^, по методу центра тяжести, полученное четкое число обозначим через

Для распознавания успешности функционирования объектов необходимо идентифицировать нечеткое число с функцией принадлежности (д.и (х), п=\,Ы с одним из термов ПОСП с названием У (с одним из нечетких чисел ^,(=1,5 с функциями принадлежности (х), г=1,5). Для этого вычислим идентифи-

кационные показатели

1

В' =-?-

гл 1

|тт(цг(х),цп(х))й&

, /=1,5, п-\,И.

|тах(ц1.(х),ци(х))й6с

Если Р£=тахР^, то состояние п-го объекта определяется ^-ым уровнем шкалы У1 = «предельно неуспешно», У2 = «неуспешно», У3 = «средне успешно», У4 = «относительно успешно», У5 = «предельно успешно», р=Т,5 [6, 7].

Обозначим соответственно через Л^, Л2 рейтинговые оценки п-го объекта за периоды 1 и 2. В зависимости от соотношений между Ли', Л2 делаются следующие выводы: если Лп' > Лп2, то состояние п-го объекта ухудшилось; если Л 1 < Л 2, то состояние п-го объ-

3 п п ^

екта улучшилось; если Лп' = Лп2, то состояние п-го объекта не изменилось.

2. Пример. Анализ риска банкротства предприятия

Рассмотрим характеристику V - «степень риска банкротства предприятия» с лингвистическими значениями П1 - «незначительная», D2 - «низкая», Б3 - «средняя», Б4 - «высокая», D5 - «наивысшая». Этой характеристике в соответствие можно поставить характеристику С - «состояние предприятия», а лингвистическим значе-

ниям И{,1=1,5 характеристики Б поставить в соответствие лингвистические значения С5 - «предельное благополучие», С4 - «относительное благополучие», С3 - «среднее качество», С2 - «неблагополучие», С1 - «предельное неблагополучие» характеристики С. Областью изменения характеристики С является отрезок [0, 1].

Функциями принадлежности лингвистических значений С/9/=1,5 могут быть функции г|/,/=1,5 соответственно с параметрами ^=(0,0.15,0,0.10),

т]2 =(0.25,0.35,0.10,0.10),

Лз =(0.45,0.55,0.10,0.10),

=(0.65,0.75,0.10,0.10),

Г15 =(0.85,1,0.10,0).

Эксперты установили, что на основании группы из шести отдельных показателей, имеющих равную значимость для анализа, можно проводить комплексный анализ выбранных предприятий с очень высокой степенью достоверности.

Такими показателями являются:

X - коэффициент автономии (отношение собственных средств к валюте баланса);

X2 - коэффициент обеспеченности оборотных активов собственными средствами (отношение чистого оборотного капитала к оборотным активам);

X3 - коэффициент промежуточной ликвидности (отношение суммы денежных средств и дебиторской задолженности к краткосрочным пассивам);

X4 - коэффициент абсолютной ликвидности (отношение суммы денежных средств к краткосрочным пассивам);

X5 - оборачиваемость всех активов в годовом исчислении (отношение выручки от реализации к средней за период стоимости активов);

X6 - рентабельность всего капитала (отношение чистой прибыли к средней за период стоимости активов).

Лингвистическими значениями характеристик ^.,7=1,6 являются следующие значения: X. - «очень низкий», X, - «низкий», 1] '2] '

X . - «средний», X.. - «высокий», Х]. - «очень

высокий», 7=1,6 соответственно с функциями принадлежности ц/;,/=1,5,7=1,6 :

=(0,0.100,0,0.100), ц21 = (0.200,0.250,0.100,0.050), Из, = (0.300,0.450,0.050,0.050), ц41 =(0.500,0.600,0.050,0.100), ц51 =(0.700,1,0.100,0), ц12 =(-1,-0.005,0,0.005), ц22 =(0,0.090,0.005,0.020), ц32 =(0.110,0.300,0.020,0.050), ц42 =(0.350,0.450,0.050,0.050), ц52 =(0.500,1,0.050,0), ц31 =(0,0.500,0,0.100), ц33 =(0.800,0.900,0.100,0.100), ц43 =(1,1.300,0.100,0.200), ц53 =(1.500, оо, 0.200, оо), ц14 =(0,0.020,0,0.010), ц24 =(0.030,0.080,0.020,0.020), ц34 =(0.100,0.300,0.020,0.050), ^ =(0.350,0.500,0.050,0.100),

ц54 =(0.600, оо, 0.100, с»),

ц15 =(0,0.120,0,0.020),

ц25 = (0.140,0.180,0.020,0.020),

ц35 =(0.200,0.300,0.020,0.100),

ц45 =(0.400,0.500,0.100,0.300),

ц55 =(0.800, оо, 0.300, оо),

Шб =(-°°,0,-оо,0),

Ц2б =(0,0.006,0,0.004),

ц36 =(0.010,0.060,0.004,0.040),

ц46 =(0.100,0.225,0.040,0.175),

ц56 =(0.400, оо, 0.175, оо).

Рассмотрим предприятие машиностроения, которое анализируется по двум

Таблица 1

Значения финансовых показателей Financial ratios

Шифр показателя X j Наименование показателя X ] Значение показателя X. - с1. J J в период 1 Значение показателя X - с2 j J в период 2

Xi Коэффициент автономии 0,839 0,822

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

X2 Коэффициент обеспеченности 0,001 -0,060

X3 Коэффициент промежуточной ликвидности 0,348 0,208

X4 Коэффициент абсолютной ликвидности 0,001 0,0001

X5 Оборачиваемость всех активов (в годовом исчислении) 0,162 0,221

X6 Рентабельность всего капитала -4% -4,3%

Таблица 2

Значения М/Дс1.), X11 по периоду 1 The values мДс1^, X^ for the period 1

MiXc1,) М2,(с1,) МзХс1,) М4,(с1,) М5,(с1,-)

Xi 0 0 0 0 1

X2 0 1 0 0 0

X3 1 0 0 0 0

X4 1 0 0 0 0

X5 0 1 0 0 0

X6 1 0 0 0 0

'к1, 0,500 0,333 0 0 0,167

Таблица 3

Значения М//с2;), X2; по периоду 2 The values Mj(c2j), X2; for the period of 2

М1,(с2,) М1,(с2,) Мз,(с2,) М4,(с2,) М5,(с2,)

X1 0 0 0 0 1

X2 1 0 0 0 0

X3 1 0 0 0 0

X4 1 0 0 0 0

X5 0 0 1 0 0

X6 1 0 0 0 0

к2, 0,666 0 0,167 0 0,167

периодам - третий и четвертый кварталы некоторого года (период 1 и период 2) - и характеризуется значениями показателей , у=1, 6, представленными в табл. 1.

В табл. 2 и 3 занесены соответственно

данные Ц/7.(c^)ДJ, /=Ц5,7=М).

Согласно данным табл. 2 и 3, получаем значение для «состояния предприятия» в периоде 1 равным А1 = 0,291, а в периоде 2 равным А2 = 0,287. Предприятие в обоих периодах признано неблагополучным (не-

четкие рейтинговые оценки идентифицируются с термом С2 - «неблагополучие»), с высокой степенью риска банкротства (терм С2 - «неблагополучие» соответствует уровню Б4 - «высокая степень риска банкротства предприятия»). Причем произошло некоторое ухудшение состояния предприятия, причиной которого является перекрытие качественного роста оборачиваемости качественным падением обеспеченности оборотных активов собственными средствами.

Заключение

В настоящей работе для формализации экспертной информации, полученной при оценивании характеристик различных областей деятельности человека (образование, экология, экономика, техника и т.д.), выбраны семантические пространства. Как правило, процедуры экспертного оценивания усложняются разнородностью оцениваемых характеристик, которые носят количественный и качественный характер. Построение рейтинговых оценок в таких условиях стало возможным после появления понятия лингвистической переменной, которая позволила формализовать значения качественных характеристик, а физическим значениям количественных характеристик поставить в соответствие экспертные оценки их качественного восприятия. Результатом этого стала возможность оперирования разнородными характеристиками в рамках единой универсальной шкалы. В работе представлена модель определения рейтинговых оценок в условиях наличия характеристик разнородного

характера, которая гарантирует корректность оперирования с их значениями и устойчивость конечных результатов.

Библиографический список

1. Olga Poleshchuk and Evgeniy Komarov Expert Fuzzy Information Processing. - Springer-Verlag Berlin Heidelberg, 2011. - 237 p.

2. Заде, Л.А. Понятие лингвистической переменной и его применение к принятию приблизительных решений / Л.А. Заде. - М.: Мир, 1976. - 165 с.

3. Полещук, О.М. Методы представления экспертной информации в виде совокупности терм-множеств полных ортогональных семантических пространств / О.М. Полещук // Вестник МГУЛ - Лесной вестник. - 2002. -№ 5(25). - С. 198-216.

4. Полещук, О.М. Математическая модель обработки экспертных оценок / О.М. Полещук // Вестник МГУЛ -Лесной вестник. - 2005. -№ 6(42). - С. 161-164.

5. Полещук, О.М. О развитии систем обработки нечеткой информации на базе полных ортогональных семантических пространств / О.М. Полещук // Вестник МГУЛ - Лесной вестник. - 2003. - № 1(26). - С. 112-117.

6. Домрачев, В.Г. Мониторинг функционирования объектов на основе нечеткого описания их состояний / В.Г. Домрачев, Е.Г. Комаров, О.М. Полещук // Информационные технологии. - 2007. - № 11. - С. 46-52.

7. Ashraf Darwish and Olga Poleshchuk New models for monitoring and clustering of the state of plant species based on sematic spaces / // Journal of Intelligent and Fuzzy Systems. - 2014. - Vol. 26. - P. 1089-1094.

RATING ASSESSMENT ON THE BASIS OF SEMANTIC SPACES Poleshchuk O.M., Doctor of Technical Sciences, Professor, Head of Higher Mathematics and Physics Department (1)

[email protected]

(1)Moscow State Forest University, MSFU, 1, 1st Institutskaya st., Mytischi-5, Moscow reg., 141005, Russia

A model of rating assessment on the basis of semantic spaces in terms of qualitative and quantitative characteristics is developed in the paper. This problem has been nontrivial for a long time because different characteristics have different scales not always with correct arithmetic operations. Solution of the problem in such conditions became possible after the appearance of the concept of linguistic variable which allowed to formalize the values of qualitative characteristics and to match quantitative values of physical characteristics the expert assessment of their quality perception. As a result of that it is appears a possibility of operating with different characteristics within a single universal scale.

Keywords: rating point, linguistic variable, semantic space.

References

1. Olga Poleshchuk and Evgeniy Komarov Expert Fuzzy Information Processing. - Springer-Verlag Berlin Heidelberg, 2011. 237 p.

2. Zadeh L.A. Ponjatie lingvisticheskoj peremennoj i ego primenenie kprinjatiju priblizitel'nyh reshenij [Concept of a linguistic variable and its application to adoption of approximate decisions]. Moscow: Mir, 1976. 165 p.

3. Poleshchuk O.M. Metody predstavleniya ekspertnoy informatsii v vide sovokupnosti term-mnozhestv polnykh ortogonal'nykh semanticheskikh prostranstv [Methods of presentationof expert informationas a set ofterm-sets of complete orthogonalsemantic spaces]. Moscow state forest university bulletin - Lesnoy vestnik. 2002. № 5 (25). pp. 198-216.

4. Poleshchuk O.M. Matematicheskaya model obrabotki ekspertnykh otsenok [Mathematical model of processing expert assessments]. Moscow state forest university bulletin - Lesnoy vestnik. 2005. № 6 (42). pp 161-164.

5. Poleshchuk O.M. O razvitii system obrabotki nechetkoj informacii na bazepolnyh ortogonal'nyhs emanticheskihprostranstv [On the development offuzzy information processing systems on the basis ofcomplete orthogonal semantic spaces]. Moscow state forest university bulletin - Lesnoy vestnik. 2003. № 1 (26). pp. 112-117.

6. Domrachev V.G., Komarov E.G., Poleshchuk O.M. Monitoring funktsionirovaniya ob"ektov na osnove nechetkogo opisaniya ikh sostoyaniy [Performance monitoringobjects based on fuzzy descriptions of their states]. Informatsionnye tekhnologii. 2007. № 11. pp. 46-52.

7. Ashraf Darwish and Olga Poleshchuk New models for monitoring and clustering of the state of plant species based on sematic spaces. Journal of Intelligent and Fuzzy Systems. 2014. Vol. 26. pp. 1089-1094.

i Надоели баннеры? Вы всегда можете отключить рекламу.