8. Data Mining Tools See5 and C5.0 [Электронный ресурс]. URL: https://www.rulequest.com/see5-info.html (дата обращения: 20.04.2018).
Яковлев Сергей Сергеевич, аспирант, bigsergoya@gmail. com, Россия, Тула, Тульский государственный университет,
Середин Олег Сергеевич, канд. ф.-м. наук, доцент, oseredin@yandex. ru, Россия, Тула, Тульский государственный университет
USING DECISION TREE ALGORITHMS IN MULTIDIMENSIONAL SCALING
S.S. Yakovlev, O.S. Seredin
There aremany data visualization algorithms providing set of vector projections of multidimensional data objectsin a space with a smaller dimension used to analyze the value of components ofprojection vectors and the location of groups ofprojected vectors of visualized objects in a given space. However, often these methods can'tprovide sufficient separability of initial multidimensional data objects. It is proposed to use decision tree algorithm See5 for multidimensional scaling. Using C5 algorithmas multidimensional scaling algorithm can provide a qualitative separation of objects from different classes of source data in relation to the existing methods of multidimensional scaling.
Key words: Multidimensional scaling, decision trees, See5/C5.
Yakovlev Sergey Sergeevich, postgraduate, bigsergoya@gmail. com, Russia, Tula, Tula State University,
Seredin Oleg Sergeevich, candidate of mathematical science, docent, oseredin@yandex. ru, Russia, Tula, Tula State University
УДК 004.827
РЕШЕНИЕ ОБРАТНЫХ ЗАДАЧ ПРИ ИНТЕРВАЛЬНОМ ЗАДАНИИ
ИСХОДНЫХ ДАННЫХ
В. А. Фатуев, И. А. Пчелинцев
Предлагается метод решения обратных задач, позволяющий значительно сократить бесконечное множество решений при интервальном задании исходных данных. Обратная задача решается на основе диофантова уравнения с использованием факторного пространства и интервальной математики.
Ключевые слова: интервал, диофантовы уравнения, обратная задача, факторное пространство, функция Эйлера.
Решение обратных задач является весьма актуальной проблемой. Такие науки, как физика и математика, обязаны многим открытиям именно формализацией и решением обратных задач. Но не только точные науки нуждаются в решении подобных задач. Например, в археологии постоянно возникает необходимость решения обратных задач для восстановления последовательности исторических событий на основе
145
достаточно малого количества зарегистрированных находок и заключений. Задачи диагностики в медицине также являются обратными задачами по своей сути. Для примера, по текущим параметрам состояния пациента возможно определить, какая болезнь у пациента и причины ее возникновения. Возможны различные постановки обратных задач [1,4].
Пусть задана структура математической модели: у = щ ■ а + и2 ■ Ь. Обратная задача заключается в нахождении щ и и2 при известных у,а,Ъ. В такой постановке данное уравнение известно, как диофантово и имеет бесконечное количество решений.
При моделировании используется такое понятие, как факторное пространство.
В общем случае решением диофантова уравнения является бесконечное количество комбинаций входных значений, но, так как имеется факторное пространство, выходить за пределы которого недопустимо, искомым решением будет такая комбинация, которая входит в факторное пространство и удовлетворяет уравнению.
Один из методов решения данного уравнения предполагает использование функции Эйлера. Функция Эйлера - мультипликативная арифметическая функция, равная количеству натуральных чисел, меньших п и взаимно простых с ним. При этом полагают по определению, что число 1 взаимно просто со всеми натуральными числами, и Д1)=1.
Решение уравнения у = щ- а + и2- Ь имеет вид [1] Г щ = (у а^-У) + Ь-к
\и2 = (у (1-а^(й))/Ь)-а-/с' где у,а, Ь - известные коэффициенты, а/(Ъ) - функция Эйлера от второго известного коэффициента, к - подбирается вручную.
Для нахождения щ и и2 нужно подобрать такое чтобы данное решение удовлетворяло факторному пространству. Чтобы исключить бесконечное число решений к принимается целым числом, в частных случаях возможно принятие к как дробного значения. Таким образом, вычисляется решение обратной задачи для двух входных факторов с учетом факторного пространства с обычными данными.
Можно представить универсальное решение для п неизвестных, когда уравнение приводится к двум зависимым переменным. Две зависимые переменные выбираются произвольно, в зависимости от постановки задачи.
Пример для четырех входных факторов:
а - щ + Ь ■ и2 + с ■ щ + с1 ■ и4 = у.
Пусть щи и2— зависимые переменные, тогда:
щ=у2- +Ь-к; и2 = у2 ■ (1 - а^)/Ь -а-к,
где а,Ь — известные коэффициенты, у2находится в зависимости от введенных независимых факторов, к— целое число, выбирается подбором , в зависимости от щ ии2;
У 2 = У ~ (с ' из +(1-щ).
Исходя из вышеперечисленного, для решения задачи нужно ввести три значения: щ, щ, к. При этом щ, щ вводятся независимо от других коэффициентов, после находятся иь и2.
Данный подход можно использовать и при интервальном задании исходных данных.
Если используются интервальные данные, то все вычислительные операции проводятся на основе интервальной математики: [3, 4] пусть имеются два интервала
А=[а, Ь] В=[с, ё],
тогда
С=А+В=[а+с, ЪЩ; С=А-В=[а-ё, Ь-с] 146
C=A-B=[min (ас, ad, bc, bd), шах (ас, ad, bc, bd)] C=A/B=[a,b] -[l/d,l/c], d,c <> 0.
Рассмотрим в качестве примера интервальную модель с тремя интервальными входами и одним интервальным выходом:
а[3; 5] ■ иг + Ъ[6; 8] ■ и2 + с[ 1; 3] ■ и3 = у[99; 136],
где U^max ], U2[u2min) U2max] , Uз\Цзт1п> тах]-
Универсальное решение проводится в два этапа:
1) выбор двух зависимых факторов и перенос независимых в правую часть уравнения;
2) нахождение решений по минимальным и максимальным значениям интервалов.
Пусть щ и и2— зависимые факторы, следовательно, фактор щ независимый и переносится в правую часть уравнения:
а[3; 5] ■ иг + Ь[6; 8] ■ и2 = у[99; 136] - с[ 1; 3] ■ щ
Вводится переменная у2 :
а[3; 5] ■ иг + Ь[6; 8] ■ и2 = Уг\УгтЫ,Угтах\ ГД6 "У2тЫ ~ 99 — 3 " У-2тах> У2тах ~ 136 — 1 ■ У-2тт-
Находятся решения по минимальным и максимальным значениям интервалов:
3 " U^min + 6 " U2min — y2min> 5 " U^max + 8 " U2max — У2т,ахш
Откуда: а
и1 min ~ ( У2тт ' ^ ) + 6 ■ /с, и2min = (.У2min ' (З — — 3 ■ к;
и1 тах = ( У2тах ' + 8 ■ к2;
Щ тах = (У2шах"(1-5/(8)))/8-5-/с2.
Пусть известно что интервал щ [5;8], а выходу[99; 136]:
а[3; 5] ■ иг + Ъ[6; 8] ■ и2 + с[ 1; 3] ■ и3[5; 8] = у[99; 136], а[3; 5] ■ иг + Ъ[6; 8] ■ и2 = у[99; 136] - с[ 1; 3] ■ и3[5; 8], а[3; 5] ■иг + Ь[6;8] ■ и2 = у2[75; 131].
Решение по минимальным и максимальным значениям описываются уравнениями 1 и 2 соответственно:
3 ■ Uimin + 6 ■ u2min — 75; (1)
5 ■ Щтах + 8 ■ и2тах — 131. (2)
Тогда:
ты = 75 ■ 3(/(б)_1) + 6 ■ кг = 225 + 6 ■ к±) (1 - ЗГЮ)
и2min — 75 - 3 • ki — —100 — 3 ■ к^,
У-imax = 131 ■ 5^(8)_1) + 8 ■ k2 = 16375 + 8 ■ k2, (1 - 5/W)
u2max = 131 ■ ^---J- -5 -k2 = -10218 - 5 ■ k2.
Пусть из факторного пространства известно, что щ , и2 не могут быть отрицательными и не могут быть больше 25. Исходя из этого условия подбираются коэффициенты к1ик2:
кг = -37, к2 = -2046. uimin = 225 + 6 ■ (—37) = 3; u2min = —100 — 3 ■ (—37) = 11;
Щтах = 16375 + 8 ■ (-2046) = 7; и2тах = -10218 - 5 ■ (-2046) = 12.
На рисунке представлены графически уравнения по минимальным и максимальным значениям. Исходя из априорных условий мы можем варьировать размеры интервалов щи и2. К примеру щ [3;7] , и2 [11; 12] , можно уменьшить интервал если расширить интервал и2 :
Щ [3;5], и2 [11; 13,25] .
Так же можно поступить и наоборот. На уравнении такие действия отразятся изменением коэффициентов к^ или к2, т.е. за изменения в минимальных значениях интервалов щ,и2, отвечает /сь а за изменения в максимальных значениях отвечает к2.
Пример:
кх = -37, к2 = -2046, щ [3;7], и2 [11;12];
к± = -36,6667 , к2 = -2046, и± [5;7] ,и2 [10; 12] (частный случай когда к± не целое число);
кг = -37, к2 = -2046,375 , иг [3;4] ,и2 [11; 13,875]; (частный случай когда к2 не целое число).
Графическое представление уравнений 1 и 2.
Варианты решения уравнения: а[3; 5] ■ U-J3; 7] + Ь[6; 8] ■ и2 [11; 12] + с[1; 3] ■ и3 [5; 8] = у[99; 136]. а[3; 5] -и![5;7] + Ь[6; 8] ■ и2 [10; 12] + с[1; 3] ■ и3 [5; 8] = у[99; 136]. а[3; 5] ■ U-J3; 4] + Ь[6; 8] ■ и2[11; 13,875] + с[1; 3] ■ щ [5; 8] = у[99; 136]. В данной статье сформулирована и решена обратная задача определения возможных интервалов значений входных переменных реальных объектов с известными интервальными моделями статики при заданных интервалах значений выходной переменной. Подобные задачи возникают всегда при программном управлении и оптимизации реальных объектов в условиях интервальной неопределенности.
Список литературы
1. Башмакова И.Г. Диофант и диофантовы уравнения. М.: Наука, 1972.
68 с.
2. Фалин Г.П., Фалин А.И. Линейные диофантовы уравнения. М.: Чистые Пруды, 2008. 32 с.
3. Скибицкий Н.В. Интервальные методы в задачах построения моделей объектов и процессов управления: дис. ... д-ра техн. наук. М., 2005. 310 с.
4. Вощинин А.П. Интервальный анализ данных: развитие и перспективы // Заводская лаборатория. 2002. T. 68. № 1. С.118 - 126.
Фатуев Виктор Александрович, д-р техн. наук, профессор, vfaliiev a inhox.ru, Россия, Тула, Тульский государственный университет,
Пчелинцев Иван Андреевич, аспирант, _pchel.21 @yandex.ru, Россия, Тула, Тульский государственный университет
THE SOLUTION OF INVERSE EXERCISE WITH INTERVAL SETTING THE INITIAL DATA
V.A. Faluev, I.A. Pchelinlsev
We propose a method for solving inverse exercise, which can significantly reduce the infinite numbers of solutions in the interval selling of the original data. The inverse exercise is solved on the basis of the Diophantine equation, using factor space and interval mathematics.
Key words: interval, Diophantine equations, inverse problem, factor space, Euler
function.
Fatuev Victor Aleksandrovich, doctor of technical sciences, professor, [email protected], Russia, Tula, Tula State University,
Pchelintsev Ivan Andreevich, postgraduate, pchel. 21 @yandex. ru, Russia, Tula, Tula State University
УДК 004
ЧЕЛОВЕЧЕСКИЙ ФАКТОР В ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ
Д.Г. Маркова
Рассматривается понятие «человеческий фактор», основные аспекты проблемы человеческого фактора в информационной безопасности, структурные компоненты данной проблематики, а также её возможное решение.
Ключевые слова: человеческий фактор, информационная безопасность.
Поскольку человек является потребителем информации и субъектом её обработки, всегда существовал, существует и будет существовать риск, связанный с ошибкой принятия решения. Примером служит неверное определение круга лиц с доступом к информации. Также, возможности человека в исполнении тех или иных решений всегда чем-либо ограничены. Характеристики, которые возникают при взаимодействии человека с любыми техническими системами, включая сторонние системы обработки информации, часто называют «человеческий фактор».
Ошибки, которые являются проявлением человеческого фактора, как правило, не относятся к преднамеренным. Человек выполняет ошибочные действия и расценивает их при этом как верные или же наиболее подходящие, и ошибки могут возникать при обыкновенной невнимательности или халатности.
149