Рис.4. Окно визуализации дробильной фабрики
дробильно-измельчительного комплекса горнообогатительного комбината в виде структуры с распределенными параметрами функции сокращения крупности руды позволяет минимизировать удельные затраты на процессы дробления-измельчения и добиться максимальной производительности технологической линии.
Экономический эффект от использования пред-
Рис.5. Окно визуализации обогатительной фабрики
ложенной системы обеспечивается за счет перераспределения нагрузок между отдельными стадиями процесса рудоподготовки в соответствии с текущими характеристиками перерабатываемой руды и состояния технологического оборудования, позволяет добиться снижения нагрузок на конечную стадию - измельчение, что, в свою очередь, способствует общему снижению энергопотребления.
Библиографический список
1. Купш А.1. 1нтелектуальна щентифка^я та ке-рування в умовах процеав збагачувальноТ технологи: монографiя. Кривий Р^: КТУ, 2008. 204 с.
2. Маринич И.А. Математическое описание дробиль-но-измельчительного комплекса горнообогатительного комбината в виде структуры с распределенными параметрами // Вюник Криворiзького техшчного ушверситету : зб. наук. праць. 2011. №29. С.250-256.
3. Маринич И.А., Савицкий А.И. Распределенная система автоматического управления рудоподготов-кой на базе промышленных контроллеров // Новое в
технологии и технике переработки минерального сырья: сб. науч. трудов. Кривой Рог, 2012. С.143-154.
4. Моркун B.C., Цокуренко А.А., Луценко И.А. Адаптивные системы оптимального управлення технологическими процессами. Кривой Рог: Минерал, 2005. 261 с.
5. Пат. на корисну модель № 72410 УкраТна, МПК 2012.01. Споаб управлшня дробильно-подрiбнювальним комплексом / Маринич I.A.; заявник i патентовласник Криворiзький техн. ун-т. -№201110455; заявл. 29.08.2011; опубл. 27.08.2012, Бюл. № 16.
УДК 004.94
ИССЛЕДОВАНИЕ ПРОЦЕССОВ ПОСТРОЕНИЯ МОДЕЛЕЙ ГРУППОВЫХ ЭТАЛОНОВ
К.К. Паскал1, И.А. Серышева2, Н.С. Царёва3, Ю.П. Хрусталев4
Иркутский государственный технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83.
Недоопределенными называются системы, в которых размерность вектора наблюдений меньше размерности вектора состояния. Для повышения точности оценок вектора состояния таких систем можно использовать его прогнозы, вычисляемые на предыдущих тактах обработки измерительной информации. В работе исследуются процессы построения прогнозирующих моделей, когда исходных временных рядов (обучающая выборка) нет в распоряжении исследователя.
1 Паскал Кристина Константиновна, студентка факультета кибернетики, тел.: 89516283436, e-mail: [email protected] Paskal Kristina, Student of the Faculty of Cybernetics, tel.: 89516283436, e-mail: [email protected]
2Серышева Ирина Анатольевна, старший преподаватель кафедры автоматизированных систем, тел.: (3952) 405164, e-mail: [email protected]
Serysheva Irina, Senior Lecturer of the Department of Automated Systems, tel.: (3952) 405164, e-mail: [email protected]
3Царёва Наталья Сергеевна, студентка факультета кибернетики, тел.: 89526236560, e-mail:[email protected] Tsaryova Natalya, Student of the Faculty of Cybernetics, tel.: 89526236560, e-mail: [email protected]
4Хрусталёв Юрий Петрович, кандидат технических наук, доцент кафедры вычислительной техники, тел.: (3952) 405107, email: [email protected]
Khrustalev Yuri, Candidate of technical sciences, Associate Professor of the Department of Computing Machinery, tel.: (3952) 405107, e-mail: [email protected]
Ил.5. Табл. 1. Библиогр. 6 назв.
Ключевые слова: недоопределенные системы; идентификация; прогнозирующие модели; процессы авторегрессии; критерии адекватности; временные ряды; оптимизация.
STUDYING REFERENCE GROUP MODEL BUILDING K.K. Paskal, I.A. Serysheva, N.S. Tsaryova, Yu.P. Khrustalev
Irkutsk State Technical University, 83 Lermontov St., Irkutsk, Russia, 664074.
The systems, where the dimensionality of the observation vector is less than the dimensionality of the state vector are called underdetermined. The authors propose to use state vector predictions calculated at the previous cycle of measuring information processing in order to improve its estimates precision. The paper studies the processes of building predictive models when the initial time series (a training set) are not available for the researcher. 5 figures. 1 table. 6 sources.
Key words: underdetermined systems; identification; predictive models; autoregression processes; adequacy criteria; time series; optimization.
Одной из типичных задач исследования динамических стохастических систем является задача оценки их состояния и связанные с ней проблемы идентификации. Задача оценивания состояния заключается в нахождении оценок вектора состояния системы по результатам измерений. В литературе различают задачи обработки измерений (когда учитываются шумы измерительной системы) и наблюдений (когда шумами измерений можно пренебречь) [1].
Во многих технических системах результаты измерений представляют собой разности физических величин - измеряемой и эталонной (или образцовой) искомого вектора - вектора состояния. С математической точки зрения такие системы являются недоопре-деленными. Типичным примером подобных систем являются групповые эталоны физических величин, в частности, эталоны времени и частоты. В [2, 3] показано, что оценки состояния эталонов времени и частоты, оптимальные в смысле минимума суммы квадратов их отклонений от «истинных значений», могут быть найдены на основе использования прогнозирующих моделей - моделей авторегрессии - скользящего среднего. При этом используется субоптимальный фильтр Калмана, в котором динамика системы учитывается при вычислении прогнозов относительных отклонений частоты водородных стандартов - мер времени и частоты [2]. Прогнозирующие модели строятся по методике Бокса-Дженкинса при наличии исходных временных рядов, которые можно рассматривать в качестве обучающей выборки.
Проблемы построения таких моделей для стандартов, входящих в состав эталонов времени и частоты, заключаются в отсутствии данных об относительных отклонениях частоты для каждого из элементов группового эталона. Имеются лишь результаты косвенных измерений - относительные разности частот опорного и /'-го стандарта, 1=1, 2,...,п, где / - число стандартов в эталоне. Как уже упоминалось выше, мы имеем дело с недоопределенной системой. В [2] показано, что оценка состояния опорного элемента ух-относительное отклонение его частоты от «истинного значения» в момент времени 1к, к = 1 ,2 ,. . может быть найдена при статической обработке данных путем минимизации функционала
п-1 N ¡=1 ¡=1
где -результат /-го измерения, выполненного в момент г;Д1) - прогноз этого измерения. Т.к. прогнозы ¿ц=у1]-уц зависят от параметров прогнозирующих моделей: ф ¡- коэффициенты авторегрессии и - коэффициенты скользящего среднего ( I=1, 2,...,р, к=1, 2,...,ц), то задача минимизации функционала /сводится к поиску векторов параметров моделей /}■ = [ф12.....р • в[22.....ч]для всех стандартов, входящих в состав эталона.
В [3] продемонстрировано применение данного подхода к задаче оценивания состояния вторичного эталона времени и частоты ВЭТ 1-5 ВСФ ВНИИФТРИ по результатам взаимных измерений. Показано, что сумма квадратов отклонения оценок относительных отклонений частоты опорного стандарта от значений, найденных с помощью системы ГЛОНАС, снижается примерно на 9% по сравнению с оценками метода наименьших квадратов (МНК-оценки). Кажущееся незначительным повышение эффективности алгоритма оценивания, основанного на использовании прогнозов вектора состояния эталона, на самом деле связано с серьезным экономическим эффектом, поскольку прирост точности эталона за счет привлечения новых, более точных технических средств требует больших капиталовложений.
Однако оценка эффективности алгоритмов обработки данных, получаемых в процессе функционирования эталонов времени и частоты, на основе их сличения с Государственным эталоном не является единственным из возможных методов. Более того, оценки состояния Государственного эталона сами содержат погрешности (как и вообще все оценки). Кроме того, погрешности канала сличения (система ГЛОНАС) также вносят дополнительный вклад в погрешность оценивания вектора состояния вторичного эталона. Поэтому представляется весьма важным использовать подход к оцениванию точности алгоритмов обработки данных, получаемых в групповых эталонах, на основе методов статистического моделирования.
На наш взгляд, особого внимания заслуживают следующие моменты:
- Генерация (имитация) временных рядов Y(t), обладающих заданными статистическими свойствами.
- Имитация рядов наблюдений = ^(О -и оценка параметров моделей в недоопределен-
ных системах на основе минимизации критерия /(//).
- Исследование рядов остатков а;( £) = Уг(£) -У;(0и проверка адекватности построенных моделей.
Введем ряд ограничений, вытекающих из изложенного выше подхода к поставленной задаче моделирования (мы не предполагаем всестороннего изучения процессов идентификации недоопределенных систем, а рассматриваем лишь отдельные, на наш взгляд, ключевые моменты в этой процедуре).
1. Исходя из потребностей исследуемых в данной работе реальных систем (вторичные эталоны времени и частоты), будем считать ряды измерений, а следовательно, и ряды исходных данных равнопро-межуточными, т.е. будем считать, что мы работаем с данными, полученными на суточных интервалах.
2. Шумами измерений при обработке данных на суточных интервалах можно пренебречь. Иначе говоря, мы решаем задачу обработки наблюдений.
3. Поскольку наша задача - выявление основных закономерностей, проявляющихся при идентификации недоопределенных систем, то не имеет смысла рассмотрение всего множества моделей авторегрессии -скользящего среднего. Ограничимся лишь самыми простыми моделями - моделями авторегрессии (АР) первого порядка.
4. Т.к. при анализе реальных данных детерминированные тренды, содержащиеся в рядах относительных отклонений частоты водородных стандартов, могут быть обнаружены и учтены при обработке путем привлечения результатов внешних сличений [3], то мы будем считать достаточным рассмотрение моделей класса АР, т.е. откажемся от использования разностных рядов, а следовательно, и термина «проинтегрированные» применительно к динамическим стохастическим моделям.
Исходя из поставленных задач и вытекающих из них ограничений, рассмотрим инструментальные средства, которые целесообразно использовать при моделировании процессов построения моделей авторегрессии скользящего среднего (АРСС). Прежде всего, отметим, что разработка специализированных систем моделирования в настоящее время может рассматриваться как определенное «архитектурное излишество», требующее значительных затрат времени исследователя, поскольку поставленную задачу можно решить, используя программные средства компьютерной математики: МАТ1.АВ, МАП-ЮАР, БТАПвТЮА и т.д. Наиболее универсальной системой из перечисленных выше, безусловно, является МАТ1_АБ. Однако, несмотря на множество существующих ограничений, для решения многих проблем можно использовать систему МАТ-ЮАР. Более того, МАТНСАР может быть с успехом применен и в более сложных задачах, таких как задачи субоптимальной фильтрации, рекуррентного оценивания состояний и т.д. С учетом значительно меньшей стоимости этой системы, а также простой процедуры обмена данными с другими систе-
мами (в частности с ППП STATISTICA) было решено использовать для наших целей, кроме решения оптимизационной задачи, в основном, именно MATHCAD. Как показали дальнейшие исследования, это решение было правильным, поскольку позволило объединить процесс изучения процедуры идентификации недоопределенных систем с процессом реализации алгоритмов построения прогнозирующих моделей, т.е. по существу решить проблему работы с ППП MATHCAD и STATISTICA в интерактивном режиме.
Рассмотрим процедуру генерации процессов авторегрессии с использованием MATHCAD при следующих значениях параметров временного ряда: а2 - дисперсия белого гауссова шума - 0,01 (СКО а = 0,1); YY1 - начальное значение ряда - 0; n - длина временного ряда = 200; ф 1 - коэффициент авторегрессии = 0,8.
Фрагмент ряда ^ (первые 20 точек) приведен на рис. 1. Видно, что данный ряд, сформированный с помощью MATHCAD-программы (рис. 2), имеет сильную положительную корреляцию.
Рассмотрение частной автокорреляционной функции (рис. 3) подтверждает это предположение.
0.4
0.2
Ai 0
- 0.2
- 0.4
10
15
20
Рис. 1. Фрагмент временного ряда, сгенерированного с помощью модели АР(1), ф 1=0.8
ARl(fii) :=
k ^ 1 YYk ^ Ak
while k < 400 k ^ k + 1
YY ^ fii • YY , + A, k k-1 k
YY
Рис. 2. Фрагмент программы генерации временных рядов
Модель АР, построенная для сгенерированного ряда с помощью ППП STATISTICA, дает ту же самую оценку (= 0 ,8).
Влияние дисперсии шума <т|, «возбуждающего систему», оценивалось генерацией процессов АР(1) -авторегрессии 1-го порядка. При разном уровне шума <т2 = 1 , <т22 = 4 вид частной автокорреляционной функции не меняется. При достаточно большой выборке (W >100) оценки параметров фг практически не зависят от уровня шума. Фрагменты временных рядов, полученных при указанных выше значениях ,
приведены на рис. 4.
5
-1,0 -0,5 0,0 0,5
Рис. 3. Частная автокорреляционная функция
A1,
A2;
' к'А ■Ал^
-s/' 1 ■ ■Jу V- fi/ У V •
10
20
30
40
50
Рис. 4. Временные ряды, полученные при разных уровнях шумов
Таким образом, используя предложенную процедуру генерации временных рядов, мы можем получать временные ряды с заданными статистическими свойствами. Ряды наблюдений zi(t) получаются простым вычитанием членов выборки, соответствующих i-му элементу группового эталона, из «элементов» опорного стандарта частоты, т.е. Zi(t) = YYx(t) - YY^t).
Метод, используемый при идентификации параметров моделей АРСС (в нашем случае - коэффициентов ф1), заключается в минимизации суммы квадратов отклонений результатов наблюдений z(t) от их прогнозов Zi(t), Zi(t) = YY^t) - YY2(t), где прогнозы YY1 и yY^ момент t находятся как Щ = фt-1). Таким образом, речь идет об оптимизации функционала /. В системе MATHCAD оптимизационные задачи решаются с помощью встроенных функций Minimize и Maximize. Причем целевая функция задается в аналитическом виде. В нашем случае прогнозы и оценки текущих значений рядов «относительных отклоне-
ний», т.е. рядов Yнаходятся с помощью МАТНСАй-подпрограммы. Попытки решить поставленную задачу в МАТНСАй к успеху не привели. Ни в одной из просмотренных многочисленных публикаций по методам оптимизации в системе МАТНСАй задач в подобной постановке нам не встречалось. Поэтому для поиска оптимальных значений коэффициентов ф1 использовалась функция Мпипо пакета МАТ1.АВ. При моделировании генерировались три временных ряда: Y1, Y2, Y3. Ряды имитировались с помощью моделей авторегрессии 1-го порядка. СКО гауссово шума для всех трех рядов полагалось равным 0,1. Длина рядов - 100. Коэффициенты авторегрессии: ф 1 = 0 ,5 ; ф\ = 0,3; Ф1 = -од.
Начальные оценки вектора параметров выбирались из области допустимых значений [4]. В наших экспериментах полагалось, что ф1 = 0,1 = 1 ,2, 3. Было проведено 10 машинных экспериментов, в которых находились оптимальные оценки параметров (коэффициентов ф;). Средние значения оценок: ф>1 = 0,5 02 8; ф> I = 0, 3136 ; ф I = -0, 1 0 0 18. Максимальная погрешность оценивания ( -норма) не превышает по модулю 0,014. Относительная погрешность равна примерно 4%, что вполне допустимо для задач, связанных с обработкой экспериментальных данных. Естественно, что с увеличением объема выборки точность оценивания растет [5].
Следующим шагом в наших исследованиях является проверка адекватности построенных моделей. Ограничимся при этом только проверкой адекватности модели опорного элемента (точнее, модели временного ряда, построенной для относительных отклонений частоты опорного генератора эталона времени и частоты). Практически все критерии адекватности моделей АРСС основываются на анализе остаточных членов ^ = ^ 1 ), вычисляемых как разность
5
0
5
текущей оценки члена ряда % и ее прогноза 1 ), вычисляемого на предыдущем шаге. Для адекватных моделей остаточные члены должны подчиняться нормальному закону и быть не коррелированными [4]. На рис. 5 приведена гистограмма ряда остатков, из которой видно, что распределение близко к нормальному.
[4]:
Совокупный критерий согласия вычисляется как
<2 = n-^r2
(г; = A Ci? ;,n = 50 0 - объем выборки),< = 5 ,8 5. Число степеней свободы рравно 14 (fc = 1 5 ;v = к - 1 ),
Более формальные методы основываются на использовании критерия Пирсона. Например, для ряда остатков, содержащего 100 точек, с математическим ожиданием £[Х] = 0 и единичной дисперсией (<т = 1) при разбиении на 16 разрядов (число степеней свободы v = 1 4) получено значение X2-статистики, равное 2,99, что соответствует вероятности р =0,886 (критическое значение X2(14) при уровне значимости 0,05 равно 23,68). Естественно, что при таких результатах гипотеза о нормальности остатков отброшена быть не может.
Наиболее общий подход к анализу адекватности моделей АРСС основывается на использовании совокупного критерия согласия [4], в котором анализируются значения корреляционной функции ряда остатков. Автокорреляционная функция вычислялась с помощью STATISTICA. Импорт ряда остатков из MATHCAD в STATISTICA производится с помощью группы операторов: ТИе:="путь", например, file:="D:\2\test.txt"
A:= "идентификатор импортируемого файла" writePRN(file):=A
После этого файл с именем "file" вводится в ППП STATISTICA через буфер обмена. Автокорреляционные функции (ACR), вычисленные в ППП, представлены в таблице (K - номер лага):
K ACR K ACR
1 0,004 9 -0,034
2 -0 10 0,088
3 0,024 11 0,019
4 0,002 12 0,059
5 0,030 13 -0,040
6 -0,038 "14 0,052
7 0,019 15 0,013
8 -0,081
-1 О 1
Верхние границы (х <= граница)
Рис. 5. Гистограмма ряда остатков
(?кр( 14) - критическое значение величины (?, подчиняется Х2-распределению. На уровне значимости 0,05 равно 23,58. Вычисленное значение критерия 5,85<<23,58. Таким образом, гипотеза об адекватности модели не отбрасывается и на основании совокупного критерия. Впрочем, подобный результат можно было предполагать и на основе простого рассмотрения ряда остатков.
Таком образом, модели АР, построенные на основе минимизации функционала и, удовлетворяют требованиям адекватности и могут быть использованы для вычисления краткосрочных прогнозов рядов относительных отклонений частоты водородных стандартов.
Все полученные выше результаты основываются на знании структуры временных рядов. На практике порядки авторегрессии (р) и скользящего среднего ( ц) не известны. Известно только, что р и ц не превышают 5 [4]. Многолетний опыт работы с моделями временных рядов относительных отклонений частоты показал, что для водородных стандартов, эксплуатируемых в составе эталонов времени и частоты в СССР в 70-80-х годах, порядок процессов не превышает 3 и 2 соответственно для р и ц [6].
Исследования по влиянию структурной избыточности на точность оценивания параметров авторегрессии показали, что с увеличением порядка в моделях АР не удается подучить резкого уменьшения параметра при превышении «истинной» величины , т.е. порядка АР, заданного при генерации временных рядов. Это в целом соответствует положению о неоднозначности моделей АРСС, построенных для конкретных временных рядов (как правило, существует несколько альтернативных моделей, остаточные дисперсии которых отличаются весьма незначительно). Даже при небольшом числе стандартов, входящих в групповой эталон (5-6 стандартов), общее число мо-
делей, рассматриваемых в качестве альтернативных, весьма велико. В [3] был предложен для решения данной задачи подход, основанный на получении предварительных оценок состояния эталона с помощью метода наименьших квадратов - МНК-оценки, которые находятся с помощью псевдообратной матрицы наблюдений. Для опорного элемента МНК-оценки для каждого такта обработки t равны среднему арифметическому результатов наблюдений:
п-1
t = l ,2.....N.
П ¿—1
¡=1
Можно показать, что автокорреляционная функция (ACR) ряда yon(t), а следовательно, и частная ACR при увеличении объема выборки N и числа элементов группового эталона стремится к ACR «истинных» (т.е. сгенерированных при известных ф;) рядов. Поэтому ряды, полученные с помощью псевдообратной матрицы, можно использовать для решения задачи определения структуры моделей АРСС, т.е. следуя терминологии Бокса-Дженкинса, задачи идентификации моделей. Решение задачи оценивания параметров моделей АРСС при известной их структуре рассмотрено выше и основано на минимизации функционала/.
В заключение рассмотрим вопрос об эффективности алгоритмов субоптимальной фильтрации, основанных на использовании краткосрочных прогнозов, вычисленных с помощью моделей АРСС. Под эффективностью будем понимать средний квадрат отклонений оценок относительных отклонений частоты опорного стандарта от их «истинных» значений. В качестве «истинных» примем значения ряда ^(t), сгенерированного на основе заданного коэффициента АР. Теоретически оценить эффективность алгоритма крайне сложно, т.к. она зависит от применяемых динамических стохастических моделей временных рядов, от
Библиограф
1. Браммер К., Зиффлинг Г. Фильтр Калмана-Бьюси / пер. с нем. М.: Наука, 1982. 198 с.
2. Хрусталев Ю.П. Статическая и динамическая обработка данных, получаемых в процессе ведения эталонов времени и частоты // Измерительная техника. 2004. №6. С.20.
3. Хрусталев Ю.П., Акулов В.М., Ипполитов А.А., Курыше-ва Л.Н. Обработка данных, полученных по результатам взаимных измерений вторичного эталона времени и частоты // Вестник ИрГТУ. 2012. №7.
4. Бокс Д., Дженкинс Г. Анализ временных рядов. Прогноз и управление. М.: Ж мир, 1974. Вып.1. 406 с.
уровня шума, возбуждающего систему, от наличия трендов (детерминированных и стохастических) и т.д. Анализ экспериментальных данных показал, что эффективность субоптимального алгоритма примерно на 20% выше эффективности алгоритма, основанного на использовании МНК-оценок. Это примерно соответствует данным, полученным при использовании алгоритма ARS (авторегрессии скользящего среднего) для оценки результатов внутренних измерений, выполняемых в эталоне времени и частоты [6]. В настоящей работе рассматривались временные ряды, в которых:
- отсутствуют тренды,
- используются простейшие модели временных рядов,
- ограничено число исходных временных рядов и соответственно рядов измерений.
Тем не менее, из анализа даже таких, весьма упрощенных, систем можно сделать ряд серьезных выводов:
1. Используя модели АРСС, можно генерировать временные ряды, статистические характеристики которых удовлетворяют предъявляемым требованиям.
2. Модели АР, параметры которых находятся минимизацией функционала - суммы квадратов отклонений результатов измерений от их прогнозов, отвечают требованиям адекватности.
3. Структуру моделей АР (и АРСС) можно оценить, рассматривая временные ряды, соответствующие оценкам относительных отклонений частоты водородных генераторов, которые получаются с использованием псевдообратной матрицы (МНК-оценки).
4. Оценки вектора состояний эталонов, полученные на основе использования алгоритмов субоптимальной фильтрации, более эффективны, нежели МНК-оценки.
ский список
5. Хрусталев Ю.П., Овечкина А.А., Щербаков Е. Построение моделей многомерных временных рядов по результатам наблюдений в динамических системах // Методы исследования и моделирования технических, социальных и природных систем. Новосибирск: Наука, 2003. С.293-307.
6. Хрусталев Ю.П., Спиридонова Е.В. Алгоритмы обработки измерительной информации, получаемой в процессе хранения единиц времени и частоты // Техника средств связи. Серия «Радиотехнические измерения». М., 1986. Вып. 0. С. 58-72.