в программных модулях ЕИС и внедрены в УГТУ — УПИ. Благодаря совершенствованию и автоматизации процесса "Движение контингента" повысилась производительность: сотрудников деканата — на 27 %, а сотрудников ЛСС — на 29 %, т. е. более чем в три раза. Экономический эффект от внедрения предложенных моделей "как будет" и автоматизации процесса "Движение контингента" составляет 1027 гыс. руб. в год. Эффект достигнут за счет сокращения "лишних" петель и этапов процесса движения докумен-
тов. сокращения ввода дублирующей информации и снижения нагрузки на сотрудников деканатов и личного стола студентов.
Решение задачи интеграции имитационного. экспертного, ситуационного и мультиагентного моделирования, а также объектно-ориентированного подхода позволило реализовать объектно-ориентирован-ный метод моделирования и принятия решений МППР, а также ОО СППР ВР51ш4, которая используется в УГТУ.
СПИСОК ЛИТЕРАТУРЫ
1. Андрейчиков A.B., Андрейчикова О.Н.
Интеллектуальные информационные системы: Учебник. М.: Финансы и статистика. 2004. 424 с.
2. Швецов А.Н. Модели и методы построения корпоративных интеллектуальных систем поддержки принятия решений: Дис. ... д-ра техн. наук. СПб.. 2004. 461 с.
3. Аксенов К.А., Гончарова Н.В. Динамическое моделирование мультиагентных процессов преобразования ресурсов. Екатеринбург: ГОУ ВПО УГТУ-УПИ, 2006. 311 с.
4. Аксенов К.А. Исследование и разработка средств имитационного моделирования дискретных процессов преобразования ресурсов: Дис. ... канд. техн. наук / ГОУ ВПО "УГТУ — УПИ". Екатеринбург, 2003. 188 с.
5 Аврамчук Е.Ф., Вавилов A.A., Емельянов C.B. и др. Технология системного моделирования. М.: Машиностроение. 1988. 520 с.
6. Jorg Р. Müller. Markus Pischel. The Agent Architecture InteRRap: Concept and Application / German Research Center for Artificial Intelligence (DFKI).
7. Аксенов К.А., Попов М.В., Смолий Е.Ф., Доросинский Л.Г. Динамическая система моделирования и проектирования мультисервисных сетей связи "ВР.чтлЗ" // Имитационное моделирование. Теория и практика: Матер, третьей Всерос. науч.-практ. конф. Санкт-Петербург / ФГУП ЦНИИ технологии судостроения. СПб., 2007. Т. 1. С. 253-257.
8. Результаты обследования и формирования требований на создание единой И С поддержки учебного процесса (с 15 мая 2005 года по 14 февраля 2006 года): Отчет по проекту *01200601073 / ГОУ ВПО "Уральский государственный технический университет — УПИ"; Руководитель работы А.К. Аксенов. Екатеринбург. 2006. 119 с.
9. Техническое задание на создание единой информационной системы учебного процесса УГГУ — УПИ: Отчет по проекту'»01200601073 / ГОУ ВПО "Уральский государственный технический университет — УПИ"; Руководители работы А.К. Аксенов. А. Лукшин. Екатеринбург, 2006. 116 с.
УДК 51 7.977.5:553.982.2
О.М. Верхотурова
РАЗРАБОТКА ПОДХОДА К РЕШЕНИЮ ЗАДАЧИ ВЫДЕЛЕНИЯ ЕСТЕСТВЕННЫХ НЕСТРУКТУРИРОВАННЫХ ОБЪЕКТОВ НА ОСНОВЕ ДИСКРЕТНЫХ МОДЕЛЕЙ
Задача выделения объектов встречается в различных областях человеческой деятельности, в том числе в космических ис-
следованиях, нефтяной промышленности, медицине. Особый интерес представляет для естественных, неструктурированных
объектов (рассматривается на примере задачи выделения продуктивных пластов на скважинах месторождения), будучи весьма трудоемкой, сложной и неоднозначной.
Над решением указанной задачи работали многие ученые, в том числе отечественные исследователи, исследовательские группы и компании. Так, одним из первых предложил подход к решению этой проблемы Ш.А. Губерман [5. 6|; методы решения данной задачи развивались группой профессора И.С. Гутмана [7]; интерес представляет работа, в которой для нахождения решения использовались нейронные сети |8]. Анализ существующих методов выявил необходимость разработки нового подхода для повышения эффективности решения задачи выделения естественных неструктурированных объектов.
Постановка и математическая модель задачи. Задача состоит в том, что нужно выделить интервалы (определить их границы) в исследуемых узлах рассматриваемой области на основе опорных узлов, в которых эти границы известны.
Каждый опорный и исследуемый узел характеризуются набором данных (в зависимости от глубины) — числовых значений с очень небольшим шагом дискретизации, которые графически представлены кривыми.
Границы интервалов выделяются по схожести участков характеризующих каждый узел кривых.
Математическая модель
Введем обозначения: рассматриваемая область — О с /?•'; опорные узлы — Рт(хт, у„„ 1т), т = \,М, Р,„ исследуемые узлы — Р„(х1Г у„, 1п), п = Рп е О.
Следует отметить, что начальное I у каждого ухаа может быть свое, но поскольку с точки зрения положения на плоскости ХОУэто не имеет значения, то все узлы выравниваются на уровень I — 0: 1т — О, т = \.М и 1„ = 0, /? = 1,.V.
У каждого опорного и исследуемого узла есть несколько характеризующих его данных (кривых) — £¡"(11) и ) соответственно, / = \,Ь (в дальнейшем будут визуализироваться в виде кривых — рис. 1):
Рис. 1. Иллюстрация исходных данных задачи Для наглядности показаны только лве кривых, в общем случае L.
/ 7 — рассматриваемая область. О; (О) — опорный узел; х — исследуемый узел
g'"(h), где И — номер замера или глубина (дискретная величина), h е Н"';
), где /;' — номер замера или глубина (дискретная величина), /;' е //";
Н"' — множество номеров замеров или множество глубин для от-го узла;
//" — множество номеров замеров или множество глубин для /7-го исследуемого узла.
Есть к = \,К выделенных интервалов (к объектов).
В опорных узлах границы интервалов известны:
начало интервала — Тор'" — соответственно глубина или номер замера;
конец интервала — Bot™ — соответственно глубина или номер замера:
тоР: * Bot:, тоР: < Пусть G — множество всех кривых во всех опорных узлах, т. е. все g"' eGu, I = IL. m = IM;
Gn — множество всех кривых во всех исследуемых узлах, т. е. все g" е GА ,
1=П. n = lN;
Topi' — множество всех известных верхних границ А'-го интервала в опорных узлах, т. е. все Тор: е Тор", т = \,М\
Bot" — множество всех известных нижних границ к-го интервала в опорных узлах, т. е. все Bot': е Bot", т = \.М;
Тор}? — множество всех неизвестных верхних границ А-го интервала в исследуемых узлах, т. е. все Тор"к е Top I, п = 1 ,N;
Bot? — множество всех неизвестных нижних границ к-го интервала в исследуемых узлах, т. е. все Bot" е Bot, п = \,N.
Нужно найти границы интернатов в исследуемых узлах Тор? и Boll • так- чтобы целевая функция F(GM ,Gn,Topi', Bot". Top?,Bot?) min, k = l,K.
В качестве целевой функции может выступать, например, сумма квадратов расстояний между выделенными интервалами в опорных и исследуемых узлах (по точкам соответствующих кривых):
£ S2 (GM {Topi'. Bot?) - G v (Top?, Bot?)) ->
—» min. к = I.A.'. В вышеизложенной постановке рассматриваемая задача относится к классу оптимизационного геометрического моделирования.
Методы и алгоритмы решения. Решение можно разбить на несколько последовательных этапов:
формирование кривой, по которой будут находиться границы интервалов:
выбор опорных узлов для каждого исследуемого узла для нахождения границ интервалов;
выбор критерия для сравнения интервалов (целевой функции);
нахождение границ интервалов в исследуемых узлах;
уточнение границ интервалов. Рассматривается также альтернативный метод нахождения границ интервалов, заимствованный из области распознавания речевых сигналов.
Формирование кривой, по которой будут находиться границы интервалов. Для каждого узла существуют всевозможные характеризующие его кривые. Поэтому возникает вопрос, по каким именно кривым искать границы интересующих нас интервалов. Предлагается сравнивать интервалы не по исходным кривым, а по некоторой синтетической кривой, которую получаем в результате применения метода главных компонент (МГК) к данным всех узлов области либо определенной их части.
Метод главных компонент — один из основных способов уменьшения размерности данных с минимальными потерями
информации, изобретен К. Пирсоном в 1901 году. Основная идея МГК заключается в сокращении числа исходных переменных до наиболее существенно влияющих факторов [ I ].
Главные компоненты & (/ = 1, У) — это линейные комбинации исходных переменных х/ (у = |,У). Они могут быть записаны в общем виде (1):
г,=а = (I)
При этом количество выделенных главных компонент в общем случае значительно меньше числа исходных переменных.
В предлагаемом подходе используется только первая главная компонента. Например, если исходные кривые /\, /у, то синтетическая кривая определяется по формуле
Г = а/, + а/2 + а/3 + а/4, (2)
где а,, а2, а3, а4 — коэффициенты при первой главной компоненте, полученные с помощью МГК.
Выбор опорных узлов для каждого исследуемого узла для нахождения границ интересов. Дана область, в которой есть М опорных узлов и /V исследуемых. Нужно соотнести их друг с другом.
Можно выделить следующие варианты: парное сравнение узлов, когда с каждым опорным узлом поочередно сравниваются соседние исследуемые узлы, затем с ними сравниваются их соседние и т. д.;
интегральное сравнение узлов, когда решение находится сразу во всех исследуемых узлах на основе известных значений в опорных узлах.
Парное сравнение узлов хорошо тем, что в нем число узлов с известными границами интервалов постепенно увеличивается, кроме того, узлы удобно сравнивать между собой попарно. Здесь был выбран именно этот вариант. Рассмотрим его более подробно.
При парном сравнении узлов один из решающих моментов — построение путей обхода узлов исследуемой области, которое можно выполнить различными способами. В данной задаче предполагается, что наибольшим сходством обладают близлежащие
узлы, а по мере удаления степень сходства постепенно уменьшается. С учетом этого были рассмотрены следующие варианты построения путей обхода узлов:
по профилям, составленным специалистами. Сравнение узлов можно проводить по уже составленным специалистами профилям (профиль — последовательность узлов. первый из них опорный), согласно которым и осуществляется парное сравнение характеризующих каждый узел кривых;
по ячейкам. Поскольку в профилях расстояние от первого до последнего узла может быть достаточно значительным, то характерные особенности узлов (форма кривых на рассматриваемых интервалах) по мере движения по профилю постепенно меняются и корреляция падает. Поэтому было решено применять так называемую площадную корреляцию, при этом вся область разбивается на ячейки Вороного, после чего строятся пути обхода узлов внутри каждой ячейки.
Выбор критерия для сравнения интервалов (целевой функции). Для выделения интервалов необходимо выбрать критерий — числовой показатель, на основе которого можно делать вывод о схожести определенных участков сравниваемых кривых.
Первоначально было несколько вариантов данного критерия: между участками сравниваемых кривых сумма квадратов отклонений, косинус угла и коэффициент корреляции.
В результате проведенных исследований самым информативным и легко интерпретируемым оказался коэффициент корреляции, который и применяется в предлагаемом подходе.
Применение выбранного критерия предполагает сравнение интервалов с одинаковым количеством данных, соответственно участки сравниваемых кривых необходимо приводить к равному количеству точек.
Нахождение границ интервалов в исследуемых узлах. Поиск происходит таким образом, что одновременно ищутся границы только одного интервала.
Каждое решение состоит из верхней границы интервала (Тор) и ширины интервала (Dh), в результате определяется нижняя граница интервала (Bor = Тор + Dh).
Пространство поиска задается
Д| — диапазоном возможных значений
[Тор Тор + , в пределах которого
может лежать верхняя граница;
Д2 — диапазоном, в котором может находиться ширина интервала
[ОИ-^-ОИ + Ь.] 2 2 После чего происходит поиск в получившемся пространстве возможных решений (рис. 2).
Получаем пространство решении
Рис. 2. Схема действий по заданию пространства решений
Для поиска решения реализовано два альтернативных метода:
полный перебор (в случае, если пространство решений небольшое, и можно найти решение за приемлемое время); генетический алгоритм (ГА). Полный перебор — точный метод, который всегда находит оптимальное решение в заданном пространстве возможных значений, но при большом диапазоне поиска требует значительных затрат времени.
Задаем диапазон пояска начапа инюрнама
Задаем диапазон поиска ширины инюрвала
Генетический алгоритм [4] — эвристический метод, поэтому он не гарантирует нахождения оптимального решения, но более приемлем с точки зрения вычислительных затрат. Перебор решений в нем осуществляется с помощью генетических операторов выбора родителей, скрещивания (кроссовера), мутации, селекции, переупорядочения.
Для данной задачи в генетическом алгоритме каждая хромосома представляет собой следующее решение:
Ans:
J
Ans,
\
Time Warping) — метод динамического растяжения времени [3].
Суть метода DTW заключается в определении наилучшего соответствия входных и эталонных сигналов. Для рассматриваемой задачи данные опорного узла — эталонный сигнал, а данные исследуемого узла — входной (рис. 3).
Нвхакдени» rpjHi.it иктсрввлое с помощью метода OTW
Опорный узел -
»Т1Л9МГ1ЫИ
сигнал
Начало интервала Мощность интервала
Рассматривались различные варианты параметров генетического алгоритма, в том числе и различные варианты операторов кроссовера и мутации. В результате был выбран кроссовер SBX (Simulated Binary Crossover) [9].
Уточнение границ интервалов. Коэффициент корреляции позволяет находить сходные интервалы, но не очень точен в определении границ интервалов. Поэтому для уточнения границ необходимы дополнительные критерии.
Один из возможных вариантов — учет знака первой производной для определения положения границы интервала:
если знак производной на границе положительный — граница находится в интервале возрастания;
если знак отрицательный — граница находится в интервале убывания;
если производная на границе интервала равна 0 — граница соответствует локальному экстремуму.
То есть в процессе поиска определяются знаки первой производной на границах интервалов в опорном узле. В результате в исследуемом узле рассматриваются возможные положения границ только с такими же знаками первой производной. Это ограничивает пространство возможных решений.
Альтернативный метод нахождения границ интервалов. Таким методом выделения интервалов может служить DTW (Dynamic
Исследуемый узел -«шнеиситы
Рис. 3. Иллюстрация выделения границ интервалов с помошью метода ОТ1У
Основные области использования метода ОТУУ — системы распознавания речи, системы верификации рукописной подписи, медицинская диагностика. Однако он подходит и для решения рассматриваемой задачи.
Особенно важными в этом смысле будут следующие особенности метода:
алгоритм особенно хорошо подходит для сопоставления сигналов, в которых некоторая информация может быть пропущена;
он учитывает неравномерность протекания процесса во времени.
Исходя из этого, если исследуемые интервалы имеют схожую форму кривых и хорошо выделяются по всей области, то целесообразнее применять метод, основанный на корреляции.
Если же форма кривых в исследуемых интервалах значительно изменяется, характеризуется сжатием, растяжением, отсутствием некоторых участков, то в этом случае метод, основанный на корреляции, не
будет давать удовлетворительных результатов. Тогда необходимо использовать метод /)7Ж
Практическое применение. Все разработанные модели и методы были адаптированы под решение конкретной задачи — выделения продуктивных пластов на скважинах месторождения. Процесс выделения пластов в геологии носит название корреляции разрезов скважин и является одной из первых задач при построении геологической модели месторождения [2]. Следует отметить, что если другие этапы построения геологической модели уже во многом автоматизированы, то проблемы корреляции до сих пор в основном решаются методом экспертных оценок, далеких от статистической согласованности и математической строгости.
В связи с этим актуально создание компьютерной системы корреляции разрезов скважин, позволяющей определять границы продуктивных пластов на эксплуатаци-
онных скважинах месторождения на основе сети опорных скважин, для которых эти границы известны.
У каждой скважины есть различные данные геофизического исследования скважин (ГИС), которые графически представлены каротажными кривыми. На опорных скважинах известны границы продуктивных пластов: верхняя граница — кровля пласта, нижняя граница — подошва пласта. По схожести участков каротажных кривых требуется найти эти границы на эксплуатационных скважинах месторождения.
Программное обеспечение и численные эксперименты. Все представленные в работе методы, алгоритмы и функции реализованы в среде MATLAB — удобного средства как с точки зрения встроенных стандартных функций, так и возможности разработки собственных.
Был разработан графический интерфейс-пользователя GUI — Graphical User Interface, который позволяет загружать необходимые
Рис. 4. Пример визуализации результатов, полученных с помощью разработанного программного продукта
Сравнение границ пластов, полученных с помощью автоматического выделения, с границами пластов геологов
(Гарасовское месторождение)
Глубина но стволу скважины до кров- 11огрешность Глубина по стволу скважины до по- Погрешность Мощность пласта, м Погрешность Коэффициент корреляции Погрешность
Номер сква- ли пласта, м дошвы пласта, м
жины по оцен- абсолют- относи- по оцен- абсолют- относи- но оцен- абсолют- относи- но оцен- абсолют- относи-
расчет ке эксперта ная, м тельная, % расчет ке эксперта ная, м тельная, % расчет ке эксперта ная, м тельная, % расчет ке эксперта ная, м тельная, %
1247 2664,2 2663,7 0,5 2,81 2682,2 2681,5 0,7 3,93 18,0 17,8 0,2 1,12 0,9183 0,8538 0,0644 7,02
1004 2851,4 2850,6 0,8 3,62 2871,4 2872,7 -1,3 -5,88 20,0 22,1 -2,1 -9,50 0,9180 0,8581 0,0599 6,52
1020 2650,0 2650,0 0 0 2668,6 2667,7 0,9 5,08 18,6 17,7 0,9 5,08 0,8337 0,7895 0,0442 5,30
1084 2660,0 2660,3 -0,3 -1,37 2682,2 2682,2 0 0 22,2 21,9 0,3 1.37 0,9518 0,9011 0,0507 5,33
1035 2804,0 2804,8 -0,8 -3,31 2830,2 2829,0 1.2 4,96 26,2 24,2 2,0 8,26 0,8101 0,7256 0,0844 10,43
3210 2697,0 2697,9 -0,9 -3,85 2722,0 2721,3 0,7 2,99 25,0 23,4 1.6 6,84 0,9441 0,8529 0,0912 9,66
3209 2622,0 2623,0 -1,0 -4,33 2646,8 2646,1 0,7 3,03 24,8 23,1 1.7 7,36 0,8989 0,7124 0,1865 20,75
3203 2900,4 2901,4 -1,0 -4,20 2926,2 2925,2 1,0 4,20 25,8 23,8 2,0 8,40 0,8834 0,8119 0,0715 8,09
1082 2681,2 2682,3 -1,1 -4,68 2706,2 2705,8 0,4 1,70 25,0 23,5 1.5 6.38 0,9644 0,7677 0,1966 20,40
... ... ... ...
данные по месторождению, устанавливать параметры поиска и сохранять результаты в удобном для геолога формате. Полученные результаты могут быть представлены также в графическом виде. Можно вывести профиль (последовательность скважин) с выделенными интервалами. Триангуляии-онно-корреляционная сеть скважин и карта толщин позволяют выявить слабые места или те скважины, которые требуют дополнительного анализа. Выводится также общий коэффициент корреляция скважин по месторождению (рис. 4).
Численные эксперименты проводились на нескольких месторождениях РФ (Приобское, Комсомольское, Тарасовское). В качестве результатов приведем таблицу сравнения границ пластов, полученных с помощью разработанной системы, с границами пластов экспертов (геологов).
Из таблицы можно сделать вывод, что в среднем коэффициент корреляции по границам, полученным с помощью автоматического выделения, выше, что позволяет говорить о том, что разработанная система находит границы не хуже экспертов.
Таким образом, предлагается еше один подход к решению задачи выделе-
ния естественных неструктурированных объектов.
Рассматривается ряд вопросов: от разработки модели до написания программного обеспечения, касающегося выделения продуктивных пластов на скважинах месторождения. Приводится математическая модель задачи, которая позволяет отнести ее к классу задач оптимизационного геометрического моделирования.
Применяется несколько вариантов решения задачи. Один из них базируется на наиболее распространенном метаэв-ристическом методе — "генетического алгоритма", адаптируемом для решения поставленной задачи. Кроме того, используется метод из области распознавания речевых сигналов, — метод динамического искажения времени (ЭТЛУ).
Разработанная система опробована на Приобском, Тарасовском и Комсомольском месторождениях. В результате вычислительных экспериментов установлено, что ее применение позволяет улучшить решение, получаемое экспертами (геологами), в среднем на 5—15 % в зависимости от месторождения и выделяемого пласта, при этом время работы значительно сокращается.
СПИСОК ЛИТЕРАТУРЫ
1. Айвазян С.А., Бухштабер В.М.. Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. М.: Финансы и статистика. 1989. 607 с.
2. Банков В.А., Борисов Г.А., Верхотурова О.¡VI., Надеждин О.В. Современные методы анализа геофизических исследований скважин // Научно-технический вестник ОАО НК "Роснефть". М„ 2007. С. 27-31.
3. Бонларенко И.Ю., Федяев О.И. Анализ эф-фективности метода нечеткого сопоставления образов для распознавания изолированных слов // Интеллектуальный анализ информации ИАИ-2006: Сб. трудов VI Междунар. науч. конф. / Под ред. Таран Т.А. Киев: Просв1та, 2006. С. 20—27.
4. Васильев В.И., Ильясов Б.Г. Интеллектуальные системы управления с использованием генетических алгоритмов: Учеб. пособие / Уфимск. гос. авиац. техн. ун-т. Уфа. 1999. 105 с.
5. Губерман Ш.А. Неформальный анализ данных в геологии и геофизике. М.: Недра. 1987.
6. Губерман Ш.А., Калинина Е.Е., Овчинникова М.И., Осипов В.Ф. Корреляция геофизических разрезов скважин на ЭВМ // Геология нефти и газа. 1981. № 2.
7. Гутман И.С., Копылов В.Е., Котов Ф.С., Бронскова Е.И. Корреляция геолого-геофизичес-ких разрезов скважин с помошыо программы Тео-кор-2" // Геология нефти и газа. 2002. № 2.
8. Тененев В.А., Якимович Б.А., Сенилов М.А., Паклин И.Б.. Интеллектуальные системы интерпретации данных геофизических исследований скважин // Искусственный интеллект. 2002. № 3.
9. Herrera F., Lozano М., Sanchez A.M. Hybrid crossover operators for real-coded genetic algorithms: an experimental study // Soft Computing. Vol. 9, № 4. 2005. P. 280-298.