УДК 621.391
© М.В. Харинов
МОДЕЛЬ ЛОКАЛИЗАЦИИ ОБЪЕКТОВ НА ЦИФРОВОМ ИЗОБРАЖЕНИИ
Статья посвящена проблеме автоматического выделения объектов на цифровом изображении или «проблеме сегментации», эффективная формализация которой по постановке задачи в настоящее время ограничивается случаями простейших изображений типа «объект-фон».
Ключевые слова: пиксели изображения, кластеризация, слияние, дробление, модель Мамфорда-Шаха.
© M.V. Kharinov
A MODEL FOR LOCALIZATION OF OBJECTS IN DIGITAL IMAGES
The article is devoted to the problem of automatic detection of objects in digital images or so-called “segmentation problem”. At present the effective formalization of problem statement is available only in the case of simplest images of “object-background” type.
Keywords: image pixels, clustering, merging, splitting, Mumford-Shah model.
Введение
Проблему локализации можно охарактеризовать как проблему разбиения обрабатываемого изображения на изображения объектов, подлежащие дальнейшему признаковому анализу и идентификации автоматической системой распознавания. Из-за недостаточной формализации понятия «изображение» в настоящее время данная проблема относится к числу недостаточно формализованных и обычно рассматривается для изображений из заданной предметной области или решается в контексте распознавания заданных объектов. Тем не менее в случае простейших изображений объектов на однородном фоне она, как правило, не возникает. Поэтому имеет непосредственный смысл разработка алгоритмов, которые позволили бы установить взаимосвязь решения общей проблемы локализации объектов с решением частной задачи их выделения на однородном фоне.
Целью статьи является обсуждение вычислительной модели локализации объектов на цифровом изображении, разработанной в предположении иерархической природы объектов посредством обобщения и развития вычислений в методах Оцу [1-3], модели Мамфорда-Шаха [4-10] и методе K-средних [11-19], реализуемых на современных компьютерах.
1. Постановка задачи
Перечисленные подходы, в отличие от большинства других подходов к выделению объектов на цифровых изображениях, наиболее формализованы по постановке задачи, так как при построении разбиений опираются на определенный критерий качества. Критерием качества в методах Оцу и методе K-средних, а также в версии [7] модели Мамфорда-Шаха служит суммарная квадратичная ошибка E, или равносильная величина среднеквадратичного отклонения а значений пикселей изображения от значений пикселей оцениваемого кусочно-постоянного приближения.
Метод Оцу [1-3] является одним из немногих, если не единственным методом точного вычисления оптимальных приближений, минимально отличающихся от изображения по суммарной квадратичной ошибке. Это классический метод кластеризации пикселей изображения посредством нахождения по яркостной гистограмме одного или нескольких пороговых значений яркости, которые разбивают шкалу яркости на диапазоны из условия минимального значения среднеквадратичного отклонения средних по диапазонам значений пикселей от значений пикселей исходного изображения. В методе Оцу одинаковые пиксели изображения всегда относят к одному кластеру, состоящему из некоторого числа сегментов (связных областей) изображения. То, что метод Оцу не позволяет относить одинаковые пиксели к различным кластерам, препятствует его использованию для локализации объектов посредством классификации пикселей в зависимости от особенностей их локального распределения. Принципиальным ограничением метода Оцу является то, что он не имеет очевидного обобщения на
случай классификации многомерных пикселей цветовых или многоспектральных изображений.
Метод ^-средних является старейшим методом многомерного кластерного анализа [17-18] и интенсивно применяется не только в обработке изображений, но также и в ряде других областей, связанных с классификацией и распознаванием данных. В приложении к изображениям он сводится к итеративной коррекции разбиений пикселей на кластеры или сегменты посредством реклассификации пикселей из условия минимизации расстояния до центроидов в виде векторов (столбцов), покомпонентно усредненных по кластерам яркостных значений. В учебной и научной литературе принято обсуждать метод ^-средних без предварительного аналитического обоснования. Между тем элементарные выкладки, приводимые в следующем разделе, показывают, что минимизация расстояний до центроидов кластеров не равносильна минимизации суммарной квадратичной ошибки. Поэтому для оптимизации приближений вместо метода ^-средних оказывается эффективным применять метод коррекции разбиений в уточненном варианте [19].
Традиционная модель Мамфорда-Шаха [4-9] относится к теоретически и экспериментально обоснованным моделям сегментации изображения посредством итеративного слияния сегментов. Отождествление классов со связными сегментами, однако, ограничивает возможность отнесения пикселей экземпляров объекта и частей объекта к одному классу. Условие связности пикселей поддерживается в модели автоматически, благодаря использованию единственной операции слияния смежных сегментов, которая не выводит из их множества. С другой стороны, использование единственной операции слияния сегментов при последовательной генерации разбиений изображения опирается на предположение, что последовательность оптимальных разбиений изображения является иерархической. Поскольку последовательность разбиений изображения, минимизирующих Е или а, вообще говоря, отличается от иерархической [10], единственность операции слияния сегментов является принципиальным недостатком вычислений в традиционной модели Мамфорда-Шаха [4-9], который полезно исправить.
Характерной особенностью обсуждаемых классических методов сегментации изображений посредством оптимизации качества разбиений по суммарной квадратичной ошибке Е или среднеквадратичному отклонению а является прозрачность алгоритмов и необходимых вычислительных формул, которая часто утрачивается в многочисленных приложениях при эвристическом учете свойств «объектов интереса» и оптимизации итерационных вычислений по скорости. При этом постановочное условие оптимизации качества разбиений по Е (или а) обычно не контролируется в качестве обязательного критерия достоверности вычислений. В отличие от большинства практических решений для конкретных предметных областей, мы строим унифицированный алгоритм локализации объектов только на основании элементарных аналитических соотношений, непосредственно связанных с минимизацией целевого функционала.
2. Рабочие формулы
Рассмотрим приращение ЛЕ суммарной квадратичной ошибки Е при реклассификации многомерных пикселей, т. е. исключении к пикселей, характеризуемых вектором средних значений I, из числа п пикселей кластера 1, характеризуемого вектором средних значений яркости ^, и отнесении их к некоторому другому кластеру.
Случай к = щ сопоставляется включению всех щ пикселей кластера 1 в число пикселей некоторого ранее выделенного на изображении кластера 2, т. е. слиянию кластеров 1 и 2, которое описывается неотрицательным приращением суммарной квадратичной ошибки &Етегзе:
ЛЕ = ^М_>о , (1)
^^тег%е 11 —
--+---
П1 п2
где знак || ||2 обозначает суммирование квадратов отклонений 1Х — /2 (евклидову норму векторов по цветовым или спектральным компонентам).
В случае к < п предусматриваются две возможные операции реклассификации подмножества пикселей кластера 1 - дробление и коррекция.
При операции дробления кластера надвое к пикселей из кластера 1 выделяются в новый кластер. При этом кластер 1 преобразуется в кластер из щ — к пикселей, которые дополняли обсуждаемые к пикселей в составе прежнего кластера. Операция дробления кластера сопровождается отрицательным, или нулевым, приращением суммарной квадратичной ошибки АЕ ш :
II/ — /1|2
АЕрШ = —^ 0 . (2)
к «
При операции коррекции часть пикселей реклассифицируется из кластера-донора 1 в акцепторный кластер 2, что сопровождается приращением суммарной квадратичной ошибки АЕсотгс,:
АЕ = II7 — 7 Л2 — I1 — 7М2. (3)
АЕсоггеС 1111 ( )
— + — --------
к п2 к щ
При этом второе, отрицательное, слагаемое в (3) описывает приращение суммарной квадратичной ошибки при выделении к пикселей из кластера 1 в самостоятельный кластер, а первое слагаемое описывает ее приращение при слиянии выделенного кластера с кластером 1 согласно (1) и (2). Таким образом, операция коррекции трактуется как составная.
Из (3) получаем для коррекции критерий убывания суммарной квадратичной ошибки Е :
\\/ — /Ц >а-\\/ — /2\, (4)
где коэффициент а < 1 описывает соотношение количества пикселей в рассматриваемых кластерах 1, 2 и выражается в виде:
а-Д^. (5)
\«1 («2 + Ч
Если коэффициент а в формуле (4) положить равным 1, то из нее выводится метод Х-средних. Однако если не делать этого упрощения, которое практически не влияет на скорость вычислений на современных компьютерах, то, опираясь на формулу (4) с учетом коэффициента а , удается получить более сильный метод реклассификации пикселей [19]. Он позволяет избегать преждевременного останова минимизации суммарной квадратичной ошибки, точнее выбирать варианты реклассификации пикселей и эффективнее снижать величину суммарной квадратичной ошибки за счет реклассификации не отдельных пикселей, а их множеств.
3. Модель устойчивой локализации объектов
В нашем понимании изображение состоит из вложенных изображений. Поэтому наглядные понятия «изображение», «объект» и «кластер пикселей» принципиально не разделяются друг с другом.
Локализация объектов сводится к получению последовательности разбиений изображения на вложенные изображения из условия минимизации суммарной квадратичной ошибки или среднеквадратичного отклонения. Искомые разбиения содержат кластеры пикселей. Кластеры пикселей из различных разбиений, вообще говоря, перекрываются между собой. Допускается, что кластер пикселей может содержать более одного сегмента (связной области, компоненты связности). Поэтому операции дробления и коррекции, которые, вообще говоря, нарушают связность сегментов, не выводят из рассматриваемого множества кластеров.
Если два соседствующих на изображении пикселя принадлежат различным кластерам, то эти кластеры считаются смежными - так же, как и в случае сегментов.
Кластер содержит один или несколько несмежных сегментов. Каждый кластер из нескольких сегментов разделяется на два вложенных кластера без нарушения целостности сегментов. В свою очередь каждый сегмент, содержащий более одного пикселя, разделяется на два вложенных сегмента. Разделение каждого сегмента надвое задается бинарной иерархической последовательностью разбиений, которая порождается итеративным слиянием смежных сегментов и выполняется по формуле (1) до слияния всех исходных пикселей в один сегмент. Затем формирование бинарной иерархической последовательности разбиений кластера на составные части продолжается посредством итеративного
попарного объединения сегментов до их слияния в один кластер. При этом для каждого сегмента, как для отдельного изображения, выполняется укрупнение вложенных смежных сегментов в модели Мамфорда-Шаха [7, 10], очередная пара которых выбирается по критерию слияния, которым служит минимальная величина ДЕ^ :
АЕтегЯе = тт , (6)
а затем тот же самый критерий применяется для объединения сегментов посредством вычисления значений ДЕ^ для каждой пары сегментов, составляющих рассматриваемый кластер. В целом для
каждого кластера из р пикселей обсуждаемая бинарная иерархическая последовательность разбиений задает 2р — 1 составных частей (вложенных кластеров, сегментов и их связных компонент).
Для детализации разбиения изображения посредством дробления кластера на составную часть и ее дополнение используется формула (2). Критерием служит условие максимального падения суммарной квадратичной ошибки, т. е. ее минимального приращения ДЕ и{:
ДЕ^р1и = тт . (7)
В результате дробления кластера общее число кластеров увеличивается на единицу, а число сегментов увеличивается или остается прежним.
Формула (3) применяется для итеративного снижения суммарной квадратичной ошибки посредством циклически повторяемой коррекции пар кластеров. Выполняется до тех пор, пока на изображении обнаруживаются кластер-акцептор и кластер-донор, имеющий смежную с кластером-акцептором составную часть, реклассификация которой в кластер-акцептор приводит к падению суммарной квадратичной ошибки. Из множества вариантов требуемой реклассификации выбирается вариант, сопровождаемый минимальным приращением суммарной квадратичной ошибки ДЕсогге а:
ДЕоаггеа = тт < 0 . (8)
В процессе коррекции разбиения изображения на кластеры общее число кластеров не меняется. Если при коррекции реклассифицируемая составная часть кластера-донора содержит единственный сегмент, то число сегментов в кластере-акцепторе также остается прежним.
В результате коррекции получается устойчивое разбиение изображения на кластеры, которое нельзя улучшить по суммарной квадратичной ошибке посредством реклассификации составной части любого кластера в другой, смежный с этой частью.
Если в изложенной схеме коррекции разбиения изображения на кластеры допускается реклассификация любой части кластера-донора, необязательно смежной с кластером-акцептором, то такая коррекция называется безусловной. При безусловной коррекции разбиения изображения число кластеров сохраняется, но возрастает число сегментов в кластерах-акцепторах за счет слияния кластеров-акцепторов с несмежными составными частями кластеров-доноров. В результате безусловной коррекции получается разбиение изображения на кластеры, которое нельзя улучшить по суммарной
квадратичной ошибке посредством реклассификации любой предусмотренной составной части одно-
го кластера в другой.
Вычисления проводятся в алгоритме «наращивания кластеров», в котором коррекция разбиения изображения выполняется по очереди с увеличением числа кластеров на единицу за счет дробления кластера, отвечающего максимальному падению суммарной квадратичной ошибки. При этом генерируется последовательность устойчивых разбиений изображений на кластеры для любого начального разбиения (например, содержащего единственный сегмент, покрывающий все изображение) или для начального разбиения изображения на несколько сегментов. Во втором случае применение вместо дробления кластеров безусловной коррекции обеспечивает детализацию начального разбиения изображения за счет увеличения числа сегментов при неизменном числе кластеров.
Таким образом, в нашей интерпретации, локализация объектов реализуется благодаря вычислению последовательности кусочно-постоянных приближений изображения, порождаемых его устойчивыми разбиениями на кластеры. Кластеры пикселей изображения разделяются на составные части, образуемые сегментами (связными областями) изображения. При построении устойчивых разбиений кластеры обмениваются сегментами из условия снижения суммарной квадратичной ошибки Е или среднеквадратичного отклонения а. В процессе построения устойчивого разбиения при модифика-
ции кластеров обновляется и сопоставляемая каждому кластеру иерархия его составных частей. Поэтому устойчивые кластеры пикселей изображения характеризуются не только устойчивостью относительно обмена составными частями друг с другом, но и соответствием составных частей целостным кластерам.
4. Экспериментальные результаты
Экспериментальные результаты по локализации объектов в графическом виде демонстрируются на рис. 1.
Рис. 1. Оценка качества разбиения в зависимости от числа кластеров
Рис. 1 на примере стандартного изображения «Лена»1 иллюстрирует среднеквадратичное отклонение а изображения от его кусочно-постоянных приближений в зависимости от числа кластеров g , которое совпадает с числом градаций средней яркости. Графики изображены в логарифмическом масштабе по горизонтальной оси в диапазоне числа кластеров от 1 до 100.
Две верхних переплетающихся кривых описывают иерархические разбиения на сегменты, полученные по версии FLSA модели Мамфорда-Шаха [8, 9] (верхняя штрихованная кривая) и по версии [7] (сплошная серая кривая). Они отражают известные результаты и приведены для наглядной демонстрации эффекта снижения среднеквадратичного отклонения а при генерации устойчивых разбиений.
Пара нисходящих сливающихся друг с другом черных кривых описывает процесс автоматической генерации последовательности устойчивых разбиений изображения посредством чередования увеличения числа кластеров на 1 за счет дробления одного из них и циклической коррекции разбиения до преобразования его в устойчивое разбиение изображения. Верхняя кривая соответствует случаю тривиального начального разбиения, содержащего единственный кластер. Нижняя кривая соответствует начальному разбиению изображения на два кластера из нескольких сегментов. При этом каждому значению числа кластеров g на той и другой кривой соответствуют по две точки, которые для отдельных значений g на графиках разделяются, а для большинства остальных сливаются между собой, т. к. незначительно различаются по а. Устойчивые разбиения изображения описываются для каждого значения g минимальным значением а.
Отрезок вертикальной пунктирной прямой на рис. 1 начинается от минимального значения а для g = 2 на верхней нисходящей кривой. Он описывает циклическую детализацию соответствующего инвариантного разбиения изображения по числу сегментов при неизменном числе кластеров в алгоритме безусловной коррекции. В результате безусловной коррекции получается устойчивое разбиение изображение на два кластера, которое характеризуется значением среднеквадратичного отклонения, равным а = 30.64564 . Характерно, что полученное разбиение совпадает с оптимальным разбиением изображения на два кластера пикселей [3, 7], которое вычисляется классическим методом Оцу [1]. Фактически обсуждаемый отрезок представляет 182 точки, сгущающиеся по мере приближения к
1 иКЬ: http://sipi.usc.edu/database/
оптимальному значению. При этом плавное снижение а наглядно выражается в проявлении шумов на соответствующих кусочно-постоянных приближениях изображения. Поэтому для испытания алгоритма поочередного дробления и коррекции при нетривиальном начальном разбиении изображения (нижняя нисходящая кривая на рис. 1) в качестве начального устойчивого разбиения выбрано не оптимальное разбиение, а разбиение, полученное с подавлением шумов, которое получается на 11-й итерации безусловной коррекции и отвечает значению а = 30.79373 .
Для уточнения данных первые десять пар численных значений а (для верхней нисходящей кривой) и а' (для нижней нисходящей кривой), отвечающие устойчивым разбиений изображения, перечислены для последовательных значений числа кластеров g в таблице 1 (по пять штук в каждой колонке).
Таблица
Значения а и а' для последовательных разбиений изображения
№ & а а'
11 6 23.62842 22.93591
12 6 23.51916 21.17198
13 7 22.82637 20.56156
14 7 22.73704 18.64853
15 8 22.05335 18.04458
16 8 21.99891 18.01739
17 9 21.39022 17.43846
18 9 21.25647 17.19645
19 10 20.59120 16.82263
20 10 20.55978 16.77930
№ & а а'
1 1 55.88322
2 1 55.88322
3 2 43.16748 30.79373
4 2 40.58435 30.79373
5 3 34.39798 28.72376
6 3 31.85193 28.08163
7 4 29.55488 25.85536
8 4 27.04307 25.73018
9 5 25.09586 24.31218
10 5 24.86835 24.21468
Значения среднеквадратичного отклонения, указанные в таблице 1 в строках с четными номерами, отвечают устойчивым разбиениям изображения. Сами устойчивые разбиения, которые наглядно описываются посредством кусочно-постоянных приближений изображения, представлены на рис. 2.
Рис. 2. Устойчивые разбиения изображения
В правом верхнем углу рис. 2 показано стандартное изображение «Лена». В первой колонке демонстрируются устойчивые разбиения изображения с числом кластеров от одного до пяти, полученные чередованием дробления очередного сегмента и циклической коррекции при тривиальном начальном разбиении изображения, отвечающего значению а = 55,88322. Во второй колонке показаны устойчивые разбиения, полученные по тому же алгоритму, но при нетривиальном начальном разбие-
нии изображения, которое отвечает значению а = 30.79373 и размещено под стандартным изображением.
Графически последовательность разбиений рис. 2 описывается огибающими каждой из черных сливающихся кривых на рис. 1, которые строятся по точкам с меньшими значениями а . По поводу рис. 2, следует заметить, что вычисляемые для кластеров значения средней яркости являются вещественными числами, которые при визуализации округляются до целых и могут не различаться при печати.
5. Интерпретация
Исходя из результатов эксперимента, можно утверждать, что по сравнению с традиционной моделью Мамфорда-Шаха, предложенная модель локализации объектов на цифровом изображении обеспечивает заметное улучшение кусочно-постоянных приближений по среднеквадратичному отклонению а, (рис. 1), причем, без резкого увеличения числа сегментов, как в методе Оцу [3, 7]. При этом улучшение качества приближений наглядно выражается в более полном и точном «проявлении» объектов в приближениях изображения с ограниченным числом градаций яркости (рис. 2).
Характерно, что при генерации разбиений в алгоритме «наращивания кластеров» от различных начальных разбиений изображения, различие по а результирующих устойчивых разбиений нивелируется, и соответствующие кривые на рис. 1 сближаются друг с другом, по-прежнему, заметно выигрывая по а у традиционной модели. На изображении при этом выделяются сходные совокупные наборы объектов.
Отличительной особенностью пары сливающихся кривых на рис. 1 , описывающих процесс получения последовательности устойчивых разбиений изображения, является наличие участков плавного снижения среднеквадратичного отклонения а , разделенных его резкими перепадами. Резкое снижение а описывает существенное изменение очередного разбиения изображения при модификации нескольких кластеров и заметном смещении их границ, как в верхних четырех приближениях слева на рис. 2. Плавное снижение а описывает последовательное проявление на изображении очередного объекта при незначительной модификации границ, как в колонке приближений справа на рис. 2, размещенных под исходным изображением. Последнее дает основание предположить, что изображение имеет «кусочно-иерархическую» структуру, т.е. аппроксимируется последовательностями иерархических приближений по диапазонам кластеров, которые можно вычислить, детектируя участки плавного снижения среднеквадратичного отклонения а на графиках рис. 1 . По нашему мнению, сформулированная гипотеза представляет самостоятельный интерес для дальнейшего теоретического и экспериментального исследования.
Заключение
Таким образом, в настоящей статье мы развиваем оптимизацию приближений изображения для локализации и выделения объектов на основе модели Мамфорда-Шаха [7], в которой из соображений минимизации суммарной квадратичной ошибки Е (среднеквадратичного отклонения а) утроили число операций с множествами пикселей и перешли от вычислений со связными сегментами к вычислениям с кластерами из несмежных сегментов, порождаемыми дополнительными операциями дробления и коррекции кластеров пикселей изображения. Для оптимизации разбиений изображения по Е (или а ) разработан и испытан алгоритм «наращивания» кластеров, аналитически выведенный из условий минимизации суммарной квадратичной ошибки (1)-(3) и (6)-(8), в котором именно соображениями минимизации целевого функционала определяется как порождаются кластеры, как они разделяются на составные части, а также как обмениваются составными частями друг с другом. При этом для минимизации функционала с сохранением числа кластеров применен метод многомерной кластеризации, который по эффективности превосходит метод ^-средних, а в одномерном случае обеспечивает воспроизведение результатов, полученных классическим методом Оцу [1], что позволяет применять этот метод в качестве многомерного аналога метода Оцу.
В настоящее время продолжаются работа по совершенствованию предложенной модели и ее применению для унификации автоматической локализации и выделения объектов на цифровых изображениях [20].
Литература
1. Otsu N. A Threshold Selection Method from Gray-Level Histograms // IEEE Transactions on systems, MAN, and CYBERNETICS. 1979. Vol. SMC-9, January. - №. 1. - P. 62-66.
2. Ping-Sung Liao, Tse-Sheng Chen, Pau-Choo Chung A Fast Algorithm for Multilevel Thresholding // J. Inf. Sci. Eng. 2001. Vol. 17 (5), P. 713-727.
3. Харинов М.В. Устойчивая сегментация изображения // Вестн. Бурят. гос. ун-та. - 2012. - Вып. 9. - С. 64-69.
4. Mumford D., Shah J. Boundary detection by minimizing functionals, I // Proc. IEEE Comput. Vision Patt. Recogn. Conf., San Francisco. - 1985. - P. 22-26.
5. Mumford D., Shah J. Optimal Approximations by Piecewise Smooth Functions and Associated Variational Problems // Communications on Pure and Applied Mathematics. 1989.Vol. XLII, № 4. P. 577-685.
6. Koepfler G., Lopez C., Morel J. A Multiscale Algorithm for Image Segmentation by Variational Method // SIAM Journal on Numerical Analysis. - 1994. - Vol. 31, № 1. - P. 282-299.
7. Бугаев A.C., Хельвас А. В. Поисковые исследования и разработка методов и средств анализа и автоматического распознавания потоковой информации в глобальных информационных системах. Шифр «Лацкан» // Отчет по НИР. - М.: Изд-во МФТИ, 2001. - Т. 1. - 140 с.
8. Redding N.J. et al. An efficient algorithm for Mumford-Shah segmentation and its application to SAR imagery // Proc. Conf. Digital Image Computing Techniques and Applications (DICTA ’99). 1999. P. 35-41.
9. Robinson ВЛ., Redding N.J., Crisp D.J. Implementation of a fast algorithm for segmenting SAR imagery // Scientific and Technical Report, Australia: Defense Science and Technology Organization, Australia. 2002. 1 January.
10. Харинов М.В. Устойчивая сегментация цифрового изображения // Компьютерная графика и зрение (Графикон’2012): материалы XXII Междунар. конф. по компьютерной графике и зрению. М.: Изд-во МГУ им. М. В. Ломоносова, 2012. С. 208-213.
11. Steinhaus H. Sur la division des corps materiels en parties // Bull. Acad. Polon. Sci.,1956. C1. III Vol. IV. P. 801-804.
12. Lloyd S.P. Least squares quantization in PCM // IEEE Transactions on Information Theory. 1982. № 28 (2). P. 129-137.
13. MacQueen J.B. Some Methods for classification and Analysis of Multivariate Observations // Proc. Fifth Berkeley Symp. Math. Stat. and Probab., Berkeley: University of California Press, 1967. Vol. 1. P. 281-297.
14. Likas A., Vlassis N. and Verbeek J. The Global K-Means Clustering Algorithm // Pattern Recognition. 2003. Vol. 36. P. 451-461.
15. Jain A.K., Murthy M.N., Flynn P.J. Data Clustering A Review // ACM Computing Surveys. 1999. Vol. 31, № 3. P. 264-323.
16. Jain A.K. Data Clustering: 50 Years Beyond K -Means // Pattern Recognition Letters. 2010. Vol. 31, № 8. P. 651-666.
17. Мандель И.Д. Кластерный анализ. - М.: Финансы и статистика. 1988. - 176 с.
18. Айвазян С.А. и др. Прикладная статистика: классификация и снижение размерности. - М.: Финансы и статистика, 1989. - 607 с.
19. Kharinov M.V. Reclassification formula that provides to surpass К -means method // arXiv preprint , arXiv:1209.6204, 28 Sep 2012. 10 p. URL: http://arxiv.org/ftp/arxiv/papers/1209/1209.6204.pdf
20. Харинов М.В. Обобщение трех подходов к оптимальной сегментации цифрового изображения // Труды СПИИРАН. - 2013. - Вып. 2(25). С. 294-316.
Харинов Михаил Вячеславович, кандидат технических наук, старший научный сотрудник лаборатории прикладной информатики Санкт-Петербургского института информатики и автоматизации, тел: (812) 3281919, e-mail: [email protected]
Kharinov Mikhail Vyacheslavovich, candidate of technical sciences, senior researcher, laboratory of applied computer science, St. Petersburg Institute for Informatics and Automation RAS, e-mail: [email protected]