Для вычисления второй добавки рассмотрим листы, не попавшие в «нарезанные» блоки. Число
этих листов К°Ср = mod
f zoct
^step
M + M+
. В зависимости
от количества станций, занятых на обработку на данном этапе, может быть получено следующее распределение:
1. К°ер = 0 ;
2. КОёр < М+ ;
3. кОСтр > м+.
Таким образом, значение второй добавки вычисляется согласно (5).
max(ts.), если К^р = 0
А2 = Tstep, если KStep < M
step сли
где low_order(tv(K°tceTp - M+))
Tstep + low _order(ts., (KOteP - M + )) если KOtceP >'M+
возвращает
(K°tep — M+) -й элемент в отсортированном по неубыванию массиве ts. .
ЗАМЕЧАНИЕ 3. Удаление 8гй станции с этапа обработки означает, что листы, обработанные этой станцией, перешли на следующий этап обработки или покинули систему. Таким образом, величина
„0 „0
должна принять значение, равное Zstep - С8. .
Предварительное исследование алгоритмов балансировки вычислительных мощностей показало оптимизацию до 46% для некоторых классов начальных распределений заданий. Эти результаты свидетельствуют о том, что организация параллельно-конвейерного вычислительного процесса в сканцен-тре, основанная на научном подходе и детальном анализе предметной области, позволяет достичь решения задачи массового перевода информации с бумажных носителей в компьютерные форматы за приемлемое время [2].
Сегодня пока остаются открытыми вопросы, связанные с определением оптимального алгоритма балансировки для каждого из классов начальных распределений заданий, а также порогов динамического перераспределения, и требуют дальнейших исследований. Настоящие результаты получены в Международной лаборатории БЬБ1С.
Список литературы
1. Вишняков Ю.М., Цур А., Хашковский В.В. Скантех-нологии. Параллельная обработка заданий в интрасети. //Изв. ТРТУ. Темат. выпуск: Матер. Всерос. науч.-техн. конф. с меж-дунар. участ.: Компьютерные технологии в управленческой и инженерной деятельности. - Таганрог: ТРТУ, 2001. - №3 (21) -С.216-217.
2. Вишняков Ю.М., Хашковский В.В. Параллельно-конвейерная обработка документов в сканцентре. //ИСАПР. -Таганрог, ТРТУ, 2001.
3. Клейнрок Л. Вычислительные системы с очередями. -М.: Мир, 1979.
4. Маматов Ю.А. Организация работы мультипроцессорных СЦВМ с многоуровневой памятью //Дис. на соискание ученой степени д-ра техн. наук.
СРЕДСТВА ОБЕСПЕЧЕНИЯ НАДЕЖНОСТИ ФУНКЦИОНИРОВАНИЯ ИНФОРМАЦИОННЫХ СИСТЕМ
С.Л. Котов, Ю.В. Гибин, А.С. Котов
Для надежного и предсказуемого функционирования информационной системы необходимо иметь данные о предельной нагрузке (выраженной, например, в количестве одновременно поступающих в систему пользовательских запросов), о характере поведения системы в условиях перегрузки и возможных последствиях в случае отказа системы из-за превышения допустимой нагрузки. К сожалению, расчетные значения таких характеристик, определенные теоретическими методами, не всегда совпадают с
фактическими и неадекватно отражают поведение системы в реальной критической ситуации.
Кроме того, информационная система сама по себе неоднородна с позиции предельной производительности: всегда имеются критичные элементы программно-аппаратной платформы, накладывающие ограничение на производительность системы и снижающие ее надежность. Выявление таких элементов не всегда является тривиальной задачей, и экспери-
ментальные данные дают порой весьма неожиданные результаты.
По характеру поведения информационной системы в условиях критической нагрузки их можно условно разделить на три группы:
1) системы, у которых при повышении нагрузки производительность достигает максимального значения и затем остается практически постоянной при дальнейшем росте нагрузки (идеальные системы);
2) системы, у которых наблюдается медленный плавный спад производительности при превышении максимального уровня нагрузки;
3) системы, у которых производительность резко падает при незначительном превышении максимальной нагрузки.
Системы третьего типа наиболее критичны с позиции надежности и безопасности информации и требуют соблюдения постоянного наличия резерва по производительности.
Оценка показателей функционирования информационной системы является сложным процессом, требующим организации работы и четкого взаимодействия большого числа пользователей для создания различных уровней нагрузки на систему. При этом возможно возникновение ситуаций, создающих реальную угрозу безопасности информации, особенно в режимах с пиковой нагрузкой. Поэтому решение задачи измерения показателей функционирования должно базироваться на применении специальных методов тестирования и, соответственно, специальных инструментальных программных средств, позволяющих значительно снизить стоимость и трудоемкость проведения испытаний.
Для получения данных о производительности выполняется тестирование системы под нагрузкой с последующим анализом временных характеристик прохождения тестовых заданий. Тестирование под нагрузкой является методом, при котором тестовые задания имитируют нагрузку на информационную систему, подобную той, которая создается реальными пользователями системы.
Реализация указанного метода тестирования осуществляется с помощью инструментальных средств, позволяющих в лабораторных условиях эмулировать сложное окружение телекоммуникационных, клиент-серверных и /иГегиеГ-взаимодействий и выполнять всесторонний анализ распределенной системы.
Задачей таких инструментальных средств является эмуляция от десятков до тысяч пользователей, посылающих и получающих информацию, воспроизводя тем самым сложное взаимодействие между клиентским и серверным приложением, базами данных, /иГегиеГ-серверами и другими системами. Наиболее совершенные
инструментальные средства нагрузочного тестирования позволяет организовать испытательный стенд с распределенным выполнением тестов и централизованным управлением. Структура такого стенда ®®яюяаетпытаний;
- центральную управляющую станцию, где располагаются сервисы управления процессом тестирования, сервисы обработки статистики, репозиторий результатов тестирования и управляющая графическая консоль пользователя;
- рабочие станции моделирования нагрузки, на которых расположены компоненты для имитации деятельности пользователей (на каждой такой станции может быть смоделирована работа до нескольких сотен виртуальных пользователей);
- дополнительные станции мониторинга и генерации тестовых данных, на которых запускаются генераторы тестовых данных для обеспечения бесперебойного снабжения ими рабочих станций моделирования нагрузки.
Структура испытательного стенда представлена на рисунке.
Моделирование нагрузки осуществляется путем выполнения тестовых транзакций, каждая из ко-
торых включает определенный набор тестов, выполняемых в последовательном или произвольном порядке.
При тестировании сложных систем большое значение имеет адекватность моделирования взаимосвязанных процессов обработки информации. Выполнение следующего этапа технологического цикла обработки запроса зависит от результатов предыдущего, то есть практически образуется цепочка работ, принимающая на входе результаты предыдущего этапа обработки и на выходе передающая собственные результаты следующему этапу. Группы пользователей или клиентские приложения, взаимодействующие с автоматизированной системой, являются частью общего технологического цикла, а их действия являются взаимосвязанными между собой. Для обеспечения достоверного моделирования сложных технологических циклов инструментальные средства тестирования должны учитывать взаимосвязи работ, преобразуя их в соответствующие этапы выполнения тестовых заданий. Адекватное моделирование работы пользователей в таких системах возможно только при поддержке тестовым инструментарием определенной схемы выполнения тестов - конвейерной модели выполнения тестов с асинхронной передачей результатов между этапами выполнения.
Накопленный в Государственном испытательном центре программных систем вычислительной техники (ГИЦ ПС ВТ) г. Тверь, опыт работы с инструмен-
тальными средствами нагрузочного тестирования позволил обобщить и сформулировать ряд требований к их характеристикам.
• Масштабируемость нагрузки. Поддержка возможности параллельного запуска систем выполнения тестовых транзакций на большом числе станций испытательного стенда. Каждая станция должна обладать возможностью имитации до 100 виртуальных пользователей.
• Централизованный сбор статистики. Инструмент должен обладать централизованным компонентом сбора статистики в реальном режиме времени. Средства статистической обработки должны давать возможность строить временные ряды для изучения динамики измерения показателей в течение сеанса тестирования.
• Централизованное управление. Подготовка к выполнению сеансов, планирование, запуск и остановка сеансов, просмотр результатов - все эти процессы должны выполняться из единой точки. Процедуры конфигурирования и управления состоянием исполняющих систем, измерительных мониторов и агентов должны осуществляться в автоматическом режиме.
• Гибкость моделирования. Инструментальное средство тестирования должно обладать способностью построения реалистичных по составу потоков тестовых запросов. Необходимо иметь возможность независимого исполнения нескольких тестовых транзакций с различными тестовыми смесями, для каждой транзакции должен задаваться свой план выполнения и число имитируемых пользователей. Для мо-
делирования сложных систем, особенно связанных с документооборотом, требуется поддержка конвейерной модели выполнения тестов с асинхронной передачей результатов между этапами выполнения.
• Развитые средства хранения конфигурации сеансов и результатов тестирования. Конфигурация сеансов тестирования представляет достаточно сложную систему взаимосвязанных параметров, поэтому инструментальное средство должно предоставлять возможности по структурированному хранению конфигурации сеансов. Необходимо иметь возможность многократного запуска каждого сеанса тестирования с сохранением статистических результатов по всем реализациям с целью последующего проведения сравнительного анализа. Наилучшим решением является использование реляционной СУБД для хранения конфигураций и связанных с ними наборов результатов.
• Наличие средств мониторинга показателей системной статистики. Параллельный анализ показателей системной и прикладной статистики, привязанных к единой временной шкале, позволяет более точно определить причину возникновения узких мест и несбалансированности в системе.
• Наличие средств регистрации событий (логирование), необходимых для выполнения автоматизированной фиксации нештатных ситуаций и записи сообщений об обнаруженных в ходе тестирования отклонениях в поведении испытываемой системы.
Указанные требования реализованы в программном комплексе тестирования Сервер-Тест 2.5, разработанном в ГИЦ ПС ВТ, зарегистрированном в Роспатенте и сертифицированном Госстандартом России. Комплекс прошел всестороннюю апробацию на ряде крупных банковских систем обработки оперативной информации.
СРАВНИТЕЛЬНЫЙ АНАЛИЗ НЕКОТОРЫХ АЛГОРИТМОВ РАСПОЗНАВАНИЯ
В.В. Круглое, И.В. Абраменкова
Целью настоящей статьи является изложение результатов сравнительного анализа разработанного авторами алгоритма распознавания, реализующего методы адаптивной нечеткой логики с известными алгоритмами - методом эталонов и нейросетевым с использованием сети встречного распространения. Подобный анализ проводился путем реализации имитационного эксперимента в среде математической системы МЛТЬЛБ [1]. Сравнение алгоритмов проводилось путем сопоставления количества ошибок распознавания при обучающих и тестовых выборках, одинаковых для всех алгоритмов.
Процедура построения (обучения) предлагаемого нечеткого адаптивного распознавателя выглядит следующим образом.
1. Из т (т<] где N - общее число примеров обучающей выборки) произвольных примеров <£', (возможно, с учетом имеющейся априорной информации) обучающей выборки составляется начальная база знаний распознавателя, отображаемая
матрицей итХ(П+8) со строками вида (£1, £2 , — , , , /2 , — , ), 1 = 1, т , где Т £п - количест-