ловека и анализирует вводимые им данные и получаемые результаты. Затем на основе этого формируется подсказка, подталкивающая к выполнению типичных и правильных действий. Подсказки выводятся в специальном окне в виде текста и гиперссылок. Гиперссылки позволяют выполнять определенные действия.
Формирование поисковых запросов
Одним из самых сложных шагов в работе с системами поиска ФЭ является процедура составления поискового запроса. Данная процедура подразумевает переход от слабоструктурированной и часто нечетко сформулированной технической задачи к некому формализованному запросу, который используется для выполнения поиска.
При разработке системы «Полезный эффект» была внедрена возможность полнотекстового поиска в БД ФЭ, что позволяет искать ФЭ, вообще не используя их формализованное представление.
Однако более важным является мастер формализации поискового запроса, работающий на основе классификации научно-технических задач. Он позволяет за несколько шагов последовательно сузить область задачи и получить нужный поисковый запрос.
Коррекция поисковых запросов
Как показывает практика эксплуатации систем поиска ФЭ, существует ряд проблем, касающихся корректности введенного поискового запроса и соответствующей ему выборки ФЭ из БД. Так, например, в результате поиска могут быть получены неадекватные с точки зрения пользователя результаты: пустая выборка, слишком большая выборка или выборка, не содержащая нужных ФЭ. И хотя поиск во всех этих случаях произво-
дится точно в соответствии с запросом, сам запрос может быть составлен неудачно или с ошибками, что и ведет к неожиданным результатам.
В ходе исследования и анализа были сформулированы правила и приемы диагностики указанных ситуаций и разработаны методы их исправления. На основе этих приемов и методов работает подсистема коррекции поисковых запросов.
В заключение отметим, что для апробации решений, внедренных в автоматизированную систему «Полезный эффект», был проведен ряд экспериментов, в каждом из которых пользователи пытались решить задачи по поиску ФЭ на различных автоматизированных системах.
Пользователи для эксперимента подбирались таким образом, чтобы среди них были как новички в предметной области (поиск ФЭ), так и довольно опытные пользователи.
Испытания показали, что на большинстве задач разработанная система позволяет быстрее и правильнее ввести поисковый запрос. Это достигается наличием текстового запроса, удобной навигацией по дереву тезаурусов и возможностью воспользоваться подсказкой системы для коррекции или формализации запроса. Кроме того, необходимо отметить высокую субъективную оценку данной системы пользователями, так как она была признана более удобной в использовании, чем системы-аналоги.
Разработанная система может быть использована в инженерном творчестве, изобретательстве, а также в учебном процессе в дисциплинах, связанных с физическими знаниями.
Теоретические и практические результаты работы содержат ряд инвариантных компонентов, которые могут быть использованы в исследованиях и разработках в других областях.
ТЕХНОЛОГИЯ ВЫВОДА ДАННЫХ В МУНИЦИПАЛЬНЫХ ГЕОИНФОРМАЦИОННЫХ СИСТЕМАХ
Д.Е. Андрианов, к.т.н., А.В. Булаев
(Муромский институт (филиал) Владимирского государственного университета)
Управление любой сложной социально-экономической системой - от предприятия до региона -предполагает постоянную доступность актуальной информации о состоянии системы и ее элементов для оценки текущего положения дел и определения тенденций развития, что обеспечивает лицам, принимающим решения, наличие необходимых знаний для принятия эффективных мер регулирования и управления.
Интенсивный рост объема информации об объектах городской инфраструктуры влечет за собой естественное расчленение данных и знаний по
отраслям и дисциплинам науки, усугубляемое различной терминологией, узостью частных задач, отсутствием межведомственной координации, что отражается в создаваемых информационных системах. Для обеспечения целостности и комплексности оценок информации процессу дифференциации необходимо противопоставить усилия по интеграции знаний и информации на основе создания единых методологических и методических подходов, методов и информационных технологий (Чесалов Л.Е., Блискавицкий А.А., Аракчеев Д.Б. Информационно-аналитическое обеспечение рационально-
го природопользования. М., 2005).
При разработке и внедрении муниципальных информационных систем необходимо решить достаточно широкий круг задач (Андрианов Д.Е., Макаров К.В., Штыков Р.А. Системы оперативного управления пространственно распределенными объектами. М., 2005). Одна из них - вывод картографической информации на твердый носитель, которая всегда осложняется тем, что требуемое разрешение и размеры вывода значительно превосходят допустимые форматы имеющихся технических средств. При разработке муниципальных геоинформационных систем (МГИС) предложено применять возможность вывода картографического изображения на форматы, поддерживаемые офисными техническими средствами, с их дальнейшей стыковкой. При этом учитывается, что печатающие устройства могут поддерживать режим работы печати без полей и для стыковки карты используется печать с перекрытием, когда небольшая часть изображения на листе дублируется на следующей странице.
Вывод на твердый носитель может осуществляться в векторном и растровом видах.
При использовании стандартных средств печати вывод картографического изображения осуществляется в векторной форме, для чего требуется наличие самой геоинформационной системы (ГИС), что не всегда возможно, если вывод на твердый носитель производится вне землеустроительной организации.
Одним из решений данной проблемы является экспорт картографического изображения в некоторый стандартный векторный формат. Но при этом теряются сведения о стилистике оформления объектов и, как следствие, теряется реалистичность изображения объектов.
Вторым способом является экспорт в виде растрового изображения. При этом будет использоваться возможность получения растрового изображения карты из видимой части рабочего окна ГИС.
Основными требованиями, предъявленными при составлении данного алгоритма, являлись:
• определение конечного формата вывода картографического изображения;
• выбор области, печать которой предполагалась;
• определение разрешения конечного изображения;
• хранение участков карты в стандартных форматах;
• управление ориентацией частей карты.
При этом серьезным недостатком большинства известных ГИС является то, что они способны экспортировать изображения карты лишь с разрешением, не превосходящим 300 dpi.
Введем обозначения для параметров и промежуточных величин, на основе которых будем строить технологию: W - конечная ширина
картографического изображения; Hmap - конечная высота картографического изображения; Wdotmap -конечная ширина картографического изображения; Hdotmap - конечная высота картографического
изображения; Wdmap - ширина картографического изображения в видимой части карты; Hdmap - высота картографического изображения в видимой части карты; Smap - масштаб исходной карты;
S - масштаб плавающего окна; Xbegin,Xend - начальная и конечная координаты Х выводимого на печать участка карты; Ybegin,Yend - начальная и
конечная координаты Y выводимого на печать участка карты; AWH - коэффициент угольности
картографического изображения; Rmap - разрешение экспорта системы ГИС «Ингео»; Rpmap - требуемое разрешение печати карты; X,Y - координаты позиционирования плавающего окна.
В общем виде технология основана на алгоритме формирования картографического изображения, состоящего в следующем.
1. Исходя из конечного формата вывода на печать картографического изображения и предполагаемого разрешения печати высчитывается количество точек конечного изображения W xR H xR
и- map pmap jj map pmap , * *
' dotmap ~ ^ * У dotmap ~ ^ ~ ' ( )
2 5 aotmap ^ 5
2. Получаем значение коэффициента угольно-сти исходной карты:
Wmap
jWfc-^. (2)
H
map
3. Определяем количество дюймов в видимой
части карТЫ (средствами ГИС): Wdmap , Hdmap .
4. Определяем размерность в числе плавающих окон с учетом разности разрешения экспорта и конечного требуемого разрешения:
N =Wmap/2'5 R
Wd
x
R
H /2 5 R
pmap _ map/ w pmap (3)
H
dmap map dmap
либо исходя из соотношения N...
R
AWH=-
N„
(4)
5. Зная исходные координаты области печати, рассчитываем смещения для плавающего окна (в координатах местности):
X -X Y -Y
ДХ= end begin д Y= end begin
N..
Nh
(5)
6. Тогда позиция каждого следующего плавающего окна будет рассчитываться как: X=Xbesin+AXxNwi,Y=Ybesin+AYxNhj, (6)
где = 1,2,3,...^^ , Nhj = 1,2,3,..- позиции плавающего окна в сетке карты.
О
Модуль широкоформатной печати
Настройки генерации образа карты
Количество байт на пиксель изображения (глубина цвета) 4 байта (32 бит) - потребует максимальный объем памяти 3 байта (24 бит) - экономичнее предыдущего на 25% без потерь 2 байта (16 бит) - малый объем памяти, на выходе 65536 цветов С* 1 байт (8 бит) - наименьший объем памяти, на выходе 256 цветов Экспортный формат карты (в миллиметрах] 210
297
Формат А4
Использовать генерацию растра ячейками стандартного Формата
Разрешение (NxN)
Область экспортирования Видимая область карты 100
Г" Сохранять части изображения
Г" Не определять правильную ориентацию на листе
Генерировать изображение карты
Рис. 1. Окно настройки экспорта картографического изображения
7. При использовании плавающего окна необходимо произвести изменение масштаба в соответствии с выражением:
« = . (7)
8. После получения изображений карты в плавающих окнах производится их объединение без наложения.
В результате работы алгоритма формируется растр размерностью ^Ло,тар,Нао,тар. Для апробации
и внедрения представленного алгоритма был разработан программный модуль, являющийся расширением для ГИС «Ингео 3.6», который производит экспорт картографического изображения в растровый графический формат (рис. 1).
Поскольку в результате работы представленного расширения формируется единый файл изображения с требуемой пиксельной размерностью, то получаемые части картографического изображения должны формироваться таким образом, чтобы их стыковка осуществлялась без наложения (рис. 2).
В ходе апробации разработанного алгоритма и расширения, его реализующего, был выявлен недостаток - высокая требовательность алгоритма к вычислительным ресурсам ЭВМ, что обусловлено работой с графическими данными в несжатом виде. Дальнейшее совершенствование алгоритма может быть направлено на реализацию возможности формирования участков карты с наложением, что не повлечет его существенного изменения и может быть отнесено к задачам программирования.
АКТУАЛЬНОСТЬ И ХАРАКТЕРНЫЕ ОСОБЕННОСТИ ПРИМЕНЕНИЯ ТЕХНОЛОГИИ DATA MINING ДЛЯ РЕШЕНИЯ КОРПОРАТИВНЫХ ЗАДАЧ
Н.Ю. Текуч (Санкт-Петербургский государственный университет водных коммуникаций)
Корпоративная база данных любого предприятия в современном мире содержит набор таблиц, хранящих записи об объектах либо фактах (например, о счетах, клиентах, продажах). Как правило, каждая запись в подобной таблице описывает какой-то конкретный факт или объект. Например, запись в таблице продаж отражает тот факт, что некий товар продан такому-то клиенту тогда-то, и, по большому счету, ничего, кроме этих сведений, не содержит. Однако совокупность большого количества таких записей, накопленных за несколько лет, может стать источником дополнительной, гораздо более ценной информации, которую нельзя получить на основе одной конкретной записи, а именно, сведений о закономерностях, тенденциях или взаимозависимостях между данными.
Объемы данных настолько внушительны, что человеку просто не по силам проанализировать их
самостоятельно, хотя необходимость проведения такого анализа вполне очевидна, ведь в этих "сырых данных" заключены знания, которые могут быть использованы при принятии решений. Для того чтобы провести автоматический анализ данных, используется Data Mining.
Существует множество определений Data mining, но в целом они совпадают в выделении четырех основных признаков. Вот определение, которое дал Григорий Пиатецкий-Шапиро, один из ведущих мировых экспертов в области Data Mining: "Data mining - это процесс обнаружения в сырых данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности" (G. Piatetsky-Shapiro, GTE Labs).
Информация, найденная в процессе применения методов Data Mining, должна быть нетриви-