Международный электронный научный журнал ISSN 2307-2334 (Онлайн)
Адрес статьи: pnojournal.wordpress.com/archive15/15-05/ Дата публикации: 1.11.2015 № 5 (17). С. 15-20. УДК 528.7
В. Я. Цветков, В. Т. Матчин
Обновление баз геоданных
Статья описывает механизм обновления баз геоданных. Показано разделение технологии обновления на логическую (алгоритмическую) и физическую технологии. Предложены оценки эффективности обновления. Показано, что обновление в базах геоданных происходит дискретно по объектам или файлам. Показана целесообразность использования при анализе обновления модели информационной конструкции. Предложено для оценки актуальности информации в любой базе данных использовать механизм дисконтирования.
В частности, описан механизм дисконтирования для оценки изменения количества актуальных объектов в базе данных или базе геоданных. Механизм дисконтирования основан на том, что значение анализируемого показателя (стоимость, количество актуальных объектов в базе данных) в следующий момент не может быть произвольным, оно связано со значением в предыдущий момент времени. Показана зависимость коэффициента актуализации от характера процесса.
Определен ряд понятий: логическое обновление, физическое обновление, эффективность логического обновления, время физического обновления.
Ключевые слова: информация, база данных, обновление информации, алгоритмы обновления, механизмы обновления, ценность информации, актуальность информации
Perspectives of Science & Education. 2015. 5 (17)
International Scientific Electronic Journal ISSN 2307-2334 (Online)
Available: psejournal.wordpress.com/archive15/15-05/ Accepted: 13 September 2015 Published: 1 November 2015 No. 5 (17). pp. 15-20.
V. Ya. TsVETKoV, V. T. MATcHiN
Upgrade geodatabase
This article describes the update mechanism geodatabases. The article shows the separation of technology updates to the logical (algorithmic) and physical technology. The article introduces the evaluation of the effectiveness of information update. The article indicates that the update is happening in geodatabases discrete objects or files. The article demonstrates the usefulness of the analysis of the model update of information structure. The article shows the application of the discounting mechanism for assessing the relevance of information in any database.
In particular, the described mechanism of the discount rate for measuring changes in the amount of relevant objects in the database or geodatabase. The mechanism of discounting is based on the fact that the value of the analyzed index (the cost, amount of relevant objects in the database) in the next moment can not be arbitrary, it is associated with the value in the previous time. The dependence of the coefficient updates from the nature of the process.
Defined a variety of concepts: the logical updating, physical updates, the effectiveness of the logical updating, physical updates.
Keywords: information, database, updating the information, update algorithms, mechanisms for updating, the value of information, relevance of information
_Введение
С7— ольшинство современных информацион-\ ных ресурсов хранятся в БД. Актуальность К! / информации БД является обязательным требованием к информации, применяемой для поддержки принятия решений и управления, хранимой в БД. Это обуславливает введения процедуры актуализации или обновления, которая не решается в полной мере средствами СУБД. Обновление пространственной информации является сложной процедурой. При этом следует разделять базы данных пространственной информации или базы пространственных данных (БПД) [1] и базы геоданных (БГД) [2]. БПД является более широким понятием. оно включает, например, картографические базы данных [3] или базы данных изображений [4]. Эти данные менее систематизированы или организованы в сравнении с геоданными. Геоданные являются высокоорганизованными. структурированными данными, которые являются системным ресурсом [5], что позволяет решать на их основе системные задачи и проводить системный анализ [6, 7] на основе БГД.
Оценка актуальности информации в
базе геоданных
Одним из базовым понятий. определяющим акутальность объектов, включая объекты базы данных, является понятие жизненного цикла [8, 9]. Завершение жизненного цикла информации может служить объективным критерием ее обновления в БД. Завершение жизненного цикла может быть обусловлено разными факторами. из которых применительно к БД можно выделить два: естественное старение информации; появление новой актуальной альтернативной информации.
Как определить естественное старение? Один из способов - связать информацию с ее ценностью, то есть со стоимостью. Для стоимости различных объектов существует понятие дисконтирования, то есть привязки ценности объекта в натоящем к ценности объекта в будущем.
Всякая информация имеет определенную ценность. Актуальная информация - наиболее ценная. Можно связать ценность или стоимость информации с актуальностью. В качестве аналога целесообразно взять оценку изменения стоимости, применяемую в финансовой деятельности. Существует простой механизм дисконтирования, который может быть перенесен на оценку стоимости информации в базе данных или в базе геоданных.
Стоимость является прагматической мерой. Другой прагматической мерой в базе данных является количество актуальной информации. Уменьшение стоимости информации равнозначно уменьшению актуальной информации. Поэтому можем применить дисконтирование для
оценки уменьшения актуальности информации в базе данных или базе геоданных.
Однако в базе данных хранится не информация как таковая, а информация связанная с информационными объектами (файлами). Это могут быть изображения, это могут быть электронные карты, это могут быть цифровые модели местности, это могут быть некие законченные информационные конструкции. Поэтому информация в базе геоданных меняется не непрерывно, а дискретно - пообъектно. Отсюда следует, что можно применить дисконтирование для оценки изменения количества актуальных объектов в базе данных или базе геоданных. Оценка объема информации в БД или БГД не является корректной. объем изменяется не непрерывно, а дискретно в соответствии с объемами заменяемых файлов. Учет количества объектов более корректный, так как информация в базе данных зависит именно от объектов и меняется дискретно.
Механизм дисконтирования основан на том, что значение анализируемого показателя (стоимость, количество актуальных объектов в БД) в следующий момент не может быть произвольным, оно связано со значением в предыдущий момент времени. Этот механизм используется в цепях Маркова, Кригинге, цифровом моделировании местности, движении летательных аппаратов, объектах транспорта и многих других связанных процессах.
При дисконтировании используют сложный и простой проценты. Сложный увязывают с капитализацией. Поскольку в БД нет никакой капитализации воспользуемся формулой простого процента [10]. пусть СО - начальная стоимость информации; С^) - текущая стоимость информации в момент ^ Тогда
С
с а)=-С^ (1)
1 + ёг
Здесь d - коэффициент дисконтирования.
Выражение (1) описывает изменение стоимости С^) информации в базе данных с течением времени t.
Для изменения актуализации количества объектов формула (1) трансформируется в
N (г) =
N
1 + ёг
(2)
Здесь - N количество актуальных объектов в БД в начальный момент. ^^ - количество актуальных объектов в базе данных в момент времени ^ d - коэффициент актуализации.
В отличие от коэффициента дисконтирования в экономики коэффициент актуализации в базе данных является вариабельной характеристикой, связанной с характером исследуемого явления. В таблице 1 приведены характерные явления и периоды уменьшения актуализации информации (объектов) на 90% для разных периодов времени.
Зависимость коэффициента актуализации от характера процесса
Таблица 1
Тип явления Характерный период времени изменения актуальности на 90% Коэффициент актуализации
Сезонное год 0,11
Медленный геодинамический процесс месяц 1,33
Пожар лесной день 40,56
Чрезвычайная ситуация (наводнение) час 973,33
Военные действия 10 минут 5840
Астероидная опасность 1 минута 58400
На рис.1 приведены сравнительные характеристик изменения актуальной информации в базе данных для разных явлений и разный периодов изменения информации (год, месяц и день).
К А
1
0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0
По вертикальной оси величина К - коэффициент актуальности. Он показывает долю актуальных объектов в базе данных или базе геоданных. Подчеркнем различие: актуальность это свой-
2 4 6 8 10 12 Цгоды)
Рис.1. Изменение количества актуальных объектов в БГД с течением времени
ство, оценивается в % или в частях; актуализация это процесс.
Определение величин d задает временное ограничение для хранения объектов в базе данных. Если известен характер процесса, то при известном d, можно определить срок его обновления в базе данных. Такой подход связан с тенденцией.
Наряду с тенденцией временные процессы характеризуют коньюнктурные события или "всплески" не зависимые от времени. В этом случае можно говорить об уменьшении актуальности безотносительно к временному периоды.
Таким образом приходим к двум критериям необходимости обновления или актуализации геоданных: по временному критерию из-за естественного старения информации; по количественному критерию из-за уменьшения актуальных объектов в базе данных.
Механизмы обновления
Различают логическую и физическую базу данных [11, 12]. Логической базой данных называют логическую структуру связанных данных, в которой определены данные и отношения между ними. Физической базой данных называют физическую структуру связанных данных, хранимых на машинных носителях для которых заданы отношения и сами данные отделены от процедур манипуляции с ними. Обновление данных связано с физическим изменением данных при сохранении логической структуры [13, 14]. При обновлении не меняется схема данных, а изменяется физическое наполнение БД. Соответственно можно ввести понятие логического обновления и физического обновления.
Определение. Логическое обновление - механизм или алгоритм обновления информации, основанный на логических схемах и принципах.
Определение. Физическое обновление - технология (автоматизированная или интерактивная) замены физических объемов старой информации (файлов) на актуальные файлы. Размеры старых и новых файлов могут не совпадать. Это ставит дополнительную задачу - дефрагмента-ции физического пространства базы данных при обновлении или после обновления
Введем понятие эффективности логического обновления и времени физического обновления - как характеристики физического обновления
Определение. Эффективность логического обновления - отношение числа логических или алгоритмических операций к общему числу физических и логических операций при обновлении информационной единицы базы данных.
Определение. Время физического обновления - время между началом и окончанием процедуры обновления в базе или банке данных. Например, если число логических операций равно числу физических, то эффективность логического обновления 0,5. Если на обновление фрагмента базы данных требуется 0.01 сек - это и есть время физического обновления. Специфическим является обновление пространственной информации в базах данных или в базах геоданных [15, 14].
В настоящее время появилась новая формальная модель. которую удобно использовать для описания БГД и объектов в ней. Эта модель носит название "информационная конструкция" [17]. Семантика состояния информационной конструкции, включая БГД, может быть представлена как «снимок» системы данных или «мгновенное описание» системы данных в информационной конструкции.
Информационная конструкция допускает и требует обновления. Для ряда систем (программных или технологических) обновление информационных конструкций может быть представлено как «бесконечное» выполнение одного алгоритма обновления.
Проверка на актуальность.
Если "да" ^ нет обновления.
Если "нет" ^ есть обновление
Результат действия такой системы обновления - бесконечная последовательность состояний, где каждое следующее состояние получается переходом из предыдущего. Задача логического обновления состоит в проверке необходимости обновления ее данных на основе концепции Model Checking [18, 19].
При создании БД важнейшей задачей является задача согласования данных, а для баз данных, баз геоданных или банков пространственной информации эта задача трансформируется в задачу согласования данных (геоданных) [15,
16]. Задача поиска согласованной структуры пространственных данных всегда связана с организацией этих данных применительно к решаемым задачам. Такая организация, являясь одновременно и инструментом поиска геоданных, релевантных поставленной задаче, должна обладать определенной гибкостью, что обусловлено необходимостью пополнения ее новыми геоданных и динамизмом изменения параметров задачи. Изменения состава БД влекут за собой изменение связей между отдельными элементами в БД и последующие целенаправленные структурные преобразования, направленные на согласование ее отдельных компонентов в смысле взаимоотношений и взаимосоответствий ряда параметров. Обновление состава БД влекут за собой переустановление отношений между отдельными элементами в БД и последующие изменения отношений в условиях решаемой задачи.
Важным требованием для БГД является необходимость оперативно обновлять данные [20, 21]. оно обусловлено тем что БГД хранятся большие объемы информации ив настоящее время говорят не о базах данных, а о банках геоданных которые включают десятки БГД. Но механизм обновления банков данных в свое основе использует механизм обновления БГД. Поэтому обновление БГД актуально и для банков данных пространственной информации
Формально для этой цели можно выделить какое-то количество людей-операторов, которые следили бы за изменением тех или иных участков БГД. Однако, если объем этих объектов исчисляется терабайтами, уследить за изменением всех параметров человеку невозможно. При этом процесс перестройки структурной модели длительный. Поэтому остро встает вопрос об автоматизации данного процесса.
Для этой цели можно использовать механизм анализа информационных конструкций хранимых в базе данных. Многие пространственные данные и все геоданные используют визуальное представление в виде электронных карт. Для таких и в геоданных наиболее распространенной информационной конструкцией хранения в БГД является тайл. Тайл (англ.ЬПе - плитка) [22] в компьютерных картографических сервисах - один из квадратных фрагментов, на которые разбивается растровое изображение. Каждый тайл представляет собой изображение формата jpeg (спутниковые снимки) или png (карты, слои) и хранится в файле с уникальным именем, которое определяется координатами этого тайла по осям X и У Тайлы не есть произвольные фрагменты пикселей, а строго стандартизованные элементы. При при тайловом способе хранения требуется хранить только разные тайлы и информацию об их координатах. Очевидно, что тайловый метод хранения - это перенос идей хранения растровых изображений в БГД. При таком подходе хранение одинаковых тайлов исключается, чем су-
щественно сокращается объем памяти для всей информации. Следует отметить что тайловая организация данных в БГД хранится по особому, не сплошным массивом как при обычном хранении, а только в виде разных фрагментов, составляющих этот файл.
Синонимом термина «тайл» является «текстура». Наложение текстуры является одной из задач графического аппаратного обеспечения. Ключевой задачей при наложения текстур является задача хранения и управления большими текстурами на графических процессорах. Тайло-вая технология позволяет хранить небольшой набор тайлов вместо большого растрового изображения. Эта технология на порядки (1000) уменьшает объем хранимых растровых изображений [23]. Однако она выдвигает дополнительную проблему конструирования объектов из тайлов и обновлений объектов из тайлов. Большинство графических программ применяют тай-лы размерами 256х256 пикселей.
Заключение
Методология проверки актуальности обновления и БГД включает предварительную логическую и последующую физическую процедуры. Критерием обновления является актуальность информации, для оценки которой целесообразно применять механизм дисконтирования. В отличие от дисконтирования в экономике, где имеются устоявшиеся интервалы значений механизма дисконтирования в теории баз геоданных коэффициенты дисконтирования разнятся на порядки, что обусловлено типами информации. Механизм обновления целесообразно ориентировать на модели информационных конструкций и механизм пообъектного обновления. Геоданные являются временными данными, но не темпоральными данными. Механизм темпорального обновления также может быть использован для обновления [19], но для этого геоданные надо привести к темпоральному виду.
ЛИТЕРАТУРА
1. Розенберг И.Н., Альтшулер Б.Ш., Самратов У.Д. О концепции создания инфраструктуры пространственных данных с использованием спутникового позиционирования. // Автоматика, связь, информатика. 2005. № 10. C. 19-23.
2. Розенберг И.Н., Цветков В.Я. Сбор данных для ГИС: учебное пособие. М.: МГУПС (МИИТ), 2015. 75 с.
3. Малинников В.А., Цветков В.Я., Беленко В.В. Разработка картографической базы данных для инженерных изысканий // Инженерные изыскания. 2012. № 9. С. 55-59.
4. Бондур В.Г., Лонский И.И., Остапенко Е.А. Модель видеобазы для обеспечения экологического мониторинга // Известия ВУЗов. Геодезия и аэрофотосъемка. 1993. №1-2. С.147-159.
5. Савиных В.П., Цветков В.Я. Геоданные как системный информационный ресурс // Вестник Российской Академии Наук. 2014. Т. 84. № 9. С. 826-829.
6. Tsvetkov V.Ya. Dichotomous Systemic Analysis. // Life Science Journal 2014. № 11(6). рр. 586-590.
7. Вдовин В.М., Суркова Л.Е., Валентинов В.А. Теория систем и системный анализ: учебник. М.: Дашков и К, 2013. 664 с.
8. Ando A., Modigliani F. The" life cycle" hypothesis of saving: Aggregate implications and tests // The American economic review. 1963. С. 55-84.
9. V.Yа.Tsvetkov, Resource Method of Information System Life Cycle Estimation // European Journal of Technology and Design.
2014. Vol.(4). № 2. pp.86-91. DOI: 10.13187/ejtd.2014.4.92.
10. Четыркин Е.М. Финансовая математика. М.: Дело, 2006. 400 с.
11. Цветков В.Я. Проектирование структур данных и базы данных / Учебное пособие. М.: Московский государственный университет геодезии и картографии, 1997. 90 с.
12. Beeri C. et al. Sets and negation in a logic data base language (LDL1) // Proceedings of the sixth ACM SIGACT-SIGMOD-SIGART symposium on Principles of database systems. ACM, 1987. С. 21-37.
13. Цветков В.Я., Железняков В.А. Интеллектуальное обновление данных в банке данных земель сельскохозяйственного назначения // Науки о Земле. 2012. № 2. С. 73-79.
14. Цветков В.Я., Матчин В.Т. Концептуальное построение программы обновления геоданных // Перспективы науки и образования. 2015. № 1. С. 30-38.
15. Дулин С.К., Розенберг И.Н. Об одном подходе к структурной согласованности геоданных // Мир транспорта. 2005. № 3. С. 16-29.
16. Матчин В.Т. Формирование геоданных // Славянский форум. 2015. № 2 (8). С. 185-193.
17. Tsvetkov V.Ya. Information Constructions // European Journal of Technology and Design. 2014. Vol.(5). № 3. p. 147-152.
18. Bernholtz O., Vardi M. Y., Wolper P. An automata-theoretic approach to branching-time model checking // Computer Aided Verification. Springer Berlin Heidelberg, 1994. рp. 142-155.
19. Цветков В.Я. Применение темпоральной логики для обновления информационных конструкций // Славянский форум.
2015. № 1(7). С. 286-292.
20. Соколов С. М. и др. Мобильный комплекс для оперативного создания и обновления навигационных карт // Известия Южного федерального университета. Технические науки. 2011. Т. 116. № 3.
21. Цветков В.Я., Лобанов А.А., Матчин В.Т., Железняков В.А. Обновление банков данных пространственной информации // Информатизация образования и науки. 2015. № 1 (25). С. 128-136.
22. Wei L. Y. Tile-based texture mapping on graphics hardware // Proceedings of the ACM SIGGRAPH/EUROGRAPHICS conference on Graphics hardware. ACM, 2004. pp. 55-63.
23. Markelov V. Spatial Information Storage // European Researcher. 2013. Vol.(60). № 10-1. p. 2374-2378.
REFERENCES
1. Rozenberg I.N., Al'tshuler B.Sh., Samratov U.D. On the concept of spatial data infrastructure, using satellite positioning. Avtomatika, sviaz', informatika - Automation, communication, Informatics, 2005, no. 10, pp. 19-23 (in Russian).
2. Rozenberg I.N., Tsvetkov V.Ia. Sbor dannykh dlia GIS: uchebnoe posobie [Collection of data for GIS: tutorial]. Moscow, MGUPS (MIIT) Publ., 2015. 75 p.
3. Malinnikov V.A., Tsvetkov V.Ia., Belenko V.V. Development of cartographic databases for engineering research. Inzhenernye izyskaniia - Engineering surveys, 2012, no. 9, pp. 55-59 (in Russian).
Bondur V.G., Lonskii I.I., Ostapenko E.A. Model of videobase to ensure environmental monitoring. Geodeziia i aerofotos"emka
- Geodesy and aerial photography, 1993, no. 1-2, pp. 147-159 (in Russian).
5. Savinykh V.P., Tsvetkov V.Ia. Geodata system as an information resource. Vestnik Rossiiskoi Akademii Nauk - Bulletin of the Russian Academy of Sciences, 2014, V. 84, no. 9, pp. 826-829 (in Russian).
6. Tsvetkov V.Ya. Dichotomous Systemic Analysis. Life Science Journal, 2014, no. 11(6), pp. 586-590.
7. Vdovin V.M., Surkova L.E., Valentinov V.A. Teoriia sistem i sistemnyi analiz: uchebnik [Systems Theory and system analysis: textbook]. Moscow, Dashkov i Ko Publ., 2013. 664 p.
8. Ando A., Modigliani F. The" life cycle" hypothesis of saving: Aggregate implications and tests. The American economic review, 1963, pp. 55-84.
9. V.Ya.Tsvetkov. Resource Method of Information System Life Cycle Estimation. European Journal of Technology and Design, 2014, Vol.(4), no. 2, pp.86-91. DOI: 10.13187/ejtd.2014.4.92.
10. Chetyrkin E.M. Finansovaia matematika [Financial mathematics]. Moscow, Delo Publ., 2006. 400 p.
11. Tsvetkov V.Ia. Proektirovanie struktur dannykh i bazy dannykh / Uchebnoe posobie [Designing data structures and database / tutorial]. Moscow, Moskovskii gosudarstvennyi universitet geodezii i kartografii Publ., 1997. 90 p.
12. Beeri C. et al. Sets and negation in a logic data base language (LDL1). Proceedings of the sixth ACM SIGACT-SIGMOD-SIGART symposium on Principles of database systems. ACM, 1987, pp. 21-37.
13. Tsvetkov V.Ia., Zhelezniakov V.A. Intelligent update data in the data Bank of agricultural land. Nauki o Zemle - Earth Sciences, 2012, no. 2, pp. 73-79 (in Russian).
14. Tsvetkov V.Ia., Matchin V.T. Conceptual building program update the geodatabase. Perspektivy naukiiobrazovaniia - Perspectives of science and education, 2015, no. 1, pp. 30-38 (in Russian).
15. Dulin S.K., Rozenberg I.N. About one approach to structural coherence geodatabase. Mir transporta - World of transport, 2005, no. 3, pp. 16-29 (in Russian).
16. Matchin V.T. Formation of a geodatabase. Slavianskii forum - Slavic forum, 2015, no. 2 (8), pp. 185-193 (in Russian).
17. Tsvetkov V.Ya. Information Constructions. European Journal of Technology and Design, 2014, Vol.(5), no. 3, pp. 147-152.
18. Bernholtz O., Vardi M. Y., Wolper P. An automata-theoretic approach to branching-time model checking. Computer Aided Verification. Springer Berlin Heidelberg, 1994. pp. 142-155.
19. Tsvetkov V.Ia. Use of temporal logic for updating the information structures. Slavianskii forum - Slavic forum, 2015, no. 1(7), pp. 286-292 (in Russian).
20. Sokolov S. M. i dr. Mobile system for rapid creation and updating navigation maps. Izvestiia Iuzhnogo federal'nogo universiteta. Tekhnicheskie nauki - News of southern Federal University. Technical Sciences, 2011, V. 116, no. 3 (in Russian).
21. Tsvetkov V.Ia., Lobanov A.A., Matchin V.T., Zhelezniakov V.A. Updating databases of spatial information. Informatizatsiia obrazovaniia i nauki - Informatization of education and science, 2015, no. 1 (25), pp. 128-136 (in Russian).
22. Wei L. Y. Tile-based texture mapping on graphics hardware. Proceedings of the ACM SIGGRAPH/EUROGRAPHICS conference on Graphics hardware. ACM, 2004. pp. 55-63.
23. Markelov V. Spatial Information Storage. European Researcher, 2013, Vol.(60), no. 10-1, pp. 2374-2378.
Информация об авторах Цветков Виктор Яковлевич
(Россия, Москва) Профессор, доктор технических наук, заместитель директора Центра фундаментальных и
перспективных исследований. Научно-исследовательский и проектно конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте E-mail: [email protected]
Information about the authors
Tsvetkov Viktor Yakovlevich
(Russia, Moscow) Professor, Doctor of Technical Sciences Deputy Director of the Center for fundamental and advanced studies. Research and design engineering Institute of Informatization, automation and communication on railway transport E-mail: [email protected]
Матчин Василий Тимофеевич
(Россия, Москва) Старший преподаватель Московский государственный технический университет радиотехники, электроники и автоматики E-mail: [email protected]
Matchin Vasily Timofeevich
(Russia, Moscow) Senior lecturer Moscow State Institute of Radio Engineering Electronics and Automation E-mail: [email protected]