№ 5(29) 2010
К.С.Гудков
Математическая модель управления справочниками административно-территориального деления стран СНГ в корпоративных информационных системах
В статье представлена задача управления справочниками в корпоративных информационных системах. Решение задачи демонстрируется с использованием информации по административно-территориальному делению стран СНГ. Автором даны рекомендации по выбору внешних источников и структуре справочников, а также предложены математические модели для их заполнения и тиражирования информации.
М
ногие корпоративные базы данных включают в себя справочники, связанные с административно-территориальным делением (АТД). К сожалению, примерно в половине предприятий отсутствуют системы поддержки нормативно-справочной информации (НСИ) [11]. Существуют требования, выполнение которых обеспечивается системой поддержки НСИ и необходимо для эффективного использования любой НСИ:
• обеспечение актуальности и полноты данных;
• согласованность данных между территориально удаленными отделами корпорации.
Если в корпоративной информационной системе (КИС) не существует системы поддержки НСИ и необходимые для функционирования территориально удаленных участков КИС справочники заполняются на местах, то справочники различных участков противоречат друг другу и содержат заведомо неполную и неактуальную информацию. В результате функционирование КИС затруднено, и неизбежны финансовые потери.
При использовании предлагаемой системы поддержки НСИ обеспечение актуально-
сти и полноты данных достигается за счет обращения к открытым, надежным и регулярно обновляемым справочникам внешних источников и применения специальных программных комплексов по импорту и тиражированию данных. Автоматизированная система импорта внешних справочников (АСИВС) не просто переносит данные, но и преобразовывает их к наиболее приспособленному к нуждам корпорации виду. Доводы против использования внешних справочников в их первоначальном виде приводятся в [12]. Принципы работы рекомендуемой АСИВС описываются в [2].
Обеспечение согласованности данных между территориально удаленными отделами корпорации становится возможным благодаря созданию в КИС центральной консолидированной базы данных нормативносправочной информации (КБД НСИ) и применению для тиражирования НСИ гетерогенной системы репликации данных. Информационная система считается гетерогенной, если отдельные ее компоненты используют базы данных, находящиеся под управлением различных СУБД, и гомогенной — если все ее базы данных находятся под управлением одной и той же СУБД. Система репликации
Математическая модель управления справочниками административно-территориального деления стран СНГ в корпоративных информационных системах
№ 5(29) 2010
гетерогенная, если позволяет проводить репликацию в гетерогенных информационных системах. Доводы в пользу создания КБД НСИ приводятся в [13]. В качестве примера гетерогенной системы репликации данных можно назвать авторскую систему [9] или ЭВБв-систему синхронизации данных [3-7]. Трехуровневая архитектура системы поддержки НСИ, включающая использование КБД НСИ, АСИВС и гетерогенной системы репликации данных, описана в [10].
При создании и последующей работе со справочниками, содержащими информацию по административно-территориальному делению, нужно дополнительно обеспечить поддержку:
• требуемого числа уровней иерархии данных;
• исторических данных.
Выполнение перечисленных требований
достигается выбором структуры корпоративных справочников. Кроме того, для поддержки требуемого числа уровней иерархии данных необходимо наличие соответствующей информации в исходных внешних справочниках.
Источники внешних данных
В качестве источников внешних данных используются открытая база данных международного административно-территориального деления GEONAMES и национальные классификаторы административно-территориального деления стран СНГ. В таблице 1 приведены рекомендуемые источники данных для каждой из стран СНГ.
Выбор между базой данных GEONAMES и национальными классификаторами определялся отдельно для каждой страны путем сравнения распространяемых данных с точки зрения полноты, надежности и актуальности.
Как видно из табл. 1, для работы со справочниками АТД АСИВС должна поддерживать форматы данных DBF, TXT и XLS. Во всех приведенных случаях формат DBF означает файлы локальной базы данных DBASE. Формат XLS необходим для хранения электронных таблиц Microsoft Office Excel. Текстовые файлы базы данных GEONAMES используют кодировку UTF8. Одна строка текстового файла соответствует одному кортежу спра-
Таблица 1
Источники данных административно-территориального деления
Страна Справочник Источник Формат
Азербайджан GEONAMES http://www.geonames.org/ TXT
Армения GEONAMES http://www.geonames.org/ TXT
Белоруссия СОАТО http://www.nalog.by/ DBF
Казахстан КАТО http://www.stat.kz/ XLS
Киргизия GEONAMES http://www.geonames.org/ TXT
Молдавия КАТЕМ http://www.statistica.md/ XLS
Россия КЛАДР http://www.gnivc.ru/ DBF
Таджикистан GEONAMES http://www.geonames.org/ TXT
Туркмения GEONAMES http://www.geonames.org/ TXT
Узбекистан GEONAMES http://www.geonames.org/ TXT
Украина КОАТУУ http://www.ukrstat.gov.ua/ XLS
ПРИКЛАДНАЯ ИНФОРМАТИКА ^----------
1 № 5 (29) 2010
вочника. Для разделения атрибутов применяют табуляцию. АСИВС осуществляет преобразование данных из формата внешних источников во внутренний, в качестве которого используется формат CSV1. Такой подход позволяет минимизировать изменения, вносимые в структуру АСИВС, при переходе внешнего источника на неподдерживаемый формат XXX. В этом случае имеет место только добавление поддержки нового формата при переносе данных из XXX в CSV, но не затрагивается структура АСИВС в целом.
Модель импорта данных
Пусть tj и f/_1 — времена согласования внешних справочников и таблиц КБД НСИ. В момент времени tj таблицы в составе КБД НСИ согласованы со справочниками внешних источников в момент времени f/_1. Требуется выделить изменения, произошедшие в справочниках внешних источников за интервал между tj и tj_1, и применить их к таблицам КБД НСИ. Решение этой задачи позволит согласовать данные внешних справочников и таблиц КБД НСИ в момент времени tj. Для этого применяется АСИВС.
Общий алгоритм работы АСИВС:
• Автоматическая загрузка новой версии справочников.
• Разархивирование данных (если требуется). Формирование множеств OD (внешние справочники) и SOD (используемые внешние справочники).
• Преобразование справочников внешних источников к промежуточному формату АСИВС. F0I — функция, осуществляющая преобразования. В результате формируются множества IDnew и IDo!d, состоящие из текущей и предыдущей версий справочников в промежуточном формате. При добавлении нового, ранее не поддерживаемого формата, требуется модификация функции For
• Получение изменений, произошедших в справочниках внешних источников
1 См.: http://www.creativyst.com/Doc/Articles/CSV/ CSV01.htm.
в интервале времени между Гу и Гу_1, путем сравнения множеств Юпеш и Юм. Функция ^веюьапдез находит эти изменения. Она реализована на основе использования красно-черных деревьев, предложенных Р. Байером в 1972 г. [14]. На первом этапе кортежи множества Юпеш заносятся в красночерное дерево. После этого для каждого из элементов множества ЮоШ проверяется его наличие в красно-черном дереве. Кортеж, который содержится во множестве Юм, но не содержится во множестве Юпеш, — это удаленный из справочника кортеж. Совокупность таких кортежей образует множество удаленных из справочника кортежей ЮсЬ /!с1е1. На втором этапе кортежи множества /ОоИ заносятся в красно-черное дерево. После этого для каждого из элементов множества Юпек проверяется его наличие в красно-черном дереве. Кортеж, который содержится во множестве Юпеш, но не содержится во множестве /ОоИ, — это добавленный в справочник кортеж. Совокупность таких кортежей образует множество добавленных в справочник кортежей ЮсЬапдезаМ. Проведенные эксперименты на базе компьютерного моделирования показали превосходство красно-черных деревьев над AVL-деревьями [1], хэш-таблицами, бинарными деревьями поиска и линейным списком для рассматриваемой задачи. Полученный результат согласуется с теоретическими ожиданиями на основании применения теории сложности, согласно которой использование красно-черных деревьев, АЛ_-деревьев и хэш-таблиц предпочтительно перед бинарными деревьями поиска и линейными списками, а их взаимный порядок предпочтения определяется спецификой исходных данных. В результате выполнения функции Рее,СЛапде8 формируется множество
^сЬапдев ^сЬапде8а<3<3 ^ ^сЬапде8<Зе1'
• Перенос изменений, содержащихся во множестве ЮсЬапдеэ, в КБД НСИ. — функция переноса изменений из промежуточного формата, используемого АСИВС, в КБД НСИ. Функция модифицирует множество ОЯСОб, состоящее из справочников в фор-
119
К.С.Гудков
Математическая модель управления справочниками административно-территориального деления стран СНГ в корпоративных информационных системах
№ 5(29) 2010
мате КБД НСИ (например, из таблиц MS SQL Server).
Общая функция переноса данных из внешних справочников имеет вид:
FMain = XX F0¡ {sod, ) • FGetChanges (idn,, ido, ) •
k I
Fir (idea,, idcd,, drk ),
где
sod, e SOD — справочник внешнего источника;
idn, e IDnew — справочник в промежуточном формате на момент времени t-ido, е IDo!d — справочник в промежуточном формате на момент времени t¡_1; idea, е IDchangesadd — добавленные к справочнику кортежи;
idcdi е IDchangesdei — удаленные из справочника кортежи;
drk е DRCDB —таблица КБД НСИ, соответствующая внешнему справочнику.
Распишем вычисление функции FUajn на примере российского справочника КПАДР:
FUaJn = Foi (socrbase.dbf ) •
Foetchanges (NEW \ socrbase.txt ,OLD \
\ socrbase.txt) •
Fir(CHANGES \ socrbaseadd.txt, CHANGES \ \ socrbasedel.txt, ADM _ TypesRus) +
F0I (kiadr.dbf ) •
Feetchanges (NEW \ kladr.txt,OLD \ kladr.txt) •
Fir (CHANGES \ kladradd.txt, CHANGES \
\ kiadrdei.txt, ADM _ DataRus) +
F0I (street.dbf ) •
Feetchanges (NEW \ street.txt, OLD \ street.txt) ■ Fir (CHANGES \ streetadd.txt, CHANGES \
\ streetdei.txt, ADM _ DataRus).
Справочники socrbase.dbf, kiadr.dbf, street.dbf — элементы множества SOD, т. e. исходные внешние справочники в формате разработчика. Директории OLD, NEW, CHANGES — папки АСИВС для хранения
справочников в промежуточном формате. В папке OLD размещаются файлы предыдущей версии импортируемого справочника в промежуточном формате, а в папке NEW— текущей. В папке CHANGES сохраняется разность между версиями справочника. Например, справочник streetadd.txt содержит кортежи, которые присутствуют в его текущей версии, но отсутствуют в предыдущей. В свою очередь справочник streetdei.txt содержит кортежи, присутствующие в его предыдущей версии, но отсутствующие в текущей. Справочники ADM_TypesRus и ADM_ DataRus — это таблицы КБД НСИ для хранения объектов административно-территориального деления и их типов. Вычисление функций F0I, FGetChanges и Fir программное.
Модель тиражирования данных
Предполагается, что в КИС существует консолидированная база данных, обновляемая АСИВС на основании обновлений внешних справочников. В заданные по расписанию промежутки времени территориально удаленные участки КИС синхронизуют свои базы данных с КБД НСИ. Поставим в соответствие корпоративной информационной системе ориентированный граф G(V,Е). Тогда общая топология КИС выглядит следующим образом:
{3\v0 eV : W ф v0 ^ (v,v°) е Е) &
(W1 0 W2 0 ^{{{v V 2)<tE )&((v 2у 1)ёЕ))),
где
V — множество участков КИС; у0 eV — участок КИС с КБД НСИ; v1 eV,i ф 0 — территориально удаленный участок КИС с локальной базой данных, синхронизирующей свои справочники с КБД НСИ;
Е — множество каналов связи между участками информационной системы.
Введем дополнительные обозначения: RCDB — множество всех справочников в составе КБД НСИ. Включает сами спра-
№ 5(29) 2010
вочники и вспомогательные таблицы, необходимые для проведения LRO-репликации. С точки зрения механизма отслеживания изменений в реплицируемой таблице системы репликации подразделяются на три группы:
1) репликация моментальных снимков (snapshot replication);
2) репликация слиянием (merge replication);
3) транзакционная репликация (transactional replication).
LRO-репликация — это разновидность транзакционной репликации, при использовании которой информация об изменениях в реплицируемой таблице сохраняется в отдельной, специально созданной таблице. Альтернативой для LRO-репликации служит ERO-репликация, в этом случае поддержка репликации внедряется в уже существующие таблицы. В рамках репликации моментальных снимков передаются все данные тиражируемой таблицы. Справочники административно-территориального деления содержат большой объем незначительно меняющихся со временем данных. Использование репликации моментальных снимков привело бы к чрезмерным нагрузкам на каналы связи;транзакционной репликации — к минимуму сводятся нагрузки на каналы связи, увеличивая производительность репликации и уменьшая стоимость финансовой поддержки тиражирования. Перечисленные доводы послужили основанием для реализации гетерогенной системы репликации в виде транзакционной системы.
• DRCDB — основное множество справочников.
• CRCDB — множество вспомогательных таблиц, содержащих изменения в таблицах из множества DRCDB. Вспомогательные таблицы формируются при помощи триггеров.
Связь между множествами RCDB, DRCDB и CRCDB представлена формулой: RCDB = DRCDB u CRCDB.
Пусть на территориально удаленном участке v1 е V, i ф О КИС существует спра-
вочник э, который нужно синхронизовать со справочником б в составе КБД НСИ. Для возможности синхронизации справочники э и б должны быть связаны при помощи операторов переименования, проекции и выбора реляционной алгебры кортежей: э = ос(%(р5(лл..л](б))). Используются обозначения операторов реляционной алгебры кортежей, согласованные с [8]: ос — оператор выбора; кл — оператор проекции; р5(дд л } — оператор переименования. Для возможности проведения ЬРО-репликации в КБД НСИ присутствует таблица сб, содержащая информацию об изменении данных в составе справочника б. Таблица сб формируется при помощи триггеров. Обозначим набор данных для хранения изменений, которые необходимо провести над справочником э для согласованности данных, св. Учитывая связь между справочниками ей б, можно получить формулу для связи между таблицами изменений ев и сб:
СБ = Ос(яА^А2_Ам (р5(а,а2...а1_)
(Сб)))
Гетерогенная система репликации — это комплекс программ, состоящий из сервера репликации и клиента репликации. Сервер репликации располагается на участке у0 еУ, а клиент репликации — на территориально удаленных участках V1 еУ,/ ф 0. При необходимости возможно применение нескольких серверов репликации, объединенных в кластер. Наиболее частая причина — увеличение числа параллельно подключающихся к серверу репликации клиентов. При использовании описанной гетерогенной системы репликации данных схема тиражирования одной таблицы выглядит следующим образом:
• клиент репликации на территориально удаленном участке инициализирует соединение с сервером репликации на участке информационной системы, содержащим КБД НСИ;
• на основе известной связи между справочниками э и б формируется набор
К.С.Гудков
Математическая модель управления справочниками административно-территориального деления стран СНГ в корпоративных информационных системах
№ 5(29) 2010
данных се, содержащий изменения, которые необходимо произвести над справочником в территориально удаленного участка КИС;
• набор данных се передается в территориально удаленный участок КИС;
• в соответствии с набором данных се справочник в территориально удаленного участка КИС изменяется клиентом репликации;
• разрыв соединения.
В случае синхронизации нескольких участков V0, V1 справочников второй, третий и четвертый этапы повторяются в цикле.
По принципу установления соединения между синхронизируемыми участками системы репликации разделяют на три типа:
1) основанныенасообщениях;
2) сеансовые;
3) основанные на постоянном соединении.
Как видно из приведенной выше схемы тиражирования данных, предлагается использовать сеансовую синхронизацию. Системы репликации, основанные на сообщениях, не могут гарантировать согласованность данных, а основанные на постоянном соединении не подходят для применения при наличии мобильных компонентов КИС. Кроме того, они достаточно дороги в эксплуатации. Сеансовая синхронизация позволяет добиться согласованности данных на момент проведения сеанса их синхронизации. Она подходит для использования мобильных КИС и значительно дешевле при эксплуатации, чем система репликации, основанная на постоянном соединении. Исходя из перечисленных соображений, созданная гетерогенная система репликации была разработана как сеансовая система репликации данных.
Поддержка иерархии данных
Для поддержки иерархических данных объектов АТД (см. табл. 1) используют следующие поля:
• СоипКуЮ — идентификатор страны СНГ;
• RegionID — идентификатор региона первого уровня в стране;
• ID — идентификатор объекта АТД в заданном регионе;
• ParentID — идентификатор родительского объекта.
При обращении к национальным классификаторам стран СНГ разделение единого идентификатора объекта (например, CODE в КЛАДР или ТЕ в КОАТУУ) проводится АСИВС при выполнении функции F0I. Подобное разделение обеспечивает ббльшую гибкость в управлении данными, чем при наличии единого поля, характеризующего объект АТД.
Поддержка исторических данных
Для поддержки в справочнике в составе КБД НСИ исторических данных необходимо добавить:
• к справочнику поле StartDate , содержащее дату создания записи;
• в КБД НСИ таблицу-дубликат Name_History, где Name — имя справочника, для которого важно отслеживать исторические данные.
Представим таблицу-дубликат в виде списка атрибутов: Name_History = (HistorylD, FieldsOfName, DeleteDate, AdditionalFields). Поле HistorylD — это идентификатор записи в таблице с историческими данными Name_History. Так как таблица истории не реплицируется, то HistorylD в Name_History является суррогатным первичным ключом. Наиболее естественное решение — использовать для атрибута HistorylD автоинкрементное поле или его аналоги для СУБД, которые не поддерживают этот тип полей. Например, для СУБД Interbase автоинкрементное поле можно смоделировать при помощи генераторов и триггеров. Набор полей FieldsOfName — это поля исходной таблицы с именем Name. Поле DeleteDate — дата удаления записи из исходной таблицы. Набор полей AdditionalFields — поля, добавляемые в таблицу с историческими данными, исходя из потребностей конкретной задачи.
№ 5(29) 2010
Покажем, каким образом извлекаются данные на заданный момент времени. Пусть введены обозначения:
• Я(Д,..., Аы) —исходное отношение, где Аы = 3!аг!Оа!е:
• Н(В, Д,..., Аы ,СД,...,Ок) —таблица-дубликат для отношения Я, где В = НШогуЮ и С = Ое!е1:еОа1:е\
• Т — искомое отношение, содержащее актуальные на момент времени Сиггеп10а1е кортежи, можно вычислить по формуле:
т = я(Ос. (Я) ио^(Н)),
где С1 — предикат (вГагГОаГе < СиггепГОаГе); Сг —предикат (вГагГОаГе < СиггеМОа1е) л л (самая ранняя Ое/еГеОаГе среди (Ое/еГеОаГе > СиггепЮа1:е)).
Полученная в результате примененного механизма информация особенно полезна при работе с паспортными данными. Например, человек родился в городе или регионе, которых в настоящий момент не существует. Использование справочника, хранящего только текущие данные, приводит к тому, что информацию об этом человеке не удастся обработать автоматизированно. В то же время при обращении к справочнику, поддерживающему исторические данные, никаких затруднений не происходит.
Тиражирование программного обеспечения в корпоративной информационной системе (КИС)
Для обеспечения функционирования одного и того же ПО на нескольких территориально удаленных участках КИС возможны два основных подхода:
• Учитывая связь
Э = Ос (я а1А2...Ан (р5( )(^)))'
простое копирование программного обеспечения и его настройка под требуемые параметры подключения к базе данных. При использовании этого подхода необходимо решить проблему безопасного хранения пара-
метров подключения к базе данных. Запрос имени пользователя и пароля при соединении приложения с базой данных понижает удобство пользователя, а текстовые файлы и ресурсы для хранения имени пользователя и пароля — безопасность базы данных. В качестве решения этой проблемы можно порекомендовать хранение имени пользователя и пароля в ресурсе с предварительным шифрованием. Если секретность данных не слишком велика, то в качестве такого шифрования можно применять мо-ноалфавитные и полиалфавитные шифры. При использовании моноалфавитного шифра каждому символу ставится в соответствие единственный символ из таблицы соответствия. В качестве простейшего примера моноалфавитного шифра можно привести шифр Цезаря. При полиалфавитном шифровании несколько моноалфавитных шифров задействуются в цикле. Минус приведенных шифров для конкретной задачи — неустойчивость к дизассемблированию.
• Оформление программного обеспечения в виде ISAPI DLL и его использование как web-приложения (weblication). При необходимости преобразования существующего Windows-приложения, написанного в среде программирования Delphi, в web-приложение значительные усилия может сэкономить технология IntraWeb2. При ее использовании возможно создание базового класса, содержащего требуемую приложению функциональность и дизайн, и двух кпассов-нас-ледников: для Windows-приложения и web-приложения. В результате при минимальных затратах существующее Windows-приложение преобразовывается в web-приложение, способное работать на web-сервере IIS.
В зависимости от конкретного вида тиражируемого программного обеспечения может применяться любой из перечисленных подходов.
2 Более подробно об этой технологии можно узнать из руководства (http://downloads.atozed.com/intraweb/ IntrawebManual. pdf) и онлайн-документации (http://www. atozed.com/intraweb/docs/).
К.С.Гудков
Математическая модель управления справочниками административно-территориального деления стран СНГ в корпоративных информационных системах
№ 5(29) 2010
Заключение
В статье автором предложен метод внедрения справочников административно-территориального деления стран СНГ в корпоративные информационные системы. Внешние справочники переносятся в КБД НСИ при помощи АСИВС и распространяются территориально удаленным отделам корпорации посредством гетерогенной системы репликации данных, рекомендуемые внешние источники которых также приведены автором. Разработаны предложения по структуре справочников, позволяющие обеспечить поддержку иерархических и исторических данных. Затронут вопрос тиражирования программного обеспечения. Рассмотренный метод был применен на практике для КБД НСИ под управлением MS SQL Server и АСИВС, реализованной в среде программирования Delphi. Предложенные рекомендации могут быть использованы не только при внедрении справочников административно-территориального деления, но и других внешних справочников с иерархическими, меняющимися во времени данными.
Список литературы
1. Адельсон-Вельский Г. М., Ландис Е. М. Один алгоритм организации информации // Доклады АН СССР. 1962. №2(146).
2. Бондаренко А. В., Г/дков К. С. Создание таблиц нормативно-справочной информации на основе разнородных внешних справочников // Модели и методы обработки информации. Сборник статей. — М.: МФТИ, 2009.
3. Бондаренко А. В., Лисицын А. В., Лисицын М. В., Арабаджиев С. Е. Синхронизация распределенных баз данных. Часть I. Сравнительный анализ систем репликации и синхронизации распределенных баз данных // Вестник компьютерных и информационных технологий. 2005. №6.
4. Бондаренко А. В., Лисицын А. В., Лисицын М. В., Арабаджиев С. Е. Синхронизация распределенных баз данных. Часть II. Систе-
ма сеансовой синхронизации распределенных баз данных (SS-синхронизация) // Вестник компьютерных и информационных технологий. 2005. №7.
5. Бондаренко А. В., Лисицын А. В., Лисицын М. В., Арабаджиев С. Е. Синхронизация распределенных баз данных. Часть III. Синхронизация баз данных в гетерогенных средах // Вестник компьютерных и информационных технологий. 2007. №9.
6. Бондаренко А. В., Лисицына. В., Лисицын М. В., Арабаджиев С. Е. Синхронизация распределенных баз данных. Часть IV. Технология выполнения удаленных запросов в распределенных базах данных // Вестник компьютерных и инфор-мационныхтехнологий. 2007. №10.
7. Бондаренко А. В., Лисицына. В., Лисицын М. В., Арабаджиев С. Е. Синхронизация распределенных баз данных. Часть V. Синхронизация в защищенных сетях II Вестник компьютерных и информационных технологий. 2007. № 11.
8. Гарсиа-Молина Г., Ульман Д., Уидом Д. Системы баз данных. — М.: Вильямс, 2003.
9. Гудков К. С. Решение проблемы готовности в рамках построения системы репликации баз данных II Труды 50-й научной конференции МФТИ. Часть VII. Управление и прикладная математика. Современные проблемы фундаментальных и прикладных наук. — Долгопрудный, 2007.
10. Гудков К. С. Управление внешней нормативносправочной информацией в распределенных информационных системах // Материалы XVI международной конференции студентов, аспирантов и молодых ученых «Ломоносов — 2009». Секция «Вычислительная математика и кибернетика». — Москва, 2009.
11. Михайлов С. Национальные подходы к системам поддержки НСИ II CIO. 2005. №2.
12. Колесов А. Технология управления НСИ корпоративного уровня II PCWeek/RE. 2005. №18 (480).
13. Помазков Я. Системы НСИ: мировой опыт и тенденции развития // PCWeek/RE. 2006. № 12 (522).
14. Bayer R. Symmetric binary В-trees: Data Structure and maintenance algorithms //Acta Informática. 1972.