Научная статья на тему 'Энергетические характеристики процесса долговременного хранения данных'

Энергетические характеристики процесса долговременного хранения данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
191
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДАННЫЕ / ПРОЦЕСС СОХРАНЕНИЯ / СИСТЕМА ХРАНЕНИЯ / ЭНЕРГЕТИЧЕСКИЕ РЕСУРСЫ / ЗЕЛЕНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ / ЭНЕРГЕТИЧЕСКИЙ БАРЬЕР / МЕТАДАННЫЕ / БЛОК ДАННЫХ / DATA / STORAGE SYSTEM / ENERGY SOURCES / GREEN INFORMATION TECHNOLOGY / ENERGY BARRIER / METADATA / DATA UNIT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Верзун Н. А., Колбанёв М. О., Пойманова Е. Д.

Одна из новых задач в области информатизации длительное сохранение больших массивов цифровых данных. Показано, что ее решение требует разработки новых технологий, отличных от тех, которые используются в операционных системах реального времени. Такие характеристики современных систем, как время записи/считывания данных или время доступа к данным, в системах долговременного хранения отступают на второй план. Одним из ключевых требований становится возможность технологии обеспечить сохранение данных в течение заданного времени при минимальных затратах энергии. Исследуется взаимозависимость энергетических и временных характеристик систем долговременного сохранения цифровых данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Energy performance of long-term data storage process

The problem of long-term storage of large amounts of digital data is considered. Solutioning to the problem is shown to call for development of new technologies different from those used in real-time operation systems. Characteristics of modern systems, such as time of data recording/reading or time of data access in long-term storage systems recede into the background, while one of the key requirements becomes the ability of technology to provide persistent storage for the specified time at minimum cost of energy. Interdependence of energy and time characteristics of systems long-term storage of digital data are studied.

Текст научной работы на тему «Энергетические характеристики процесса долговременного хранения данных»

УДК 004.07

DOI: 10.17586/0021-3454-2017-60-2-158-164

ЭНЕРГЕТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ПРОЦЕССА ДОЛГОВРЕМЕННОГО ХРАНЕНИЯ ДАННЫХ

Н. А. Верзун, М. О. Колбанёв, Е. Д. Пойманова

Санкт-Петербургский государственный экономический университет, 191023, Санкт-Петербург, Россия E-mail: e.d.poymanova@gmail. com

Одна из новых задач в области информатизации — длительное сохранение больших массивов цифровых данных. Показано, что ее решение требует разработки новых технологий, отличных от тех, которые используются в операционных системах реального времени. Такие характеристики современных систем, как время записи/считывания данных или время доступа к данным, в системах долговременного хранения отступают на второй план. Одним из ключевых требований становится возможность технологии обеспечить сохранение данных в течение заданного времени при минимальных затратах энергии. Исследуется взаимозависимость энергетических и временных характеристик систем долговременного сохранения цифровых данных.

Ключевые слова: данные, процесс сохранения, система хранения, энергетические ресурсы, зеленые информационные технологии, энергетический барьер, метаданные, блок данных

Рост цифровой вселенной предъявляет новые требования к технологиям сохранения данных. Одной из новых задач в этой области информатизации стало сохранение больших информационных массивов в течение длительного времени [1, 2]. Размерность задачи может быть оценена следующим образом:

— при объеме цифровой вселенной в зета- и йотабайты размеры массивов данных, предназначенных для хранения, могут достигать не только тера-, но и петабайт;

— требуемое время хранения некоторых видов данных может измеряться не только десятками лет, как, например, при архивном хранении, но и сотнями и даже тысячами лет, если речь идет о фамильных данных или данных, потенциально влияющих на выживание будущих поколений человечества.

Можно ожидать, что в ближайшее время появятся специализированные предприятия, предлагающие соответствующие услуги [3—6].

Широко распространенные сегодня технологии сохранения данных не ориентированы на долговременное хранение [7]. Они предназначены для использования в системах реального времени [8], позволяют многократно изменять относительно небольшие объемы данных, обеспечивать их доставку пользователям по инфокоммуникационным сетям. Конкурентоспособность подобных систем хранения тем выше, чем выше плотность записи на информационный носитель и меньше время записи/считывания данных (целью разработчиков также является уменьшение времени доступа к данным). Носители для таких систем можно проектировать исходя из времени гарантированного сохранения, ограниченного годами, как правило, этого достаточно для работы систем реального времени.

Исторически долговременное (в течение тысячелетий [2]) хранение гарантировали „аналоговые технологии", такие как глиняные таблички шумеров, египетские папирусы или русские берестяные грамоты. И в наше время информацию с ветхих бумажных носителей в архивах и библиотеках можно надежно сохранить при помощи аналоговых технологий путем, например, фотографирования и изготовления слайдов. Однако этот опыт не может быть использован при сохранении большей части цифровых данных из-за их огромного объема и

трудности или невозможности визуализации. Что же будет известно о нашей цифровой цивилизации через 5000 лет? Возможно ли сохранение цифровых данных в течение такого времени?

Одной из специфических проблем при долговременном хранении цифровых данных является сложность алгоритма кодирования цифровой информации. Так, табличку, созданную шумерами, можно „прочитать" и сегодня, поскольку за 5000 лет органы зрения у людей не изменились. Чтение цифрового кода возможно только при доступе к эталонным моделям цифровых данных, которые позволят выделить из информационного массива метаданные и в соответствии с ними превратить цифровой код в сигналы, доступные для органов чувств человека. Необходимость сохранения эталонных моделей и метаданных совестно с данными пользователя существенно влияет на характеристики процесса сохранения. Служебная информация увеличивает объемы исходного информационного массива, подлежащего сохранению, вследствие чего ухудшаются и все технологические характеристики информационных систем (если оценивать их по отношению к полезным — пользовательским — данным).

Каждому хранимому на цифровых носителях элементу данных ставится в соответствие минимальная единица хранения (МЕХ). МЕХ — это физическая система, главное свойство которой заключается в способности оставаться в одном из нескольких (в частности, двух) устойчивых состояний [9], установленных управляющим сигналом. В магнитной памяти МЕХ — это домен, т. е. макроскопическая область, в которой вектор спонтанной однородной намагниченности определенным образом ориентирован относительно соответствующего вектора в соседних доменах. В полупроводниковой и оптической памяти — это транзисторы интегральной схемы и информационный рельеф на поверхности оптического диска соответственно. Если минимальная единица хранения имеет два устойчивых состояния, то может сохранить 1 бит данных, если четыре, то — 2 бита, если восемь, то — 3 бита и т.д.

В процессе хранения информационного носителя МЕХ может искажаться. Вероятность искажения определяется законом Аррениуса, она тем выше, чем меньше энергетический барьер, отделяющий минимальные единицы хранения друг от друга и от среды [10]. Создание сильных энергетических барьеров требует большей энергии. Эта энергия достаточно мала при записи одного бита, но растет по мере роста объемов хранения до величин, которыми уже нельзя пренебрегать.

Для сохранения больших объемов данных на длительное время нужны энергоэффективные информационные системы, обеспечивающие гарантированное сохранение данных при минимальных затратах энергии [11—13]. Это требование в полной мере соответствует и принципам построения зеленых информационных технологий [14].

В статье исследуется взаимозависимость энергетических и временных характеристик систем долговременного сохранения цифровых данных.

Введем следующие обозначения:

и — энергетический барьер, отделяющий МЕХ друг от друга и внешней среды. Будем предполагать, что этот барьер одинаков у всех МЕХ и для его установки требуется энергия, равная и (Дж);

т — время гарантированного сохранения МЕХ (лет), зависящее от и.

Значение т зависит от силы энергетического барьера следующим образом [15]:

( .. Л

т = Т0ехр

V квТ ]

(1)

где Т0 ~10 9 с для магнитных материалов, кв — постоянная Больцмана, Т — температура окружающей среды (К).

Зависимость гарантированного времени сохранения от энергетического барьера представлена на рис. 1, из которого, в частности, видно, что барьер и « 11,48квТ позволит сохра-

нить данные 100 лет, 13,78kвT — 1000 лет, 20,69kвT — 1 000 000 лет. Можно также заметить, что скорость увеличения энергетического барьера растет по мере увеличения времени гарантированного сохранения.

т, лет 100

80

60

40

20

6

Рис. 1

10

12 u, Дж

Теперь оценим энергетические затраты системы сохранения за все требуемое время.

В общем случае процесс длительного хранения цифровых данных состоит из циклов перезаписи (с целью восстановления энергетических барьеров МЕХ), продолжительность которых зависит от времени гарантированного сохранения т [16]. Процедура перезаписи может выполняться и в ручном, и в автоматическом режиме. Количество перезаписей данных за требуемое время сохранения будет тем больше, чем меньше т. Уменьшить число перезаписей можно, увеличивая энергетический барьер, за счет дополнительных энергозатрат при управлении состояниями МЕХ.

Обозначим дополнительно:

t — требуемое время сохранения информационного массива, устанавливаемое пользователем (заказчиком услуги);

п — число циклов перезаписи за время t

t t 1

п > — или п =— к, (2)

т т

где к— коэффициент поправки, выбираемый исходя из предположения о реальных внешних условиях хранения информационных носителей. Выполнение условия (2) обеспечит поддержание уровня энергетического барьера до того момента времени, когда истекает время гарантированного сохранения МЕХ;

Е — энергия, затрачиваемая за время ^

E = пы = nквT 1п

' т ^

V т0

(3)

На рис. 2 представлена зависимость энергии от требуемого времени хранения с учетом реалистичных значений п .

Видно, что существует такое значение энергетического барьера, при котором общие энергетические затраты за время директивного сохранения минимальны.

Технологии сохранения никогда „не работают" с одним битом данных или с целым информационным массивом. Они обеспечивают разбиение исходного информационного массива, подлежащего сохранению, на отдельные блоки данных, причем разбиение не связано со смыслом информации. Например, в операционных системах реального времени требуется, чтобы магнитный информационный носитель на аппаратном уровне был разделен на отдельные сектора. Каждый сектор помимо данных из исходного информационного массива должен содержать дополнительные метаданные, которые позволяют обнаружить его на носителе,

2

4

8

произвести считывание и коррекцию данных и другие операции [17—19]. Далее на программном уровне операционная система формирует более крупные блоки данных и связанные с ними дополнительные метаданные. Иерархия блоков данных в общем случае может иметь несколько уровней.

Е-квТ, Дж -2 4 6 8 10 и,

150 000

100 000

50 000

2 4 6 8 10

____ :

20 40 60 80 100 t, лет

Рис. 2

Для упрощения расчетов далее будем предполагать, что выделение блоков данных осуществляется на одном уровне. Обозначим:

V — число битов данных на носителе;

S — число битов данных в одном блоке;

SM — количество метаданных в одном блоке;

Sn — количество „полезных" данных в одном блоке:

S = ^м + Sn ;

P — число блоков на носителе:

P = V/S;

Ет — энергия, затрачиваемая за время гарантированного хранения, с учетом технологии записи;

Еп — энергия, потраченная на запись „полезных" данных;

Ем — энергия, потраченная на запись метаданных:

Ет = Еп + Ем .

Очевидно, что энергия, затрачиваемая на сохранение исходного информационного массива, зависит от размера блока данных. При увеличении последнего будет уменьшаться количество метаданных, приходящихся на каждый бит „полезной" информации или, что то же самое, уменьшаться энергия, затрачиваемая на запись метаданных.

Вернемся к процедуре записи. Каждый блок состоит из „полезных" данных и метаданных, содержащих служебную информацию. Количество метаданных, приходящихся на один блок, мало зависит от количества „полезных" данных и может считаться константой. Таким образом, можно предположить, что чем больше размер записываемых блоков на носителе, тем меньше доля метаданных на нем, соответственно для сохранения одного „полезного" бита потребуется меньше энергии.

Размер записываемых блоков данных определяется требованиями операционной системы. Очевидно, что с увеличением размера блока данных скорость обработки информации операционной системой будет падать. Однако для системы долговременного хранения скорость обработки не является критичной, поскольку к данным не требуется обращение в режиме реального времени.

С учетом емкости сохраняемого информационного массива общая энергия Е, затраченная на запись V бит, будет равна:

Е = квТ 1п

С t ^

V- . (5)

V то)

Энергия, затрачиваемая на запись „полезных данных", на магнитный диск размером V

бит:

(

Еп = кВТ 1п

V

t ^ ¿и Р -

т0 )

(

= квТ 1п

V t

Л

(5 - )--

S т,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

о )

на запись метаданных:

(

Ем = кВТ 1п

Л

Р-

= квТ 1п

С VI ^

1о )

5 т,

(6)

(7)

о )

На рис. 3 показана зависимость энергии от размера записываемого блока данных. Как и следовало ожидать, энергия, затрачиваемая на сохранение исходного информационного массива, существенно сокращается при увеличении размера блока данных и уменьшении объема метаданных.

Е-квТ, Дж 125

124

123

122

4

Рис. 3

8 5, 10 бит

Результаты исследования показывают, что для долговременного хранения больших массивов данных необходимы новые технологии и системы. Главным требованием к ним является не способность работать в масштабе реального времени, а возможность малых энергозатрат при длительном сохранении. Как показывают проведенные расчеты, при организации информационного процесса долговременного хранения данных имеется возможность настроить характеристики технологии таким образом, чтобы уменьшить общее потребление энергетических ресурсов.

список литературы

1. Советов Б. Я., Колбанёв М. О., Татарникова Т. М. Диалектика информационных процессов и технологий // Информация и космос. 2014. № 3. С. 96—104.

2. Советов Б. Я., КолбанёвМ. О., Татарникова Т. М. Информационные процессы и технологии. СПб: ГУАП, 2014.

3. Колбанёв М. О., Микадзе С. Ю., Татарникова Т. М. Модель информационного взаимодействия для предприятий сервиса // Изв. вузов. Приборостроение. 2014. Т. 57, № 9. С. 10—14.

4. Воробьёв А. И., Колбанёв М. О., Татарникова Т. М. Оценка вероятностно-временных характеристик процесса предоставления информационно-справочных услуг // Изв. вузов. Приборостроение. 2014. Т. 57, № 9. С. 15—18.

5. Коршунов И. Л. Состояние и концепция развития информационных технологий в сфере сервиса // Изв. вузов. Приборостроение. 2014. Т. 57, № 9. С. 7—10.

6. Головкин Ю. Б., Ярцев Р. А., Газетдинова С. Г. Моделирование процессов инструментальной подготовки сервисного обслуживания на основе экспертных оценок // Изв. вузов. Приборостроение. 2014. Т. 57, № 9. С. 27—32.

2

6

7. Татарникова Т. М., Пойманова Е. Д. Технологии долговременного хранения данных // Сб. науч. тр. по матер. Междунар. науч.-практ. конф. „Наука и образование в XXI веке". 2013. С. 136—138.

8. Богатырев В. А., Богатырев А. В., Богатырев С. В. Оценка надежности выполнения кластерами запросов реального времени // Изв. вузов. Приборостроение. 2014. Т. 57, № 4. С. 46—48.

9. Колбанёв М. О., Татарникова Т. М. Информационный объем базовых информационных процессов // Информационно-управляющие системы. 2014. № 4. С. 42—47.

10. Kish L.B., Granqvist C.G. Does Information Have Mass? // Proc. IEEE. 2013. Vol. 101, N 9. P. 1895—1899.

11. Колбанёв М. О., Пойманова Е. Д., Татарникова Т. М. Физические ресурсы информационного процесса сохранения данных // Изв. вузов. Приборостроение. 2014. Т. 57, № 9. С. 38—42.

12. Колбанёв М. О., Татарникова Т. М. Физические ресурсы информационных процессов и технологий // Науч.-техн. вестн. информационных технологий, механики и оптики. 2014. Т. 14, № 6. С. 113—122.

13. Верзун Н. А., Колбанёв М. О., Омельян А. В. Об энергетической эффективности сетей пакетной передачи данных // Изв. вузов. Приборостроение. 2014. Т. 57, № 9. С. 42—46.

14. Воробьев А. И., Колбанев А. М., Колбанев М. О. Экологическая безопасность информационных технологий // Геополитика и безопасность. 2015. Т. 32, № 4. С. 90—99.

15. Мейлихов Е. З., Фарзетдинова Р. М. Максимальная плотность магнитной записи и распределение переключающих полей // Физика твердого тела. 2014. Т. 56, вып. 12. С. 2326—2334.

16. Колбанев М. О., Татарникова Т. М., Малков К. О. Подход к организации адаптивного согласующего центра корпоративной сети // Информационно-управляющие системы. 2008. № 3. С. 28—31.

17. Bogatyrev V. A. Protocols for dynamic distribution of requests through a bus with variable logic ring for reception authority transfer // Automatic Control and Computer Sciences. 1999. Vol. 33, N 1. P. 57—63.

18. Богатырев В. А., Богатырев А. В. Оптимизация резервированного распределения запросов в кластерных системах реального времени // Информационные технологии. 2015. Т. 21, № 7. С. 495—502.

19. Татарникова Т. М., Пойманова Е. Д. Роль метаданных при длительном хранении информации // Сб. науч. тр. по матер. Междунар. науч.-практ. конф. „Современное общество, образование и наука". 2015. С. 141—142.

Сведения об авторах

Наталья Аркадьевна Верзун — канд. техн. наук, доцент; СПбГЭУ, кафедра информационных сис-

тем и технологий; E-mail: [email protected]

Михаил Олегович Колбанёв — д-р техн. наук, профессор; СПбГЭУ, кафедра информационных

систем и технологий; E-mail: [email protected]

Екатерина Дмитриевна Пойманова — аспирант; СПбГЭУ, кафедра прикладных информационных технологий; E-mail: [email protected]

Рекомендована кафедрой Поступила в редакцию

информационных систем и технологий 29.06.16 г.

СПбГЭУ

Ссылка для цитирования: Верзун Н. А., Колбанёв М. О., Пойманова Е. Д. Энергетические характеристики процесса долговременного хранения данных // Изв. вузов. Приборостроение. 2017. Т. 60, № 2. С. 158—164.

ENERGY PERFORMANCE OF LONG-TERM DATA STORAGE PROCESS N. A. Verzun, M. O. Kolbanev, E. D. Poimanova

St. Petersburg State University of Economics, 191023, St. Petersburg, Russia E-mail: [email protected]

The problem of long-term storage of large amounts of digital data is considered. Solutioning to the problem is shown to call for development of new technologies different from those used in real-time operation systems. Characteristics of modern systems, such as time of data recording/reading or time of data access in long-term storage systems recede into the background, while one of the key requirements becomes the ability of technology to provide persistent storage for the specified time at minimum cost of energy. Interdependence of energy and time characteristics of systems long-term storage of digital data are studied.

Keywords: data, storage system, energy sources, green information technology, energy barrier, metadata, data unit

Data on authors

PhD, Associate Professor; St. Petersburg State University of Economics, Department of Information Systems and Technologies; E-mail: [email protected]

Dr. Sci., Professor; St. Petersburg State University of Economics, Department of Information Systems and Technologies; E-mail: [email protected]

Post-Graduate Student; St. Petersburg State University of Economics, Department of Information Systems and Technologies; E-mail: [email protected]

For citation: Verzun N. A., Kolbanev M. O., Poimanova E. D. Energy performance of long-term data storage process // Journal of Instrument Engineering. 2017. Vol. 60, N 2. P. 158—164 (in Russian).

DOI: 10.17586/0021-3454-2017-60-2-158-164

Natalya A. Verzun —

Mikhail O. Kolbanev —

Ekaterina D. Poimanova —

i Надоели баннеры? Вы всегда можете отключить рекламу.