УДК 002
DOI: 10.17223/23062061/16/9
И.А. Куликов
ОБОСНОВАНИЕ ПРИМЕНЕНИЯ АППАРАТА НЕЧЁТКОЙ ЛОГИКИ В ИССЛЕДОВАНИИ СИСТЕМЫ ЭЛЕКТРОННОЙ КНИГИ
Аннотация. В статье обосновывается возможность применения аппарата нечёткой логики к системе электронной книги, рассматриваются математические методы, использование которых позволяет определить отношение электронных информационных объектов к книге. Обосновывается выбор алгоритма Мамдани для достижения целей исследования. Рассматриваются основные составляющие данного алгоритма.
Ключевые слова: электронная книга, нечёткая логика, документологический подход, типологические свойства книги, лингвистическая переменная, системы нечёткого вывода, алгоритм Мамдани, фаззификация, дефаззификация.
Постоянное развитие информационных технологий и широкое распространение интернет-сервисов, а также мобильных приложений для чтения книг стали основными причинами смещения книжной отрасли в сторону электронной среды. По прогнозам компании «ЛитРес», в 2017 г. ёмкость рынка реализации электронных книг в России возрастёт до 4 млрд руб., легальный электронный контент предположительно составит 5-7%, и его рост будет продолжаться. Эксперты полагают, что при самом консервативном сценарии к 2020 г. объём продаж электронных книг составит более 7 млрд руб. [1, 2].
Эти процессы повлекли за собой серьёзные преобразования не только на книжном рынке, но и в системе самой книги, что привело к возникновению ряда теоретических и практических проблем, которые в современном книговедении, а также в смежных с ним научных отраслях библиотековедении и библиографоведении -являются актуальными и по настоящее время до конца не решены.
Развитие информационных технологий позволило:
1) объединить в одном информационном объекте несколько знаковых систем и создать мультимедийный книжный продукт;
2) изменить способ общения между автором и читателем, что привело к возможности их совместного творчества в процессе создания книги;
3) создать в электронной среде предпосылки для реализации в книге нового уровня интерактивности;
4) вносить изменения в структуру книги без её переиздания и т.д. [3].
В результате появились электронные информационные объекты, в которых не реализуется одна из главных сущностных характеристик книги, отмеченная в книговедческих исследованиях, -стабильность знаковой и содержательной составляющих. К таким изданиям можно отнести, например, базы данных, электронные газеты и журналы, энциклопедии, учебные пособия, созданные на основе сайтов и др.
Кроме того, распространение интернет-сервисов привело к появлению электронных книг, не прошедших редакционно-издательскую обработку, но опубликованных в электронной среде, что обострило проблему соотношения понятий «книга» - «издание» прежде всего по отношению к электронной продукции. В связи с этим возник вопрос о месте подобных объектов в документивной системе.
Возрастающий объём электронных объектов коммуникации требует определения условий их идентификации, учёта, хранения, а также обеспечения доступа пользователей к их содержанию. Особенно важной в этом контексте является проблема применения авторского права к электронной книге, которая определяется книгоиздателями как остроактуальная.
Ответы на эти вопросы могут быть связаны со стандартизацией понятия «электронная книга», что позволило бы приблизиться к решению практических проблем в библиотечной и библиографической деятельности, но термин «электронная книга», в отличие от понятия «электронный документ», пока не стандартизирован. В ходе прошедшего 14 марта 2017 г. круглого стола «Электронный обязательный экземпляр. Как это работает на практике?» ведущими книгоиздателями страны, представителями Книжной палаты была принята резолюция, в положениях которой предлагается:
1) актуализировать терминологию таких понятий, как «документ» и «издание»; новые формулировки этих понятий должны включать в себя «электронные документы» и «электронные издания» во всех существующих и перспективных форматах;
2) зафиксировать определения новых терминов, связанных с описанием аудиовизуальных, видео- и мультимедийных изданий, кроссплатформенных информационных систем [4].
Однако сложность идентификации относительно постоянно расширяющегося списка электронных книжных объектов заключается в отсутствии критериев отбора, а также в необходимости разграничения понятий «книга» и «не-книга».
Попытка преодоления этих проблем была сделана в работах Е.В. Динер, которая провела исследование теоретико-методологических аспектов электронной книги. На основе применения документологического подхода автор доказал, что книгу в целом необходимо рассматривать как тип документа, а электронную книгу - как тип электронного документа [5].
Обосновывая такой подход, Е.В. Динер обращается к теории нечёткой логики, применение которой позволяет рассмотреть книгу как нечёткое множество объектов, объединённых некоторыми отличительными признаками [4]. На основе этого автор выявляет типологические свойства книги в целом, производит анализ электронной книги и уточняет её определение.
Применение аппарата нечёткой логики к книге можно считать вполне обоснованным. Его использование в гуманитарных системах можно встретить, например в трудах М.И. Вершинина, М.С. Чвановой [6, 7]. Но подтверждение положений, выдвинутых в отношении книги, в работах Е.В. Динер производится с опорой на теоретические аспекты нечёткой логики [8-10], в то время как для характеристики электронных объектов в системе книжной коммуникации только теоретических методов недостаточно. Требуется алгоритм, позволяющий перейти от нечёткости к конкретным значениям. Иными словами, для решения этой проблемы необходимо применить математический аппарат нечёткой логики и системы нечёткого вывода. Этот вопрос в научных трудах, по-
свящённых сущностным характеристикам книги, пока не нашёл освещения.
В основе применения математических методов нечёткой логики к системе книги находится понятие нечёткого подмножества [11]. Данное подмножество отличается от чёткого тем, что для его элементов нет однозначного ответа относительно какого-либо свойства. В связи с этим нечёткое подмножество А универсального множества Е определяется как множество упорядоченной пары А = {тА(х)/х}, где тА(х) - характеристическая функция принадлежности (или просто функция принадлежности), принимающая значение в некотором упорядоченном множестве М (например, М = [0,1]) [12].
Функция принадлежности указывает степень (или уровень) принадлежности элемента х к подмножеству А. Множество М называют множеством принадлежностей. Если М = {0,1}, тогда нечёткое подмножество А может рассматриваться как обычное, или чёткое, множество.
Например, опишем множество молодых людей. Формально его можно записать так:
В = {множество молодых людей}
Поскольку возраст начинается с 0, то нижняя граница этого множества должна быть нулем. Верхнюю границу определить сложнее. Предположим, что она может быть равна 20 годам. Таким образом, имеем В как чётко ограниченный интервал, буквально: В = [0,20]. Однако возникает вопрос: почему кто-то в свой двадцатилетний юбилей - молодой, а сразу на следующий день уже не молодой? Очевидно, это структурная проблема, и если передвинуть верхнюю границу в другую точку, то можно задать такой же вопрос.
Более естественный путь создания множества В состоит в ослаблении строгого деления на молодых и немолодых. Сделаем это, вынося не только чёткие суждения «Да, он принадлежит множеству молодых людей» или «Нет, он не принадлежит множеству молодых людей», но и гибкие формулировки «Да, он принадлежит к довольно молодым людям» или «Нет, он не очень молодой» [13].
Рассмотрим как с помощью нечёткого множества определить выражение «Он ещё молодой».
В первом примере были кодированы все элементы множества с помощью 0 ли 1. Простым способом обобщения данной концепции является введение значений между 0 и 1. Реально можно допустить бесконечное число значений между 0 и 1, в единичном интервале I = [0, 1].
Интерпретация чисел при соотношении всех элементов множества становится теперь сложнее. Конечно, число 1 соответствует элементу, принадлежащему множеству В, а 0 означает, что элемент точно не принадлежит множеству В. Все другие значения определяют степень принадлежности объектов к множеству В.
Для наглядности приведем характеристическую функцию множества молодых людей (рис. 1).
м М(В)
20 25 30 Возраст
Рис. 1
Рассмотрим дополнительные определения, которые потребуются нам для дальнейших рассуждений.
Лингвистическая переменная есть кортеж <в, Т, X, О, М>, где: в - имя лингвистической переменной; Т - множество её значений (термов); X - универсум нечётких переменных; О - синтаксическая процедура образования новых термов; М - семантическая процедура, формирующая нечёткие множества для каждого терма данной лингвистической переменной [14].
Нечётким будем называть высказывание вида «в 18 а», где в -лингвистическая переменная; а - один из термов этой переменной.
Правило нечётких продукций - это классическое правило вида «ЕСЛИ... ТО...», где в качестве условий и заключений будут использоваться нечёткие высказывания [14]. Записываются такие правила в следующем виде:
Ш (в1 18 а:) АШ (в2 18 а2) ТИЕК (вз 18 аз).
Для того чтобы однозначно определить, является ли тот или иной электронный объект книгой, недостаточно лишь описания данных понятий. Потребуется алгоритм, позволяющий осуществить переход от нечёткости к конкретным значениям.
На сегодняшний день существует несколько таких алгоритмов. Все они действуют по принципу, показанному на рис. 2.
Рис. 2
Наиболее распространенными среди них являются алгоритмы Мамдани и Сугено. Для достижения целей исследования был выбран алгоритм Мамдани [15]: в отличие от алгоритма Сугено, который позволяет представлять выходные переменные только в числовом виде [16], он даёт возможность задать требуемую зависимость на языке, близком к естественному [17].
Сущность алгоритма Мамдани в том, что он описывает несколько последовательно выполняющихся этапов, при этом на каждом последующем используются значения, полученные на предыдущем.
С целью применения этого алгоритма к системе книги необходимо более подробно рассмотреть его этапы [14].
1. Формирование базы правил. База правил - это множество, где каждому подзаключению сопоставлен определенный весовой коэффициент. Она может иметь следующий вид (для примера используются правила различных конструкций):
RULE_1: IF «Condition_1» THEN «Conclusion_1» (F1) AND «Conclusion_2» (F2);
RULE_2: IF «Condition_2» AND «Condition_3» THEN «Conclu-sion_3» (F3);
RULE_n: IF «Condition_k» THEN «Conclusion_(q-1)» (Fq-1) AND «Conclusion_q» (Fq);
Где Fi - весовые коэффициенты, означающие степень уверенности в истинности получаемого подзаключения (/ = 1..q). По умолчанию весовой коэффициент принимается равным 1. Лингвистические переменные, присутствующие в условиях называются входными, а в заключениях выходными. Обозначения:
n - число правил нечётких продукций; m - количество входных переменных; s - количество выходных переменных; к - общее число подусловий в базе правил; q - общее число подзаключений в базе правил. Изучение теоретических аспектов применения аппарата нечёткой логики к системе книги позволило предположить, что с целью формирования базы правил можно использовать основные сущностные свойства книги как типа документа, определенные в диссертационном исследовании Е.В. Динер. К ним относятся: 1) объективированность содержания книги в (на) любом материальном носителе, выбор которого определяется её целевым назначением и читательским адресом; 2) способность книги быть, с одной стороны, продуктом духовной деятельности, с другой - хранилищем духовных и культурных ценностей; 3) социальная значимость книги, степень которой определяется её функциональным аспектом;
4) способность книги быть материальным объектом хранения, выдачи, распространения и др., имеющим финансовое выражение;
5) как правило, семиотический характер книги, поскольку её содержание может быть представлено с помощью искусственно созданных знаков, основу которых составляют знаки-символы;
6) наличие организованной структуры и инфраструктуры, характер
которых, а также закономерности их взаимосвязи напрямую зависят от социального назначения и читательского адреса книги; 7) существование книги во времени и пространстве в качестве опубликованного и поименованного документа, который может быть обнародован в виде авторского произведения и/или издания [9]. Наличие этих свойств у электронного информационного объекта свидетельствует о том, что его следует относить к системе книги. После формирования базы правил переходим к этапу фази-фикации.
2. Фаззификация входных переменных. Этот этап часто называют приведением к нечёткости. На вход поступают сформированная база правил и массив входных данных А = {a1, ..., am}. В нашем случае таким массивом будет совокупность отдельных электронных объектов, которые могут принадлежать к нечёткому множеству «книга» или не принадлежат ему.
Целью этого этапа является получение значений истинности для всех подусловий из базы правил. В этом случае для каждого из подусловий необходимо найти значение bi = ц(^). В результате получим множество значений bi, (i = 1..k). На выходе из этого этапа мы получим множество значений истинности, соответствующих разным типологическим свойствам для каждого электронного объекта.
3. Агрегирование подусловий. Как уже упоминалось выше, условие правила может быть составным, т. е. включать подусловия, связанные между собой при помощи логической операции «AND». Целью этого этапа является определение степени истинности условий для каждого правила системы нечёткого вывода. Иными словами, для каждого условия находимо минимальное значение истинности всех его подусловий. Формально это выглядит так:
Cj = min{bj},
где j = 1..n, а i - число из множества номеров подусловий, в которых участвует j-я входная переменная.
4. Активизация подзаключений. На этом этапе происходит переход от условий к подзаключениям. Для каждого подзаключе-ния находится степень истинности di = ci*Fi, где i = 1..q. Затем
каждому 7-му подзаключению сопоставляется нечёткое множество Di с новой функцией принадлежности. Её значение определяется как минимум из di и значения функции принадлежности терма из подзаключения. Этот метод называется min-активизацией, который формально записывается следующим образом:
ц^х) = min [d1, мДх)}, где ц^х) - «активизированная» функция принадлежности; цДх) -функция принадлежности терма; di - степень истинности 7-го подзаключения.
Цель этого этапа - получение совокупности «активизированных» нечётких множеств Di для каждого из подзаключений в базе правил (7 = 1..q).
5. Аккумуляция заключений. На этом этапе следует получить нечёткое множество (или их объединение) для каждой из выходных переменных. Это выполняется следующим образом: 7-й выходной переменной сопоставляется объединение множеств.
Е = U Dj.
Здесь j - номера подзаключений, в которых участвует 7-я выходная переменная (7 = 1..s). Объединением двух нечётких множеств является третье нечёткое множество со следующей функцией принадлежности:
^i(x) = max (^i(x), Ц2(х)}, где ц1(х), ц2(х) - функции принадлежности объединяемых множеств.
В итоге получаем нечёткое множество, соответствующее одному из изучаемых книжных объектов, и выделяем для него функцию принадлежности.
6. Дефаззификация выходных переменных. Цель дефаззифи-кациии - получить количественное значение (crisp value) для каждой из выходных лингвистических переменных. Формально это происходит следующим образом. Рассматриваются 7-я выходная переменная и относящееся к ней множество Ei (7 = 1..s). Затем при помощи метода дефаззификации находится итоговое количественное значение выходной переменной. В данной реализации алго-
ритма используется метод центра тяжести, в котором значение i-й выходной переменной рассчитывается по формуле
'.г V
Jx-f,ii(x)dx
V =Шп-
~ I Мах
Min
где ^(x) - функция принадлежности соответствующего нечёткого множества Ei; Min и Max - границы универсума нечётких переменных; yi - результат дефаззификации.
В результате мы сможем определить степень принадлежности изучаемого книжного объекта к системе книги.
Таким образом, используя инструментарий нечёткой логики применительно к электронным книжным объектам, можно установить границы нечёткого множества «электронная книга», что позволит уточнить свойства объектов, подпадающих под данное понятие, и выработать специфические для него интрументы атрибуции.
Литература
1. Харитонов В. Электронное книгоиздание в России (2016). Итоги пятилетки URL: http://www.digital-books.ru/archives/4251 (дата обращения: 29.01.2017).
2. Ленский Б.В., Воропаев А.Н., Соловьёва Е.В., Зорина С.Ю., Столяров А.А., Казакова О.М. Книжный рынок России. Состояние, тенденции и перспективы развития: отраслевой доклад. М. : Федеральное агентство по печати и массовым коммуникациям, 2017. 98 с.
3. Динер Е.В. Опыт классификации объектов, входящих в систему электронной книги // Библиосфера. 2016. № 1. С. 19-25.
4. Ногина Е.Б., Груздев И.А., Чеченев К.В., Вислый А.И., Степашин С.В. Тезисы резолюции круглого стола «Электронный обязательный экземпляр. Как это работает на практике?» // Университетская книга. 2017. № 4. С. 20-21.
5. Столяров Ю.Н. Документология : учеб. пособие. Орёл : Горизонт, 2013. 370 c.
6. Вершинин М.И., Вершинина Л.П. Применение нечеткой логики в гуманитарных исследованиях // Библиосфера. 2007. № 4. С. 43-47.
7. Чванова М.С., Киселева И.А., Молчанов А.А. Проблемы использования экспертных систем в образовании // Вестник Томского государственного университета. 2013. № 3. С. 39-47.
8. Динер Е.В. Книга как тип документа: к постановке проблемы // Вестник Вятского государственного гуманитарного университета. 2015. Т. 7. С. 6.
9. Динер Е.В. Теоретико-методологические подходы к обоснованию электронной книги как книговедческой категории : дис. ... д-ра пед. наук. М., 2016. 451 c.
10. Динер Е.В. Концептуальные решения проблемы определения электронной книги // Научные и технические библиотеки. 2016. № 2. С. 70-82.
11. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений / под ред. Н.Н. Моисеева, С.А. Орловского. М. : Мир, 1976. 167 c.
12. Пивкин В.Я., Бакулин Е.П., Кореньков Д.И. Нечеткие множества в системах управления : метод. пособие. Новосибирск : НГУ, 1997. 38 c.
13. Бауэр П. Введение в нечеткую логику и системы нечеткого управления. URL: http://www.gotai.net/documents/doc-l-fl-001.aspx (дата обращения: 03.05.2017).
14. Леоненков А.В. Нечеткое моделирование в среде MATLAB и fuzzyTECH. СПб. : БХВ Петербург, 2005. 736 c.
15. Mamdani E.H. An experiment in linguistic synthesis with a fuzzy logic controller // International Journal of Man-Machine Studies. 1975. Vol. 7. P. 1-13.
16. Минько Э.В., Завьялов О.А., Минько А.Э. Оценка эффективности коммерческих проектов. Стандарт третьего поколения : учеб. пособие. СПб. : Питер, 2014. 368 c.
17. Рогозин О.В. Формирование наборов тестов в scorm-системах на основе нейро-нечётких моделей // Образовательные технологии. 2017. № 2. С. 94-103.
SUBSTANTIATION OF THE POSSIBILITY OF USING THE FUZZY LOGIC APPARATUS IN THE RESEARCH OF THE ELECTRONIC BOOK SYSTEM
Tekst. Kniga. Knigoizdanie - Text. Book. Publishing, 2018, 16, pp. 148-160 DOI: 10.17223/23062061/16/9
Ilya A. Kulikov, Vyatka State University (Kirov, Russian Federation). E-mail: il-yamobi@gmail.com
Keywords: electronic book, fuzzy logic, documentological approach, typological properties of book, linguistic variable, fuzzy inference system, Mamdani algorithm, fuzzifi-cation, defuzzification.
The article substantiates the possibility of using the fuzzy logic apparatus to the electronic book system, considers mathematical methods, the use of which allows one to determine the relation of electronic information objects to the book. The choice of the Mamdani algorithm for achieving the research objectives is substantiated. The main components of this algorithm are considered.
References
1. Kharitonov, V. (n.d.) Elektronnoe knigoizdanie v Rossii (2016). Itogi pyatiletki [Electronic book publishing in Russia (2016). Results of the Five-Year Plan]. [Online] Available from: http://www.digital-books.ru/archives/4251. (Accessed: 29th January 2017).
2. Lenskiy, B.V. Voropaev, A.N., Soloveva, E.V., Zorina, S.Yu., Stolyarov, A.A. & Kazakova, O.M. (2017) Knizhnyy rynok Rossii. Sostoyanie, tendentsii i perspektivy razvitiya: otraslevoy doklad [The Book Market of Russia. State, Trends and Prospects for Development: Industry Report]. Moscow: Federal Agency on the Press and Mass Communications.
3. Diner, E.V. (2016) The experience of classifying objects entering the e-book system. Bibliosfera - Bibliosphere. 1. pp. 19-25. (In Russian). DOI: 10.20913/1815-31862016-1-19-25
4. Nogina, E.B., Gruzdev, I.A., Chechenev, K.V., Vislyy, A.I. & Stepashin, S.V. (2017) Tezisy rezolyutsii kruglogo stola "Elektronnyy obyazatel'nyy ekzemplyar. Kak eto rabotaet na praktike?" [Theses of the resolution of the Round Table "Electronic compulsory copy. How does this work in practice?"]. Universitetskaya kniga. 4. pp. 20-21.
5. Stolyarov, Yu.N. (2013) Dokumentologiya [Documentology]. Orel: Gorizont.
6. Vershinin, M.I. & Vershinina, L.P. (2007) Primenenie nechetkoy logiki v gumanitarnykh issledovaniyakh [Fuzzy logic in humanitarian research]. Bibliosfera -Bibliosphere. 4. pp. 43-47.
7. Chvanova, M.S., Kiseleva, I.A. & Molchanov, A.A. (2013) Problemy ispol'zovaniya ekspertnykh sistem v obrazovanii [Problems of using expert systems in education]. Vestnik TGU- Tambov University Review. Series Humanities. 3. pp. 39-47.
8. Diner, E.V. (2015) Kniga kak tip dokumenta: k postanovke problemy [The book as a type of document: to the statement of the problem]. Vestnik Vyatskogo gosudar-stvennogo gumanitarnogo universiteta - Herald of Vyatka State University. 7. pp. 6.
9. Diner, E.V. (2016) Teoretiko-metodologicheskie podkhody k obosnovaniyu el-ektronnoy knigi kak knigovedcheskoy kategorii [Theoretical and methodological approaches to the substantiation of an electronic book as a bibliographic category]. Pedagogy Dr. Diss. Moscow.
10. Diner, E.V. (2016) Conceptual solution for digital book definition. Nauchnye i tekhnicheskie biblioteki - Scientific and Technical Libraries. 2. pp. 70-82. (In Russian).
11. Zadeh, L. (1976) Ponyatie lingvisticheskoy peremennoy i ego primenenie k prinyatiyu priblizhennykh resheniy [The concept of a linguistic variable and its application to the adoption of approximate solutions]. Translated from English. Moscow: MIR.
12. Pivkin, V.Ya., Bakulin, E.P. & Korenkov, D.I. (1997) Nechetkie mnozhestva v sistemakh upravleniya [. Fuzzy sets in control systems]. Novosibirsk: Novosibirsk State University.
13. Bauer, P. (n.d.) Vvedenie v nechetkuyu logiku i sistemy nechetkogo upravleniya [Introduction to fuzzy logic and fuzzy control systems]. [Online] Available from: http://www.gotai.net/documents/doc-l-fl-001.aspx. (Accessed: 3rd May 2017).
14. Leonenkov, A.V. (2005) Nechetkoe modelirovanie v srede MATLAB i fuzzyTECH [Fuzzy modeling in the environment of MATLAB and fuzzyTECH]. St. Petersburg: BKhV Peterburg.
15. Mamdani, E.H. (1975) An experiment in linguistic synthesis with a fuzzy logic controller. International Journal of Man-Machine Studies. 7. pp. 1-13. DOI: 10.1016/S0020-7373(75)80002-2
16. Minko, E.V., Zavyalov, O.A. & Minko, A.E. (2014) Otsenka effektivnosti kom-mercheskikh proektov. Standart tret'ego pokoleniya [Evaluation of the effectiveness of commercial projects. The third generation standard]. St. Petersburg: Piter.
17. Rogozin, O.V. (2017) Formirovanie naborov testov v scorm-sistemakh na os-nove neyro-nechetkikh modeley [Formation of test sets in scorm-systems based on neural-fuzzy models]. Obrazovatel'nye tekhnologii. 2. pp. 94-103.