УДК 004.421.2
ПРЕДСТАВЛЕНИЕ МАТЕМАТИЧЕСКИХ ПОНЯТИЙ В ОНТОЛОГИИ НАУЧНЫХ ЗНАНИЙ
1 2 А.А. Муромский , Н.П. Тучкова
Вычислительный центр им. А.А. Дородницына ФИЦ ИУРАН, Москва, Россия [email protected], [email protected]
Аннотация
Рассматриваются особенности математических предметных областей в контексте построения онтологии научных предметных областей. Приводятся примеры из разрабатываемого тезауруса по уравнениям смешанного типа из раздела уравнений с частными производными математической физики. Особое внимание уделяется вопросам представления и актуальной поддержки тезауруса адресата. Предлагается использовать специализированные тезаурусы, где наряду с определениями на естественном языке присутствуют символьные выражения. Этот подход позволяет уточнить запрос, используя математическую запись в ТеХ-нотации независимо от языка первоисточника, что приводит к уменьшению поискового шума и сокращению времени поиска. Обсуждается вопрос о том, почему всё ещё недостаточно создано математических тезаурусов и что надо сделать, чтобы они использовались в цифровых библиотеках наряду с другими информационными ресурсами. Приводится пример создания тезауруса для отдельной математической предметной области. Особая трудность состоит в описании родо-видовых отношений в математических предметных областях, предлагается один из вариантов описания этих связей для уравнения смешанного типа.
Ключевые слова: поисковый запрос, сравнение математических текстов, семантический поиск, тезаурус математических нотаций, ТеХ-нотации.
Цитирование: Муромский, А.А. Представление математических понятий в онтологии научных знаний / А.А. Муромский, Н.П. Тучкова // Онтология проектирования. - 2019. - Т.9, №1(31). -С. 50-69. - DOI: 10.18287/2223-9537-2019-9-1-50-69.
Введение
Почему всё ещё недостаточно математических тезаурусов и что надо сделать, чтобы они использовались в цифровых библиотеках наряду с другими информационными ресурсами (ИР)? От классиков известно, что «математика - царица наук» (Фридрих Гаусс) и «язык, на котором Бог написал вселенную» (Галилео Галилей). Воспользоваться этим языком могут лишь профессионалы, поскольку уникальные математические знания излагаются на языке формул. В то же время математические знания востребованы всеми естественными науками и существует необходимость их систематизации и поиска.
Кеннету Мэю (Kenneth O. May) принадлежит авторство уникального цифрового проекта по созданию словарей и тезаурусов по математике совместно с издательством McGrow-Hill. Ранее тезаурусы рассматривались, в основном, как инструменты для языковых словарей, например, тезаурус английских слов Роже [1], который переиздаётся уже больше столетия (впервые опубликован в 1852 году). Основной и очевидный для многих тезис К.О. Мэя, прозвучавший на одной из конференций, гласит: «Вы не можете сделать научную работу и систематически работать ни в какой-либо области без словарей в этой области» [2]. Этот тезис сохранил актуальность и приобрёл новое практическое значение в эпоху интернет-технологий и междисциплинарных исследований. В цифровой век появилась возможность
обработки символьной информации для презентации в Интернете (MathML, Coristo WordXML и др.). Ставятся задачи поддержки пользователей в процессе обучения, поиска и взаимодействия с компьютером в области математических наук, машинного обучения и формализации математических знаний. Последней тематике посвящены, например, разработки научных групп Университета Кэмбриджа и Технологического университета Мюнхена, которые ведутся с середины 80-х годов ХХ в. [3]. Аналогичные исследования ведутся в отечественных проектах [4-5]. Значительное число работ посвящено проблемами представления знаний в Интернете и связанных с ними развитием онтологий [6-7] и предметных тезаурусов [8]. Обзор глобальных цифровых математических библиотек даётся в работе [9].
Для обеспечения востребованности ресурса информационные системы должны также отражать реальное место математических наук в системе научных знаний и предлагать настраиваемый на пользователя интерфейс. Опираясь на тезис, сформулированный ещё Муэрсом (Mooers) [10], необходимо отметить, что использование информационно-поисковой системы должно приносить пользу авторам.
Современные средства представления предметных областей (ПрО) на основе построения онтологий и технологий социальных систем обеспечивают такие возможности. Трудности заключаются в описании внутренних взаимосвязей в самих ПрО, поскольку это подразумевает совместные междисциплинарные исследования экспертов ПрО и информационных технологий (ИТ). Каждый такой ИР уникален в своём роде, поскольку отражает индивидуальные взгляды на математическую область, традиции математических школ и подходов к рассмотрению задач и их приложений. Известно, также, что тренд на экспоненциальный рост информации в Интернете распространяется и на математические публикации, что формирует проблему информационного шума при поиске. Это особенно негативно отражается на эффективности использований ИР в научной работе. Составление обзоров при подготовке публикаций стало практически такой же частью научных исследований, как и сами научные исследования. Хотя обзоры всегда необходимы для подтверждения актуальности предлагаемых исследований, сегодня, во многом, они опираются на анализ интернет-изданий. Процесс поиска научной литературы занимает значительное количество времени в отличие от ситуации, когда было достаточно ознакомиться с реферативными журналами, чтобы составить представительный список цитирований по изучаемой проблеме. Поиск и анализ данных в интернет-ресурсах становится самостоятельным видом деятельности [11].
ИТ не прекращают двигаться по пути предоставления поисковых средств для научных исследований. Это оправданно, поскольку только сам специалист, исследователь может адекватно сформулировать свой информационный запрос, и необходимо предоставить ему такую возможность. Исследования не теряют своей актуальности и складываются из нескольких направлений:
■ использование символьной информации для передачи данных;
■ представление формул в системах компьютерной алгебры;
■ системы доказательства теорем и поиск доказательных (reasoning) данных;
■ разработка методов и технологий представления математических знаний в цифровых библиотеках;
■ создание платформ для поддержки пользователей в изучении математических наук;
■ поиск математических публикаций и взаимодействие учёных в процессе исследований;
■ создание систем поддержки актуальных математических знаний в научном интернет-пространстве и управления этими данными на основе семантических связей ПрО;
■ создание и поддержка цифровых библиотек математических публикаций.
Для формирования информационных образов разделов математики необходимо учитывать перечисленные аспекты. А именно, использовать представительные словари с толкова-
нием терминов и формул и связей между ними, как основы информационно-поискового тезауруса данной ПрО. В работе [12] был представлен тезаурус для ПрО «обыкновенные дифференциальные уравнения» (ОДУ), и теперь разрабатывается его расширение на область «уравнения с частными производными» (Partial Differential Equations, PDE) как части общего математического ресурса по «уравнениям математической физики и смежных областей» (Equations of Mathematical Phisycs, EMPh) [13]. Тестовая реализация разрабатывается на базе цифровой библиотеки LibMeta [14]. Для накопления персональных научных знаний о ПрО используется понятие тезауруса адресата (см. работу [15]).
1 Особенности информационных образов математических ПрО
Интерес к проблеме использования символьной записи в виде формул в поисковом запросе сформировался достаточно давно. В работе [9] даётся обзор источников, посвящённых основным тенденциям исследований в этой области: использованию индексирования публикаций на основе таксономии и включению формул в поисковый запрос. В целом, разделяют проблемы представления формул для хранения, визуализации и поиска публикаций с формулами. Изучаются методы кодирования математических знаний, анализа символьных выражений, индексации математических статей ключевыми словами и формулами. Разрабатываются системы контекстного поиска с учётом таксономии. Это направление, которое сочетает семантические связи и рекурсивный поиск индексированных документов с формулами, оценивается как наиболее развиваемое и актуальное. Такой подход предполагает создание предварительной структуры данных и разметку документов для быстрого поиска и дальнейшего уточнения запроса по предварительной выборке.
Можно отметить отличительные особенности математических публикаций, такие как наличие формул и структуру изложения (утверждения, доказательства). Элементы предварительной аналитико-синтетической обработки математических текстов кроме создания словарей, тезаурусов и наборов ключевых слов для индексации, дополняются списками формул и связей между ними, а также утверждениями, где они встречаются. Связи утверждений и формул диктуются логикой самой математической ПрО. Некоторые технические аспекты математических цифровых библиотек отражены в работе [16].
1.1 О формулах и поиске по формулам
Формула - понятие, выражающее разные значения. Трудно назвать область, где это понятие не употребляется или заменяется другим термином. Формула, как некая запись, совокупность знаков, имеющих определённый смысл (значение), имеет довольно широкое употребление. Например, запись «формула поведения» отношения к математике не имеет, если поведение, как некое действие, не является объектом математического описания. Формула -понятие, которое образуется в результате процесса деятельности в науке (математике, химии и др.). Математическая формула имеет входные данные и выходные, получаемые в результате математических операций над входными данными. Поэтому каждая формула может быть представлением определённого процесса, если имеется соответствующая интерпретация данных. Для интерпретации математических знаний часто прибегают к теории графов [17].
Всякая математическая запись, выражающая определённый смысл, может восприниматься как формула. Приведём некоторые определения, чтобы избежать излишних рассуждений на тему термина «формула» и его трактовок. Термин «формула» иностранного происхождения (от лат. formula), определения из [18-20] основаны на определениях из ряда энциклопедий, изданных ранее.
Формула - это:
■ точное определение какого-либо правила, отношения, закона, приложимое в определённых условиях ко всем частным случаям; всякое определение, выраженное в краткой форме; совокупность величин, выраженных числами и буквами и соединенных посредством математических знаков; сокращённое обозначение состава какого-либо соединения с помощью букв, заменяющих названия элементов, и чисел, указывающих на количественное соотношение этих элементов в данном соединении [18];
■ общее краткое и точное выражение (мысли, закона), определение [19];
■ норма, масштаб, схема, образец, правило, по которому что-либо делают (вначале термин имел геометрическое содержание, его корень - forma) [20].
В англоязычном варианте некоторые из определений лексической базы данных Princeton's WordNet [21] отражают термин «формула» как математическое выражение:
Formula, expression (noun) a group of symbols that make a mathematical statement; a standard procédure for solving a class of mathematical problems.
Синонимы: formulation, aspect, rule, chemical formula, saying, look, verbal expression, expression, manifestation, verbalism, grammatical construction, pattern, face, convention, locution, normal, reflexion.
Приведённые определения позволяют использовать при составлении поискового запроса словесный контекст формулы. Синонимы составляют множество выражений для этого контекста наряду с другими содержательными текстовыми фрагментами.
Для поиска на естественном языке можно употреблять то, что можно по аналогии назвать словесной формулой, выражающей описание объекта поиска. Набор ключевых слов с высказанной выше точки зрения - словесная формула в данной тематике.
Структура математической формулы, т.е. её символьная запись, для разных случаев может быть одна и та же, различны только интерпретации входных и выходных данных, кроме, естественного временного параметра или входного данного. Рассмотрим примеры.
Пример 1: utt = a2uxx, или в TeX-нотации [22]: $ u_{tt} = aA2 u_{xx} $ - уравнение свободных поперечных колебаний струны.
Пример 2: уравнение Лаврентьева-Бицадзе; ux + sign y -u = 0 ; $ u_{xx} + sign y u_{yy} = 0 $.
В поисковых системах, поддерживающих формулы в TeX-нотации, как правило, символьные выражения сравниваются с точностью до переменных.
Если формула имеет общепризнанное название, например, «формула бинома», «Далам-бера», то тем самым её входным и выходным данным назначена определённая интерпретация в зависимости от её тематического применения.
Именные формулы также могут быть записаны по-разному.
ô 2u ô2u
--7 +-2
ôx2 ôy
$ y \frac{\partialA2 u}{\partial xA2} + \frac{\partialA2 u}{\partial yA2} = 0 $. Если формула не имеет общепризнанного названия (обозначения), то для её идентификации более значимым становится контекст. Например, есть «неизвестная» формула в контексте, где встречаются термины из списка некоторых ключевых слов для термина «колебание струны» из примеров 1 и 4. Значит, эта формула может быть помещена как «синоним» или примечание в соответствующую статью указателя и будет полезным комментарием при поиске.
Пример 4:
■ малые плоские поперечные колебания струны;
■ вертикальное перемещение струны;
Пример 3: «уравнение Трикоми»; «уравнение Т»; yZx +Ztt = 0, y—- +--- = 0 ;
■ закон свободного колебания струны, Даламбера решение, Даламбера формула;
■ общее решение однородного волнового уравнения,
■ однородное волновое уравнение.
Предлагаемый в статье вариант работы с математическими текстами рассчитан на публикации в ТеХ-нотации. При этом, поскольку используется идея сравнения «по аналогии» и контекстный поиск, то в определённой степени предложенный механизм может быть использован и для работы с текстовыми документами и MSword-документами. Работа с pdf-файлами - это отдельная задача. Эти файлы, если они размещены в сети для специалистов, как правило, имеют стандартные наборы сопроводительных описаний в виде библиографических записей и других полей для поиска, включая тематическую принадлежность и указ а-ния на классификаторы.
При анализе текста необходимо выявить его структуру, определить список ключевых слов и связей. Найти «главный» объект, воздействие на него и действие главного объекта, установить «отклонение» от «основного» смысла. Приведём простой пример на основе использования ключевых слов текста, не касаясь его структуры: есть «k» текстов, в них содержится какое-то количество слов, совпадающих с терминами тезауруса ПрО. Главными объектами текста считаются ключевые слова, совпадающие с дескрипторами тезауруса ПрО. Вводится интегральный показатель (Ni, i=1,2...,k) этих совпадений для оценки тематической близости текстов к тематике ПрО. Если N1<N2<....<Nk, то чем больше частотный показатель совпадений, тем ближе исследуемый текст к тематике ПрО.
Любой процесс в математической физике можно описать по-разному. Если есть совпадения, то можно говорить об аналогии на основе тезауруса ПрО. Например, в [23] приводится множество аналогий математического и физического описания волновых процессов. Эти примеры характерны для случаев различных традиционных представлений (математической записи) волновых уравнений математической физики, используемых в математике и в физике. При сравнении текстов с математическими записями возможны варианты: а) математические представления различные, но описывается одно и то же явление (процесс), б) математические записи совпадают, а словесное описание отличается. И в случае а), и в случае б) сравнение текстов выявит аналогию в смысловом содержании.
Несмотря на тот факт, что ключевые слова могут относиться к терминам различных тезаурусов, совпадающие математические записи позволяют сравнивать тексты и можно сделать вывод, что термины двух тезаурусов необходимо дополнить ассоциативными связями, так как они ссылаются на одинаковые математические записи.
Таким образом, можно использовать сравнение текстов для автоматического расширения тезауруса некоторой ПрО за счёт выявленных новых связей между терминами, если это не противоречит логике самих текстов. В частности, для больших текстов можно реализовать механизм создания тезаурусов на основе частотного анализа словаря ключевых слов и выявления главных терминов в тексте (в качестве дескрипторов) и связанных с ним терминов (в качестве ассоциативных). При реализации этого механизма сжатия смысл текста будет в какой-то мере определяться списком дескрипторов и связями, что позволит ускорить процесс сравнения при поиске. В цифровой библиотеке LibMeta множество признаков сравнения задаётся значениями полей атрибутов (см. пример 5 на рисунке 1).
Наличие механизма сравнения формул в нотации MathML или TeX-нотации весьма расширяет возможности поиска математических текстов, хотя и может привести к известным дополнительным сложностям из-за неоднозначности записи в этих нотациях. Известно достаточное количество разработок, посвящённых сравнению математических текстов в формате TeX, однако на практике применяется контекстное сравнение текстов. Например, в реа-
UbMeU ■ Список наборов атрибутов
лизации проекта EgoMath2 [24], используется процедура конвертации математических формул в некоторые текстовые аналоги для последующего сравнения.
Естественный механизм «разметки» документов задаётся при наличии ключевых слов в пристатейных вторичных документах. В противном случае, используя частотный анализ, составляется локальный тезаурус или словарь для статьи. Т.е. выделяются главные термины и работы, связанные с ними реферативным материалом. Таким образом статья «приписывается» к определённой ПрО, где выбранные главные термины входят в состав дескрипторов.
Основная работа, безусловно, - это составление самого предметного тезауруса и сопровождение его формулами в ТеХ-нотации. Формулы при поиске сравниваются с точностью до переменных, а наличие формул в виде «карти- Рисунок 1 - Пример 5: описание формулы нок» даёт дополнительную визуальную через набор атрибутов в цифр°в°й библготеге ШМйа информацию - это полезная информация, которая служит уточнению запроса.
В цифровой версии словаря всевозможные данные (знания) о специальных функциях помещаются в поля определений и используются в дальнейшем поиске (реализовано в цифровой библиотеке LibMeta [14]). Это названия на русском и английском, запись в ТеХ-нотации, изображения в jpg-формате, индексы классификаторов УДК (универсальный десятичный классификатор) и соответствующие в MSC (Mathematics Subject Classification). Возможна другая дополнительная информация, ссылки на литературу и на другие термины (ассоциативные связи). Фрагмент из двуязычного словаря специальных функций математической физики, составленный с использованием справочника [25], приведён в примере 6. Пример 6:
Бернулли многочлен обобщённый (многочлен Нёрлунда) Generalized Bernoulli polynomial (Noerlund polynomial) $B_(n}A((\alpha )}(z)$
bm,n(z)
$\left( \frac{t}{1-eA{t}}\right) A{\alpha } eA{zt} = \sum_{k=0}A{\infty} B_{k}A{(\alpha )}(z)\frac{tA{k}}{k!}$
LibMeta СЕМАНТИЧЕСКАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
На главную Новый набор атрибутов
Список наборов атрибутов
Название (на русск.) Обозначение (на англ.) Описание
Набор атрибутов персоны FOAF Набор атрибутов для персоны (РОАР)
Набор атрибутов публикации DC Набор атрибутов для публикации (ОС)
Набор атрибутов для ШПгРЫ_ОДУ ODU attribute set Набор атрибутов для описания экземпляров литературы по ОДУ
Набор атрибутов авторов ОДУ auth_ODU Набор атрибутов авторов из литературы, использовавшейся при составлениии ОДУ
Набор для описания Set for formulas Набор для описания формул
формул
© иЬМе1а 2019
Термин, Ru: Термин, En: Термин, TeX: Термин, jpg: Определение, TeX:
Определение, jpg:
l(z) = (Z)z™(l-zy
■ УДК: 517.589
■ МБС: 11В68
Статья словаря в таком виде содержит все поля для идентификации соответствующих формул в тексте. Источником информационного шума становится «поиск по аналогии», который часто применяется в информационно-поисковых системах. Уточнение с помощью формулы позволяет квалифицированному пользователю сократить время поиска и принятия решения при обращении к первоисточнику.
■
1.2 Использование семантических структур для описания связей в ПрО уравнений математической физики
Одно из первых появление формул в тезаурусе относится к ПрО химии, что вполне оправдано и стало возможным после появления средств визуализации в Интернете. В русскоязычном сегменте в 1972 г. появился «Тезаурус научно-технических наук» [26], в 1978 г. «Тезаурус по теории формальных и алгебраических групп» [27], в 1991 г. «Русско-немецкий информационно-поисковый тезаурус по робототехнике» [28]. В 2005 г. был опубликован «Тезаурус информационно-поисковый по ПрО: обыкновенные дифференциальные уравнения» [12], где были даны основные дескрипторы и связи терминов в этой области. В работе [13] был дан обзор этих и других ИР, но теперь через 10 лет многое изменилось. В основном это англоязычные указатели, тезаурусы и классификаторы. Ниже приведены наиболее распространённые открытые источники с указанием в таблицах иерархических структур и родовидовых отношений в тех случаях, когда это явно представлено в самих ресурсах.
1.2.1 Проект «Математика в Web-представлении»
Проект «Математика в Web-представлении» (Mathematics on the Web) американского математического общества (AMS), http://www.ams.org/mathweb/mi-classifications.html. Он включает предметные классификации MSC и Zentralblatt/Math Reviews Classification Statistics, представленные в виде списка гиперссылок, реализующих иерархические (род-вид) и горизонтальные (синонимы, ассоциативные) связи. Для поиска нужного раздела можно перемещаться по цепочке гиперссылок или использовать одно или несколько ключевых слов ПрО. Добавлены новые, «нестандартные» классификаторы издателей, но многие из них перестали существовать или вошли в состав более крупных ресурсов и также стали недоступны.
Ранее раздел «уравнения с частными производными» входил в подраздел «дифференциальные уравнения, интегральные уравнения и операторы», в который включаются также разделы «обыкновенные дифференциальные уравнения», «динамические системы», «интегральные уравнения», «вариационное исчисление и оптимизация» и «глобальный анализ». В качестве дополнительных гиперссылок данного подраздела были приведены «численные методы», «численный анализ» и «приложения» (см. таблицу 1). Теперь этот ресурс расширился и охватывает практически всю ПрО «уравнения с частными производными» на английском языке. Появилась расшифровка позиции кода MSC:35 из предыдущей версии (см. таблицу 2).
1.2.2 Указатель библиотеки Конгресса США
Указатель, использующий систему библиотеки Конгресса США, (Library of Congress Classification Outline), https://www.loc.gov/catdir/cpso/lcco/. В нём нет детализации в разделе математики и тема «уравнения математической физики» не выделена в самостоятельный раздел (см. таблицу 3).
Таблица 1 -Дифференциальные уравнения, интегральные уравнения и операторы (Differential Equations and integral equations and Operators) в системе MSC 2008 г.
Коды родовых терминов Родовые термины
MSC:34 Ordinary differential equations
MSC:35 Partial differential equations
MSC:45 Integral equations
MSC:48 Calculus of variations and optimization
MSC:49 Global analysis
■ numerical methods, numerical analysis, applications
Таблица 2 - Уравнения с частными производными (Partial differential equations) в системе MSC 2018 г.
Коды Коды Видовые термин
35-00 General reference works (handbooks, dictionaries, bibliographies, etc.)
35-01 Instructional exposition (textbooks, tutorial papers, etc.)
35-02 Research exposition (monographs, survey articles)
35-03 Historical (must also be assigned at least one classification number from Section 01)
35-04 Explicit machine computation and programs (not the theory of computation or programming)
35-06 Proceedings, conferences, collections, etc.
35Axx General theory
35Bxx Qualitative properties of solutions
35Cxx Representations of solutions
35Dxx Generalized solutions of partial differential equations
35Exx Equations and systems with constant coefficients [See also 35N05]
35Fxx General first-order equations and systems
35Gxx General higher-order equations and systems
35Hxx Close-to-elliptic equations
35Jxx Partial differential equations of elliptic type [See also 58J10, 58J20]
35Kxx Parabolic equations and systems [See also 35Bxx, 35Dxx, 35R30, 35R35, 58J35]
35Lxx Partial differential equations of hyperbolic type [See also 58J45]
35Mxx Partial differential equations of special type (mixed, composite, etc.) {For degenerate types, see 35J70, 35K65, 35L80}
35Nxx Overdetermined systems [See also 58Hxx, 58J10, 58J15]
35Pxx Spectral theory and eigenvalue problems for partial differential operators [See also 47Axx, 47Bxx, 47F05]
35Qxx Equations of mathematical physics and other areas of application [See also 35J05, 35J10, 35K05, 35L05]
35Rxx Miscellaneous topics involving partial differential equations {For equations on manifolds, see 58Jxx; for manifolds of solutions, see 58Bxx; for stochastic PDEs, see also 60H15}
35Sxx Pseudodifferential operators and other generalizations of partial differential operators [See also 47G30, 58J40]
Таблица 3 - Раздел «математика» (Mathematics) указателя библиотеки Конгресса США
Родовой подкласс Коды подклассов (4 уровня) подкласса QA и (видовые) термины
Subclass QA ■ QA1-939 Mathematics o QA1- 43 General o QA1- 47- 59 Tables o QA71-90 Instruments and machines ■ QA75-76.95 Calculating machines ■ QA75.5-76.95 Electronic computers. Computer science > QA76.75-76.765 Computer software ■ QA101-(145) Elementary mathematics. Arithmetic ■ QA150-272.5 Algebra ■ QA273-280 Probabilities. Mathematical statistics ■ QA299.6-433 Analysis ■ QA440-699 Geometry. Trigonometry. Topology ■ QA801-939
1.2.3 Указатель на основе десятичной системы Дьюи
Классификация на основе десятичной системы Дьюи (Dewey Decimal Classification, DDC) существует с 1873 года. Сейчас редакция 2011 г. используется в основном в библиотечном деле. Раздел «математическая физика» представлен в науке «физика», подчинённом в разделе «естественные науки и математика»: DDC - 500 - Natural sciences & mathematics, http://bpeck.com/references/DDC/ddc_mine500.htm (см. таблицу 4).
Таблица 4 - Раздел «физика» (Physics) указателя Дьюи
Код и родовой термин Коды и вложенные (видовые) термины
530 Physics ■ 530 Physics o 530.1 Theories and mathematical physics o 530.4 States of matter o 530.8 Testing and measurement ■ 531 Classical mechanics; Solid mechanics ■ 532 Fluid mechanics; Liquid mechanics ■ 533 Gas mechanics ■ 534 Sound & related vibrations o 534.5 Subsonic and ultrasonic vibrations ■ 535 Light & related radiations o 535.5 Beams o 535.6 Color o 535.8 Spectroscopy ■ 536 Heat ■ 537 Electriticy & electronics o 537.5 Electronics o 537.6 Electric currents (Electrodynamics) and thermoelectricity ■ 538 Magnetism ■ 539 Modern physics o 539.2 Radiations (Radiant energy) o 539.7 Atomic and nuclear physics
Перечисленные наиболее известные англоязычные ресурсы используются в различных информационно-поисковых и библиографических системах. Многие из цитированных ранее в [13] ресурсов за истекший период стали закрытыми, например: классификация препринтов на Лос Аламос (Index using Los Alamos Preprint-Server Classifications), проект американского математического общества «Математический атлас» (The Mathematical Atlas), проект Масса-чусетского технологического университета «Открытые знания» (Unlocking Knowledge). Это связано во многом с тем, что системы классификации стали частью информационных, в основном библиографических, баз данных с соответствующими авторскими правами. Сюда можно отнести классификаторы, которые используются в известных программных продуктах таких, как MathWorks пакета MATLAB (http://www.mathworks.com/products/product_listing/index.ht), Wolfram Research (http://mathworld.wolfram.com/PartialDifferentialEquation.html), тематические классификаторы WoS (http://apps.webofknowledge.com) и Scopus (https://www.scopus.com), которые закрыты для внешнего пользователя.
Наиболее полно ПрО «уравнения с частными производными» отражена в системе MSC. Формулы и язык для записи формул, разработанные в системах Mathematica Wolfram Research и MathWorks, являются внутренними средствами этих систем. Формулы используются активно в «Encyclopedia of Mathematics» (https://www.encyclopediaofmath.org/index.php/Main_Page).
Из русскоязычных ресурсов в электронном виде продолжают развиваться известные классификаторы ГРНТИ (Государственный рубрикатор научно-технической информации) и УДК (Универсальная десятичная классификация) Всероссийского института научной и технической информации (ВИНИТИ). Наряду с ними можно отметить ресурсы http://eqworld.ipmnet.ru/, http://ontomathpro.org/ontology/ как самостоятельные версии указателей с иерархическими и горизонтальными связями, а также «Общероссийский математический портал» Math-Net.Ru (http://www.mathnet.ru/).
1.2.4 Классификатор ГРНТИ
ГРНТИ представляет собой универсальную иерархическую классификацию областей знания на русском языке, принятую для систематизации всего потока научно-технической информации (http://www.viniti.ru/products/classification-systems/rubricator-grnti). На основе рубрикатора построена система локальных (отраслевых, проблемных) тематических указателей научно-технической информации и рубрикатор отраслей знаний (http://www.viniti.ru/products/classification-systems/rubricator-viniti). Последняя редакция ГРНТИ 2018 г. содержит, в частности, раздел «дифференциальные уравнения в частных производных» (см. таблицу 5).
Таблица 5 - Раздел «дифференциальные уравнения в частных производных» рубрикатора ГРНТИ
Код и родовой термин Коды и видовые термины
27.31 дифференциальные уравнения в частных производных ■ 27.31.17линейные и квазилинейные уравнения ■ 27.31.19 нелинейные уравнения ■ 27.31.21 общие уравнения первого порядка ■ 27.31.33 уравнения высших порядков
1.2.5 Классификатор УДК
Основное назначение УДК - тематическая классификация. На сайте ВИНИТИ (http://scs.viniti.ru/udc/) по номеру УДК можно получить значение, например: на запрос «517.956.6», получить ответ «уравнения смешанного типа».
Таблицы УДК найти можно на разных ресурсах в Интернете. Раздел УДК 517.95 «дифференциальные уравнения с частными производными» показан в таблице 6. В позициях 517.956 и др. есть более глубокая иерархическая цепочка, но полного соответствия, например классификации МБС, нет, как нет и иллюстраций в виде формул.
1.2.6 Интернет-проекты
Интернет-проект (http://eqworld.ipmnet.ru/indexr.htm) «Мир математических уравнений» (EqWorld) поддерживает шесть языков (русский, английский, немецкий, французский, итальянский, испанский). Научный редакторский коллектив под руководством А.Д. Полянина состоит из представителей различных математических коллективов России, США, Канады и др. EqWorld содержит многочисленные ссылки на вспомогательный материал, библиографию, вычислительные средства (Maple, Mathematica, MATLAB и др.). Указатель (предметный и именной) математических уравнений включает разделы: ОДУ, дифференциальные уравнения с частными производными (уравнения математической физики), интегральные уравнения, функциональные уравнения. EqWorld наиболее приближен к российской классической математической школе как учебник и справочник с формулами. Это реализуется за счёт ссылок на справочник [29], т.е. по ссылке из указателя переходим к страничке справочника (см. рисунок 2).
Ресурс «Общероссийский математический портал» (http://www.mathnet.ru/) Математического института им. В.А. Стеклова РАН использует классификаторы MSC, УДК и др. На странице Math-Net.Ru содержатся также ссылки на актуальные программные продукты, такие как MikTeX (пакет для работы с TeX в операционной системе Windows), Magma (компьютерно-алгебраическая система для вычислений в алгебре, теории чисел и геометрии) и др. Имеются также ссылки на известные классификаторы (УДК и MSC 2000) и ряд полезных ссылок на известные издательства, математические ресурсы в Интернете, реферативные базы и математические научные сообщества.
Таблица 6 - Раздел «дифференциальные уравнения с частными производными» УДК ВИНИТИ
Код и родовой Коды и видовые термины Коды и ассоциативные термины
термин
517.95 Дифференциальные уравнения с частными производными 517.951 Общая теория дифференциальных уравнений с частными производными: вариационные, аналитические, основанные на интегральных преобразованиях и другие методы. Геометрическая теория. Аппроксимация ■ см. 517.518.22 Компактные семейства функций ■ см. 517.972.5 Вариационные методы решения дифференциальных, интегральных и других функциональных уравнений ■ см. 517.984.5 Изучение спектра конкретных операторов, в том числе дифференциальных и интегральных операторов
517.952 Общие уравнения первого порядка и системы: свойства, типы и т.п.
517.953 Общие уравнения высших порядков и систем: свойства, типы и т.п.
517.954 Краевые задачи: общая теория, уравнения на многообразиях ■ см. 517.927 Краевые задачи для обыкновенных дифференциальных уравнений ■ см. 517.929.7 Краевые задачи
517.955 Задачи Коши для дифференциальных уравнений с частными производными
517.956 Линейные и квазилинейные уравнения и системы
517.957 Нелинейные уравнения и системы
517.958 Дифференциальные и интегральные уравнения математической физики
Ресурс «OntoMathpro Ontology classes» (http://ontomathpro.org/ontology) Казанского федерального университета содержит англо-русский алфавитный указатель терминов с горизонтальными связями, например термин «Численное решение сингулярных интегральных уравнений с ядром Коши» (см. рисунок 3).
Exact Solutions > Linear Partial Differential Equations >
Second-Order Hyperbolic Partial Differential Equations > Telegraph Equation
2.7. Telegraph Equation ^= a1^+ bw
For k > 0 and 6 < 0, il is the telegraph equation.
The substitution »(j, f) = exp(-±/tf)u(j, t) leads to the Klein-Gordon equation
(Pu
which is discussed in Subsection 2.3.
Reference
Pohanin. A. D„ Handbook of Linear fortial Differential Equations for Engineers and Scientists, Chapman & MallCRC, 2002.
Class: 'Численное решение сингулярных интегральных уравнений с ядром Коши'
http://cll.niimni.ksu.ru/ontologies/mathematics#E433 Annotations (2)
• comment "См. Габдулхаев Б.Г. Прямые методы решения сингулярных интегральных уравнени первого рода. Численный анализ. - Казань: КГУ, 1994. Иванов В.В. Теория приближенных методов и ее применение к численному решению сингулярных интегральных уравнении. -Киев: Наукова Думка, 1968. Лифанов И.К. Метод сингулярных интегральных уравнений и численный эксперимент (в математической физике, аэродинамике, теории упругости н дифракции волн). - М.: ТОО Янус, 1995." (nj)
• label "Численное решение сингулярных интегральных уравнений с ядром Коши" (ш)
Superclasses (1)
Telegraph Equation
Copyright © 2004 Andrei D. Polyanin
http://e^vorldjpmnet.ru/en'solutions/lp<ie/lpde207.pdf
Usage (1)
• Class: 'Численное решение сингулярных интегральных уравнений с ядром Коши'
Рисунок 2 - Представление термина «телеграфное уравнение» в указателе EqWorld
Рисунок 3 - «Численное решение сингулярных интегральных уравнений c ядром Коши» в словаре OntoMathpro
Среди авторов и создателей этих ресурсов нет единого мнения и/или классификатора, для ПрО «уравнения математической физики», но существует достаточно много версий и уточнений. Каждое уточнение может дополнять существующие системы отношений и знаний ПрО в целом. Для сохранения терминологической чистоты научных текстов добавление новых терминов должно сопровождаться расширением тезауруса силами экспертного научного сообщества.
2 Уравнения математической физики смешанного типа
2.1 О предметной области уравнений математической физики
Изучение ПрО уравнений математической физики затрагивает многие разделы математики. За определениями, которые помогут установить семантические связи понятий этой ПрО, следует обратиться к математической энциклопедии [30], где они представлены:
В.С. Владимиров: «Математической физики уравнения - уравнения, описывающие математические модели физических явлений. ...»
А.Н. Тихонов: «Математическая модель - приближённое описание какого-либо класса явлений внешнего мира, выраженное с помощью математической символики».
«Математическая физика (МФ) - теория математических моделей физических явлений; занимает особое положение и в математике, и в физике, находясь на стыке этих наук. М.Ф. тесно связана с физикой в той части, которая касается построения математической модели, и в то же время МФ - раздел математики, поскольку методы исследования моделей являются математическими. В понятие методов МФ включаются те математические методы, которые применяются для построения и изучения математических моделей, описывающих большие классы физических явлений. »
Введём обозначения: «математическая физика» (mathematical physics, MPh), «методы математической физики» (methods of mathematical physics, MMPh), «уравнения математической физики» (equations of mathematical physics, EQMPh), «математические методы» (mathematical methods, MM), «методы теоретической физики» (methods of theoretical physics, MTPh), «математическая символика» (mathematical symbols, MSb).
Все обозначенные уравнения и методы связаны между собой в ПрО MPh (subject domain of mathematical physics, SD MPh), как указано в [30], следующим образом: EQMPh е MTPh; MSb е MM е MMPh.
Уравнения смешанного типа отличаются тем, что принимают гиперболический тип (hyperbolic type,HT), параболический тип (parabolic type,PT) и эллиптический тип (elliptic type, ET), в зависимости от области определения (рассмотрения), как часть PDE второго порядка. В таблице 7 приведены иерархические отношения для PDE второго порядка.
Таблица 7 - Раздел «PDE второго порядка»
Родовой термин Видовые термины
^ РББ второго порядка с двумя независимыми переменными ■ именные РББ ■ нарицательные РББ • Линейные РББ • Линейные РББ относительно старших производных с коэффициентами у старших производных > постоянные коэффициенты > переменные коэффициенты ❖ РББ гиперболического типа ❖ РББ параболического типа ❖ РББ эллиптического типа
Для эффективности работы каждый термин сопровождается идентификатором, который в дальнейшем используется в поисковым запросе. Идентификаторы терминов PDEXXXX(YY), где PDE - «partial differential equation», XXXX - десятичный номер, YY -принимает значение типа уравнения HT, PT, ET.
Видовые термины в таблице 8 - уравнения типа HT, PT и ET.
Таблица 8 - Терминологические обозначения РББ второго порядка с двумя независимыми переменными
Идентификатор Термин (словесное обозначение, символьные выражения, идентификатор)
|РББ1003| «Линейное однородное РББ второго порядка с постоянными коэффициентами и двумя независимыми переменными» Ц = 0. Ц = Аихх + 2Виху + Сиуу + Оих + Еи + Ри = 0, где А, В, С, О, Е - постоянные.
Вид: |РББ 1004(ИТ)|,|РББ 1005(РТ) |, |РББ1006(БТ) |
|РББ1007| «Линейное неоднородное РББ второго порядка с постоянными коэффициентами и двумя независимыми переменными» Ь2 = (р(х, у) Ь2 = Аихх + 2Виху + Сиуу + Оих + Еиу + Ри = р(х, у), где А, В, С, О, Е - постоянные, р - достаточно гладкая функция переменных х и у .
Вид: |РББ 1008(ИТ)|, |РББ 1008(РТ)|,|РББ1010(БТ)|
|РББ1011| «Линейное относительно старших производных РББ второго порядка с постоянными коэффициентами у старших производных и двумя независимыми переменными» Ь3 = 0 Ь3 = Аихх + 2Виху + Сиуу + Р1(х, у, и, их, иу ) = 0, где А, В, С - постоянные
Вид: |РББ 1012(ИТ)|, |РББ 1013(РТ)|,|РББ1014(БТ)|
|РББ1015| «Линейное относительно старших производных РББ второго порядка с постоянными коэффициентами у старших производных, правой частью и двумя независимыми переменными» Ц4 = р( х, у), Ц4 = Аих + 2Виху + Сиуу + р (х, у, и, их, иу ) = р(х, у), где А, В, С - постоянные, р -достаточно гладкая функция переменных х и у .
Вид: |РББ 1016(ИТ)|, |РББ 1017(РТ)|,|РББ1018(БТ)|
|РББ1019| «Линейное однородное РББ второго порядка с переменными коэффициентами двумя независимыми переменными» Ь5 = 0, Ц5 = а11(X, у)ихх + 2а12(X у)иху + а22(X у)иуу + Ь (X, у)Ых + + с( х, у)иу + й (х, у)и = 0, где а11, а12, а22, Ь , с, й - достаточно гладкие функции переменных х и у
Вид: |РББ 1020(ИТ)|, |РББ 1021 (РТ) |, |РББ1022(БТ) |
|РББ1023| «Линейное неоднородное РББ второго порядка с переменными коэффициентами двумя независимыми переменными» Ь6 = / (х, у) Ц6 = al1(x, у)ихх + 2а12(X, у)иху + а22(X, у)иуу + Ь (X, у)их + + с( х, у)иу + й (х, у)и = / (X, у) а11, а12, а22, Ь , с, й, / - достаточно гладкие функции переменных х.
Вид: |РББ 1024(ИТ)|, |РББ 1025(РТ) |, |РББ1026(БТ) |
|РББ1027| «Линейное относительно старших производных РББ второго порядка с переменными коэффициентами у старших производных и двумя независимыми переменными» Ь7 = 0 Ц = А(х, у)ихх + 2В(х, у)иху + С(х, у)иуу + Р2 (х, у, и, их, иу ) = 0, где А, В, С - достаточно гладкие функции переменных х и у .
Вид: |РББ 1028(ИТ)|, |РББ 1029(РТ)|,|РББ1030(БТ)|
|РББ1031| «Линейное относительно старших производных РББ второго порядка с переменными коэффициентами у старших производных, правой частью и двумя независимыми переменными» Ц8 = /1( х, у) Ц8 = А(X, у)ихх + 2B(X, у)иху + С(X у)иуу + Р2 (X, У, и их , иу ) = У1 (X, у) , где А, В, С, /1 - достаточно гладкие функции переменных X и у .
Вид: |РВБ1032(ИТ)|,|РББ1033(РТ)|,|РББ1034(БТ)|
Наименования рассматриваемых PDE второго порядка по возможности должны обозначать структуру уравнений и/или указывать на их использование. Наименования PDE часто сопровождаются математическими записями «уравнение колебаний», например:
C2 u C2 u C2 u
p—— = div(p grad u) - qu + F(x, t) ; «уравнение колебаний струны», —2---т = 0 и др.
Ct Cx dy
Для данных именных PDE в любой информационной среде математическая запись обязательна.
2.2 Об указателе терминов и уравнений смешанного типа
В задаче поиска математических публикаций для ПрО уравнений смешанного типа, как части общего ресурса по уравнениям с частными производными, формируется указатель терминов и уравнений по тематике уравнений смешанного типа. Используется термин «указатель» (index в английской терминологии).
Предлагается следующая структура и состав статьи «указатель»: терминологическое обозначение - дескриптор PDE, идентификатор PDE; термины - синонимы (Син); коды классификаторов (MSC и УДК); символьные обозначения (Форм, MSWord, Latex); литература (Лит); родовые дескрипторы (Род); видовые дескрипторы (Вид); ассоциативные дескрипторы (Асс); ключевые слова (КлС); см. также (См); историческая справка (Ист);
примечание: пояснения, ссылки, связи, дополнительная информация (Прим).
В качестве примера статьи указателя для PDE смешанного типа рассматривается именной термин-дескриптор «Трикоми уравнение» этой ПрО. Для этого примера используется более развернутый вариант идентификаторов, дополненный указаниями о типе смешанного уравнения и канонической форме, то есть следующие сокращения: PDE MXT - PDE смешанного типа, CF - каноническая форма(ы), первая - CF1, вторая - CF2.
В таблице 9 приведён вариант представления статьи указателя для дескриптора «Трико-ми уравнение», где указаны ссылки на синонимы, ассоциативные, видовые и родовые термины в виде их идентификаторов. Формулы для видовых терминов с указанием первоисточников имеют вид:
_ ( Г7 _ Л — Г) ( — V --1 — V -L- Э/
|PDE1031(CF2,HT,y<0)| [31]: (z?- zv) = 0, (E = x - 4<(-у)/2Л = x + 32(-y)/2, У < 0)
1 1/3/
|PDE1031(CF,ET,y>0)| [32]: ^ + z^ + ^zv= 0, (E = x,r = 3/2(-уУ\У > 0)
. я 2u C 2u 5 1
|PDE1031(CF,ET, z = Tjau, a = - k )| [32]: + + — u = 0, (z = r au, a = - k,
/6"L C£2 Cr 36 r /6
|PDE1031(CF,ET, z = rau,a = - )3)| [32]: + C-u- +1 — —Lu = 0, (z = rau,a = - k)
/3 CE, Cr r Cr 9r
Особенности разрабатываемого указателя: структура статьи указателя содержит разнообразную информацию о термине; позволяет реализовать три варианта входа: термин, формула, автор; использовать родо-видовые отношения для формирования семантической
структуры ПрО; выбирать коды классификаторов МБС и/или УДК; добавлять термин со ссылкой на первоисточник. Указанные свойства позволили представить термин с контекстом - ключевыми словами, авторами и др. Это расширяет поле поиска при информационном запросе. С другой стороны, наличие формул, как вспомогательной иллюстративной информации, так и в качестве «ключевых слов (символов)» в ТеХ-нотации, может служить уточнению запроса, уменьшению поискового шума, что, в итоге, приведёт к получению пертинент-ной информации для адресата. В качестве синонимов приведены русские и английские эквиваленты терминов и сочетание кодов классификаторов МБС и УДК, что необходимо при работе со статьями и при поиске в базах данных.
Таблица 9 - Статья указателя для дескриптора «Трикоми уравнение»
Позиции ста- Тип Значения позиций статьи указателя
тьи указателя данных
|РБЕ1031(МХТ)| Ru Трикоми уравнение
En Tricomi equation
Син1 Ru Уравнение Т
Син2 En Equation T
MSC 35M10 Equations of mixed type
УДК 517.956.6 Уравнения смешанного типа
Форм 1 MSWord д 2u д2u У-7 +-7 = 0 дх2 ду2
Форм2 LaTex $y\frac{\partialA2 u}{\partial xA2}+\frac{\partialA2 u}{\partial yA2}=0$
ФормЗ LaTex $y u {xx}+u {yy}=0$
Лит1 [1ru] Смирнов М. М. Уравнения смешанного типа. М., 1970. 296 с.
Лит2 [2ru] Трикоми Ф. Лекции по уравнениям в частных производных. Пер. с итал.
Д.А. Райкова с предисл. Б. М. Левитана М.: Изд-во иностр. лит., 1957. 443 с.
ЛитЗ [1en] Smirnov M.M. Equations of mixed type. American Translation of the Mathematical monografs. Vol. 51. Mathematical Soc., 31 Dec 1978. p: 232.
Лит4 [2en] Lupo D., Morawetz C.S., Payne K.R. On closed boundary value problems for equations of mixed elliptic-hyperbolic type // Communications on Pure and Applied Mathematics, 2007, 60 (9), 1319-1348
Род Ru |PDE1030(MXT)| Уравнения смешанного типа
Род En |PDE1030(MXT) | Equations of mixed type
Вид 1 |PDE1031(CF2,HT,y<0)
Вид 2 |PDE1031(CF,ET,y>0)|
Вид 3 |PDE1031(CF,ET, Z = rjau,a = - ^6)|
Вид 4 |PDE1031(CF,ET, Z = rau,a = -^ )|
КлС Трикоми задача, обобщение Трикоми задачи, Трикоми метод, задача Коши для
уравнения Трикоми, краевая задача для уравнения типа Чаплыгина, краевая
задача для уравнения смешанного типа
Асс Ru |PDE1037(MXT)| Геллерстедта задача
Асс En |PDE1037(MXT) | The Gellerstedt problem
См |PDE1039(MXT)| Газовой динамики уравнение смешанного типа
Ист Название термина по имени Трикоми Франческо Джакомо (Tricomi Francesco
Giacomo), появилось в [1ru] как ссылка на работу[2т]
Прим |PDE1036(MXT)| Геллерстедта решение задачи Трикоми для уравнения
Эти особенности позволяют перейти на язык онтологий для описания ПрО уравнения смешанного типа (ББ РБЕ МХТ), как части ПрО уравнения с частными производными (ББ РБЕ) и, соответственно, ПрО уравнений математической физики (ББ ЕОМРЬ). Отсюда:
ББ РБЕ МХТ с ББ РБЕ с ББ ЕМРЬ.
Переход к онтологии реализуется на базе ЫЬМйа [14], где для поддержки формул было
введено отдельное понятие Формула, которое позволяет хранить оригинальную строку формулы из источника, где она получена. Строка может быть в формате Content MathML, Presentation MathML, LATeX. На рисунке 4 приведён пример из этой системы для ПрО ОДУ [12].
Петровский И Лекции по теории обыкновенных дифференциальных уравнений. Изд. 6-е. Матвеев Н М Методы интегрирования обыкновенных дифференциальны» уравне-1Ь ний
Родовые связи ОДУ первого порядка линейное неоднородное [РЕ0025|
ОДУ первого порядка, разрешенное относительно производной [DE0005]
ОВщее решение Гобщий интеграл] ОДУ первого порядка линейного неоднородного [RDE0021] ОВщее решение ГоВщий интеграл] ОДУ первого порядка линейного однородного [RDE0022] ОДУ первого порядка с разделенными и разделяющимися переменными [DE0028]
Пусть функции ¡)(ж) и g(i) непрерывны в интервале а < х < Ь . Тогда через каждую точку только одна интегральная кривая этого уравнения, определенная при всех х на интервале
ООщее решение ( общий интеграл ) ОДУ первого порядка линейного неоднородного (см. (1) и (3}) есть сумма общего решения соответствующего однородного ОДУ (см. (2)) и частного решения неоднородного ОДУ (см. (3)) (см. Методы интегрирования обыкновенных дифференциальных уравнений. Учебное пособие. Изд. 5-е. дополн.Гс. 60-62], а также Курс высшей математики. Т.Н. Изд. 14^е. нсправл.(с. 20 20): Дифференциальные уравнения. Изд. 3-е. стереотип.(с. 66-66)). ОДУ (1} сохраняет свой вид, т. е. свойство линейности (см. Методы интегрирования обыкновенных дифференциальных уравнений. Учебное пособие. Изд. 5-е.
а) замене независимой переменной вида х — (¿), где — непрерывно дифференцируемая
б) линейной замене искомой функции ¡f(i) = cr(i) г + где z = z(x) — новая неизвестная функция, а (Л 8(х) — непрерывно дифференцируемые функции от г, а ill Ф 0.
Рисунок 4 -Фрагмент описания понятия «ОДУ первого порядка линейное неоднородное» в библиотеке LibMeta
Расширение онтологического представления перечисленных областей математики - это добавление статей в указателе (терминов со связями на основании структуры статьи указателя). Эффект семантических связей основан на использовании терминов из тезауруса математической ПрО, снабженных формулами, как основы для математического запроса.
На примере онтологического представления ПрО, внедрённого в информационно-поисковую цифровую среду, библиотеку ЫЬМйа показаны следующие возможности:
■ обогащение тезауруса адресата за счёт информации из указателя/словаря/тезауруса ПрО;
■ связи терминов и публикаций упрощают поиск публикации, способствуют учёту предыдущих исследований, т.е. цитированию в рамках ПрО;
■ использование терминов из тезауруса в качестве ключевых слов публикации для уточнения значимости исследований в рамках ПрО;
■ применение терминов тезауруса в поисковых запросах при составлении реферативного материала и пр.
Термины из тезауруса математической ПрО, снабжённые формулами, составляют основу для математического запроса. Терминологическое описание ПрО на основе словарей и тезаурусов выходит на первый план при решении проблемы уменьшения поискового шума и уточнения запроса с помощью включения в него формул.
Заключение
Создание словарей, тезаурусов, наборов ключевых слов, списков формул и идентификация связей понятий и терминов ПрО составляют элементы предварительной аналитико-синтетической обработки текстов, помещаемых в Интернете в информационно-поисковую среду. В статье дан краткий обзор тематических ресурсов. Единого стандарта в этой области нет, к тому же далеко не все разделы науки представлены полно. Предлагаемый в работе указатель ПрО «уравнения смешанного типа» служит частичному заполнению указанных пробелов.
Благодарности
Работа выполнена при частичной финансовой поддержке РФФИ, проекты № 17-07-00217-а, 18-00-00297-комфи.
Список источников
[1] Roget, P.M. Roget's thesaurus of English words and phrases / P.M. Roger. Taylor Anderson (Editor). — Create Space Independent Publishing Platform. 2017. — 660 р.
[2] May, K.O. Historiography: A Perspective for Computer Scientists / K.O. May // Invited address to International Research Conference on the History of Computing, June 10, 1976, Los Alamos.
[3] Paulson, L.C. Computational logic: Its origins and applications / L.C. Paulson // Proceedings of the Royal Society. 2018. Series. A 474. https://doi.org/10.1098/rspa.2017.0872.
[4] Клещёв, А.С. Теоретические основы оболочки для интерактивных систем верификации интуитивных математических доказательств / А.С. Клещёв, В.А. Тимченко // Онтология проектирования. - 2018. - Т. 8, №2(28). - С.219-239. - DOI: 10.18287/2223-9537-2018-8-2-219-239.
[5] Клещёв, А.С. Реализация оболочки и портала знаний по верификации математических доказательств на платформе IACPaaS / А.С. Клещёв, В.А. Тимченко // Онтология проектирования. - 2018. - Т. 8, №3(29). -С.427-448. - DOI: 10.18287/2223-9537-2018-8-3-428-448.
[6] Лукашевич, Н.В. Проектирование лингвистических онтологий для информационных систем в широких предметных областях / Н.В. Лукашевич, Б.В. Добров // Онтология проектирования. - 2015. - Т. 5. - №. 1 (15) - С.47-69.
[7] Загорулько, Г.Б. Разработка онтологии для Интернет-ресурса поддержки принятия решений в слабофор-мализованных областях / Г.Б. Загорулько // Онтология проектирования. - 2016. - Т. 6, №4(22). - С. 485-500. - DOI: 10.18287/2223-9537-2016-6-4-485-500.
[8] Boyack, K. W. Thesaurus-based methods for mapping contents of publication sets / K.W. Boyack // Scientomet-rics. 2017. 111: 1141. https://doi.org/10.1007/s11192-017-2304-3.
[9] Ion, P.D.F. The Global Digital Mathematics Library and the International Mathematical Knowledge Trust. / P.D.F. Ion, S.M. Watt // In: Geuvers H., England M., Hasan O., Rabe F., Teschke O. (eds). Intelligent Computer Mathematics. CICM 2017. Lecture Notes in Computer Science. 2017. Vol. 10383. Springer, Cham -https://link.springer.com/chapter/10.1007/978-3-319-62075-6_5.
[10] Mooers, C. Information retrieval viewed as temporal signaling // Proceedings of the International Congress of Mathematicians. — 1950. — V.1. — P.572-573.
[11] Ландэ, Д.В. Поиск знаний в Internet. Профессиональная работа / Д.В. Ландэ. — М: Издательский дом «Ви-льямс». 2005. — 272 с.
[12] Моисеев, Е.И. Тезаурус информационно-поисковый по предметной области: обыкновенные дифференциальные уравнения / Е.И. Моисеев, А.А. Муромский, Н.П. Тучкова. — М.: МАКС Пресс. 2005. - 116 с.
[13] Моисеев, Е.И. Интернет и математические знания: представление уравнений математической физики в информационно-поисковой среде / Е.И. Моисеев, А.А. Муромский, Н.П. Тучкова. — М.: МАКС Пресс. 2008. - 80 с.
[14] Серебряков, В.А. Информационная модель открытой персональной семантической библиотеки LibMeta / В.А. Серебряков, О.М. Атаева // Труды XVIII Всерос. научной конференции «Научный сервис в сети интернет». Новороссийск, 19 по 24 сентября 2016 г. ИПМ им. М.В. Келдыша РАН. - 2016. - С.304-313.
[15] Моисеев, Е.И. Онтология научного пространства или как найти гения / Е.И. Моисеев, А.А. Муромский, Н.П. Тучкова. // Онтология проектирования. — 2014. — №4 (14) . — c.18-33.
[16] Miller, B.R. Technical aspects of the digital library of mathematical functions / B.R. Miller, A. Youssef // Ann. Math. Artif. Intell. — 2003. — Vol. 38. — No. 1. — P.121-136.
[17] Kohlhase, M. Mathematical knowledge management: Transcending the one-brain barrier with theory graphs / M. Kohlhase//. European Mathematical Society (EMS) Newsletter, June 2014. - P.22—27.
[18] Захаренко, Е.Н. Новый словарь иностранных слов: свыше 25 000 слов и словосочетаний / Е.Н. Захаренко, Л.Н. Комарова, И.В. Нечаева. 3-е изд., испр. и доп. — М.: ООО ИФ «Азбуковник», 2008. — 1040 с.
[19] Булыко, А.Н. Большой словарь иностранных слов. — Издательство «ИДДК», 2007. - 704 с.
[20] Александрова, Н.В. История математических терминов, понятий, обозначений / Н.В. Александрова // Словарь - справочник. Издание третье, исправленное. - М.: Изд-во ЛКИ, — 2008. — 248 с.
[21] Princeton's WordNet. G.A. Miller, R. Beckwith, C.D. Fellbaum, D. Gross, K. Miller. 1990. WordNet: An online lexical database. Int. J. Lexicograph. 3, 4, - P.235-244. - https://wordnet.princeton.edu/.
[22] Кнут, Д.Э. Всё про TeX / Д.Э. Кнут. — М.: Издательский дом «Вильямс». 2003. — 560 с.
[23] Тихонов, А.Н. Уравнения математической физики: учеб. пособие / А.Н. Тихонов, А.А. Самарский. 6-е изд., испр. и доп. — М.: Изд-во МГУ, 1999. — 799 с.
[24] Misutka, J. System Description: EgoMath2 As a Tool for Mathematical Searching on Wikipedia.org./ J. Mis-utka, L. Galambos // In: Davenport J.H., Farmer W.M., Urban J., Rabe F. (eds) Intelligent Computer Mathematics. CICM 2011. Lecture Notes in Computer Science, Springer, Berlin, Heidelberg. — 2011. Vol. 6824.
— P. 307-309 https://doi.org/10.1007/978-3-642-22673-1_30.
[25] Brychkov, Yu.A. Handbook of Mellin Transforms. Chapman and Hall/CRC / Yu.A. Brychkov, O.I. Marichev, N.V. Savischenko. - Boca Raton - London - New York. — 2018. — 607 c.
[26] Тезаурус научно-технических наук / Под.ред. Ю.И. Шемакина. М.: Воениздат, — 1972. — 671 с.
[27] Глазунов, Н.М. Тезаурус по теории формальных и алгебраических групп и его реализация на ЕС ЭВМ: Препр. / Н.М. Глазунов, В.М. Дриянский, Т.Н. Комарова, Ю.А. Рыбалко //АН УССР. Ин-т кибернетики; 78-27. - К.: 1нститут шбернетики НАНУ. 1978. - 39 c.
[28] Барт, К. Русско-немецкий информационно-поисковый тезаурус по робототехнике / К. Барт, А.Т. Мице-вич, А.М. Петрина, Ш. Риглер, Е.В. Сукачева, В. Тош, З.Н. Хадзиламбру. - М.: ВИНИТИ. 1991. - 318 с.
[29] Polyanin, A.D. Handbook of Linear Partial Differential Equations for Engineers and Scientists / A.D. Polyanin, Chapman & Hall/CRC, 2002.
[30] Математическая энциклопедия. Гл. ред. И.М. Виноградов. Т.2. Д-Коо. - М.: Советская энциклопедия, 1979.
- 1104 с. https://dic.academic.ru/contents.nsf/enc_mathematics.
[31] Владимиров, В.С. Уравнения математической физики. 2-е изд., стереотип. Учебник для вузов./ В.С. Владимиров, В.В. Жаринов. — М.: ФИЗМАТЛИТ. 2004. — 400 с.
[32] Трикоми, Ф. Лекции по уравнениям в частных производных / Ф. Трикоми. Пер. с итал. — М.: КомКнига., 2007. — 443 с.
REPRESENTATION OF MATHEMATICAL CONCEPTS IN THE ONTOLOGY OF SCIENTIFIC KNOWLEDGE
1 2 A.A. Muromskiy , N.P. Tuchkova
Dorodnicyn Computing Centre FRC CSC of RAS, Moscow, Russia '[email protected], [email protected]
Abstract
Features of mathematical data domains in the context of creation of ontology of scientific data domains are considered. Examples from the developed thesaurus on the equations of the mixed type from the section of the equations with partial equations of mathematical physics are given. Special attention is paid to questions of representation and relevant support of the thesaurus of the addressee. It is offered to use specialized thesauruses where along with definitions in a natural language there are character expressions. This approach allows to specify a request, using mathematical entry in the TeX-notation irrespective of original language that leads to reduction of search noise and reduction of search time. The issue of why there is still insufficient amount of mathematical thesauruses created and their necessity for digital libraries along with other information resources is discussed. The example of creation of a thesaurus for separate mathematical data domain is given. The special difficulty consists in the description of the taxonomy (genus and species relations) in mathematical subject domains, one of the possible versions of the description of these communications for the equation of the mixed type is proposed.
Key words: search query, comparison of mathematical texts, semantic search, thesaurus of mathematical notations, TeX-notations.
Citation: Muromskiy AA, Tuchkova NP. Representation of mathematical concepts in the ontology of scientific knowledge [In Russian]. Ontology of designing. 2019. 9(1): 50-69. - DOI: 10.18287/2223-9537-2019-9-1-50-69.
Acknowledgment
The work was partially supported by the Russian Foundation for Basic Research, projects No. 17-07-00217-a, 18-00-00297-comfi.
References
[1] Roget PM. Roget's thesaurus of English words and phrases. Taylor Anderson (Editor). — CreateSpace Independent Publishing Platform. 2017. — 660 p.
[2] May KO. Historiography: A Perspective for Computer Scientists. Invited address to International Research Conference on the History of Computing, June 10, 1976, Los Alamos.
[3] Paulson LC. Computational logic: Its origins and applications // Proceedings of the Royal Society. 2018. Series. A 474. - https://doi.org/10.1098/rspa.2017.0872.
[4] Kleschev AS, Timchenko VA. Theoretical foundations of the shell for interactive systems of intuitive mathematical proofs verification [In Russian]. Ontology of designing. 2018; 8(2): 219-239. DOI: 10.18287/2223-9537-20188-2-219-239..
[5] Kleschev AS, Timchenko VA. Implementation of the shell and knowledge portal for mathematical proofs verification on the IACPaaS platform [In Russian]. Ontology of designing. 2018; 8(3): 427-448. - DOI: 10.18287/22239537-2018-8-3-427-448..
[6] Lukashevich NV, Dobrov BV. Developing linguistic ontologies in broad domains [In Russian]. Ontology of designing. - 2015; 5(1): 47-69.
[7] Zagorulko GB. Development of ontology for intelligent scientific internet resource decision-making support in weakly formalized domains [In Russian]. Ontology of designing. 2016; 6(4): 485-500. DOI: 10.18287/2223-95372016-6-4-485-500.
[8] Boyack, K.W. Thesaurus-based methods for mapping contents of publication sets // Scientometrics. 2017. 111: 1141. - https://doi.org/10.1007/s11192-017-2304-3.
[9] Ion PDF, Watt SM. The Global Digital Mathematics Library and the International Mathematical Knowledge Trust. // In: Geuvers H., England M., Hasan O., Rabe F., Teschke O. (eds). Intelligent Computer Mathematics. CICM 2017. Lecture Notes in Computer Science. 2017. Vol. 10383. Springer, Cham -https://link.springer.com/chapter/10.1007/978-3-319-62075-6_5.
[10] Mooers C. Information retrieval viewed as temporal signaling // Proceedings of the International Congress of Mathematicians. — 1950; 1: 572-573.
[11] LandjeDV. Search for knowledge on the Internet. Professional work [In Russian]. Poisk znanij v Internet. Profes-sional'naja rabota. — M: Publishing house "Williams" [Izdatel'skij dom «Vil'jams»]. 2005. — 272 p.
[12] Moiseev EI, Muromskij AA, Tuchkova NP. Thesaurus information retrieval in the subject area: ordinary differential equations [In Russian]. Tezaurus informacionno-poiskovyj po predmetnoj oblasti: obyknovennye differen-cial'nye uravnenija. — M.: MAKS Press. 2005. - 116 p.
[13] Moiseev EI, Muromskij AA, Tuchkova NP. Internet and mathematical knowledge: representation of equations of mathematical physics in the information retrieval environment [In Russian]. — M.: MAKS Press. 2008. - 80 p.
[14] Serebrjakov VA, Ataeva OM. Information model of the open personal semantic library LibMeta [In Russian]. In-formacionnaja model' otkrytoj personal'noj semanticheskoj bib-lioteki LibMeta // Proceedings of the XVIII All-Russia. scientific conference "Scientific service on the Internet." Novorossiysk, September 19 to September 24, 2016. Institute of PM named after M.V. Keldysh RAS. - 2016. - P.304-313.
[15] Moiseev EI, Muromskij AA, Tuchkova NP. Ontology of scientific space or how to find the genius [In Russian]. Ontology of designing. — 2014; 4(14): 18-33.
[16] Miller BR, Youssef A. Technical aspects of the digital library of mathematical functions / Ann. Math. Artif. Intell. — 2003; 38(1): 121-136.
[17] Kohlhase M. Mathematical knowledge management: Transcending the one-brain barrier with theory graphs / European Mathematical Society (EMS) Newsletter, June 2014. - P.22—27.
[18] Zaharenko EN, Komarova LN, Nechaeva IV. [Novyj slovar' inostrannyh slov: svyshe 25 000 slov i slovoso-chetanij. 3-e izd., ispr. i dop.] New dictionary of foreign words: over 25,000 words and phrases [In Russian]. — M.: «Azbukovnik», 2008. — 1040 p.
[19] Bulyko AN. Bol'shoj slovar' inostrannyh slov. — Izdatel'stvo «IDDK», 2007. - 704 p.
[20] Aleksandrova NV. History of mathematical terms, concepts, designations [In Russian]. Istorija matematicheskih terminov, ponjatij, oboznachenij. Slovar' - spravochnik. Iz-danie tret'e, ispravlennoe. M.: Izd-vo LKI, — 2008. — 248 p.
[21] Princeton's WordNet. G.A. Miller, R. Beckwith, C.D. Fellbaum, D. Gross, K. Miller. 1990. WordNet: An online lexical database. Int. J. Lexicograph. 3, 4. - P.235-244. - https://wordnet.princeton.edu/.
[22] KnutD.EH. Vsyo pro TeX [In Russian]. — M.: Izdatel'skij dom «Vil'yams». 2003. — 560 p.
[23] Tihonov AN, Samarskij AA. Equations of mathematical physics [In Russian]. Uravneniya matematicheskoj fiziki — M.: Izd-vo MGU, l999. — 799 p.
[24] Misutka J, Galambos L. System Description: EgoMath2 As a Tool for Mathematical Searching on Wikipe-dia.org. In: Davenport J.H., Farmer W.M., Urban J., Rabe F. (eds) Intelligent Computer Mathematics. CICM 2011. Lecture Notes in Computer Science, Springer, Berlin, Heidelberg. — 2011. Vol. 6824. — P. 307-309 https://doi.org/10.1007/978-3-642-22673-1_30.
[25] Brychkov YuA, Marichev OI, Savischenko NV. Handbook of Mellin Transforms. Chapman and Hall/CRC . - Boca Raton - London - New York. — 2018. — 607 p.
[26] Tezaurus nauchno-tekhnicheskih nauk / Pod.red. YU.I. SHemakina. M.: Voenizdat. — 1972. — 671 p.
[27] Glazunov NM, Driyanskij VM, Komarova TN, Rybalko YUA. [Tezaurus po teorii formal'nyh i algebraicheskih grupp i ego realizaciya na ES EHVM] Thesaurus on the theory of formal and algebraic groups and its implementation on a computer [In Russian]. - Kiev: Institut kibernetiki NANU.1978. - 39 p.
[28] Bart K, Micevich AT, Petrina AM, Rigler SH, Sukacheva EV, Tosh V, Hadzilambru ZN. Russko-nemeckij in-formacionno-poiskovyj tezaurus po robototekhnike [In Russian]. - M.: VINITI. 1991. - 318 p.
[29] Polyanin AD. Handbook of Linear Partial Differential Equations for Engineers and Scientists , Chapman & Hall/CRC, 2002.
[30] Mathematical encyclopedia [In Russian]. Matematicheskaja jenciklopedija / Ed. I.M. Vinogradov. V.2. D-Koo. M.: Soviet Encyclopedia, 1979. - 1104 p. https://dic.academic.ru/contents.nsf/enc_mathematics.
[31] Vladimirov VS, ZHarinov VV. Uravneniya matematicheskoj fiziki. 2-e izd., stereotip. Uchebnik dlya vuzov. — M.: FIZMATLIT. 2004. — 400 c.
[32] Trikomi F. Lectures on partial differential equations [In Russain]. Lekcii po uravnenijam v chastnyh proizvodnyh. Per. s ital. - M.: Komkniga, 2007. — 443 p.
Сведения об авторах
Муромский Александр Александрович1, 1926 г. рождения, с.н.с., Вычислительный центр Федерального исследовательского центра «Информатика и управление» РАН (ФИЦ ИУ РАН), к.ф.-.м.н., окончил механико-математический факультет МГУ им. М.В.Ломоносова и университет им. Н.Э. Баумана, долгие годы работал в ВИНИТИ. Специалист в области математического анализа и информационных технологий. Автор более 50 работ в области функционального анализа и информационных технологий.
Alexander Alexandrovich Muromskiy1 (b. 1926) senior researcher of CCAS (Federal Research Centre of Computer Science and Control RAS), PhD, graduated from mechanics and mathematics faculty of Lomonosov MSU and the university of N.E. Bauman, for many years worked in VINITI. He is a specialist in the field of the mathematical analysis and information technologies. He has published over 50 papers in the field of functional analysis and information technology. Тучкова Наталия Павловна, 1955 г. рождения, с.н.с., Вычислительный центр Федерального исследовательского центра «Информатика и управление» РАН (ФИЦ ИУ РАН), к.ф.-.м.н., окончила факультет вычислительной математики и кибернетики МГУ им. М.В.Ломоносова. Специалист в области алгоритмических языков и информационных технологий. Автор более 40 работ в области вычислительной математики и информационных технологий.
Natalia Pavlovna Tuchkova (b. 1955) senior researcher of CCAS (Federal Research Centre of Computer Science and Control RAS), PhD, graduated from CS faculty of Lomonosov MSU. She is a specialist in the field of programming languages and information technologies. She published more than 40 papers in the field of computational mathematics and information technology.
1 Это статья, поступившая в редакцию в конце 2018, стала последней работой А.А. Муромского, который скоропостижно скончался в феврале 2019 года.