Научная статья на тему 'Адаптивные аппроксимации и итеративные процессы'

Адаптивные аппроксимации и итеративные процессы Текст научной статьи по специальности «Математика»

CC BY
421
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АППРОКСИМАЦИЯ / АДАПТАЦИЯ / ИТЕРАЦИОННАЯ ФОРМУЛА / НЕВЯЗКА / APPROXIMATION / ADAPTATION / ITERATIVE FORMULA / DISCREPANCY

Аннотация научной статьи по математике, автор научной работы — Теслер Г. С.

В статье рассмотрены адаптивные аппроксимации и итеративные процессы с точки зрения понимания процессов и явлений, происходящих в природе. Особое внимание уделено адаптивным аппроксимациям, основанным на разложении функций по невязкам и являющихся источником получения базовых итерационных функций с произвольным порядком сходимости. Показано, что использование невязки в виде неявной функции позволяет естественным образом обобщать известные методы аппроксимации функций либо получать принципиально новые итерационные методы с различными нормами погрешностей и адаптивные к внутренним и внешним условиям применения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

In the paper the adaptive approximation and iterative processes from the point of view of understanding nature processes and phenomena are discussed. Particular attention is given to adaptive approximations, based on expansion of the function on discrepancy and be the source of receiving base iterative functions with arbitrary order of convergence. It is shown, that using discrepancy as implicity function allows to unite in natural way the known methods of approximation of functions, or receive principaly new iterative methods with different rates of mistakes and adapted to internal and internal and exteznal conditions of usig.

Текст научной работы на тему «Адаптивные аппроксимации и итеративные процессы»

УДК 518.5 Г.С. ТЕСЛЕР

АДАПТИВНЫЕ АППРОКСИМАЦИИ И ИТЕРАТИВНЫЕ ПРОЦЕССЫ

Abstract: In the paper the adaptive approximation and iterative processes from the point of view of understanding nature processes and phenomena are discussed. Particular attention is given to adaptive approximations, based on expansion of the function on discrepancy and be the source of receiving base iterative functions with arbitrary order of convergence. It is shown, that using discrepancy as implicity function allows to unite in natural way the known methods of approximation of functions, or receive principaly new iterative methods with different rates of mistakes and adapted to internal and internal and exteznal conditions of usig.

Key words: approximation, adaptation, iterative formula, discrepancy.

Анотація: У статті розглянуто адаптивні апроксимації та ітеративні процеси з точки зору розуміння процесів і явищ, що виникають у природі. Особливу увагу приділено адаптивним апроксимаціям, заснованим на розкладанні функцій по нев'язках і які є джерелом отримання базових ітераційних функцій з довільним порядком збіжності. Показано, що використання нев'язки у вигляді неявної функції дозволяє природним чином узагальнювати відомі методи апроксимації функцій або отримувати принципово нові ітераційні методи з різними нормами погрішностей і адаптивні до внутрішніх і зовнішніх умов застосування.

Ключові слова: апроксимація, адаптація, ітераційна формула, нев’язка.

Аннотация: В статье рассмотрены адаптивные аппроксимации и итеративные процессы с точки зрения понимания процессов и явлений, происходящих в природе. Особое внимание уделено адаптивным аппроксимациям, основанным на разложении функций по невязкам и являющихся источником получения базовых итерационных функций с произвольным порядком сходимости. Показано, что использование невязки в виде неявной функции позволяет естественным образом обобщать известные методы аппроксимации функций либо получать принципиально новые итерационные методы с различными нормами погрешностей и адаптивные к внутренним и внешним условиям применения.

Ключевые слова: аппроксимация, адаптация, итерационная формула, невязка.

1. Постановка проблемы

Роль математики в понимании процессов и явлений, происходящих в природе, гораздо больше, чем это кажется на первый взгляд. Речь идет не о математических моделях, описывающих их, хотя и они чрезвычайно важны. Речь идет о математике как абстрактной науке, которая в ряде случаев отражает глубинные закономерности, помогающие понимать происходящие в природе и в нашем сознании процессы. И это не удивительно, так как математика в своем глубинном содержании абстрагируется от качеств и особенностей объектов, которые были в ее первооснове, и совершенно отделяющих ее от первоначального содержания, но сохраняя рациональную взаимосвязь этих объектов. Именно абстрагирование и взаимосвязь представляют особый интерес в познании происходящих в природе процессов.

Благодаря абстрагированию от первоначальных явлений и предметов, появляется общность математических понятий, что позволяет ее использовать при описании различных по природе явлений (физических, биологических, технических и других процессов).

На эти особенности математики обратили внимание многие мыслители.

Так, Энгельс в работе [1] писал: «... люди стоят перед противоречием: с одной стороны, перед ними задача - познать исчерпывающим образом систему мира в ее всеобщей связи, а с другой стороны, их собственная природа, как и природа мировой системы, не позволяет им когда-либо полностью разрешить эту задачу. Но это противоречие лежит в природе обоих факторов, мира и людей, оно является также главным рычагом всего умственного прогресса и разрешается

каждодневно и постоянно в бесконечном прогрессивном развитии человечества - совершенно так, как, например, известные математические задачи находят свое решение в бесконечном ряде или непрерывной дроби». Отметим, что последние являются предметом изучения теории аппроксимации, где происходит замена одних математических объектов другими, так называемыми приближениями.

Неверное понимание этих глубинных связей дало основание математику и философу, Нобелевскому лауреату Б. Расселу, утверждать, что вся природа пронизана идеями аппроксимации.

В заключение этого рассуждения отметим, что само название математики в переводе с греческого идет от слов - знание, наука. Именно учитывая вышесказанное, автор счел возможным включить в новую кибернетику раздел, посвященный адаптивной аппроксимации функций с различными элементами адаптации, видами обратных связей, нормами погрешности и т.д.

На предыдущем этапе развития кибернетики академик В.М. Глушков в работе [2] выступил идеологом нового понимания кибернетики, определив основное направление ее развития как математизацию вычислительной техники и ее приложений. На нынешнем этапе развития кибернетики - создание основ новой кибернетики - эта связь выглядит более глубокой и прежде всего связана с механизмами адаптации и обратными связями, развившимися внутри самой математики.

Мы привыкли, что положительные и отрицательные связи присущи живой материи и техническим средствам, в которых присутствуют системы автоматического регулирования.

Однако это не совсем так. Ряд алгоритмов также обладают этим свойством. К алгоритмам с отрицательной обратной связью относятся, прежде всего, итерационные алгоритмы, которые обладают тем свойством, что допущенные на каком-то шаге итерации неточности (возмущения) в пределах некоторой величины, не выводящей алгоритм из области сходимости, могут быть скомпенсированы на последующих шагах итерационного процесса. Упомянутые выше неточности (возмущения) могут иметь различный характер - сбои в работе, погрешность округления и т.д. Наиболее наглядно действие адаптивных алгоритмов, основанных на разложении величины невязки, показывает, что работает обратная связь. Благодаря использованию невязки, класс алгоритмов с обратной связью расширяется, так как к классу итерационных процессов добавляется просто разложение функции по невязкам. Другим примером использования обратной связи в решающих устройствах непрерывного действия, например, решения трансцедентного уравнения,

которое обычно приводится к виду /(х)= 0 , хотя более целесообразно рассмотрение уравнения

= Р(х,у ) = 0 при условии, что /(х)= 11т Р(х,у;.), где - невязка уравнения. При этом

®0

величина обратной связи имеет не только величину, но и знак.

Итерационные формулы и рекуррентные соотношения интересны для изучения не только из-за того, что они в своей сути отражают обратные связи, а в ряде случаев и адаптацию к условиям применения, но также потому, что они обладают динамизмом, который во многих случаях присущ объектам живой, а в некоторых случаях искусственной и неживой природы, а также многими физическими явлениями и процессами.

В этой связи особый интерес для понимания процессов, происходящих в живой, неживой и искусственной природе, представляет математика - наука о количественных отношениях и пространственных формах действительного мира. При этом в связи с запросами техники и естествознания определение математики наполняется все более богатым содержанием. Для нас математика представляет особый интерес в связи с возможностью абстрагироваться от реальных процессов.

С точки зрения новой кибернетики представляют особый интерес процессы адаптации, которые используются в математике, а также процессы обобщения, позволяющие порождать конкретные, наиболее эффективные алгоритмы для данного применения.

В этой связи в качестве предмета изучения рассмотрим адаптивные аппроксимации функций, которые наиболее наглядно показывают параллели математики и общих процессов, происходящих в различных естественных процессах.

При этом будем рассматривать методы адаптации к погрешностям округления (динамические - за счет использования итерационных формул, статические - за счет использования рекуррентных формул), к погрешностям метода - за счет тех же итерационных процессов.

Помимо этого, будем рассматривать также адаптивные методы, адаптивные к временной сложности, - это снова итерационные методы, т.е. методы с обратной связью, которые содержат адаптивный элемент невязку и начальное приближение. Кроме того, рассмотренное ниже разложение функций по невязкам позволяет ускорить сходимость известных разложений в ряд Тейлора, цепную дробь, дробно-рациональные приближения, включая аппроксимацию Паде, разложение по ортогональным многочленам и т.д., благодаря наличию адаптивного элемента невязки и возможности использования начальных приближений.

Особое место в ускорении вычислений занимают методы декомпозиции исходного интервала - методы сегментной аппроксимации и итерационные методы «цифра за цифрой». При этом необходимо отметить, что итерационные методы “цифра за цифрой” отличаются от обычных итерационных методов тем, что обратные связи позволяют уточнять искомый результат не на уровне чисел, а на уровне разрядов числа. Как и для обычных итерационных методов, для этих методов также представилось возможным ввести невязку, что привело к получению нового класса алгоритмов - адаптивные асинхронные итеративные методы “цифра за цифрой”. Рассмотренные классы методов интересны также тем, что позволяют рассматривать различные нормы погрешностей (абсолютные, относительные, среднеквадратичные, специальные, основанные на невязках и т.д.), а также получение соответствующих приближений - наилучших в точке, на интервале и т.д.

Важной особенностью отмеченных выше классов итерационных формул и рекуррентных отношений является возможность осуществлять счет как с фиксированной, так и переменной либо произвольной точностью.

Общеизвестны роль и значение обратных связей (отрицательной и положительной) в живой природе и технике. Их действие приводит либо к стабилизации и устойчивости процессов,

улучшению их качества, либо к их нестабильности и даже уничтожению, либо к генерированию новых возможностей, возникновению мутаций и т.д.

Вопросы обратных связей в технике первоначально изучались в теории автоматического управления, а затем в этот процесс включилась наука кибернетика, расширив перечень изучаемых систем. Кроме технических, включила также биологические, экономические и социальные. Но этот процесс расширения может быть продолжен также на процессы и явления неживой природы и Вселенной. Примеры таких процессов и явлений можно найти практически во всех областях науки. При этом важно осознавать, что отрицательная связь направлена на стабилизацию отклонений системы, а положительная - наоборот.

Отрицательная обратная связь направлена на поддержание постоянных значений основных параметров, невзирая на действие внешних и внутренних возмущений. В этом смысле можно говорить, что системы с обратными связями в некотором смысле являются адаптивными по отношению к возмущающим воздействиям.

В этом смысле, перефразируя приведенное выше высказывание Нобелевского лауреата Б. Рассела о роли аппроксимации, можно утверждать, что окружающая нас живая, неживая и искусственная природа, а также Вселенная, пронизана идеей адаптации. В этой связи не кажется случайным привлечение, помимо реальных систем, также и математических. Вполне понятно, что среди математических систем особо важным является исследование роли обратных связей на системах вычислительной математики, где существует вычислительный процесс, который можно наглядно увидеть и исследовать. Благо, для этого в настоящее время имеется такой инструмент, как компьютер.

Как уже отмечалось выше, среди объектов, которые в состоянии наглядно продемонстрировать сущность обратных связей в вычислительной математике, выбраны адаптивные аппроксимации функции, которые естественным образом включают в свой состав итеративные процессы и рекуррентные отношения, методы интерполирования, сплайн аппроксимацию и др. Такой выбор ни в коем случае не сужает общего взгляда на роль обратных связей в вычислительной математике. Это связано с тем, что многие подходы, существующие в аппроксимации функций, присущи и методам линейной алгебры, решению дифференциальных и интегральных уравнений и другим областям вычислительной математики. Об этой общности свидетельствует появление такой науки, как функциональный анализ, который обобщил многие понятия, существующие в вышеперечисленных областях вычислительной математики. Помимо этого, в спектр методов аппроксимации функций входят также методы решения дифференциальных и интегральных уравнений и множество других методов.

Наиболее наглядно обратные связи и адаптация видны при рассмотрении итерационных

формул.

В начале становления математики появилась итерационная формула, предложенная Героном, для извлечения квадратного корня и носящая его имя. С появлением дифференциального счисления появился итерационный метод решения нелинейных уравнений, носящий имя Ньютона, а с появлением функционального анализа и производной Фреше появился обобщенный итерационный метод, носящий название Ньютона-Канторовича. Развитие

итерационных методов шло в нескольких направлениях. Одно из них было направлено на получение итерационных формул более высоких порядков, а другое - на улучшение качества и области применения.

Так, в работе [3] Эйлера рассматривался метод вычисления корней многочлена на основе разложения в ряд Тейлора самого многочлена. В 1838 г. при переходе с первого курса Московского университета на второй П.Л. Чебышев написал работу [4] о получении итерационных формул высокого порядка. С этим методом можно также ознакомиться в работе [14]. Подобный метод предложил Е. Шредер в работе [5]. Дальнейшее развитие получение итерационных методов нашло в работах Ш.Е. Микеладзе [6], Дж. Трауба [7], Г.С. Теслера [8 - 11] и других авторов.

Качественные улучшения итерационных методов связаны с применением многочленов наилучшего приближения для улучшения сходимости итеративных процессов [11], с чебышевским набором параметров и использованием ортогональных разложений [11, 12], согласованием по норме погрешности начального приближения и итерационной формулы [11, 13, 14] и т.д. При решении систем линейных, нелинейных, дифференциальных и интегральных уравнений нашли широкое распространение явный и неявный Чебышева итерационные методы, методы вариационного типа (минимальных невязок, минимальных поправок, минимальных погрешностей, сопряженных градиентов, Т - метод Ланцоша [15], аппроксимационный метод Дзядыка [16]) и др.

О роли аппроксимации в кибернетическом моделировании отмечается в работе [24]: “...требование одновременной адекватности или близкости модели к действительности в кибернетике все более уступает принципу аппроксимаций. Эта гносеологическая тенденция была подмечена впервые И.Б. Новиком, который дал анализ принципа аппроксимаций, показал его методологическое значение. Принцип аппроксимаций применительно к кибернетическим структурам, по-видимому, означает также и то, что эти структуры (принципы, понятия, модели) образуют некоторую предпосылку для эвристического прогнозирования процесса решения той или иной задачи на ЭВМ”.

В этой связи рассматриваемые в данной книге адаптивные аппроксимации, основанные на разложении функции по невязкам, представляют двоякий интерес и как разнообразные аппроксимации функций с элементом адаптации (невязки), и как источник получения итерационных формул, то есть формул с обратными связями и формул для табулирования функций, сегментной аппроксимации функций, интерполирования функций и т.д. Таким образом, представлены различные подходы приближения к искомому результату с необходимой точностью с использованием различного количества и состава арифметических операций и видов начальных приближений, величины интервала задания аргумента и норм погрешностей.

Такой подход хорошо согласуется с определением кибернетики, данным в работе [24]: “Кибернетика - это прежде всего наука об общем подходе к математическому (в самом широком смысле этого слова) исследованию процессов управления, обработки информации, механизма и роли обратных связей в различных по физической природе самоуправляющихся системах (животных, технике и обществе). Не трудно заметить, что в таком определении указывается как предметный, так и методологический аспекты этой науки.” Конечно, роль математики в этом

определении преувеличена, но основное содержание науки кибернетики отражено достаточно точно. Именно поэтому и важен рассматриваемый далее материал.

2. Теоретические основы итеративных процессов

Начнем изложение проблем, связанных с итеративными процессами, с точки зрения абстрактных пространств и операторов. Такой подход позволит взглянуть на итерационные процессы, используемые для различных применений, с единых позиций.

Многие важные классы уравнений, к которым применимы итерационные методы, связаны с методами последовательных приближений, являющимися частными случаями общего

операторного уравнения вида

X = Тх , (1)

где Т - оператор, действующий в некотором функциональном нормированном

пространстве Е , поэтому в общей теории итеративных процессов исследуют именно операторное уравнение (1).

Суть применения итеративного метода к операторному уравнению (1) состоит в рассмотрении итерационной формулы:

Хп = ТХп-1, П = . (2)

Итеративный процесс начинается, исходя из некоторого начального приближения х0 е Е.

Последовательные приближения х1з х2,..., хп,... находятся на основе формулы (2).

При этом важное значение для существования уравнения (1) имеет теорема С. Банаха [17], установленная им в 1922 г. и получившая в дальнейшем название принципа сжатых отображений Банаха.

Теорема. Пусть пространство Е - полное линейное метрическое пространство, а оператор Т -оператор сжатия в этом пространстве, т.е. такой, что для любых элементов и,Vе Е выполняется условие

р(Ти Т )<ар(и, V ), (3)

где а < 1, d(и, V) - расстояние между элементами и и V.

Тогда уравнение (1) имеет единственное решение х* е Е, и последовательность {хп}, определяемая формулой (2), сходится к этому решению. При этом для погрешности п-го приближения справедлива оценка

Р(х *, хп )<!-- хР), 0 < р < п -1. (4)

1 а

В случаях, когда условия применимости принципа сжатых отображений (в частности, когда условие (3) не выполняется), часто применяют принцип Ж. Шаудера [18 - 20] о неподвижной точке, сущность которого заключается в том, что если Т - непрерывное отображение выпуклого множества Я банахова пространства в его компактную часть, то для Т существует, по крайней мере, одна неподвижная точка в Я , т.е. уравнение (1) имеет в Я , по крайней мере, одно решение.

Как видно из принципов сжатых отображений и о неподвижной точке, смысл того, что

отображение Т является сжимающим, означает, что расстояние между точками х1 и х;+1 больше, чем расстояние между их изображениями Т(х;.) и Т(х;+1), а решение (корень) уравнения (1) является неподвижной точкой отображения Т , и он преобразуется сам в себя, т.е.

Поэтому каждый шаг в итерационном процессе (2), уменьшая расстояние, тем самым должен приближать члены последовательности {хп} к неподвижной точке х* .

Для нас важно отметить тот факт, что на основании принципа сжатых отображений происходит сужение исходного интервала. Это присуще практически всем итерационным методам и не только им. Так, этим свойством обладает метод отыскания решения уравнения путем деления отрезков пополам (пристрелки) либо в отношении «золотого сечения». В результате такого деления интервалы сужаются до той величины, с которой необходимо иметь решение. Однако такого типа алгоритмы не всегда эффективны как по области применения, так и по скорости сходимости, числу необходимых действий (количеству выполненной работы) и получаемой точности.

Для лучшего понимания дальнейшего изложения напомним, что термин «итерация» происходит от латинского 11ега1о - повторение и означает в нашем случае результат повторного применения совокупности математических операций. При этом результат п - кратного применения

- п -я итерация, а процесс перехода от одной итерации к следующей называется итерированием. В свою очередь, термин «рекуррентная формула» (отношение) происходит от латинского геоиггепэ

- возвращающийся, означает формулу (соотношение), позволяющую выразить любой член рекуррентной последовательности через значения одного или нескольких предыдущих членов. При наличии рекуррентной формулы рекуррентная последовательность полностью определяется выбором ее начального члена. Аналогично определяется возвратная рекуррентная последовательность, но она определяется выбором не начального, а последнего члена последовательности. Порядок р итерационной формулы, следуя [7], определяется как отношение

(5)

(6)

где С - константа асимптотики погрешности;

(Р(х)=ф1, х1 х;_„ ) - итерационная функция (ИФ) итерационного уравнения

-х+1 =Р(х);

X* - предел последовательности {х.} при I .

Если существуют вещественное р и ненулевая константа С , удовлетворяющая (6), то ИФ

приписывается порядок р независимо от того, сходится последовательность {х.} или нет.

Скорость сходимости ИФ зависит не только от величины порядка сходимости, но и от величины константы асимптотики. Чем меньше эта величина, тем больше скорость сходимости.

Отметим, что для одноточечных ИФ без памяти порядок р будет целым, а с памятью -вещественным [7].

Обозначим объем информационного запроса символом й , который определяет количество элементов новой информации, используемой в каждой итерации (функция и ее производные).

Меру эффективности в работе [7] определяют как эффективность использования информации

Е¥¥ = р / й, (7)

т.е. частное от деления порядка на объем информационного запроса, а в работе [21] индекс эффективности определяется как

Е¥¥ * = р1 й.

Так как ИФ Ньютона, где р = 2, й = 2, Е¥¥ = 1, Е¥¥* = л/2, а для метода секущих

р = (1 + Л/5 )/2 »1,62, й = 1, Е¥¥ = Е¥¥ *=(1 + л/5 )/2.

Дж. Трауб называет оптимальными такие одноточечные ИФ, для которых Е¥¥ = 1. В работе [7] показано, что в общем случае для одноточечной ИФ Е¥¥ < 1.

Базовой последовательностью ИФ называется бесконечная последовательность ИФ

{рр }^=1, где р -й член имеет порядок р .

Оптимальной базовой последовательностью называется базовая последовательность, все члены которой оптимальны в вышеприведенном смысле. Говорят, что последовательность {х.}

*

итеративного процесса сходится к точному решению х , если при неограниченном возрастании

„ * 1 • * числа итераций существует и равен х , т.е. Птх1 = х .

Рассмотрим вопрос корректности задачи. В нашем случае в качестве задачи можно

рассматривать ИФ. Большинство задач, которые необходимо решать, можно записать в виде

где х - некоторая известная величина; у - искомая величина;

А(х) - заданная функция (оператор).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

При этом х и у могут быть числами, массивами чисел, функциями одной или многих переменных и др. матрицами.

Задача у = А(х) называется корректно поставленной, если для любых входных данных из некоторого класса решение у существует, единственно и устойчиво по входным данным.

Однако на практике даже не всякую устойчивую задачу легко решать. Так, если

||^у|| < С||^х|| и величина С весьма велика, то задача формально является устойчивой, но

фактически неустранимая погрешность может быть сколь угодно большой. Этот случай называют слабой устойчивостью или плохой обусловленностью.

Устойчивость вычислений состоит в том, что малые погрешности в исходных величинах (начальных данных, коэффициентах уравнений их правых частей и т.д.) приводят к малым погрешностям. В соответствии с видом исходной величины говорят об устойчивости по начальным данным, коэффициентам правых частей, погрешности и т.д. Отсутствие устойчивости (неустойчивость) означает, что даже незначительные отклонения в исходных величинах приводят к большим погрешностям в решении или вовсе неверному результату.

Как видим, качественно понятие устойчивости и неустойчивости в технических, биологических, экономических и социальных системах весьма близко к вышеприведенным понятиям в вычислительной математике.

3. Разложение функций по невязкам как основа получения адаптивных аппроксимаций и итерационных функций

Выше мы рассматривали итерационные процессы независимо от класса решаемых задач. В настоящем разделе мы будем рассматривать итерационные процессы для класса элементарных и некоторых специальных функций. Это связано с несколькими причинами.

Во-первых, для элементарных и специальных функций разработано и исследовано наибольшее число разнообразных итерационных функций и рекуррентных соотношений.

Во-вторых, эти итерационные функции и рекуррентные соотношения имеют разнообразные порядки сходимости, адаптацию к системам счисления и другим особенностям вычислительного процесса.

В-третьих, элементарные и некоторые специальные функции являются решениями алгебраических, дифференциальных и интегральных уравнений.

В-четвертых, элементарные и некоторые специальные функции принадлежат к числу представимых степенными рядами, цепными дробями, дробно-рациональными выражениями, разложениями по ортогональным многочленам и другими выражениями, что является чрезвычайно важно как для получения начальных и завершающих приближений, так и получения самих итерационных функций.

В-пятых, элементарные функции обладают уникальным свойством - операция дифференцирования элементарных функций не выводит их из класса элементарных.

В-шестых, именно ИФ и рекуррентные соотношения позволяют использовать широкий диапазон норм погрешностей (абсолютная, относительная, среднеквадратичная и специальная).

В-седьмых, многие элементарные и некоторые специальные функции удовлетворяют функциональным уравнениям, связывающим значение функций для разных аргументов, используемых как для получения самих ИФ и рекуррентных отношений, так и для приведения к «стандартному» интервалу изменения аргумента.

В-восьмых, этот класс наиболее изучен, так как он является предметом исследования почти всеми известными математиками, а также другими исследователями.

И, наконец, именно на ИФ и рекуррентных отношениях для вычисления этого класса функций проще всего объяснить роль обратных связей в вычислительной математике, а также продемонстрировать детерминистско-вероятностный подход.

Решение уравнений и систем уравнений вида I(х)= 0 и, в частности, с помощью итерационных функций (ИФ) имеют давнюю историю. В ее развитие внесли значительный вклад такие известные математики, как Коши, Чебышев, Эйлер, Фурье, Гаусс, Лагранж, Островский, Трауб, Канторович и многие другие.

В частности, эти методы получили развитие в работе [12]. Так, в 1963 г. чл.-кор. АН СССР Л.А. Люстерник высказал мысль, что важнейшим источником получения итерационных процессов

является итерационный метод решения уравнения ¥ (х, у ) = 0, удовлетворяющий функции

у = I(х), и привел в такой записи итерационный метод Ньютона (второго порядка сходимости). Прорыв в использовании идеи Л.А. Люстерника произошел в 1967 году, когда автор этой работы разработал ряд ИФ высокого порядка, основанных на использовании неявной функции [22, 23], и дальше развил в монографиях [8, 10], справочнике [11] и обобщил в статье [24]. Эти методы в дальнейшем получили название разложения функций по невязкам (один из видов адаптивной аппроксимации), которые могут быть использованы как самостоятельно, так и быть основой для получения ИФ.

Перейдем к непосредственному изложению этого подхода.

Рассмотрим уравнение

у0 = у. Таким образом, невязка является одновременно адаптивным и «чувствительным» элементом разложения.

(8)

где невязка г0 уравнения

основном отлична от нуля, за исключением случая

Существуют следующие подходы получения разложений функций по невязкам [11]:

1. Разрешение уравнения (8) относительно х и затем получение функционального

соотношения для функции /(х) в виде суперпозиции функций у(у0 ) и g(г0). После этого имеется возможность аппроксимировать g (г 0) одним из известных базовых методов.

2. Разрешение уравнения (8) относительно у и сделав замены у на у0 и г на г0, можно

получить аналогично случаю 1 соответствующие функциональные соотношения и их разложения. Этот случай соответствует известным прямым базовым последовательностям получения ИФ

(Чебышева, Шредера, Доморяда), но для уравнения (8) вместо /(х) = 0, однако в этом случае

конструкция невязки может отличаться от случая 1.

3. Использование для получения разложений по невязкам обобщенных функциональных уравнений относительно аргументов. Этот подход годится для получения разложения по невязкам для конкретных элементарных и некоторых специальных функций.

4. Получение разложений по невязкам обратных функций, т.е. х = /(у) на основе

обращения ряда невязок прямой функции у = /(х).

5. Получение разложений функции по невязкам на основе прямых методов получения таких разложений.

6. Получение нелинейных разложений по невязкам на основе функциональных преобразований.

7. Использование методов экономизации для рядов, дробно-рациональных аппроксимаций, что приводит к уменьшению констант асимптотики погрешности.

Возможны и другие подходы.

В качестве базовых методов разложений функций по невязкам могут быть использованы практически все известные на сегодняшний день методы приближения функций. Но при этом в результате получаем их обобщение, обладающее адаптивным свойством и возможностью в ряде случаев превращения их в ИФ произвольного порядка сходимости. Отметим, что необходимым и достаточным условием сходимости разложения по невязкам к искомой функции является равенство остаточного члена разложения нулю в пределе, когда количества его членов стремятся к бесконечности.

Наиболее просто получение разложений функций по невязкам дают подходы 1 и 3, а наиболее сложно 2 и 5. Подробно с конкурентными разложениями можно ознакомиться в работах [8, 10, 11].

Приведем примеры невязок для некоторых функций.

у = ха, г0 = х / у-1 либо 20 = 1 - у/ х ;

у = 1пх, г0 = еу /х -1; г0 = 1 - х/ еу , г0 = (х - еу )/(х + еу ); у = агсг§х , г0 = (^0 - х)/(1 + №0);

у = тувг/х , г0 = вгУу0 — х.

Приведем примеры разложения по невязке (более подробно эти вопросы рассмотрены в следующем разделе).

f ¥ л

у = (l + x )a= у o 1 + X

V n=lJ

a(a-l)...(a-n +1)

n1

z n ; ;

1 / ¥

у = 1/* = Уо (1 - z0 Г = Уо г-------ъ 1 + 2 Z PTk (u)

V1 -P\ k=1 ,

где Tk (u) - полиномы Чебышева, u0 = z0/ b |b| = max|z0|, где z0 G [— b, 0\ ui G [—1,1], z0 = 1 — y0x , остаточный член Rn—x = 2Pn /(1 — p) -^1 — ft2 ;

У = 1/* = У0(1 — z0)—1 = У0 П 1 — z02i)+ O(z02k), z0 = 1 — ХУ0.

z 0 z 0

У У + o o б z = x - У 02

У = У o + — + — - цепная дробь, z 0 =-----------------

2 + 2 +--' У 0

Получение из разложений по невязкам ИФ достаточно просто. Для этого необходимо только осуществить следующие замены: у = уі+1, у0 = уі, z0 = zi.

Отметим, что от вида разложения, связанного с использованием базового метода аппроксимации, порядок ИФ не меняется, но имеется отличие в константе асимптотики погрешности.

Рассмотрим влияние констант асимптотики и норм погрешности на точность решения с помощью итерационных процессов для различных ИФ вычисления у = ПX .

1.1. Правило Ньютона (итерационная формула 2-го порядка):

У,+1

1

n

(n - [у, + -Л

У І

; d+l » — d2

2

для n = 2 получаем итерационную формулу Герона:

УІ

+1

2

Уг +

x

1

1.2. У, +1 = У, +-n

ґ

У г -

Уг

n+1 Л

V

x

; d

І+1

у,

n + 1 с2

------d

2 г

для n = 2

1

1.10. у = nx

1.20. у = Vx

для n = 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

У,+l = У,

З - УГл

2 2х J

З

; d+l » 2 d

У,+1 = У,

гл zt 1 - n л 1 + — + •

n 2!n2 l

zt = x / У,n -1;

d » (n - l)(2n -1) d3

1+1 З! l

для n = 2

У,+1 = У,

у, + Зх З у, + X

У і+1 = У,

ґ л л \

1 1 + 1 + n 2

1---------Z,. + _

V

n 1 2 !n

2 z,

/

„ (n + l)(2n +1) оЗ

z, = У,п / x -1; d+l » ------------------------------- d

З!

Уi+1 = Уг

, 1 З 2

1 -- zt + - zt 2 , В ,

d

(2 +1)(4 +1)

i+1

З!

d3

З •5 d = -d3

1 • 2 • З l З l

1.З0. Рациональная ИФ

J*; У,+l = У, (у,2 + ^)/(ЗУ,2 + x); d+l » 4 sf

п/Х ; у,+1 = у,

1 +

і

п

V

Отметим, что погрешность ИФ третьего порядка для вычисления \х , полученная в результате разложения в ряд Тейлора, будет 8і+1 »1 /38?, а при использовании цепной дроби или модифицированного метода Доморяда будет 8+1 » 1 / 48і3, т.е. в первом случае константа

Гх ,

асимптотики погрешности С больше, чем во втором случае.

Минимальное значение константы асимптотики погрешности С достигается при использовании наилучших минимаксных приближений на заданном интервале.

Дальнейшие вычисления целесообразно вести уже по формуле Герона или ей подобной, имеющей более простой вид. Это возможно благодаря тому, что интервал погрешности у1 очень мал и поэтому целесообразно использовать ИФ, полученные не на основе минимаксных приближений, а при разложении в ряд Тейлора-Маклорена. Данная рекомендация следует [15] из того положения, что многочлен, полученный за счет ограничения ряда Тейлора п -м членом, дает

наилучшее приближение к функции / (х) вблизи нуля среди многочленов в смысле равномерной

либо квадратичной нормы при любых весовых функциях на интервале (0, к) при к ® 0.

Вместо наилучших приближений в ряде случаев проще рассматривать разложения по невязкам по ортогональным многочленам [10]. При этом точность вычислений будет несколько меньше, чем использование в первой итерации минимаксных приближений. Помимо этого, если используется несколько итераций порядка р > 2, то они практически могут скомпенсировать полученные отличия в точности. Более подробно с указанными подходами можно ознакомиться в монографиях [8, 10] и справочнике [11].

Обращаем внимание читателя на тот факт,что рассматриваемые подходы получения и использования ИФ адекватны адаптивным системам автоматического регулирования с перестраивающейся структурой.

Так, для у = л/х , х е [1/16,1] при у0 = 0,17157 + х получим

г 0 = х / у 02 - 1.

Для этих условий ИФ для р = 2 имеет вид уг = у0 (0,5047805г0 + 0,9952745), имеющую погрешность 1^1 £ 0,006 против ^ £ 0,015 для формулы Герона.

4. Рекуррентные формулы для вычисления функций и уменьшения интервала изменения аргумента

Функциональные соотношения для уменьшения интервала изменения аргумента:

sin(2и - 1)х = (- 1)” Г2и+1 (sin X); cos nx = Tn(cos X);

tgnx = h” ) (1, g) / h” ) (1, tgx),

где Tn(x) - многочлены Чебышева первого рода;

H”0^, H”1 - гармонические многочлены.

Для z, = bcos(x/2m +1), где b и t - произвольно выбранные постоянны, справедливо рекуррентное соотношение [8]:

4t 2 2t

zm , — — zm +— z 2 +----------b + t

m-1 b m b m b ’

где cosx = (z0 — t)/ b . При этом параметры b и t могут быть выбраны произвольным образом.

Для zm = cos(x /3 m) -1 справедливо рекуррентное соотношение:

z , = 4z + 12z + 9z

m—1 m m m ’

где cos x = z0 +1.

Утверждение. Функцию ax можно аппроксимировать zm - функцией вида [8]

z m—\ = (1/ь 2 )zm - (3/b2 )zm + (3t2 / b2 K, -1 / b+1, (9)

/ 3W

где zm = bax + t;

b и t - произвольные постоянные;

ax = (z0 -1)/ b.

Относительная погрешность рекуррентного соотношения (9) при достаточно больших m является инвариантной относительно параметров b и t с точностью до величин o(d„ ). Относительная погрешность формулы (9)

s ,, »3(z3 + 2z2 + z )s

m+1 \ m m m / m

Доказательство этого утверждения приведено в работе [ ].

Утверждение. Функция cosx может быть аппроксимирована zm- функцией, имеющей вид [8],

zm-1 =(4t / b)zm +(2/b)zl + 2t / b - b + t > (10)

где zm = b cos(x /2m +1);

b и t - произвольно выбранные постоянные;

cos x = (z0 -1) / b.

Абсолютная погрешность рекуррентного соотношения (10) при достаточно больших начальных величинах m является инвариантной относительно параметров b и t с точностью до

величины порядка o(D2m )

Оценка абсолютной погрешности формулы (10) отвечает неравенству Am-1 < 22 Am . Доказательство этого утверждения приведено в работе [8].

Утверждение. Функция ax может быть аппроксимирована zm - функцией, имеющей вид

z m-1 =(1/b) zl -(2t / b) z m + 12/b + t, (11)

где zm = bax 2 +1; параметры b и t - произвольно выбранные постоянные, а величина

функции ax = —(z0 -1)/b.

Абсолютная погрешность рекуррентного соотношения (11) при достаточно больших m является инвариантной относительно параметров b и t с точностью до величин o(A2m ).

Оценка абсолютной погрешности формулы (11) для х е [— ¥,0] имеет вид

А m-1

Доказательство этого утверждения приведено в работе [8].

Для получения других функций можно воспользоваться известными соотношениями:

arcsin x = p / 2 - arcsin л/ї—

x2 і

arccos x = p / 2 - arccos л/1— arcsin x = 2arcsinx

x2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

x/^2(1+V1-7)

У

атеі^х = атеі^х + аг^ (х - ^(і + хд)).

Пример.

Поэтому для п = 2 в [10] предлагается использовать соотношения

aгcctgx = 1п(1 + х) = 21п(1 + х / (1 + -\/1 + х));

Zm+i =Zm + v1 + , z = x; arcctgx =

I

z

m +1

Аналогично для гиперболических функций. Для логарифмической функции имеем

Inx=nmInx ■

m э

Inx = nln

т.е. zm+1 = nzm , но это рекуррентное соотношение приводит к большим погрешностям.

Более подробно с этими методами можно ознакомиться в работах автора [8, 10, 11].

4.1. Динамический режим счета

Утверждение. Для постоянного шага h изменения аргумента функции sinx и cosx могут вычисляться на основе слудующей реккурентной формулы [11]:

где B = cosh ;

Un = < sin xn при вычислении sin x ;

[ cosxn при вычислении cosx

xn = x + nh.

Абсолютная погрешность этой рекуррентной формулы:

Утверждение. Для постоянного шага h изменения аргумента функции sinx и cosx могут вычисляться одновременно на основе следующих рекуррентных соотношений:

где Un = sinxn; Vn = cos xn; xn = x0 + nh; A = sinh .

Абсолютные погрешности этих формул будут соответственно равны величинам

А *+1 =Д *_1 (1 -(2 А)2 )+Д * _22 А.

Аналогично могут быть получены формулы для динамического счета функций tgx, атег^х , ах и др. [11].

К этим методам тесно примыкают методы, базирующиеся на сегментной (сплайн) аппроксимации, основанные на разложении функций по невязкам [10]. При этом интервалы

разбиения исходного интервала хе [а,Ь] как непосредственно точками разбиения, так и

вложенными интервалами (нониуская аппроксимация) [11].

5. Выводы

В статье показана связь адаптивных аппроксимаций и итеративных процессов с явлениями живой и искусственной природы. Особую роль в получении адаптивных аппроксимаций и итерационных формул играет невязка решения уравнения.

Таким образом, невязка как элемент адаптации и обратных связей может рассматриваться с разных точек зрения:

- как элемент адаптации к внутренним и внешним условиям применения;

- как следствие первого свойства она позволяет ускорять сходимость различных разложений, начиная с разложений в ряд Тейлора-Маклорена, цепную дробь и кончая разложением по ортогональным многочленам;

- может служить основой получения новых норм погрешностей приближений;

- может быть основой индикатора достижения необходимой точности при использовании отрезка разложения в функциональный ряд;

- дает определенную структурированность разложения, позволяющую уменьшить погрешность округления при высоких основаниях счисления;

- позволяет получать разложение, когда это возможно и выгодно, легко получать базовые последовательности итерационных функций различных видов (полиномиальные, дробнорациональные, как произведения и т.д.), т.е. получать итерационные формулы произвольного порядка сходимости ;

- позволяет получать итерационные формулы на основе наилучших (минимаксных) приближений;

- позволяет создавать специальные нормы для обеспечения согласования вида начального приближения с итерационной формулой произвольного порядка сходимости;

- может использоваться для получения формул и разложений для вычисления взаимнообратных функций;

- может быть использована для получения экономичных формул для табулирования функций;

- может быть использована для сужения исходного интервала задания аргумента при вычислении функций;

- может быть использована для получения экономичных интерполяционноэкстраполяционных формул различных видов, включая полиномиальные дробно-рациональные, и позволяет решать проблему устойчивости (типа эффекта Рунге-Гибса и других);

- невязка может быть использована для получения общих и специальных методов сегментной аппроксимации функции;

- невязка является, в силу своей структуры, мощным обобщающим средством для получения новых методов на основе известных;

- невязка позволяет достаточно просто определять порядок итерационной формулы и/или погрешность метода;

- невязка в ряде случаев удовлетворяет обобщенным функциональным уравнениям;

- невязка может использоваться не только в области действительных чисел, но и для комплексных матриц;

- невязка позволяет использовать начальные приближения различных видов по форме и норме погрешности;

- невязка позволяет получить аналитическое представление существенно нелинейной -ступенчатой функции (для аналитического конструирования систем управления);

- в силу свойств, отмеченных выше, разложение функций по невязкам является идеальным средством для создания порождающих алгоритмов для вычисления функций на ЭВМ, обладающих необходимыми для конкретного применения свойствами. На базе этих порождающих и конкурирующих алгоритмов появилась возможность построения базы знаний нового поколения;

- невязка позволяет вводить дополнительные параметры за счет рассмотрения уравнения

у = /(х). Рассматривается уравнение г = Р(х, у);

- невязка позволяет использовать теоремы о сжатых отображениях и неподвижной точке, что приводит к сжатию исходного интервала и обеспечению стремления к пределу нуль либо константа;

- невязка является ключевым элементом для получения базовых последовательностей ИФ, оптимальных по Траубу различных видов (полиномиальных, дробно-рациональных и других) с различными нормами погрешности;

- невязка является основой получения адаптивных аппроксимаций;

- невязка является основой оптимизации системы «начальное приближение и базовая последовательность ИФ».

Свойства и значение невязки и разложений функций по невязкам можно продолжить. Но и перечисленных свойств достаточно, чтобы видеть, что адаптивный элемент в виде невязки породил беспроцентное явление в математике вообще и в теории аппроксимации, в частности. Но в живой природе такие явления не являются столь беспрецедентными. Так, например, подобным свойством является генетический код, присущий всем живым организмам. Из изложенного выше видна общность многих свойств (адаптация, обратные связи и т.д.) во многих явлениях живой и искусственной природы и математики. Помимо этого, как в вычислительной математике, в природе существуют индикаторы, которые сигнализируют о нормальном либо ненормальном протекании процесса. Так же, как и в математике, в живой, неживой и искусственной природе важную роль

играют свойства устойчивости протекания процесса генерации процессов их свойств и т.д. Все это позволяет рассматривать их совместно в новой кибернетике.

СПИСОК ЛИТЕРАТУРЫ

1. Маркс К., Энгельс Ф. Сочинения. - Т. 20. - С. 37.

2. Глушков В.М. О некоторых задачах вычислительной техники и связанных с ними задачах математики // Украинский математический журнал. - 1957. - Т. 9, № 4. - С. 369 - 376.

3. Euler L. Opera Omnia. - Ser. I. - Vol. X. - P. 422 - 455.

4. Чебышев П.Л. Вычисление корней уравнений // Чебышев П.Л. Полное собрание сочинений. - Москва -Ленинград, 1951. - Т. 5. - С. 7 - 25.

5. Schroder E. Liber unendlich viele Algorithmen zur Auflosung der Gleichnung. Math. Ann. - 1870. - 2. - P. 317 -365.

6. Микеладзе Ш.Е. О некоторых итерациях высших порядков // Сообщ. Академии наук Грузинской ССР. -1959. - Т. 22, № 3. - С. 257 - 264.

7. Трауб Дж. Итерационные методы решения уравнений: Пер. с англ. - М.: Мир, 1985. - 264 с.

8. Благовещенский Ю.В., Теслер Г.С. Вычисление элементарных функций на ЭВМ. - К.: Техника, 1977. - 208 с.

9. Теслер Г.С. Динамический режим вычисления функций в МВС с программируемой архитектурой на основе адаптивных алгоритмов // Многопроцессорные вычислительные структуры. - 1987. - Вып. 9. - С. 49 - 52.

10. Попов Б.А., Теслер Г.С. Приближение функций для технических приложений. - К.: Наукова думка, 1980. -352 с.

11. Попов Б.А., Теслер Г.С. Вычисление функций на ЭВМ: Справочник. - К.: Наукова думка, 1984. - 600 с.

12. Люстерник Л.А., Червоненкис О.А., Яснопольский А.Р. Математический анализ: вычисление элементарных функций. - М.: ГИФМЛ, 1963. - 247 с.

13. Fike C.T. Computer evalution of mathematical function. - New Jersey: Prentice - Hall, 1968. - 228 p.

14. Теслер Г.С. Адаптивные экономические итерационные методы «цифра за цифрой» // Математические машины и системы. - 1999. - № 1. - С. 43 - 52.

15. Ланцош К. Практические методы прикладного анализа: Пер. с англ. - М.: ГИФМЛ, 1961. - 524 с.

16. Дзядык В.К. Аппроксимационные методы решения дифференциальных и интегральных уравнений. - К.: Наукова думка, 1988. - 304 с.

17. Banach S. Sur les operations dans les ensembles abstraits et leur application aux equations integrals // Fund. Math. - 1922. - Vol. 3. - P. 133 - 181.

18. Березин И.С., Жидков Н.П. Методы вычислений. - 1959. - Т. 2. - 639 с.

19. Курпель Н.С. Проекционно-итеративные методы решения операторных уравнений. - К.: Наукова думка, 1988. - 1943.

20. Самарский А.А., Гулин А.В. Численные методы. - М.: Наука, 1989. - 432 с.

21. Островский А. Решение уравнений и систем уравнений: Пер. с англ. - М.: ИЛ, 1963.

22. Теслер Г.С. Способы вычисления некоторого класса функций на ЦВМ // Математическое обеспечение ЭВМ и эффективная организация вычислительного процесса. - 1967. - Вып. 2. - С. 111 - 121.

23. Теслер Г.С. Вычисление некоторых элементарных функций на ЦВМ // Математическое обеспечение ЭВМ и эффективная организация вычислительного процесса. - 1997. - Вып. 2. - С. 91 - 110.

24. Батароев К.Б. Кибернетика и метод аналогий. - М.: Высшая школа, 1974. - 104 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.