УДК 001:1:004.4
КОМПЬЮТЕРИЗАЦИЯ НАУКИ КАК ПУТЬ К ДИАЛОГУ И ИНТЕГРАЦИИ
Р.В. Маслов, С.П. Позднева
Саратовский государственный университет, кафедра философии и методологии науки E-mail: maslovrv@sgu.ru
Компьютеризация дает реальную возможность преодоления разрыва между двумя культурами: естествознанием и точными науками, с одной стороны, и гуманитарными - с другой. «Размывая» границы между обособленными культурами, она способствует становлению нового стиля мышления, очерчивает контуры науки будущего.
Computerization of Science as a Way to the Dialog and the Integration
R.V. Maslov, S.P. Pozdneva
Computerization of science gives the real possibility overload the break between two kinds of cultures: natural, so called «precise» sciences, on one hand, and humanitarian sciences, on another. «Washing away» the edges between local cultures, computerization furthers new style of thinking genesis, and marks future science contours.
XXI век по праву называют веком электроники и информатики, веком новой информационной революции. Первая, как известно, была связана с изобретением языка, вторая - письменности, третья - с книгопечатанием, четвертая - с созданием электронных средств информации, и новая, пятая -компьютерная революция - с изобретением микропроцессора и машинных носителей, хранящих информацию. Компьютерная революция характеризуется стремительными темпами проникновения практически во все сферы человеческой деятельности - производство, управление, науку, медицину, военную технику. Отличительный признак компьютерной революции состоит в бурном развитии вычислительной техники, увеличивающей научный и промышленный потенциал общества, в конструировании и функционировании систем искусственного интеллекта. Общепринятыми стали понятия «техногенная» (В.С. Степин) и «информационная» цивилизация, «информационное общество» (З. Бжезинский, П. Дракер, Р. Катц, Й. Масу-да, Т. Сакайа).
Бурное развитие вычислительной техники началось со становления кибернетики -науки о самоуправляющихся машинах, возникшей в последней трети ХХ века. Отцом кибернетики считается американский математик Н. Винер. Главная идея его книги «Кибернетика и общество» - подобие процессов управления и связи в машинах, живых организмах и сообществах. Это процессы передачи, хранения и переработки информации, т.е. различных сигналов, сообщений, сведений. Кибернетика выявляет зависимости между информацией и другими характеристиками систем - энтропией, энергией и др. Понятие «информация» (от лат. тЮтаайо - ознакомление, разъединение) здесь употребляется как мера организованности системы, в отличие от понятия энтропии как меры неорганизованности.
Справедливости ради следует назвать и отечественного ученого А. А. Богданова -философа, публициста, врача, руководителя знаменитого «Пролеткульта», работа которого «Всеобщая организационная наука - тек-тология»2 может по праву считаться предтечей кибернетики. Тектология рассматривает все явления как процессы организации и дезорганизации. Принципы организованности и динамичности связаны с принципом целостного рассмотрения отдельных явлений и мира вообще. Тектология ставит своей задачей установить общие закономерности организации для всех ступеней развития. По Богданову, существует два типа организации систем
- централистический (центральное ядро, которому подчинены все элементы комплекса), и скелетный (где единство сохраняется благодаря некоей раме, скелету, состоящему из множества элементов). Общностью тектоло-гии Богданова с кибернетикой является принцип обратной связи - когда при измене-
© Р.В. Маслов, СП. Позднева, 2007
нии параметров одной системы изменяются параметры другой. Богданов называл этот принцип биорегулятором и первым применил этот принцип как метод новой науки -тектологии. Из специалистов по кибернетике к Богданову ближе всех стоит Р. Эшби. Последний определяет кибернетику как абстрактную теорию машин, в которой мы отвлекаемся от их особенностей, кроме присущего им поведения, задаваемого некоторым преобразованием, переводящим одни состояния машины в другие. Винер же определяет кибернетику как науку об управлении и связи в живом организме и машине.
Осознание необходимости коренной трансформации стратегии человеческой деятельности сместило акценты поиска ресурсов развития в интеллектуальную сферу. Значительную роль в смене мировоззренческих ориентиров сыграла и начавшаяся массовая компьютеризация, придавшая социальным процессам новые «компьютерные измерения». Внедрение новой информационной технологии превратило информацию в неисчерпаемый ресурс цивилизации и привело к впечатляющему рывку во многих сферах жизни общества, в том числе в научных исследованиях.
Естественно, что обстоятельства подобного рода повлекли за собой потребность их мировоззренческой и методологической оценки. Тем не менее, если социальным проблемам компьютеризации уделяется внимание, то проблема применения новых информационных технологий в научном познании в философских исследованиях занимает весьма скромное место. Общеизвестна «революционная» роль технических изобрете-ний(микроскопа, телескопа, лазера и других), усиливающих физические способности человека. Но компьютеры - это «интеллектуальная» техника, именно в этом различии скрываются те специфические черты, которые принципиально меняют облик научного познания, выдвигают новые гносеологические и методологические проблемы взаимосвязи традиционных методов получения новых знаний и современных с применением информационной технологии.
Новая информационная технология познания существенно расширила границы естественно-научного познания от традиционных рамок вещественно-энергетических и пространственно-временных отношений до информационных процессов. Наибольший интеллектуальный вклад в становление информационного подхода внесли кибернетика и синергетика. Получение информации стало не только характерным видом человеческой деятельности, но и основой «гносеологического поворота» в науке - от поиска элементарных кирпичиков мироздания до уяснения единства и целостности мира.
Нас привлек один из частных, но значительных проявлений информатизации общества - феномен компьютеризации науки.
Анализ феномена компьютеризации науки как «интеллектуальной техники» приводит к необходимости рассмотрения не только понятий «информация», «искусственный интеллект», «виртуальность», «компьютер», но и, прежде всего, более широкого пласта исследования - «человек и техника». Любопытно, что на прошедшем недавно IV Российском философском конгрессе (май 2005, Москва) названным проблемам уделено достаточное внимание. Так, образована специальная секция «Философия техники и хозяйства», сформирована секция «Философия синергетики» и проведены круглые столы «Философские проблемы виртуалистики», «Информация и развитие» и «Философско-методологические проблемы когнитивных и компьютерных наук». В современной философской литературе появилась масса публикаций с заголовками «Киберкультура», «Киберпространство», «Киборг» и даже «Кибертеррор». На кафедре философии и методологии науки СГУ в 2003 г. защищена кандидатская диссертация М.В. Кувшиновым на тему: «Феномен компьютеризации: парадиг-мальный и онтологический аспекты».
Известно, что совершенствования в технике сопровождали человечество всегда. Существует обширная литература, как отечественная, так и зарубежная, по философии техники. Принято различать онтологию (М. Хайдеггер) и антропологию техники (Э. Капп, Х. Закссе), технику как коммуникативную
стратегию и «тактику жизни» (О. Шпенглер), технику как сверхпотребность и «преодоление нужды» (Х. Ортега-и-Гассет), технику как проявление бессознательного и сублимацию инстинктивного начала (З. Фрейд, К.Г. Юнг, Г. Башляр) и, наконец, учитывать эсхатологическое начало во взаимосвязи человека и машины (Н. Бердяев).
Не менее содержателен анализ техники и мифа в древних цивилизациях (Й. Хэйзин-га, Г. Гадамер, К. Леви-Строс) и в основных культурно-исторических типах техники. Наиболее разработан греческий вариант античной техники: соотношение «технэ» (ремесла и искусства) и «фюзис» (природы). Инженерные достижения (Архимед) применялись в подъемных механизмах, военной области, судостроении, горной промышленности и при строительстве храмов и театров (Витрувий). Медицина рассматривалась как важнейшая область приложения знаний и умений (Гиппократ, Гален). Аристотель выступает не только отцом физики и психологии как науки и теоретического знания, но и, по существу, первым «философом техники».
Средневековая техника выделяется не только религиозной мотивацией, но и «умением ума» (М. Вебер, С. Неретина) на примере Р. Бэкона, не только теологической, но и экспериментальной направленностью (К.Г. Юнг), без которой не было бы современной химической технологии - на примере Парацельса.
Эпоха Возрождения совмещает ремесло с наукой и создает свой идеал творчески универсальной личности - Леонардо да Винчи, который поддается детальному психоанализу (З. Фрейд).
В Новое время происходит сциентифи-кация техники: техники эксперимента, наблюдения и измерения становятся основой техники как прикладного, с одной стороны, и теоретического знания - с другой (К. Хюб-нер, Ф. Рапп, Г. Беме, В. Крон, В.С. Степин, В.Г. Горохов, М.А. Розов), и появляется понятие «технология».
В ХХ веке достижения в науке и технике
- электродинамика, тепловая машина, теория электричества, катодные лучи, радио -становятся мерилом национального престижа и фактором социального прогресса.
Среди тенденций развития техники ХХ и ХХ1 веков ведущее значение приобретают науки о сложных системах - кибернетика (Н. Винер, А.А. Богданов) и синергетика (И. Пригожин, И. Стенгерс, Г. Хакен). Наука приобретает технический характер. Техника становится коммуникационной стратегией. Возникает термин «компьютерная революция» (А.И. Ракитов), и даже «компьютерная культура» (С. Туркл), вводятся в оборот понятия «компьютерное время» (Т.А. Погре-шаева) и «время в компьютерном обществе» (В.К. Карнаух), понятие «компьютерный андеграунд» (И.В. Куприянов) в связи с демократизацией общества. Активно обсуждается проблема компьютеризации в сфере образования (Б.С. Гершунский, Е.И. Машбиц). В связи с кибернетикой начинают обсуждаться традиционные проблемы философии - проблемы мышления, интеллекта, жизни, языка (А.И. Берг, Н. Хомский, Р. Шенк), обсуждается «ментальная жизнь некоторых машин» (Х. Патнэм). Возникает гипотеза квантовой природы сознания и квантовых компьютеров (Е.М. Иванов). Модной становится проблема «искусственного интеллекта», а компьютерный эксперимент становится новой парадигмой инженерного творчества.
Исследователи называли три важных обстоятельства, вызвавшие к жизни кибернетику. Во-первых, возрастание роли управляющей деятельности на производстве стимулировало возникновение междисциплинарной науки - на стыке теории связи, теории автоматического регулирования, теории электронно-вычислительных машин, физиологии, математики. Во-вторых, кибернетика открыла новый информационный аспект, позволивший установить общие черты в функционировании искусственно созданных человеком технических устройств и живых организмов. В-третьих, развитие математической логики - исчисление высказываний -содержит формулы, описывающие и работу релейно-контактных схем.
Исследуемая нами новая информационная революция, связанная с появлением микропроцессорной технологии, персональных компьютеров, существенно меняет в обществе не только производство, но и шка-
лу ценностей. В информационном обществе производятся и потребляются не материальные ценности, а духовные - знания. Возрастает спрос на информацию.
Развернулась дискуссия относительно природы информации. Дискуссия выявила два принципиальных подхода к трактовке информации - атрибутивный и функциональный. Согласно атрибутивному подходу (Р.Ф. Абдеев, Б.В. Бирюков, В.М. Глушков, Д.А. Гущин, Е.В. Котова, С.Т. Мелюхин, И.Б. Новик, Л.А. Петрушенко, А.Д. Урсул, Ф.Н. Цырдя, Р.А. Шералиева) информация рассматривается как свойство всех материальных объектов, согласно функциональному (Н.Т. Абрамова, Н.И. Гришкин, Д.И. Дубровский, Н.И. Жуков, Э.П. Семенюк, В.С. Тюх-тин, Б.С. Украинцев) она присуща лишь самоуправляемым системам на биологическом и социальном отрезках магистрального развития материи.
В философских обобщениях понятия информации нашли отражение идеи Н. Винера, Л. Бриллюэна, У.Р. Эшби (в атрибутивной концепции) и К. Шеннона (в функциональной концепции). Так, согласно Н. Ви-неру3, информация интерпретируется как ме-ра упорядоченности, организованности систем. Согласно У.Р. Эшби, информация выступает как мера разнообразия . Близко к этой дефиниции стоит определение В.М. Глушкова (информация как мера неоднородности распределения материи и энергии), А.Д. Урсула и В.М. Адрова (информация как отраженное разнообразие).
Существует и попытка совместить два аспекта в трактовке информации. А.Д. Урсул и К.В. Казанцева предлагают определять информацию как существенную, инвариантную часть отраженного разнообразия, поддающуюся опредмечиванию, передаче5. Такой подход не только служит сближению атрибутивного и функционального подходов, попытка определить информацию через симметрию усиливает ее междисциплинарный характер, в том числе и ее социальный аспект.
В настоящее время концепция информационного общества разрабатывается Д. Беллом, Е. Масудой, М. Маклюэном и О. Тоф-
флером в аспекте социальных коммуникаций. В отечественной литературе концепция информационного общества и информационной цивилизации разрабатывается групп-пой саратовских философов - В.Б. Устьянце-вым, Е.Н. Богатыревой, С.Ф. Мартыновичем, А.С. Борщовым, П.В. Романовым, Д.И. За-ровым и др. Выясняются основы современной парадигмы информационной цивилизации, анализируются информационные основы природы, информационные стандарты мышления.
Информатизация общества рассматривается в качестве генеральной стратегии его развития (Ю.Л. Егоров), а также оценивается как технико-социокультурный процесс (И.А. Негодаев). В рамках информатизации общества анализируются познавательные и коммуникативные процессы (Е.А. Андрианова, В.Г. Федотова), оцениваются возможности информации в единстве со структурой и симметрией выступать в качестве единого междисциплинарного языка делового общения (С.П. Позднева), выясняются особенности «экранной культуры» (Н.И. Колоскова) и даются определения пространству системы любой степени сложности (М.Ю. Казари-нов). Важно подчеркнуть, что формулируются предпосылки информационной специфики сознания (В.Н. Веселовский).
Информатика действительно ставит задачи переосмысления природы психического, соотнесения понятий «информация» и «психика». В настоящее время осуществлен, по мнению Н.П. Бехтеревой, прорыв в изучении различных физиологических показателей мозговой нейродинамики при психологических тестах в условиях прямого и особенно множественного контакта с мозгом. Наряду с исследованием мозговой организации мыслительных процессов удалось получить сведения о состоянии всего мозга и его зон, что позволило строить новую функциональную анатомию мозга. Исследование интеллекта человека, его стандартов и отклонений - одно из перспективных направлений, способствующих построению систем искусственного интеллекта - главной задачи кибернетики.
Впервые коэффициент интеллекта использовался на практике службой вербовки американской армии во время Первой мировой войны. Установлено несколько врожденных способностей интеллекта - вербальная, вычислительная и пространственная. Психолога Пиаже интересует лишь процесс мышления. Гарднер полагается на теорию множественности интеллекта. У представителей престижных профессий - инженеров, архитекторов, преподавателей университетов, врачей - средний коэффициент интеллекта равен 120 баллам. Если раньше работодателей для увеличения прибыли интересовали лишь усердие и добропорядочность, то сейчас их привлекает интеллект. Анохин полагал, что мозг не истощается в связи с резким возрастанием информации. В мозгу 14 млрд нейронов. К десяти годам их можно заполнить, но каждая клетка имеет 8 тыс. контактов, т.е. кладовая мозга практически неисчерпаема - 1 и столько нулей, сколько уместится на ленте длиной 9,5 млн километров.
С конца 40-х годов ученые устремились к дерзкой цели - созданию компьютеров, которые по результатам работы были бы неотличимы от человеческого разума. Выяснилось, что для конструирования таких машин важно не только разобраться в работе миллиардов нейронов мозга, но в целом познать процессы функционирования человеческого разума, а не просто имитировать его работу. Многие склонны принять тест машинного интеллекта, данного английским математиком А. Тьюрингом: ЭВМ разумна, если она способна заставить нас поверить, что мы имеем дело не с машиной, а с человеком.
Идея создания искусственного интеллекта - мыслящих машин «человеческого типа», которые думают, говорят, двигаются, т.е. ведут себя как люди, уходит корнями в прошлое. В XVIII в. французский изобретатель Жак де Вокансон изготовил механического флейтиста, исполнявшего 12 мелодий. А Фридрих фон Кнаус сконструировал серию машин, которые имитировали писцов -умели держать перо и писали длинные тексты. Механический подход уступил место электронному. Так, «электронный мозг» предсказал итоги президентских выборов за
несколько часов до получения окончатель -ных данных в 1952 г. Исследования по искусственному интеллекту ведутся в Массачусетском технологическом институте, Технологическом институте Карнеги в Питтсбурге и Стеэнфордском университете. Однако трудности, с которыми столкнулись исследователи искусственного интеллекта, привели к пессимистическому выводу Дрейфуса: компьютеры не могут быть разумными. Третий подход, кибернетический, возникший на стыке нейропсихологии, медицины, физики и электроники, положил в основу принцип обратной связи - использование информации, поступающий из окружающего мира для изменения поведения машин. Впервые этот принцип был применен в военной технике - при малейшем изменении радиолокационных сигналов изменялась наводка орудия. Подобно принципу обратной связи Винера, Сеченов рассматривал его как механизм регуляции нервной системы.
Наконец, был использован и нейронный подход - нейрофизиолог и биолог Маккалох разработал теорию деятельности головного мозга, показавшую сходство работы машины и мозга. Нейроны упрощенно можно рассматривать как устройства, оперирующие двоичными числами - единицей и нулем, как рабочим инструментом математической логики. К. Шеннон показал, что двоичные числа соответствуют двум состояниям электрической цепи «включено-выключено» и идеально подходят для ЭВМ. Машина стала воспроизводить операции творческого мышления.
Своеобразие диалога человека и компьютера через переводчика - программиста, который в программе скрупулезно перечисляет действия машины для получения решения, создает трудности, ибо человек и машина говорят на разных языках. Не машина приспосабливается к человеку, а он вынужден осваивать ее язык, приспосабливаться к ней, ибо в настоящее время умение пользоваться компьютером становится уже своеобразным показателем образованности.
Образование своеобразного интеллектуального симбиоза человека и машины отражается как на статусе человека, так и на но-
вых подходах к выяснению сущности понятия мышления и понятия разумности. Разумность предполагает наличие интеллекта, осуществляющего деятельность по преобразованию действительности. Интеллект - это свойственный живым организмам механизм порождения знания и целенаправленной реализации их во взаимодействии организма со средой. При работе с машиной изменяются традиционные представления о передаче индивидуального интеллектуального опыта, складываются новые критерии фиксации творческих достижений, возникает ряд психологических и этических барьеров. В интеллектуальной мастерской человека ПЭВМ рассматриваются не только как средство досуга - видеоигры и вспомогательное средство
- программы-словари, но и как мощное средство доступа к сокровищам знаний.
Наиболее характерной разновидностью интеллектуальной деятельности является решение задач. Прежде всего, ведется поиск обхода препятствий, преодоления трудностей
- поиск некоторого алгоритма как средства для достижения цели. Алгоритм в этом случае выступает как точное предписание о выполнении в определенном порядке системы операций для решения данной задачи. Умение решать интеллектуальные задачи (т.е. способность целенаправленно преобразовывать имеющуюся информацию) приобретается путем обучения на опыте.
Искусственный интеллект - это совокупность автоматических методов целенаправленной переработки информации в соответствии с приобретаемым в процессе обучения опытом решения интеллектуальных задач. Это специализированные программы для ЭВМ. К интеллектуальным относят следующие задачи: игру в шахматы, сочинение музыки, доказательство теорем, диалог с человеком на русском, английском и др. языке, медицинскую диагностику. При разработке систем искусственного интеллекта невозможно обойтись без автоматического распознавания и описания зрительных и звуковых образов и др. ЭВМ не способны решать все интеллектуальные задачи - единого эффективного алгоритмам не существует.
Сложились три основных подхода к искусственному интеллекту:
1) исследование структуры и механизма работы человеческого мозга, построение моделей на основе психофизиологических данных, проведение экспериментов, выдвижение гипотез относительно механизмов интеллектуальной деятельности;
2) анализ искусственного интеллекта, интеллекта роботов. Здесь речь идет о моделировании интеллектуальной деятельности с помощью вычислительных машин. Цель -создать программы, позволяющие решать задачи не хуже человека;
3) ориентация на создание смешанных интерактивных систем - симбиоз естественного и искусственного интеллекта, основанного на диалоге человека и машины.
Еще недавно дискуссия, может ли машина мыслить, оценивалась по критерию Тьюринга. В случае, когда нельзя отличить машинное от человеческого, ответ давался положительный. Сейчас же можно утверждать, что такие интеллектуальные задачи, как распознавание образов, формирование понятий, принятие решений, решение логических задач, планирование поведения, интеллектуальные игры, доказательство теорем, адаптивное управление уже можно реализовать на ЭВМ. Если знаменитая золотая рыбка из пушкинской сказки могла говорить только один на один со своим собеседником, то речевой дисплей способен отвечать на вопросы с дальнего расстояния. В 1974 г. состоялся международный шахматный турнир, в котором выиграла российская «Каисса», программу которой создавали в Институте управления РАН и в работе над которой участвовал М. Ботвинник. В настоящее время разработаны программы, позволяющие машинам играть в деловые и военные игры. Не только само возникновение кибернетики было связано с оборонной промышленностью, но и сейчас готовность к боевым действиям в киберпространстве с точки зрения национальной безопасности столь же важна, как ядерные ракеты и контроль над космосом. Важна и поддержка квантовой информационной технологии в США.
Наиболее интересной в интеллектуальном плане является задача обучения распознаванию ситуаций, решением ее продолжают заниматься физиологи, психологи, математики, инженеры. Цель - создание читающих автоматов, систем искусственного интеллекта, ставящих медицинские диагнозы, прогнозирующие погоду, проводящие криминалистическую экспертизу. В 1957 г. американский физиолог Розенблатт предложил модель распознавания - перцептрон, - программу, имитирующую распознавание в двух режимах - обучения и распознавания. Сейчас существует много программ обучения распознавания: робот может обучаться распознаванию тактильных, зрительных, слуховых и др. сенсорных ситуаций.
Американский математик Хао Ванг создал интеллектуальную программу, которая за 3 мин вывела 220 простых лемм и теорем, и затем за 8 мин напечатала доказательства еще 130 более сложных теорем. Интересен класс интеллектуальных систем - гироматов, разработанных в Вычислительном центре России академиком Г.С. Поспеловым. Эти системы строят модель, учитывая особенности задачи, и находят решение. Так, управление пропуском судов на шлюзованном участке канала, управление работой морского порта и др. было проведено с использованием гироматов - термин принадлежит польскому писателю-фантасту С. Лему и означает системы, меняющие структуру при изменении условий решаемой задачи. Объединение машин, приборов с ЭВМ - одно из магистральных направлений развития техники в силу процесса микроминиатюризации. Микропроцессор представляет собой электронный мозг ЭВМ - реализованный в виде одного кристалла кремния размерами 4 х 5 х 0,1 мм.
На сегодняшний день в мире существует более 130 млн ЭВМ, 80% которых объединены в малые локальные или глобальные сети Интернет, что дает возможность быстрого обмена информацией между получателями и передачу сообщений - факсов, писем и др. Интернет - огромное пространство, своего рода космос с особой структурой, со своей системой обратной связи, с высокой скоростью обновления. Благодаря сети мы
имеем возможность получать практически любую информацию и отправлять сообщение в любую точку пространства. 5 веков потребовало книгопечатание. Современный компьютер с быстродействием в 1 млрд операций в секунду может иметь память, равную одной тысячной информации, содержащейся на всех полках национальной библиотеки России. Человеческий мозг содержит 240 нейронов, которые соединяют 250 связей. Современная ЭВМ приближается по своим вычислительным возможностям к мозгу.
Современный компьютер может практически все: он пишет музыку и сам ее воспроизводит, создает изображения и редактирует уже готовые, с его помощью создаются клипы, фильмы, мультипликация, он позволяет общаться, передавая звук и изображение. Первые музыкальные компьютеры появились в Японии 10 лет назад, хотя программы алгоритмической композиции используются с 50-х гг. Так, отечественный математик Р. Зарипов сочинял одноголосые музыкальные пьесы на машине «Урал».
С лета 1993 г. композиторы и аранжировщики пользуются компьютерами 1ВМ, снабженными специализированным интерфейсом. Цель музыкальных компьютеров -освободить человека от рутинной работы. Использование же соединенных с ЭВМ синтезаторов позволит моментально услышать будущее произведение. Появилась и компьютерная музыка. Однако полностью исключить композитора из процесса творчества нельзя.
Появилась нежелательная проблема -компьютерный вирус. Это специально написанная небольшая по размерам программа, которая может приписывать себя к другим программам - заражать их. Признаки вируса: некоторые программы начинают работать неправильно, на экран выводятся посторонние сообщения, работа существенно замедляется и т.д. Необходимо использовать программы-детекторы, позволяющие распознавать вирусы и их тела и либо удалять сами вирусы, либо исправлять ошибки, вносимые действиями программ-червей.
В настоящее время проблема диалога человека и компьютера переходит на свою качественно новую ступень. Вопрос об обмене информацией между человеком и компьютером приобретает иной оттенок - до каких пределов можно увеличить скорость обмена. Наиболее актуальными в решении этой проблемы стали достижения программистов в решении задач распознавания и синтеза человеческой речи. Если синтез человеческой речи - задача проблемно-ориентированная и направлена на разработку программного обеспечения для незрячих или слабовидящих пользователей ЭВМ с целью обеспечения их необходимым инструментом для доступа к информации и коммуникационным сетям (сети Интернет, электронная почта, электронные библиотеки и базы данных), то системы распознавания речи открывают широкие горизонты в плане использования их любым человеком, значительно повышая интенсивность обмена информацией между пользователем и персональным компьютером.
Первые программы, преобразующие обычный печатный текст, получаемый либо распознаванием печатного текста с помощью сканера, либо набираемый обычным путем, в человеческий голос, появились давно. В настоящее время их насчитывается уже несколько десятков. Среди областей их применения можно выделить специализированные программы, предназначенные для чтения электронной почты, программы, озвучивающие среды операционных систем для удобства навигации, программы-тесты и обучающие (в основном языковые) программы. Есть и очень компактные по размеру, занимающие объем памяти компьютера, не превышающий нескольких десятков килобайт. Есть и «гиганты», требующие для своего размещения целый компакт-диск, т.е. занимающие около 500 мегабайт памяти. Начинают появляться программы, позволяющие прослушивать текст разными голосами с достаточно хорошим произношением, менять скорость, интонацию и тембр диктора.
Основными проблемами, встающими перед разработчиками голосовых технологий, остаются следующие.
1. Проблема размера речевого модуля, определяющая необходимую конфигурацию компьютера и скорость его работы. Многие разработанные к настоящему времени голосовые модули имеют достаточно приличный размер и значительно сокращают возможности компьютера в решении многозадачности. В частности, конфигурация компьютера Pentium III - 2,2 GHz, позволяющая проводить математические и логические операции со скоростью свыше 1000 млн операций в секунду, обрабатывающая речевым модулем Digalo Russian, разработанным фирмой Digalo (Франция), обычный текст, не позволяет компьютеру в момент обработки речевой информации решать любую другую задачу.
2. Проблема метода разработки голосовых модулей. Воспроизведение речи возможно осуществить несколькими путями. Можно использовать готовые речевые фрагменты, записываемые либо для каждой отдельной буквы, либо для определенной фонемы (набора звуков), либо для целых слов. Здесь обнаруживает себя некоторое неудобство, связанное с громоздкостью такого рода хранения речевой информации. В частности, все, даже фонемные, речевые модули занимают приличный объем памяти, становящийся проблемой при использовании нескольких типов голосов. А с добавлением дополнительных возможностей, таких, как скорость воспроизведения, появляется новая проблема, связанная с автоматическим изменением тембра. Поэтому наиболее предпочтительным на современном этапе разработки модулей text-to-speech является синтез человеческого голоса, который хоть и страдает пока определенными недостатками, большей частью связанными с качеством произношения, но требует гораздо меньшего объема памяти, и связанные с этим преимущества в скорости чтения и возможном изменении тембра голоса до желаемой величины.
3. Проблема метода обработки текстовой информации. Для получения озвученной речи обработка текста протекает в несколько этапов. Первоначально исполняющей программой анализируется тип текстового файла или содержимого буфера обмена, рассчиты-
ваются коды клавиш, соответствующие буквам слов, затем проводится анализ наиболее выгодного обращения программы к голосовому модулю (по фонемам или буквам), и в конечном итоге осуществляется преобразование цифровой информации модуля синтеза в звук устройствами обработки звуковой информации (звуковой картой). Если текстовая информация представлена в графическом режиме, который преимущественно используется в текстовых редакторах Microsoft Office, встает необходимость затрачивать дополнительное время для перекодировки графической информации в текстовую.
4. Проблема качества речевых модулей с учетом специфики языка. Например, одна из многочисленных проблем такого рода - проблема ударений во французском языке, которая решается довольно просто - ударения во французских словах приходятся всегда на последний слог, и необходимо решить только проблему произносимых и непроизносимых окончаний, так как при разработке речевых модулей для русского языка необходима точная простановка ударений, иначе некачественное произношение может сильно ухудшить восприятие. Использование библиотек данных по ударениям могут сильно увеличить объем речевого модуля. Помимо этого встает проблема расстановки ударений в словах, в которых ударения зависят от кон -текста всего предложения или тех или иных речевых оборотов. Например, ударения в конструкциях «бе’лым-бе’лым снегом» и «на улице белы’м-бело». Кроме того, в печатных текстах часто не используется различие между написанием букв «е» и «ё», что при озвучивании дает заметное на слух искажение.
5. Разработка программ, позволяющих человеку «общаться» с компьютером без помощи клавиатуры - проблема распознавания человеческой речи. В настоящее время известна только одна программа, позволяющая судить о состоянии этой проблемы и возможности ее решения - это разработанный в США комплекс программ под названием Dragon Dictate. Программа позволяет человеку надиктовывать тексты и управлять работой компьютерных приложений с помощью микрофона. Идея управления компьютером с
помощью речи возникла еще лет двадцать назад, и современные достижения в развитии компьютерных технологий позволяют постепенно реализовывать некоторые ее идеи. В частности, в последнее время разработаны англоязычные библиотеки, включающие в себя около 300 тысяч слов, которые компьютер может «распознать» с голоса. Здесь обнаруживаются следующие проблемы:
1) проблема неуверенного распознавания, которая заключается в том, что в зависимости от интонации, особенностей произношения, скорости диктовки компьютер оказывается неспособным к уверенному, стопроцентному распознаванию слов. В решении этой проблемы помогают модули программ, осуществляющие слежение за особенностями произношения и при верном распознавании сохраняются в памяти индивидуальные копии произношения слов. К сожалению, такие модули часто не приносят должного результата и процент правильно распознанных слов все равно остается достаточно низким;
2) проблема способа распознавания. Программа Dragon рассчитана на диктовку текста или управление работой системы словами и даже устойчивыми словосочетаниями, что влечет за собой необходимость постоянного расширения словарей, запоминания компьютером слов разной специальной тематики, определенных специфических терминов, которыми пользуется тот или иной специалист при диктовке текстов. А при расширении словарей самой большой проблемой становится необходимость в огромном быстродействии компьютера с целью анализа большого количества баз данных и библиотек образцов произношения слов. Попытки использовать фонемы или слоги для распознавания и надиктовки текста не дают необходимой точности распознавания, поэтому для надиктовки неизвестных слов введена возможность диктовки по буквам, в которой реализуется возможность диктовки по буквам через ключевые слова (альфа, бета и т.д.). Слова с различными, но близкими по звучанию окончаниями практически не различаются при распознавании системой Dragon.
В целом вырисовывается следующая картина: возможность распознавания человеческой речи существует, но необходим иной подход в методике этого распознавания, в частности для русского языка.
Итак, феномен компьютеризации дает реальную возможность преодоления разрыва между двумя культурами: естествознанием и точными науками, с одной стороны, и гуманитарными - с другой. В этом смысле компьютеризация очерчивает контуры науки будущего - «размывание» границ между обособленными ранее культурами, становление
нового стиля мышления, увеличения возможностей развития духовного, интеллектуального мира человека как истинного мерила общественного богатства.
Примечания
1 ВинерН. Кибернетика и общество. М., 1965.
2 Богданов А.А. Всеобщая организационная наука - текто-логия. М., 1925.
3 Винер Н. Указ. соч. С.123.
4 Эшби У.Р. Введение в кибернетику. М., 1959.
5 Казанцева К.В., Урсул А.Д. Отражение, знание, информация // Науч.-техн. информ. Сер.2. 1981. №1. С.6.