Научная статья на тему 'ЭКСПЕРТНЫЕ СПОСОБНОСТИ ЛИНГВИСТИЧЕСКОЙ НЕЙРОСЕТИ'

ЭКСПЕРТНЫЕ СПОСОБНОСТИ ЛИНГВИСТИЧЕСКОЙ НЕЙРОСЕТИ Текст научной статьи по специальности «Философия, этика, религиоведение»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
нейросеть / ChatGPT / наука / искусственный интеллект / язык общения / интуитивное мышление / neural network / ChatGPT / science / artificial intelligence / communication language / intuitive thinking

Аннотация научной статьи по философии, этике, религиоведению, автор научной работы — Ракин Владимир Иванович

Сегодня лингвистические нейросети вторгаются во все сферы деятельности человека, включая и науку, что оценивается в целом положительно, поскольку приносит явный экономический эффект. Согласно популярным прогнозам, уже нынешнее поколение людей столкнётся с появлением продвинутого искусственного интеллекта, развитого на базе линейки языковых нейросетей GPT, во всём превосходящего человеческий разум. Однако эти ожидания, по-видимому, завышены. Главная причина кроется в том, что полем деятельности современных лингвистических моделей искусственного интеллекта является человеческий язык общения, но языки интуитивного мышления, без которых генерация нового знания, очевидно, не происходит, пока не поддаются формализации IT-средствами. Целью работы была оценка экспертных способностей современной нейросети ChatGPT-3.5 в ходе обсуждения явлений разного масштаба: устройство управления наукой и основы современной науки на Западе и в России и проблема обратимости и необратимости времени в физике, преломляющейся в теориях роста кристаллов. Исходно лингвистическая модель направлена на составление максимально ожидаемого суждения. И это качество приводит к эклектичности всей совокупности ответов по широкой теме диалога. Результаты общения с нейросетью по узкоспециальной теме продемонстрировали её неосведомлённость об известной проблеме физики и, что более важно, неспособность к применению её в теории роста кристаллов, в которой эта проблема является ключевой. Увлечение, необоснованный оптимизм или страхи в отношении ИИ, характеризующие настроения современного общества, пока в небольшой степени касаются научной практики, если не считать вреда от непрерывно возрастающего информационного шума, к которому становятся причастны и нейросети.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по философии, этике, религиоведению , автор научной работы — Ракин Владимир Иванович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

KNOWLEDGE-BASED CAPABILITIES OF A LINGUISTIC NEURAL NETWORK

Today, linguistic neural networks are penetrating all spheres of human activity, including science. This fact is generally considered positively, as it yields a clear economic payoff. According to popular predictions, the current generation of people will already face the emergence of advanced artificial intelligence (AI) developed on the basis of the GPT line of linguistic neural networks. They say that AI will surpass the human intelligence in all respects. However, these expectations seem to be inflated. The main reason lies in the fact that the domain of modern linguistic models of artificial intelligence is the language of human communication, but languages of intuitive thinking, without which the generation of new knowledge obviously does not occur, are not yet amenable to formalization by means of information technology. The purpose of the work was to evaluate the knowledge-based capabilities of the modern neural network ChatGPT-3.5 in the course of discussion of phenomena of different scales: the control means and the foundations of modern science in the West and in Russia and the problem of reversibility and irreversibility of time in physics reflected in the theories of crystal growth. Initially, a linguistic model is aimed at making an assertion that is as anticipated as possible. And this feature leads to the eclecticism of the whole set of responses related to the broad theme of a dialog. The results of communication with the neural network on a narrowly specialized topic have demonstrated its ignorance of a well-known physics problem and, more importantly, its inability to apply it to a theory of crystal growth where this problem is the key one. Preoccupations, unreasonable optimism or fears about AI that characterize the moods of contemporary society have so far had little to do with scientific practice, apart from the harm caused by the ever-increasing information noise in which neural networks are becoming involved.

Текст научной работы на тему «ЭКСПЕРТНЫЕ СПОСОБНОСТИ ЛИНГВИСТИЧЕСКОЙ НЕЙРОСЕТИ»

ПЕРСПЕКТИВЫ НАУКИ И ТЕХНОЛОГИЙ

ЭКСПЕРТНЫЕ СПОСОБНОСТИ ЛИНГВИСТИЧЕСКОЙ НЕЙРОСЕТИ

Ракин

Владимир Иванович1

1 Институт геологии имени академика Н. П. Юшкина Коми научного центра Уральского отделения РАН, Сыктывкар, Россия

Для цитирования: Ракин В. И. Экспертные способности лингвистической нейросе-ти // Управление наукой: теория и практика. 2023. Т. 5, № 4. С. 174-187. йО! 10.19181/ smtp.2023.5A10. ЕРЫ ЯММгН!.

АННОТАЦИЯ

Сегодня лингвистические нейросети вторгаются во все сферы деятельности человека, включая и науку, что оценивается в целом положительно, поскольку приносит явный экономический эффект. Согласно популярным прогнозам, уже нынешнее поколение людей столкнётся с появлением продвинутого искусственного интеллекта, развитого на базе линейки языковых нейросетей ОРТ, во всём превосходящего человеческий разум. Однако эти ожидания, по-видимому, завышены. Главная причина кроется в том, что полем деятельности современных лингвистических моделей искусственного интеллекта является человеческий язык общения, но языки интуитивного мышления, без которых генерация нового знания, очевидно, не происходит, пока не поддаются формализации !Т-средствами. Целью работы была оценка экспертных способностей современной нейросети ChatGPT-3.5 в ходе обсуждения явлений разного масштаба: устройство управления наукой и основы современной науки на Западе и в России и проблема обратимости и необратимости времени в физике, преломляющейся в теориях роста кристаллов. Исходно лингвистическая модель направлена на составление максимально ожидаемого суждения. И это качество приводит к эклектичности всей совокупности ответов по широкой теме диалога. Результаты общения с нейросетью по узкоспециальной теме продемонстрировали её неосведомлённость об известной проблеме физики и, что более важно, неспособность к применению её в теории роста кристаллов, в которой эта проблема является ключевой. Увлечение, необоснованный оптимизм или страхи в отношении ИИ, характеризующие настроения современного общества, пока в небольшой степени касаются научной практики, если не считать вреда

от непрерывно возрастающего информационного шума, к которому становятся причастны и нейросети.

КЛЮЧЕВЫЕ СЛОВА:

нейросеть, ChatGPT, наука, искусственный интеллект, язык общения, интуитивное мышление

ВВЕДЕНИЕ

Несомненно, что в управлении наукой важнейшими моментами являются понимание, что собой представляет наука, для чего она нужна и как она вписывается в современную жизнь общества и государства. Из ответов на эти три вопроса следуют цели, задачи и методы государственного управления национальной наукой. Понятно также, что наука отражает деятельность человека, связанную с получением новых фактов о природе и обобщение их в форме нового знания о законах природы, активно использующегося в дальнейшем для улучшения качества жизни людей. Кроме того, присутствует и вторая важная сторона — наука является основой экономической и военной мощи государства. Данный фактор становится особенно важным в условиях конфронтации государств и накладывает особые требования к методам управления национальной наукой.

Сегодня мы являемся свидетелями революционных преобразований в области знания, производственных технологий и многих аспектов жизни человека, обусловленных внедрением так называемого искусственного интеллекта (ИИ). Любой желающий может найти десятки определений искусственного интеллекта. Впервые же оно было сформулировано на конференции в Дартмутском университете (штат Нью-Гемпшир, США) в 1957 г. как «наука о том, как заставить машины делать вещи, которые требуют применения интеллекта, когда их делают люди». Сегодня даже краткое обсуждение этого понятия займёт много места и времени, но эмпирически искусственным интеллектом можно назвать некое устройство, которое способно пройти тест Тьюринга [1].

Обсудим экспертные способности лингвистической нейросети на примере доступной ChatGPT-3.5 (Generative Pre-trained Transformer) в диалогах о сформировавшейся в мире модели гражданской науки как разновидности творческой деятельности человека и об одной из проблем современной физики, преломляющейся в классической теории роста кристалла.

С широким внедрением нейросетей во всех сферах деятельности человека методы управления наукой могут радикально измениться и даже упроститься. Уже сейчас есть свидетельства, что рутинную работу по обработке научного фактического материала, доля которой непрерывно увеличивается, возьмёт на себя специально обученная нейросеть, а человеку достанется только вершина научной деятельности — обобщение, построение гипотез и

и тл о ♦♦

принятие решений. В такой перспективе штат учёных значительно сократит-

ся, но вспомогательные службы научной сферы, без которых материальная основа исследовательского процесса не способна существовать, останутся. Ожидается, что даже на сегодняшнем уровне развития нейросетей наука приобретёт внешние признаки производства, отрасли экономики, и управление такой отраслью вскоре уже не будет вызывать больших организационных проблем.

Автор признаёт, что не является специалистом в области искусственного интеллекта, имеет небольшой опыт общения с нейросетью и выражает субъективное мнение, а возможная ошибочность выводов может нарастать с быстрым развитием технологий ИИ.

CHATGPT О СОВРЕМЕННОЙ МОДЕЛИ НАУЧНЫХ ИССЛЕДОВАНИЙ

В поисках ответа на поставленные в начале статьи вопросы нами был предпринят сеанс общения с языковой моделью ChatGPT-3.5 о существе современной науки и ниже приведены полные ответы трансформера.

1. Каковы основные черты западной парадигмы науки?

Западная научная парадигма имеет несколько основных черт:

1.1. Эмпирический подход: основная идея западной научной парадигмы заключается в том, что научные знания могут быть получены только через опыт, т. е. через наблюдение, эксперимент и измерение. Эти данные затем анализируются и интерпретируются научными методами и теориями.

1.2. Объективность: ещё одной важной чертой западной научной парадигмы является её стремление к объективности. Это означает, что научные исследования должны быть свободны от субъективных мнений и предубеждений, исследователь должен быть объективным наблюдателем и аналитиком.

1.3. Научный метод: научный метод основан на сборе эмпирических данных, построении гипотез и теорий, которые могут быть проверены через эксперименты и дальнейшее наблюдение. Это означает, что научная парадигма полагается на систематическую, рациональную и логическую методологию, основанную на методах математики и логики.

1.4. Наука как процесс: западная научная парадигма интересуется не только результатами научных исследований, но и самим процессом научного исследования. Наука рассматривается как набор итеративных циклов, включающих предпосылки, эксперименты и выводы, которые должны быть проверены и уточнены в последующих исследованиях.

1.5. Критическое мышление: научная парадигма основывается на критическом мышлении, которое подразумевает систематический и критический анализ представляемых доказательств, теорий и гипотез, а также их проверку и принятие или отвержение на основании эмпирических данных.

Эти черты западной научной парадигмы определяют её методологический и философский аспекты, делая её перспективной и эффективной в получении новых знаний и их применении в различных областях.

2. В чем заключаются недостатки западной парадигмы науки?

Как и любая другая парадигма науки, западная научная парадигма имеет свои недостатки. Некоторые из них включают в себя:

2.1. Ограничения области исследований: западная научная парадигма часто ограничивает область исследований только теми вопросами, которые можно рассмотреть с помощью эмпирических данных, что может оставлять много интересных вопросов вне зоны исследований.

2.2. Игнорирование контекста: иногда научная парадигма сосредоточена исключительно на подходе и методах исследований, не учитывая общественные, культурные и исторические контексты, которые оказывают влияние на научные открытия и исследования.

2.3. Излишнее упорство на оценке: сильный уклон к научному доказательству и проверяемости может часто приводить к тому, что многие важные и многообещающие идеи и концепции отвергаются, если они не могут быть легко и непротиворечиво доказаны.

2.4. Конкуренция и жёсткий климат: иногда научные исследования могут стать слишком конкурентоспособными, и учёные могут заниматься большей конкуренцией, а не сотрудничеством и коллективным подходом в научных исследованиях.

2.5. Необходимость финансирования: научные исследования требуют финансирования, что часто приводит к высоким нормам соблюдения и готовности публиковать результаты исследований, а также к неэффективному использованию ресурсов.

Эти и другие недостатки, связанные с западной научной парадигмой, могут привести к ограничению развития научных знаний и инноваций в определённых областях, а также к необходимости более уравновешенных и комплексных подходов в исследованиях.

3. Какие ещё бывают парадигмы науки?

Существует несколько парадигм науки, каждая из которых имеет свои особенности и подходы. Ниже перечислены некоторые из них:

3.1. Позитивизм: позитивистская парадигма науки сосредоточена на объективном и эмпирическом знании, которое может быть обнаружено и подтверждено через наблюдение, эксперименты и замеры. Она полагает, что научный метод должен быть применён к реальному миру и что наука может дать ответы на все вопросы.

3.2. Гуманитаризм: гуманитаристская парадигма фокусируется на человеческой природе и социальных отношениях. Она полагает, что каждый человек имеет уникальный опыт и понимание мира, которые должны быть учётом при исследовании социальных явлений.

3.3. Конструктивизм: конструктивистская парадигма науки подчёркивает связь между конструкцией нашего понимания мира и знаний,

которые мы обнаруживаем. Она полагает, что знания не являются истинными или ложными, а являются результатом конструктивного и социального процесса создания знаний.

3.4. Постмодернизм: постмодернистская парадигма науки полагает, что наука никогда не может достичь объективной истины и что все знания являются контекстуальными. Она полагает, что знания являются результатом социального и политического влияния научных практик и исследований.

3.5. Феминистская: феминистская парадигма науки сосредоточена на женской и гендерной перспективе в исследовании явлений, а также на широкой культурном и социальном контексте, в котором происходят исследования. Она полагает, что наука должна учитывать и женское знание и опыт, чтобы процветать и более точно отражать мир.

Это некоторые из парадигм науки, имеющие свойственные им особенности в выполнении научных исследований. Каждая парадигма имеет свой вклад в развитие науки и обеспечение прогресса в различных областях научных знаний.

Приведённые ответы, на наш взгляд, обладают элементами оригинальности и ожидаемо отсылают читателя к гносеологическим корням науки. Они подтверждают, что коллектив компании OpenAI проделал огромную работу по совершенствованию лингвистической нейросети, которая уже вполне способна пройти тест Тьюринга [1]. Тест представляет собой сеанс слепого общения с машиной, в результате которого человек будет не способен отличить её от живого собеседника. Можно заметить, что приведённый выше текст демонстрирует мировоззрение нескольких десятков экспертов (преимущественно граждан Сан-Франциско), на умонастроениях которых тренировалась данная нейросеть.

Создаётся внешнее впечатление полноценного интервью с хорошо продуманными и краткими формулировками. Это, вероятно, следует из того обстоятельства, что одной из заложенных авторами целей нейросети является её обучение и форма беседы является наиболее удачным для этого форматом. Однако некоторая эклектичность тезисов побуждает к дальнейшему, развёрнутому диалогу. При этом каждый изложенный тезис вызывает новые вопросы, которые уводят от темы беседы.

В итоге можно прийти к заключению, что российская наука приобрела признаки так называемого «западного» стиля научных исследований. Но закономерно появляются новые вопросы к трансформеру и вот его ответы:

4. Как рационально управлять наукой в России?

Управление наукой в России - это сложный процесс, требующий множества различных мер и подходов. Вот несколько рациональных способов управления наукой в России:

4.1. Финансирование научных исследований: чтобы развивать научные исследования в России, необходимо обеспечивать адекватное финан-

сирование научных институтов, университетов, лабораторий и учёных.

4.2. Привлечение талантливых учёных и исследователей: Россия должна предоставить достаточные возможности для привлечения талантливых учёных и исследователей. Это может быть достигнуто путём создания специальных программ, грантов и стипендий.

4.3. Развитие научно-технического образования: важно развивать научно-техническое образование в России, создавать условия для того, чтобы молодые люди получили необходимые знания и навыки для работы в научных областях.

4.4. Укрепление международного сотрудничества: международное сотрудничество может дать России возможность отправить своих учёных на совместные исследования с зарубежными коллегами, что приведёт к новым открытиям и позволит российской науке стать более конкурентоспособной на мировой арене.

4.5. Содействие коммерциализации научных исследований: важно поощрять коммерциализацию научных исследований в России и создавать условия для коммерческих инноваций, таких как создание новых технологий и продуктов на основе научных открытий.

Эти подходы могут помочь развить науку в России и создать условия для достижения новых научных открытий и инноваций.

5. Как организовать открытую науку в обстановке конфронтации государств?

Организация открытой науки в условиях конфронтации государств может быть сложной и требующей осторожности, но это не значит, что это невозможно. Некоторые из предложенных ниже шагов могут помочь в этом процессе:

5.1. Начните с того, чтобы определить общие научные вопросы, с которыми сталкиваются государства. Ключевым элементом является конструктивность и поиск общих интересов между странами.

5.2. Будьте открыты для сотрудничества и установления новых научных контактов с другими странами. Для этого можно использовать различные каналы, включая научные конференции, форумы, университеты и т. д.

5.3. Используйте различные модели финансирования научных исследований, в том числе грантовую и контрактную систему, чтобы привлечь исследователей из стран-конкурентов.

5.4. Продвигайте открытость в научных исследованиях путём обмена результатами и проведением совместных проектов.

5.5. Разрабатывайте регулярные мероприятия, такие как симпозиумы и конференции, чтобы облегчить общение между исследователями.

5.6. Стремитесь к созданию нейтральных научных институтов, которые не будут связываться с конкретными государственными интересами.

Но, несмотря на все усилия, создание открытой науки может встретить на своём пути множество препятствий, связанных с политическими и экономическими ограничениями, а также социально-культурными различиями между странами.

К сожалению, ответы ChatGPT на вторую группу вопросов полностью разочаровывают и подтверждают подозрение, что нейросеть ориентировалась на так называемую открытую науку, без учёта национальных особенностей и интересов государства, в рамках которого работают учёные, а структура лингвистической модели, базирующаяся на расчёте вероятностных характеристик сочетаний слов и фраз, в конструируемом ответе направлена на составление наиболее вероятного (максимально ожидаемого) суждения.

В результате трансформер оказался неспособным предложить новые идеи

w м ТЛ

по совершенствованию методов управления отечественной наукой. В научной политике нашего государства необходимы перемены, но мнение западной общественности, включая и научную, отражённое в приведённых выше ответах лингвистической нейросети, нельзя считать удовлетворительным.

Однако, как утверждают представители IT-сообщества, нейросеть способна помочь человеку в более глубоком понимании обсуждаемой проблемы. Такие, пока явно завышенные ожидания к действующим языковым моделям, отождествляемым с ИИ, со стороны общества активно подогреваются самими разработчиками. Ярким примером является интервью Сэма Альтмана, генерального директора фирмы OpenAI, разработчика линейки лингвистических моделей GPT1. В беседе с журналистом С. Альтман выразил глубокое восхищение продуктом своей компании, неоднократно подчёркивая полное непонимание программистами логики в принятии решения нейросетью, полностью в духе эмоционального высказывания Алана Тьюринга [1]: «Machines take me by surprise with great frequency. This is largely because I do not do sufficient calculation to decide what to expect them to do»2. Непонимание логики ответов обучающейся нейросети, как признают специалисты, возникло с момента разработки архитектуры трансформера. При этом разработчикам вполне понятны составляющие языковую модель алгоритмы так называемого внимания, глубокого обучения трансформера (архитектура «энкодер-де-кодер») как базовые составляющие современных нейронных сетей, позволяющие осуществлять параллельный счёт и ускоряющие процесс общения с человеком [2-4].

Отмеченное противоречие создало иррациональную убеждённость большинства программистов, участвующих в проектах разработки лингвистических моделей, и вслед на ними многих обладающих властью людей в том, что вкладывание средств в развитие нейросетевых технологий уже в ближайшем будущем приведёт к появлению продвинутого ИИ — искусственного разума (ИР), во всём без исключения превосходящего человеческий разум. Заметим,

1 Будущее ИИ и СЬ^ОРТ: Интервью с Сэмом Альтманом, генеральным директором ОрепА! // УоиТиЬе: [сайт]. иЯ1_: 1Шр8://уоиШЬе.сот/\«а^11?у=аиг07СсСп\«М (дата обращения: 29.09.2023).

2 Пер.: «Машины очень часто застают меня врасплох. В основном потому, что я не делаю достаточных расчётов, чтобы решить, чего от них ожидать» (пер. наш. - В. Р.).

что такой продвинутый ИИ сегодня связывают с продолжением развития линейки ОРТ, в основе которого лежат линейные матричные преобразования чисел — математических образов слов, плохо обоснованный искусственный элемент нелинейной связи между числами и статистический расчёт коэффициентов корреляции для переменных начального и конечного вектора по многократно повторяемому алгоритму «предсказал-проверил».

Именно на этой вере базируется известный страх перед ИР и, в частности, идея, озвученная С. Альтманом, что многие области интеллектуальной деятельности человека, включая и фундаментальную науку, вскоре будут отданы искусственному разуму.

Последний тезис набирает особую популярность сегодня и проникает в сферу управления наукой. Если создание ИР произойдёт в ближайшее десятилетие, то проблема управления наукой радикально упростится. Останется только подождать до её естественного разрешения, но неизвестно, насколько далеко человечество находится от этого события.

CHATGPT КАК ТЕКСТОВЫЙ СЛЕПОК С НАКОПЛЕННОГО ЗНАНИЯ, ПРЕДСТАВЛЕННОГО В МИРОВОЙ СЕТИ

Нами была предпринята попытка общения с трансформером СИаШРТ-3.5 на специальную тему, связанную с дислокационной теорией роста кристаллов. Остановимся на одном из аспектов диалога, состоявшегося в апреле 2023 г. Дата здесь имеет значение, поскольку нейросеть представляет собой, по уверениям разработчиков, непрерывно и быстро обучающуюся модель в реальном времени.

Поясним, что фундаментальная работа по механизму дислокационного роста кристалла была опубликована в 1951 г. [5], и с тех пор каждые десять лет в научной литературе появлялась статья, подчёркивающая основополагающее значение этой работы для физики роста кристалла [6]. Однако недавно появилось сомнение в строгости вывода уравнений теории [7]. Было замечено, что переменная времени в неравновесной теории дислокационного роста введена некорректно. Время было преобразовано авторами из так называемого частотного фактора, который является энергетической характеристикой устойчивого теплового состояния равновесной термодинамической системы. Но при описании состояния равновесия переменная времени, как известно, исключается согласно теореме Лиувилля. Кроме того, уравнения классической дислокационной теории [5] одновременно базировались на динамике Ньютона, в которой время обладает свойством обратимости, и неравновесной термодинамике с необратимым временем в ней.

Заметим, что проблема перехода от обратимого времени к необратимому, так называемая Н-теорема Больцмана, до настоящего времени остаётся не доказанной. Эти противоречивые свойства времени в классической механике и термодинамике были известны ещё в начале XX века и осознаны как одна из проблем физики к началу 50-х годов [8]. В научной литературе под автор-

ством выдающихся учёных, включая и нобелевских лауреатов (А. Д. Сахаров, И. Р. Пригожин), проблема времени и переходы между соответствующими разделами физики обсуждалась неоднократно все последние 70 лет.

Поэтому ожидалось, что нейросеть продемонстрирует знакомство с этой фундаментальной областью физики, что неизбежно скажется на описании дислокационного роста, теория которого охватывает широчайший круг явлений от динамики движения отдельных атомов (строительных частиц) по грани растущего кристалла до термодинамических закономерностей процесса формирования макроскопического кристалла-многогранника.

Однако ответы лингвистической нейросети вновь разочаровали. После серии наводящих вопросов стало понятно, что нейросеть конструирует «усреднённое» и противоречивое представление о росте кристалла. Создалось впечатление, что сгенерированные трансформером тексты опирались на научные знания конца XIX века, когда атомное строение вещества оставалось ещё гипотезой. Здесь следует заметить, что в учебной литературе обычно изложены представления, характерные для начала XX века, среди которых редко можно встретить упоминание о достижениях неравновесной термодинамики, развитые только к середине века и имеющие непосредственное отношение к кристаллизации как химическому процессу.

Таким образом, беспомощность СИа1ОРТ-3.5 в обсуждаемом вопросе стала очевидной. Можно попытаться оправдать отрицательный результат нашего общения узкой специализированной темой беседы. Реальную помощь от нейросетевой модели сегодня, как утверждают, можно получить только после её массированного тренинга, для этого нужны время и целенаправленные действия корпуса программистов и экспертов. Это подтверждает практика использования нейросетей в медицине. Таким же образом активно развиваются компетенции нейросетей в области обработки изображений, звука, текстов, видео и зашифрованных сообщений. Однако перечисленное не исчерпывает творческие возможности человека, занятого научными исследованиями, и пока не даёт основание считать лингвистические нейросети полноценным искусственным интеллектом, способным стать источником нового знания о природе.

Но проблема представляется нам не только в недостаточной обученности нейросетей, но и другом:

1. Основная часть отечественных исследователей, для которых наука стала ремеслом, а не увлечением всей жизни [9], начинают активно использовать нейросети для производства всё возрастающего вала публикаций. Сегодня нейросети вполне обоснованно подозреваются в создании наукообразных текстов по желаниям заказчиков, которые злоупотребляют доверием учёных. Поэтому в последние два года вполне надёжно отмечается новый феномен — поиск достоверной информации в Интернете вызывает всё большие трудности3. В результате сформировалась новая задача для нейросетей по фильтрации недостоверных сообщений в научной литературе, с которыми человек уже не способен

3 Понизовкина Е. Вектор интеллекта // Наука Урала. 2023. № 9-10. С. 6.

самостоятельно справиться. В такой обстановке экспертное заключение языковой модели резко обесценивается.

2. Главное свойство лингвистической нейросети — создание слепка с коллективного человеческого разума, запечатлённого в Интернете. Рассмотрим для примера гипотетический случай. Если в 1915 году

Х О О « «

существовал бы современный вариант нейросетевой модели и ей была бы поставлена задача оценить будущее Общей теории относительности А. Эйнштейна, результат, вполне вероятно, мог бы оказаться отрицательным. И не только по той причине, что языковая модель по определению не специализируется на новейшей математике и может только опираться на знания среднестатистического учёного, но и по ряду иных причин, среди которых на первом месте стоит выбор Эйнштейном двух основополагающих и крайне неочевидных принципов: тождественности гравитационной и инерционной масс и постоянства скорости света в любой физической системе, из которых следует парадоксальный вывод, что гравитацию саму по себе можно не считать физической силой. В разработанной А. Эйнштейном теории произошло соединение двух различных стилей интуитивного физического и математического мышления и зародились новые концептуальные понятия, неожиданные для научного сообщества начала XX века. В такой ситуации нейросе-тевые модели, построенные согласно лингвистическому алгоритму, не способны установить надёжные связи между общепринятыми в науке понятиями с новыми категориями.

3. В современной науке, весьма сложной и разветвлённой, чем дальше мы находимся от точных наук, тем больше встречается различных подходов в исследованиях и больше новых смыслов вносится в общеупо-требимые понятия. Это, с одной стороны, привносит новую окраску в предмет исследования и требует творческого переосмысления известного понятия, но, с другой стороны — и создаёт сложности для анализа лингвистической нейросети, что усиливает некритическую оценку многих понятий. В такой ситуации безаппеляционность заключений, сгенерированных лингвистической моделью, способна легко обмануть ожидания исследователя.

ЗАКЛЮЧЕНИЕ

Широкое использование лингвистических нейросетей и ChatGPT, в частности, имеет безусловную пользу как языкового посредника, переводчика и при должной тренировке — как помощника и даже творческого партнёра. Заметим, что программирование тоже представляет собой перевод некоторого текста с «человеческого» языка на «машинный» и поэтому неудивительно, что профессия программиста рискует в скором времени радикально измениться в нечто качественно иное, но, вероятно, не исчезнет.

На наш взгляд, следует крайне осторожно относиться к нейросетям как «экспертам». Нельзя гарантировать, что в конкретном узком вопросе ней-росеть уже обладает достаточным объёмом тренировки и довериться её советам. На наш взгляд, крайне опасно поручать лингвистической модели составлять даже краткий обзор текущего уровня знаний по интересующей научной проблеме. В узкой научной сфере исследователям остро необходимы различные «сумасшедшие» идеи, а языковая нейросеть в лучшем случае будет демонстрировать традиционные решения и игнорировать новое рациональное зерно, не принимая в расчёт стиль и логику мышления отдельного исследователя.

История науки показывает, что прорывная научная идея является продуктом мыслительного процесса, как правило, одного человека и для этого совсем не обязательно опираться на весь багаж добытого человечеством научного знания даже в актуальной области науки. Поэтому вероятность отклонения новой идеи усредняющим алгоритмом расчёта языковой модели ИИ будет весьма велика. Только ИР, построенный на иных принципах, вероятно, сможет обладать необходимым качеством.

Ряд исследователей считает, что проблема разума лежит в аналоговом принципе работы человеческого мозга. Но это, видимо, ошибочное суждение. Например, в теории детерминированного хаоса качественный переход от одного поведения системы к другому с успехом демонстрируется на любом цифровом устройстве и даже калькуляторе. Только сходимость к аттрактору будет зависеть от точности расчётов (разрядов используемых чисел) и величины отклонения от точки бифуркации.

Увлечение, необоснованный оптимизм или страхи в отношении ИИ характеризуют настроения современного общества, однако они только в небольшой степени касаются научной практики. Угрозы для науки со стороны действующих моделей ИИ, на наш взгляд, пока не критичны, если не считать вреда от непрерывно возрастающего информационного шума, к которому становятся причастны и нейросети.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Существенную помощь лингвистические нейросети могут оказать при обработке больших данных по узкоспециальным направлениям науки. Причём такого рода работа характеризует только начальный этап исследований - накопление результатов наблюдений на однородном поле опыта. Логический вывод, не статистическое, но творческое обобщение и создание теории нового явления пока не подвластны алгоритму языковой нейросети. Полем деятельности современных моделей искусственного интеллекта остаётся язык общения как операционная система человеческой культуры. Но развитие наук и особенно естественных наук, по-видимому, тесно связано с развитием не обычного, а математического и физического интуитивного мышления, тоже представляющих своеобразные языки человеческой культуры, которые развиваются непредсказуемо, пока существует научный прогресс.

Нет точного определения разума, и, вероятно, одной из причин этого является тот факт, что механизм выражения разумного суждения не принимает единственную доступную всем форму языка общения людей. Человеческий разум использует множество «языков», не ясно осознаваемых, но в конеч-

ном итоге всегда трансформирует результат размышлений в язык общения. Манипулирование только словами, взятыми из языка общения людей, будет всегда оставаться имитацией разумной деятельности. Механизмы функционирования упомянутых скрытых языков мышления, по-видимому, пока неизвестны. Поэтому идея замены учёного в ближайшей перспективе искусственным интеллектом утопична, как и наши ожидания, связанные с рекомендациями языковой нейросети по методам управления национальной наукой.

СПИСОК ИСТОЧНИКОВ

1. Turing A. M. Computing machinery and intelligence // Mind. 1950. Vol. 59, № 36. P. 433-460.

2. Attention is all you need / A. Vaswani, N. Shazeer, N. Parmar [et al.] // ArXiv. org : [сайт]. 2023. August 2. URL: https://arxiv.org/abs/1706.03762 (дата обращения: 16.08.2023). arXiv 1706.03762v7. DOI 10.48550/arXiv.1706.03762.

3. Sutskever I., Vinyals O., Le Q. V. Sequence to sequence learning with neural networks // ArXiv.org : [сайт]. 2014. December 14. URL: https://arxiv.org/abs/1409.3215 (дата обращения: 16.08.2023). arXiv 1409.3215v3. DOI 10.48550/arXiv.1409.3215.

4. BERT: Pre-training of deep bidirectional transformers for language understanding / J. Devlin, M.-W. Chang, K. Lee, K. Toutanova // ArXiv.org : [сайт]. 2019. May 24. URL: https://arxiv.org/abs/1810.04805 (дата обращения: 11.08.2023). arXiv 1810.04805v2. DOI 10.48550/arXiv.1810.04805.

5. Burton W. K., Cabrera N., Frank F. C. The growth of crystals and the equilibrium structure of their surfaces // Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences. 1951. Vol. 243, № 866. P. 299-358. DOI 10.1098/rsta.1951.0006.

6. Woodruff D. P. How does your crystal grow? A commentary on Burton, Cabrera and Frank (1951) 'The growth of crystals and the equilibrium structure of their surfaces'// Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences. 2015. Vol. 373, № 2039. DOI 10.1098/rsta.2014.0230.

7. Rakin V. I. Time in crystal growth theory and the correspondence principle in thermodynamics // Crystallography Reports. 2022. Vol. 67, № 2. P. 294-300. DOI 10.1134/ S1063774522020122.

8. Кэррол Ш. Вечность. В поисках окончательной теории времени / пер. с англ. Е. Шикаревой. СПб. : Питер, 2016. 512 с.

9. Гусев А. Б., Юревич М. А. Научная политика России - 2021 / А. Б. Гусев, М. А. Юревич. М. : Буки Веди, 2021. 96 с.

Статья поступила в редакцию 29.08.2023.

Одобрена после рецензирования 22.09.2023. Принята к публикации 05.10.2023.

СВЕДЕНИЯ ОБ АВТОРЕ

Ракин Владимир Иванович [email protected]

Доктор геолого-минералогических наук, главный научный сотрудник, Институт геологии имени академика Н. П. Юшкина Коми научного центра Уральского отделения РАН, Сыктывкар, Россия Аи^огЮ РИНЦ: 55947 ОЯСЮ: 0000-0001-8085-8733

DOI: 10.19181/smtp.2023.5.4.10

KNOWLEDGE-BASED CAPABILITIES OF A LINGUISTIC NEURAL NETWORK

Vladimir I. Rakin1

1 Institute of Geology, Komi Science Center, Ural Branch of the RAS, Syktyvkar, Russia

For citation: Rakin, V. I. (2023). Knowledge-based capabilities of a linguistic neural network. Science Management: Theory and Practice. Vol. 5, no. 4. P. 174-187. (In Russ.). DOI 10.19181/ smtp.2023.5.4.10.

Abstract. Today, linguistic neural networks are penetrating all spheres of human activity, including science. This fact is generally considered positively, as it yields a clear economic payoff. According to popular predictions, the current generation of people will already face the emergence of advanced artificial intelligence (AI) developed on the basis of the GPT line of linguistic neural networks. They say that AI will surpass the human intelligence in all respects. However, these expectations seem to be inflated. The main reason lies in the fact that the domain of modern linguistic models of artificial intelligence is the language of human communication, but languages of intuitive thinking, without which the generation of new knowledge obviously does not occur, are not yet amenable to formalization by means of information technology. The purpose of the work was to evaluate the knowledge-based capabilities of the modern neural network ChatGPT-3.5 in the course of discussion of phenomena of different scales: the control means and the foundations of modern science in the West and in Russia and the problem of reversibility and irreversibility of time in physics reflected in the theories of crystal growth. Initially, a linguistic model is aimed at making an assertion that is as anticipated as possible. And this feature leads to the eclecticism of the whole set of responses related to the broad theme of a dialog. The results of communication with the neural network on a narrowly specialized topic have demonstrated its ignorance of a well-known physics problem and, more importantly, its inability to apply it to a theory of crystal growth where this problem is the key one. Preoccupations, unreasonable optimism or fears about AI that characterize the moods of contemporary society have so far had little to do with scientific practice, apart from the harm caused by the ever-increasing information noise in which neural networks are becoming involved.

Keywords: neural network, ChatGPT, science, artificial intelligence, communication language, intuitive thinking

REFERENCES

1. Turing, A. M. (1950). Computing machinery and intelligence. Mind. Vol. 59, no. 236. P. 433-460.

2. Attention is all you need / A. Vaswani, N. Shazeer, N. Parmar [et al.]. ArXiv.org, August 2. Available at: https://arxiv.org/abs/1706.03762 (accessed: 16.08.2023). arX-iv 1706.03762v7. DOI 10.48550/arXiv.1706.03762.

3. Sutskever, I., Vinyals, O. and Le, Q. V. (2014). Sequence to sequence learning with neural networks. ArXiv.org, December 14. Available at: https://arxiv.org/abs/1409.3215 (accessed: 16.08.2023). arXiv 1409.3215v3. DOI 10.48550/arXiv.1409.3215.

4. Devlin, J., Chang, M.-W., Lee, K. and Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. ArXiv.org, May 24. Available at: https://arxiv.org/abs/1810.04805 (accessed: 11.08.2023). arXiv 1810.04805v2. DOI 10.48550/arXiv.1810.04805.

5. Burton, W. K., Cabrera, N. and Frank, F. C. (1951). The growth of crystals and the equilibrium structure of their surfaces. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences. Vol. 243, no. 866. P. 299-358. DOI 10.1098/rsta.1951.0006.

6. Woodruff, D. P. (2015). How does your crystal grow? A commentary on Burton, Cabrera and Frank (1951) 'The growth of crystals and the equilibrium structure of their surfaces'. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences. Vol. 373, no. 2039. DOI 10.1098/rsta.2014.0230.

7. Rakin, V. I. (2022). Time in crystal growth theory and the correspondence principle in thermodynamics. Crystallography Reports. Vol. 67, no. 2. P. 294-300. DOI 10.1134/ S1063774522020122.

8. Carroll, S. (2016). From eternity to here. The quest for the ultimate theory of time [Russ. ed.: Vechnost'. V poiskakh okonchatel'noi teorii vremeni] / transl. from English by E. Shikareva. St. Petersburg : Piter. 512 p. (In Russ.).

9. Gusev, A. B. and Yurevich, M. A. (2021). Nauchnaya politika Rossii - 2021 [Scientific policy of Russia, 2021]. Moscow : Buki Vedi. 96 p. (In Russ.).

The article was submitted on 29.08.2023.

Approved after reviewing on 22.09.2023. Accepted for publication on 05.10.2023.

INFORMATION ABOUT THE AUTHOR Vladimir I. Rakin [email protected]

Doctor of Geology and Mineralogy, Chief Researcher, Institute of Geology, Komi Science Center, Ural Branch of the RAS, Syktyvkar, Russia

AuthorlD RSCI: 55947

ORCID: 0000-0001-8085-8733

i Надоели баннеры? Вы всегда можете отключить рекламу.