Интернет-журнал «Науковедение» ISSN 2223-5167 http ://naukovedenie.ru/
Том 9, №2 (2017) http://naukovedenie.ru/vol9-2.php
URL статьи: http://naukovedenie.ru/PDF/38TVN217.pdf
Статья опубликована 16.05.2017
Ссылка для цитирования этой статьи:
Джабраилов Ш.В., Розалиев В.Л., Орлова Ю.А. Подходы и реализации компьютерной имитации интуиции // Интернет-журнал «НАУКОВЕДЕНИЕ» Том 9, №2 (2017) http://naukovedenie.ru/PDF/38TVN217.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ.
УДК 004.85
Джабраилов Шабан Вагиф оглы
ФГБОУ ВО «Волгоградский государственный технический университет», Россия, Волгоград1
Магистрант E-mail: shaban-dzhabrailov@mail.ru
Розалиев Владимир Леонидович
ФГБОУ ВО «Волгоградский государственный технический университет», Россия, Волгоград
Кандидат технических наук, доцент E-mail: vladimir.rozaliev@gmail.com SCOPUS: http ://www. scopus.com/authid/detail.url?authorId=55913866400
Орлова Юлия Александровна
ФГБОУ ВО «Волгоградский государственный технический университет», Россия, Волгоград
Кандидат технических наук, доцент E-mail: yulia.orlova@gmail.com SCOPUS: http://www.scopus.com/authid/detail.url?authorId=55912557400
Подходы и реализации компьютерной имитации интуиции
Аннотация. Актуальность создания систем, моделирующих интуицию, в настоящее время связана с тем, что люди активно используют интуицию в различных сферах своей жизнедеятельности: творческой, научной, в принятии стратегических решений в бизнесе, или любом другом виде деятельности, на первый взгляд, не имеющем к ней никакого отношения. Примерами разнородного ее применения могут служить: постановка врачом предварительного диагноза, прогнозирование ситуации на рынке ценных бумаг, создание произведений искусства.
Проблема решения задач с помощью искусственного интеллекта и приближение интуиции программного обеспечения максимально близко к естественной интуиции человека актуальна в современном мире.
Для решения задач, связанных с искусственным интеллектом и интуицией, чаще всего выбирается нейрокибернетический подход. В статье рассмотрены подходы к имитации интуиции, проведен сравнительный анализ подходов по выделенным критериям и сформулированы выводы наилучшего подхода. Автором представлено программное решение AlphaGo, основанное на нейрокибернетическом подходе, описана архитектура, возможности, графики силы и точности стратегических и оценочных сетей, результаты работы интеллектуальной игровой системы.
1 400012, г. Волгоград, ул. Рокоссовского 50, к. 484
Так же предложена модель интуитивного прогнозирования временного ряда, основанная комбинированием сверточной и рекуррентной нейронных сетей, описаны входные данные и их семантика.
Так же предложена модель интуитивного прогнозирования временного ряда, основанная комбинированием сверточной и рекуррентной нейронных сетей, описаны входные данные и их семантика.
Ключевые слова: компьютерная имитация интуиции; глубинное обучение; машинное обучение; искусственный интеллект; сверточные нейронные сети; рекуррентные нейронные сети
1. Введение
Способы компьютерной имитации процессов человеческого мозга актуальны с начала информационной эры. Основоположники кибернетики и искусственного интеллекта Норберт Винер и Франк Розенблатт занимались исследованиями биологических нейронов. Результатом работ ученых стала теория обучения сетей перцептронов Розенблатта и идея обучения автоматов Винера. Итоги исследований ученых стали начальным этапом в создании искусственных нейронных сетей.
Использование искусственных нейронных сетей в современных компьютерных устройствах актуально не только направлении интуитивного принятия решения, но и в направлениях распознавания образов, классификации, прогнозирования, кластеризации, аппроксимации, сжатии данных, оптимизации, анализе данных [1, 2, 3].
В последние годы большое количество исследований искусственного интеллекта, интуиции связано с нейронными сетями, нечеткой логикой и моделированием семантики [4, 5, 6]. Для компьютерной имитации интуитивного принятия решений удобны нейроморфические вычислительные устройства: нейрокомпьютеры и программные имитаторы. В связи с данным фактом активно создаются нейроподобные вычислительные устройства с неклассической архитектурой фон Неймана и большое количество программных реализаций нейронных сетей, используемых для разного типа задач. Например, для распознавания и классификации образов используют перцептрон, сети адаптивного резонанса, сверточные сети, а для прогнозирования используют сети радиально-базисных функций, рекурентные сети. Программные реализации нейронных сетей развивались намного быстрее, так как их создание было проще, дешевле и гибкая к изменению архитектуры, чем их аппаратная реализация.
Адаптивные программные обеспечения, нейроморфические устройства в комбинации с алгоритмами искусственного интеллекта, основанные на методах машинного обучения, демонстрируют поведение, имитирующее принципы функционирования мозга человека. Они создают знания из входных данных без логической формализации методов и условий получения результата, по этой причине это знание представляется пользователю как «интуиция нейронной сети». Выявления интуиции нейронной сети, были зафиксированы при решении задачи диагностики авиационных двигателей [7, 8].
В данной статье будут рассмотрены основные подходы к имитации интуиции, модели и реализации систем, имитирующих процесс интуитивного принятия решений. Будет предложена модель нейронной сети для интуитивного принятия решения.
2. Подходы к имитации интуиции 2.1. Нейрокибернетический подход
Нейрокибернетика комбинирует научные методы психологии, биологии и информатики, что максимально близко может описать принципы мышления.
Такой подход основан на создании адаптивных систем, состоящих из большого количества элементов, функциональность которых идентична нейронам головного мозга, которые связаны и взаимодействуют между собой.
Основная идея этого подхода состоит в том, что единственный объект, который может мыслить - это мозг, поэтому любые устройства, воспроизводящие процессы мышления должны быть максимально близки к его структуре [9].
В настоящее время известные поисковые системы пользуются данным подходом для различных задач классификации, прогнозирования и созданные ими системы активно используются.
Исходя из вышесказанного, можно сделать вывод, что нейрокибернетика ориентирована на моделирование программных и аппаратных устройств, структура которых максимально идентична структуре мозга, но реализация таких устройств, усложняется недостаточностью информации о всех процессах участвующий в принятии решении, но в настоящее время уже созданы нейрочипы, количество нейронов в которых, достигает одного миллиона.
На сегодняшний день ни один суперкомпьютер не может сравниться с мощностью головного мозга. Поэтому одним из направлений, над которым работают ученые и инженеры -создание электронных аналогов головного мозга. Наибольших результатов достигла компания IBM, представив первый нейросинаптический процессор TrueNorth, который может стать основой кардинальных изменений, в будущем способных затронуть многие стороны жизни, начиная от смартфонов и заканчивая автомобилями-роботами. Процессор спроектирован на основе асинхронной технологии, разработанной в университете Корнелл, и использует объектно-ориентрованный язык программирования Corelet. На рисунке 1 представлена архитектура чипа.
TrueNorth состоит из 1 миллиона программируемых нейронов и 256 миллиона программируемых синапсов, обеспечивающих передачу сигналов между нейронами [10]. Эти составляющие организованы в 4096 нейросинаптических вычислительных ядер, состоящих из вычислительных и коммуникационных модулей и памяти. Подобно различным участкам головного мозга, ядра способны работать параллельно. Данная архитектура позволяет одновременно передавать инструкции и оперативные данные по одному и тому же пути. Так же присутствует возможность моделирования 256 нейронов с тактовой частотой 1000 Гц.
Логический подход, в отличие от нейрокибернетического, не имитирует процессы, происходящие в мозге. В системах с искусственным интеллектом, построенных на основе данного подхода, применяются эмпирические приемы (эвристики, аксиомы, логические правила) получения новых знаний.
Представленный подход применяется для реализации систем с логическими моделями баз знаний, основываясь на языке предикатов. Большинство систем, построенных c применением логического принципа, представляют собой вычислительные устройства для доказательств теорем. В таких устройствах в специальном блоке формируется цель, которую система пытается доказать как теорему. Если цель доказана, то по набору примененных правил можно получить последовательность действий, необходимых для реализации поставленной цели.
Рисунок 1. Архитектура ТгивЫвМИ (источник: http://www.research.ibm.com/articles/brain-chip.shtml)
2.2. Логический подход
Логический подход основан на выявлении и применении в интеллектуальных системах различных логических и эмпирических приемов (эвристик), которые применяет человек для решения каких-либо задач [11].
Последователи данного подхода аргументируют его тем, что человек не обязан полностью следовать природе в своих научных, технологических изысканиях, так как, например, даже пограничные науки о человеке до сих пор не могут объяснить устройство памяти человека, формирование и протекание его мыслительных процессов, его познавание окружающего мира.
Данное направление искусственного интеллекта большей частью было нацелено на поиск алгоритмов решения интеллектуальных задач на уже существующих моделях компьютеров. Одной из самых первых программ, реализованной на данном подходе, стала «Логик-теоретик», которая смогла автоматически доказать 38 законов из книги Рассела и Уайтхеда «Принципы математики» посредством символьной логики [12].
2.3. Сравнение подходов компьютерной имитации интуиции
Для сравнения подходов выбрано несколько критериев:
1. Сложность системы - представляет сложность систем, реализованных с помощью одного из подходов. Возможность легкого понимания принципа работы системы.
2. Отображение процесса принятия решения - возможность описания процесса принятия решения в естественном или формализованном виде.
3. Трудность реализации адекватного поведения программы в условиях неопределенности (недостаточности, зашумленности входной информации, не точно поставленной цели).
4. Однозначность поведения в одинаковых ситуациях - должен быть одинаковый результат системы в одинаковых ситуациях.
5. Эффективность при распараллеливании задач.
6. Комбинаторный взрыв - быстрое возрастание сложности решения задачи с увеличением числа принимаемых во внимание комбинаций.
7. Универсальность - возможность динамичности или адаптации под другие задачи, путем задания не значительных алгоритмов.
Таблица
Анализ подходов по критериям (разработано автором)
~~————^^^^^ Подходы Критерии " ————____ 1 2 3 4 5 6 7
Нейрокибернетический - - + - + - +
Логический + + - + - + -
На основе вышеприведенной сравнительной таблицы, можно сделать вывод, что нейрокибернетический подход является более перспективным решением для компьютерной имитации интуиции, так как обладает в некоторой степени универсальностью, что существенно для решения задач, связанных с искусственным интеллектом. Нейрокибернетический подход поддается распараллеливанию задач, что очень ускоряет процесс вычислений, и важно при решении сложных задач, так как алгоритмы вычислений близкие к мыслительным процессам человека, очень сложны. Для решения одной и той же задачи при нейрокибернетическом подходе не нужно пересчитывать алгоритм решения, чего не получится избежать при логическом подходе. Но кибернетический поход обладает и недостатками, нейронные сети могут неоднозначно вести себя при одинаковых входных данных, что может влиять на качество результата работы сети.
Нейронные сети и машинное обучение для моделирования ИИ имеет больше преимуществ, чем программные реализации, построенные с помощью логического подхода, но максимальное качество работы любого устройства, основанного на ИИ, будет качественнее, если будет присутствовать и логический аппарат, возможно, комбинирование двух.
3. Реализации систем интуитивного принятия решений
3.1. AlphaGo
До недавнего времени одной из игр, в которой компьютер не мог одержать победу даже у среднего по возможностям игрока, считалась древнейшая китайская игра го. Игровое поле представляет собой квадратную решетку 19х19 линий. Поочередно устанавливая «камни» (черные и белые фишки для игры) на пересечения линий, противники пытаются окружить территории на доске. Заканчивается игра по соглашению сторон о том, что никто из них не может улучшить свои позиции. Победителем считается игрок, захвативший как можно больший размер территорий.
Главной причиной, по которой сложно создать программу для успешной игры в го, это то, что она плохо поддается просчету вариантов.
В 2015 году компания Google DeepMind создала программу AlphaGo, которая ознаменовала важный прорыв в области искусственного интеллекта, став первой в мире программой, выигравшей матч у профессионального игрока 9 дана (наивысшего ранга) в го -Ли Седоля в марте 2016.
3.1.1. Основные принципы
Отличительной особенностью AlphaGo является то, что в нем запрограммированы только общие алгоритмы, не зависящие от особенностей игры. Остальное AlphaGo выучила сама, тренируясь на базе данных из 160 тысяч игр с помощью базовых методов, которые могут применяться и в других направлениях искусственного интеллекта. Данный подход отличает AlphaGo от таких систем, как Deep Blue. При создании шахматного суперкомпьютера Deep Blue использовалась профессиональная шахматная теория, большая библиотека дебютов с целью выиграть игру у Гарри Сапарова, в то время как AlphaGo во время игры не использует подготовленные базы данных позиций. Более того при обучении AlphaGo не было игр с Ли Седолем и во время игры программа не подстраивалась под игру противника.
Одной из самых важных особенностей программы является предсказание хода противника, этого AlphaGo добилась с помощью обучения на большом количестве партий, также программа улучшилась, играя сама с собой.
3.1.2. Архитектура AlphaGo
Основой AlphaGo стали стратегическая и оценочная свёрточные нейронные сети c использованием расширенного поиска по дереву, способные оценить позицию или предсказать следующий ход. На вход программе подается позиция, представляющая собой многослойную картинку, в которой каждый слой описывает свойства пунктов доски. Далее входные данные обрабатываются 12 различными слоями каждой нейронной сети.
Стратегическая сеть нужна для фильтрации плохих вариантов ходов и уменьшения степени ветвления при поиске. Данная сеть обучалась на 30 миллионах ходах игр с экспертами. В результате обучения сеть смогла предсказывать ход противника в 57% случаев, предыдущий результат был равен 44%, для прогноза хода такая разница существенна. Для улучшения стратегической сети применялось обучение с подкреплением, то есть сеть обучалась с предыдущими версиями сетей.
Оценочная сеть предназначена для уменьшения глубины поиска в дереве и оценки вероятности победы методом Монте-Карло в определенной позиции, она также обучалась на 30 миллионах позиций. Для того чтобы избежать переобучения, выбиралась только одна позиция в каждой игре, далее улучшенная стратегическая сеть играла сама с собой, после чего оценочная сеть обучалась на выходных данных стратегической сети. В итоге получилась сеть, способная предсказывать для каждой позиции вероятность победы, используя в 15 000 раз меньше расчетов, чем метод Монте-Карло.
На рисунке 2, представлен график а, показывающий силу игры стратегических сетей с 128, 192, 256 и 384 сверточными фильтрами в зависимости от их точности обучения [13]. График b показывает точность между сетью значений и стратегическими сетями.
На рисунке 3, представлен график рангов [13]. У AlphaGo и версии Disturbed AlphaGo наивысшие ранги.
Рисунок 2. Графики силы игры и точности стратегических и оценочных (рисунок взят из источника № 13)
Рисунок 3. График распределение рангов между программами и чемпионом Европы Фэн Хуэй
(рисунок взят из источника № 13)
Как видно из вышеприведенных графиков, AlphaGo является хорошим примером системы с искусственным интеллектом и способностью интуитивного принятия решения на основе своего прогноза.
Алгоритмы, используемые в AlphaGo, могут применяться и в других направлениях ИИ, например, в медицине. Национальная служба здравоохранения Великобритании и основатель DeepMind заключили соглашение о возможности применения искусственного интеллекта для анализа медицинских данных. В результате было создано подразделение DeepMind Health.
Модель интуитивного принятия решения
В рамках дальнейшей работы предстоит реализовать модель нейронной сети для интуитивного принятия решения. На вход такой модели будет поступать временной ряд. Хорошим практическим примером является финансовый временной ряд.
Данные отбираются для специфических случаев с резким отклонением (скачком) значений от нормальных. На рисунке 4 представлен один из таких случаев в виде графика.
Зеленым цветом выделен тренд. Прямые красного цвета в техническом анализе представляют собой, один из способов отслеживания движения финансового тренда, но в какой-то момент тренд меняет направление на противоположенное, причина смены траектории неизвестна и так как эти данные не поддаются анализу, то дальнейшее резкое отклонение может предсказываться интуитивно. Созданная модель будет обучаться на данных с резким отклонением, и момент резкого отклонения мы принимаем как интуитивно принятое решение, не основанное на техническом прогнозе. После обучения, на вход мы подаем тестовую выборку без отклонений и нейронная сеть должна интуитивно предсказать дальнейшее движение тренда. Именно, набор весов, сформировавшийся после обучения, в созданной модели нейронной сети, будет представлять собой компьютерную имитацию интуиции.
Каждый входной вектор будет представлять собой 40 десятичных значений финансового
ряда:
V{1..n}, где n = 40, для обучения будет использоваться больше 150 векторов.
Рассмотрим последние 5 значений входного вектора, допустим что первые 35 значений вектора не имели скачков и были примерно равны 60:
V{1.. n - 5, n - 4, n - 3, n - 2, n}.
Входные данные:
V{... 60.161, 60.085, 58.712, 58.313, 61.193}
Как видно из входного вектора, направление тренда было падающим, но последние значение отклонилось в противоположенную сторону. На таких данных обучается сеть, далее в нейронную сеть поддается тестовая выборка:
V{... 60.231, 60.005, 58.699, 58.212, X}.
Ожидаемый результат:
V{... 60.231, 60.005, 58.699, 58.212, X}, X = 62.012.
И рекуррентная нейронная сеть определяет значение X интуитивного прогноза.
Рисунок 4. графический пример входного вектора (разработано автором)
Принцип работы сетей и архитектура программы приведены на рисунках 5 и 6 соответственно. Входные векторы данных попадают на сверточный слой сетей, далее обрабатываются фильтрами, образуя карту признаков, после чего обработанный временной ряд попадает в модуль прогноза, представляющую собой рекуррентную нейронную сеть.
Свертка
Рисунок 5. Принцип работы сетей (разработано автором)
Рисунок 6. Архитектура программы (разработано автором)
Заключение
В настоящее время нейрокибернетический подход и искусственные нейронные имеют большой потенциал в направлениях разработки искусственного интеллекта, так как они добились наибольших успехов. Их способность к обучению, делает их гибкими и мощными, кроме того, нет необходимости разрабатывать алгоритм для решения конкретной задачи, то есть, нет необходимости понимать внутренние механизмы выполнения этой задачи, что делает нейронные сети более универсальными по сравнению с другими подходами.
Проблемы искусственного интеллекта имеют различные свойства, чтобы получить оптимальное решение, нужно выбрать подходящий тип архитектуры для реализации нейронной сети в попытке решить эту проблему.
Экспертные системы, системы на основе нечеткой логики и генетические алгоритмы могут быть интегрированы с нейронными сетями для решения сложных проблем в области машинного обучения, такие системы называются гибридным интеллектуальными системами.
ЛИТЕРАТУРА
1. Левин, Р., Дранг Д., Эделсон Б. Практическое введение в технологию искусственного интеллекта и экспертных систем с иллюстрациями на Бейсике -М.: Финансы и статистика, 1991. - 239 с.
2. Лорьер, Ж.Л., Системы искусственного интеллекта - М.: Мир, 1991. - 568 с.
3. Андрейчиков А.В., Андрейчикова О.Н., Интеллектуальные информационные системы: Учебник. - М.: Финансы и статистика, 2004. - 424 с.
4. Грановская, Р.М., Березная И.Я., Интуиция и искусственный интеллект. - Л., 1991. - 272 с.
5. Асмус, В.Ф. Проблема интуиции в философии и математике (Очерк истории: XVII - начало XX в.). - М.: Мысль, 1965. - 312 с.
6. Бунге, М. Интуиция и наука. М.: Прогресс, 1967. - 187 с.
7. Ясницкий, Л.Н., Бондарь, В.В., Черепанов Ф.М., Пермская научная школа искусственного интеллекта и ее инновационные проекты. - 2-е изд. - М.-Ижевск: НИЦ «Регулярная и хаотическая динамика», 2008. - 75 с.
8. Ясницкий, Л.Н., Введение в искусственный интеллект. - М.: Издательский центр «Академия», 2005. - 176 с.
9. Гаврилова, Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем -СПб.: Питер, 2000. - 384 с.
10. Merolla, P.A., Arthur, J.V. Cassidy, A.S., "A million spiking-neuron integrated circuit with a scalable communication network and interface", Science, vol. 345, no. 6197, pp. 668-673, Aug. 2014.
11. Гаврилов, А.В., Системы искусственного интеллекта: Учеб. пособие: в 2-х ч. -Новосибирск: Изд-во НГТУ, 2001. - Ч.1. - 67 с.
12. Стефанюка, В.Л., Компьютер обретает разум - М.: Мир, 1990. - 240 с.
13. Silver, David, et al. Mastering the game of Go with deep neural networks and tree search. Nature 529.7587 (2016): pp. 484-489.
Dzhabrailov Shaban Vagif ogli
Volgograd state technical university, Russia, Volgograd E-mail: shaban-dzhabrailov@mail.ru
Rozaliev Vladimir Leonidovich
Volgograd state technical university, Russia, Volgograd E-mail: vladimir.rozaliev@gmail.com
Orlova Yulia Alexandrovna
Volgograd state technical university, Russia, Volgograd E-mail: yulia.orlova@gmail.com
Approaches and implementation of computer simulation intuition
Abstract. Creation of systems for modelling intuition is relevant nowadays because people actively use intuition in various areas of their life: in art, science, while coming up with strategic solutions in business and even in areas that seem completely unrelated to intuition. Here are a few examples of different uses of intuition: giving a preliminary diagnosis, making predictions for stock market, creating a work of art.
The problem of solving tasks with the help of artificial intelligence and bringing the capabilities of software intuition as close as possible to capabilities of human intuition is relevant in the modern world.
A neurocybernetic approach is often chosen for solving problems related to artificial intelligence and intuition. In this article, we examine different approaches that are used for simulating intuition, perform a comparative analysis of these approaches using predefined criteria and form a conclusion regarding the best approach. The article presents a software solution based on neurocybernetic approach called "AlphaGo", along with description of its architecture, capabilities, power and precision charts for strategic and evaluation networks, and results of the work of intellectual game system.
In addition, we propose a model for intuitive prediction of time series based on a combination of convolutional and recurrent neural networks along with the description of input data and its semantics.
Keywords: computer simulation of intuition; deep learning; machine learning; artificial intelligence; convolution neural network; recurrent neural network