Научная статья на тему 'ПРИМЕНЕНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В АНАЛИЗЕ ДАННЫХ: ОБЗОР ТЕКУЩЕГО СОСТОЯНИЯ И БУДУЩИХ НАПРАВЛЕНИЙ'

ПРИМЕНЕНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В АНАЛИЗЕ ДАННЫХ: ОБЗОР ТЕКУЩЕГО СОСТОЯНИЯ И БУДУЩИХ НАПРАВЛЕНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
498
63
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
искусственный интеллект / ИИ / анализ данных / современные технологии / IT / artificial intelligence / AI / data analysis / modern technologies / IT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мокшанов Михаил Владимирович

В данной статье представлен обзор современного состояния применения искусственного интеллекта (ИИ) в области анализа данных, а также рассмотрены перспективные направления развития данной области. Анализ данных, осуществляемый с привлечением методов искусственного интеллекта, становится ключевым элементом современной информационной технологии. В рамках статьи рассматриваются основные методы и алгоритмы ИИ, применяемые в анализе данных, такие как машинное обучение, нейронные сети и обработка естественного языка. Делается акцент на том, какие выгоды приносит использование ИИ в процессе анализа данных, включая повышение точности прогнозирования, улучшение выявления паттернов и автоматизацию процессов обработки информации. В заключении рассматриваются перспективы развития данной области, включая возможности усовершенствования существующих методов, интеграцию новых технологий и преодоление вызванных ими этических и безопасностных вопросов. Анализ исследований в этой области позволяет выделить тенденции, определяющие будущее применения искусственного интеллекта в анализе данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE USE OF ARTIFICIAL INTELLIGENCE IN DATA ANALYSIS: AN OVERVIEW OF THE CURRENT STATE AND FUTURE DIRECTIONS

This article provides an overview of the current state of the application of artificial intelligence (AI) in the field of data analysis, as well as discusses promising areas of development in this field. Data analysis, carried out using artificial intelligence methods, is becoming a key element of modern information technology. The article discusses the main AI methods and algorithms used in data analysis, such as machine learning, neural networks and natural language processing. The focus is on the benefits of using AI in the process of data analysis, including improving forecasting accuracy, improving pattern detection and automating information processing processes. In conclusion, the prospects for the development of this field are considered, including the possibilities of improving existing methods, integrating new technologies and overcoming ethical and safety issues caused by them. The analysis of research in this area allows us to identify trends that determine the future of the use of artificial intelligence in data analysis.

Текст научной работы на тему «ПРИМЕНЕНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В АНАЛИЗЕ ДАННЫХ: ОБЗОР ТЕКУЩЕГО СОСТОЯНИЯ И БУДУЩИХ НАПРАВЛЕНИЙ»

DOI - 10.32743/UniTech.2024.122.5.17513

ПРИМЕНЕНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В АНАЛИЗЕ ДАННЫХ: ОБЗОР ТЕКУЩЕГО СОСТОЯНИЯ И БУДУЩИХ НАПРАВЛЕНИЙ

Мокшанов Михаил Владимирович

инженер по обработке данных в Maelys, Израиль, г. Тель-Авив E-mail: mikem@maelyscosmetics. com

THE USE OF ARTIFICIAL INTELLIGENCE IN DATA ANALYSIS: AN OVERVIEW OF THE CURRENT STATE AND FUTURE DIRECTIONS

Mikhail Mokshanov

Data Engineer at Maelys, Israel, Tel-Aviv

АННОТАЦИЯ

В данной статье представлен обзор современного состояния применения искусственного интеллекта (ИИ) в области анализа данных, а также рассмотрены перспективные направления развития данной области. Анализ данных, осуществляемый с привлечением методов искусственного интеллекта, становится ключевым элементом современной информационной технологии. В рамках статьи рассматриваются основные методы и алгоритмы ИИ, применяемые в анализе данных, такие как машинное обучение, нейронные сети и обработка естественного языка. Делается акцент на том, какие выгоды приносит использование ИИ в процессе анализа данных, включая повышение точности прогнозирования, улучшение выявления паттернов и автоматизацию процессов обработки информации. В заключении рассматриваются перспективы развития данной области, включая возможности усовершенствования существующих методов, интеграцию новых технологий и преодоление вызванных ими этических и безопасностных вопросов. Анализ исследований в этой области позволяет выделить тенденции, определяющие будущее применения искусственного интеллекта в анализе данных.

ABSTRACT

This article provides an overview of the current state of the application of artificial intelligence (AI) in the field of data analysis, as well as discusses promising areas of development in this field. Data analysis, carried out using artificial intelligence methods, is becoming a key element of modern information technology. The article discusses the main AI methods and algorithms used in data analysis, such as machine learning, neural networks and natural language processing. The focus is on the benefits of using AI in the process of data analysis, including improving forecasting accuracy, improving pattern detection and automating information processing processes. In conclusion, the prospects for the development of this field are considered, including the possibilities of improving existing methods, integrating new technologies and overcoming ethical and safety issues caused by them. The analysis of research in this area allows us to identify trends that determine the future of the use of artificial intelligence in data analysis.

Ключевые слова: искусственный интеллект, ИИ, анализ данных, современные технологии, IT.

Keywords: artificial intelligence, AI, data analysis, modern technologies, IT.

Введение

В последние годы сфера искусственного интеллекта (ИИ) и машинного обучения (МО) демонстрирует стремительные темпы развития, оказывая существенное влияние на различные аспекты коммерческой деятельности. В частности, применение этих технологий ведет к значительному

усовершенствованию методов в различных отраслях. Примером такого влияния служит использование ИИ для аналитики больших данных, что позволяет компаниям преобразовывать массивы собранной информации в ценные знания, упрощая процесс принятия решений.

Библиографическое описание: Мокшанов М.В. ПРИМЕНЕНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В АНАЛИЗЕ ДАННЫХ: ОБЗОР ТЕКУЩЕГО СОСТОЯНИЯ И БУДУЩИХ НАПРАВЛЕНИЙ // Universum: технические науки: электрон. научн. журн. 2024. 5(122). URL: https://7universum. com/ru/tech/archive/item/17513

Источник: Acumen Research and Consulting

Рисунок 1. Динамика развития рынка больших данных в мире

Так например, исследование, опубликованное в Harvard Business Review, показывает потенциал искусственного интеллекта (ИИ) в обработке масштабных массивов данных. Авторы указывают на способность ИИ значительно ускорить процесс обработки данных и в несколько раз сократить соответствующие затраты. Важно отметить, что ИИ способен выявлять скрытые паттерны и зависимости, невидимые при традиционной, ручной обработке данных. Этот аспект подчеркнут в журнале Nature [10], где рассматриваются перспективы применения ИИ для анализа медицинских данных, с утверждением о потенциальном спасении миллионов жизней через раннее выявление симптомов болезней и предложение оптимальных лечебных подходов.

В свою очередь в контексте маркетинга, ИИ и МО обеспечивают компаниям инструменты для более глубокого понимания потребностей своих клиентов, позволяя разрабатывать персонализированные предложения и стратегии. Примеры такого применения включают способность предсказывать потребительский спрос с высокой точностью, как это делает Walmart, адаптируя свои запасы в соответствии с погодными условиями и другими факторами [7]. Использование AI для интеллектуального ценообразования и адаптации маркетинговых стратегий в реальном времени демонстрирует потенциал этих технологий для улучшения качества обслуживания и увеличения удовлетворенности клиентов [3].

Целью данной работы является рассмотрение текущего состояния и будущих перспектив развития, применения искусственного интеллекта в анализе данных. Методологической основой является научные труды отечественных и зарубежных авторов, мнения экспертов и информации, содержащейся в открытом доступе в сети «Интернет».

1. Материалы и методы

Искусственный интеллект включает в себя широкий спектр технологий и методологий, направленных на имитацию человеческого интеллекта с помощью машин. Это наука и инженерия, направленная на создание интеллектуальных машин, особенно интеллектуальных компьютерных программ, способных выполнять задачи, которые обычно требуют человеческого интеллекта, такие как обучение, рассуждение, решение проблем, восприятие и понимание языка.

ИИ можно разделить на два основных аспекта: возможности и функциональность. Исходя из возможностей, ИИ подразделяется на узкий или слабый ИИ, который разрабатывается и обучается для выполнения конкретной задачи, и общий или сильный ИИ, который обладает способностью понимать, обучаться и применять знания в различных контекстах, подобно человеческому интеллекту [1].

Функционально ИИ подразделяется на традиционные и генеративные ИИ, каждый из которых представляет собой этап в эволюции сложности и понимания ИИ [5].

Понятие традиционного искусственного интеллекта (ИИ) часто ассоциируется с его ограниченным или узкоспециализированным применением. Эта форма ИИ ориентирована на выполнение специфических задач в рамках строго определенных параметров, при этом системы, разработанные в таком ключе, обладают способностью к обучению на основе данных и могут осуществлять выбор стратегий или прогнозировать результаты в соответствии с заложенными алгоритмами. Примером подобной технологии может служить компьютерная программа для игры в шахматы, которая, зная установленные правила, способна анализировать ходы оппонента и принимать решения на основе заранее запрограммированных стратегий, не выходя за рамки заданного алгоритма.

Такие системы, подобно голосовым помощникам Siri или Alexa, рекомендательным сервисам Netflix и Amazon, а также поисковым алгоритмам Google*, обучены следовать определенным директивам и выполнять конкретные функции, но не способны на творческое внесение новшеств.

Генеративный искусственный интеллект, напротив, представляет собой более продвинутое поколение ИИ, обладающее способностью к созданию оригинального контента. Если представить, что есть алгоритм, который вместо рассказывания историй человеком, может самостоятельно генерировать целые нарративы на основе предоставленного ему ввода, например, стартовой фразы. Такой ИИ не просто следует заданному алгоритму, но и способен на создание новых, уникальных произведений, будь то текст, изображение, музыкальное произведение или программный код, на основе изучения закономерностей в обучающем наборе данных.

Превосходным примером генеративного ИИ является GPT-4 от OpenAI, языковая модель, обученная на обширных массивах интернет-данных и способная генерировать тексты, практически неотличимые от написанных человеком.

В сравнительной перспективе, ключевое различие между традиционной и генеративной ИИ заключается в их функциональных возможностях и сферах применения. Традиционный ИИ находит свое применение в аналитике и прогнозировании, основываясь на заранее определенных данных и алгоритмах, в то время как генеративный ИИ открывает новые горизонты, создавая уникальный контент на основе вводимой информации. Для наглядности представления различий между этими двумя формами ИИ может быть составлена сводная таблица сравнения, демонстрирующая их уникальные характеристики и области применения.

Таблица 1.

Сравнение традиционного ИИ и генеративного [5]

Традиционный ИИ Генеративный ИИ

Основные характеристики Специфические задачи Возможность создания новых данных

Изучает данные и принимает решения или делает прогнозы Использование исходных данных для создания нового, оригинального контента

Работает в рамках заранее определенного набора правил Может генерировать текст, изображения, музыку и код

Метод обучения Контролируемое обучение Контролируемое обучение

Требуется помечать данные для обучения Не требует маркированных данных для обучения

Ограничения Ограниченность конкретными задачами Требуются большие объемы данных для обучения

Невозможность создания нового, оригинального контента Сгенерированный контент может быть недостаточно последовательным и точным

Для обучения может потребоваться большой объем помеченных данных Сложно контролировать специфику генерируемого контента

Примеры ИИ, играющий в шахматы OpenAI's GPT-4

Фильтры спама в электронной почте ИИ для передачи стиля DeepArt

Рекомендательные системы (Netflix, Amazon) Создание контента (рассказы, искусство, музыка)

Поисковые алгоритмы (Google*) Создание фейков

Индивидуальные ответы ИИ

Основные методы ИИ в анализе данных:

1. Машинное обучение - это ключевая подгруппа ИИ, которая наделяет системы способностью автономно обучаться и повышать свою производительность на основе эмпирических данных, обходя

необходимость явного программирования для каждой новой задачи. Алгоритмы МО, основанные на статистическом анализе, способствуют повышению эффективности выполнения задач за счет опыта.

Входные данные Извлечение признаков Классификация Выходные данные

Рисунок 2. Принцип работы машинного обучения

Особенностью МО является его алгоритмическая основа, которая включает в себя:

• Контролируемое обучение: Алгоритмы обучаются с использованием помеченных наборов данных, что позволяет им изучать взаимосвязь между входными переменными и целевыми выходными данными. Этот метод широко используется для задач классификации и регрессии.

• Неподконтрольное обучение: В этом подходе алгоритмы исследуют немеченые данные, чтобы найти основные закономерности или группировки. Частыми приложениями являются кластеризация и уменьшение размерности.

• Обучение с подкреплением: Этот метод предполагает обучение оптимальным действиям методом проб и ошибок с целью максимизации некоторого понятия совокупного вознаграждения.

Эти алгоритмы позволяют МО выявлять закономерности, делать обоснованные прогнозы и принимать решения при минимальном вмешательстве человека [4, 11].

2. Глубокое обучение (Deep Learning, DL),

специализированная подгруппа МО, использует искусственные нейронные сети с несколькими слоями (глубокими структурами) для моделирования сложных закономерностей в данных. В отличие от традиционного МО, DL может автоматически открывать представления, необходимые для обнаружения или классификации признаков, из необработанных данных, сводя к минимуму необходимость ручной разработки признаков.

Извлечение признаков ♦ Классификация

Рисунок 3. Принцип работы глубокого обучения

Эффективность DL в обработке широкого спектра данных, включая неструктурированные данные, такие как изображения и текст, обусловлена иерархическим процессом обучения - более простые модели на начальных слоях постепенно формируют более сложные представления на более глубоких слоях:

• Конволюционные нейронные сети (CNN): Особенно эффективны для задач распознавания изображений и видео, CNN используют специальную архитектуру, которая определяет паттерны непосредственно из пиксельных данных.

• Рекуррентные нейронные сети (RNN): Подходящие для работы с последовательными данными,

такими как текст и речь, RNN могут запоминать предыдущие данные, используя свою внутреннюю память, что делает их идеальными для задач, где контекст имеет решающее значение [4, 11].

3. Обработка естественного языка (1ЧЬР), облегчает прямое взаимодействие между компьютерами и людьми, используя естественный язык, и нацелено на чтение, интерпретацию и понимание человеческих языков в ценной манере. Она сочетает в себе вычислительную лингвистику - моделирование человеческого языка на основе правил - со статистикой, машинным обучением и моделями глубокого обучения.

Наречие

Рисунок 4. Принцип работы NLP

Эти методы позволяют понять языковой контекст, настроение и намерения, переводя неструктурированные языковые данные в форму, доступную для понимания компьютером.

4. Нейронные сети (ОЬ). В основе DL лежат нейронные сети, вдохновленные структурой и функциями

человеческого мозга. Нейронная сеть состоит из взаимосвязанных узлов или нейронов, организованных в слои. Данные проходят через эти слои, и каждый узел выполняет простые вычисления. Связи между этими узлами имеют веса, которые регулируются в процессе обучения, что позволяет сети изучать сложные закономерности в данных.

скрытые слои

Рисунок 5. Нейронные сети

5. Трансформеры представляют собой значительную эволюцию алгоритмов, связанных с пониманием последовательности и контекста данных, таких как естественный язык. Трансформеры, представленные исследователями Google* в 2017 г. в статье «Внимание - это все, что вам нужно» [12], отказываются от последовательной обработки RNNs для параллельного подхода, что позволяет ускорить обучение и лучше справляться с дальними зависимостями в данных.

Основной задачей трансформеров является механизм внимания, который позволяет модели фокусироваться на различных частях входных данных в зависимости от их релевантности, что значительно улучшает ее способность понимать контекст.

Помимо революционного влияния на задачи, связанные с обработкой естественного языка (^^Р), трансформеры адаптируются для использования в других областях, таких как компьютерное зрение, слух, синтез речи, конвертация текста в изображение и обратно, перевод с одного языка на другой

(включая языки программирования), анализ временных рядов и многое другое, демонстрируя свою универсальность и мощь в моделировании сложных взаимосвязей данных.

2. Применение искусственного интеллекта в анализе данных

Внедрение машинного обучение (МО) в анализ данных произвело революцию в интерпретации данных, обеспечив беспрецедентную проницательность и способствуя принятию решений на основе данных в различных секторах.

Данное внедрение не только переосмыслило существующие методологии, но и способствовала появлению новых профессий. Появление МО потребовало создания специализированных профессий, таких как Data Scientists, Data Analysts и Machine Learning Engineers [8]. Эти специалисты занимаются извлечением значимых закономерностей из огромных массивов данных, применяют сложные алгоритмы и строят прогностические модели, которые имеют огромное значение для стратегического планирования и операционной эффективности.

В свою очередь появление Больших Данных потребовало разработки передовых методов МО, способных обрабатывать и анализировать массивы данных, которые слишком велики, сложны или быстро меняются для традиционных методов обработки данных.

Алгоритмы машинного обучения (МО) играют ключевую роль в анализе данных, позволяя автоматизировать построение аналитических моделей. Эти алгоритмы способны обучаться на основе данных, выявлять закономерности и принимать решения при минимальном вмешательстве человека. Приложения МО в анализе данных включают сегментацию клиентов, выявление мошенничества и анализ рынка, где алгоритмы адаптивно улучшают свою производительность по мере увеличения количества доступных для обучения образцов [6].

Глубокое обучение (Deep Learning, DL), подмножество МО, использует искусственные нейронные сети для имитации человекоподобных способностей к принятию решений. Модели DL, особенно основанные на нейронных сетях, высокоэффективны в задачах обнаружения признаков и классификации, превосходя традиционные МО в работе с неструктурированными данными, такими как изображения, текст и аудио. При анализе данных методы DL помогают в таких сложных задачах, как распознавание изображений, распознавание речи и обработка естественного языка (NLP), обеспечивая глубину анализа благодаря сложным возможностям распознавания образов.

Трансформеры, класс моделей глубокого обучения, в отличие от обычных нейросетевых моделей, трансформеры используют механизм, называемый «вниманием», чтобы по-разному оценивать значимость различных частей входных данных, что позволяет превосходно работать с последовательными данными.

В области понимания естественного языка транс-формеры установили новые стандарты, став основой

таких современных моделей, как BERT (Bidirectional Encoder Representations from Transformers) и GPT (Generative Pretrained Transformer). Эти модели отлично справляются с пониманием контекста, анализом настроения и генерацией текста, расширяя аналитические возможности в самых разных областях -от анализа настроения в социальных сетях до автоматизации взаимодействия с клиентами.

Траснформеры и, в частности, GPT лежат в основе современного ИИ.

ИИ сегодня представляет собой мощный инструмент, способный радикально изменить способ обработки данных и решения задач в различных областях. ИИ может функционировать как экспертная система, содержащая в себе знания о множестве классических алгоритмов машинного обучения. Это означает, что ИИ не просто обрабатывает информацию по заданным правилам, но и способен адаптироваться, обучаясь на новых данных. Такой подход позволяет значительно повысить эффективность обработки больших объемов информации, обнаруживать закономерности и делать предсказания с высокой степенью точности.

Одним из ключевых преимуществ использования ИИ в качестве экспертной системы является его способность «демократизировать» доступ к сложным алгоритмам машинного обучения. Ранее для работы с такими алгоритмами требовался глубокий технический опыт и знания в области статистики и программирования. Однако с развитием ИИ эти алгоритмы становятся доступными широкому кругу пользователей. Использование естественного языка для формулировки задач и интерпретации результатов значительно упрощает взаимодействие с системой, открывая возможности для неспециалистов в различных областях, от медицины до маркетинга, для решения сложных аналитических задач.

В свою очередь если говорить о примерах использования ИИ, то интересным представляется медицинская отрасль. В ней ИИ может помочь при анализе медицинских данных, по типу: результатов анализов, данных МРТ и другой информации о пациентах, что в конечном счете позитивно скажется на диагностировании заболевания и последующего лечения.

Далее перейдем к рассмотрению финансовой отрасли, в которой ИИ также может быть интегрирован. В данном случае возможно его использование для анализа трендов, прогнозирования изменений в стоимости ценных бумаг, либо же в оценке рисков кредитования. То есть суть использования технологий ИИ заключается в том, что благодаря нему возможно за меньшие сроки обрабатывать большие массивы данных, исключая при этом человеческий фактор.

Далее рассмотрим аспект связанный с применением ИИ в автомобиле. В данном случае опять же за счет возможности анализа информации искусственный интеллект применяется для автоматизации процесса управления транспортным средством. Что достигается за счет наличия в таком транспорте камеров и датчиков, с которых ИИ считывает данные в режиме реального времени и принимает на основе полученных данных соответствующие решения.

В свою очередь применение ИИ в автопилоте, позволяет не только обеспечить безопасность дорожного движения, но и оптимизировать движение других транспортных средств. Поскольку будет минимизированы нарушения ПДД, что в конечном счете скажется на уменьшение пробок в крупных городах.

На основании вышеизложенного можно увидеть, что применение ИИ возможно практически в любой

отрасли жизнедеятельности человека, что достигается за счет быстрого анализа данных в режиме реального времени и принятии последующих решений [9].

Однако не стоит забывать о существующих преимуществах и недостатках, которые присущи каждой системе и которые будут более подробно отражены в таблице 2.

Таблица 2.

Преимущества и недостатки ИИ в анализе данных

Преимущества Недостатки

Более высокая точность анализа данных и принятых решений: ИИ способен анализировать большие массивы данных за короткие сроки, что в свою очередь является невозможным для человека. Сложность внедрения: Так как не существует единого механизма внедрения, поиск нужного может занять дополнительное время и в конечном счете затруднит его интеграции.

Масштабируемость: Системы ИИ способны эффективно справляться с увеличением объема данных. Предвзятость данных и этические проблемы: Исторические предубеждения в обучающих данных могут привести к искаженным результатам.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Предиктивная аналитика: Способность ИИ предсказывать результаты на основе исторических данных. Зависимость от качества данных: Эффективность ИИ зависит от качества анализируемых данных.

Автоматизированный анализ в режиме реального времени: ИИ позволяет обрабатывать данные в режиме реального времени. Высокие требования к ресурсам: Обучение сложных моделей ИИ требует значительных вычислительных ресурсов.

Выявление скрытых фактов: Алгоритмы ИИ могут выявлять неочевидные закономерности в данных. Вопросы безопасности и конфиденциальности: Применение ИИ для анализа данных требует строгих мер безопасности.

Хотя ИИ, включая продвинутые модели, такие как трансформеры, предлагает такие преимущества в анализе данных, как повышенная точность, эффективность и способность открывать новые идеи, он также создает проблемы, такие как сложность, интерпретируемость и этические проблемы. Баланс между этими преимуществами и недостатками имеет решающее значение для использования всего потенциала ИИ в анализе данных. Ожидается, что будущие достижения в области технологий и методологий ИИ позволят смягчить некоторые из этих проблем и усилить преимущества, проложив путь к более сложным, прозрачным и справедливым процессам анализа данных.

3. Инструменты ИИ в анализе данных

Программное обеспечение на базе искусственного интеллекта может автоматически анализировать загруженные данные и предоставлять необходимую информацию в кратком виде. К наиболее значимым инструментам использующих искусственный интеллект в области анализа данных следует отнести:

Polymer. В данном инструменте искусственный интеллект Polymer управляет электронной таблицей, позволяя изучить данные и получить более глубокие знания о них. Нет длительной процедуры адаптации или обучающих фильмов. Все намного проще, необходимо лишь отправить таблицу в Polymer, и она

будет преобразована в организованную базу данных, в которой легко ориентироваться.

Polymer легко подключается к широкому спектру источников данных. Легко загружайте наборы данных с помощью файлов CSV или XLS или подключайте такие источники данных, как Google*Analytics 4, Facebook**, Google* Ads, Google* Sheets, Airtable, Shopify, Jira, Stripe, WooCommerce, BigCommerce и другие интеграции.

Что отличает Polymer, так это то, что его можно использовать для анализа данных всеми командами в организации. Маркетинговые командах используют Polymer для определения наиболее эффективных каналов, выявления тенденций среди клиентов и моделей покупок на разных платформах. Отделы продаж получают более быстрый доступ к точным данным и отслеживанию производительности. Операционные группы могут создавать информационные панели, получать ценную информацию и выполнять специальный анализ на лету без необходимости написания кода или технической настройки.

Tableau — это платформа аналитики и визуализации данных , которая позволяет пользователям взаимодействовать с имеющимися у них данными без необходимости кодирования.

Платформа проста в использовании и позволяет пользователям создавать и изменять информационные панели и отчеты в режиме реального времени,

а также беспрепятственно делиться ими между пользователями и командами. Обладает всеми функциями, ожидаемыми от подобных инструментов, поддерживает базы данных всех размеров и предлагает пользователям несколько вариантов визуализации для анализа своих данных.

Tableau также позволяет пользователям запускать платформу как в облаке, так и локально для пользователей, которым нужна более герметичная среда для своих данных [13].

MonkeyLearn. MonkeyLearn — еще одна платформа без кодирования с функциями анализа данных на основе систем искусственного интеллекта, позволяющая пользователям визуализировать и реорганизовывать свои данные.

Платформа поставляется с несколькими инструментами анализа текста на базе искусственного интеллекта, позволяющими мгновенно анализировать и визуализировать данные в соответствии с потребностями пользователя. Пользователи могут настроить классификаторы текста и экстракторы текста для автоматической сортировки данных в соответствии с нужной темой или намерением, а также для извлечения функций продукта или пользовательских данных.

Power BI. Данная платформа упрощает процесс передачи и анализа данных с помощью Microsoft Power BI, приложения для бизнес-аналитики и визуализации данных. Легко подключаться к источникам данных, создавать интерактивные информационные панели и отчеты и делиться своими знаниями с другими благодаря ряду предоставляемых инструментов и возможностей.

Splunk — полезный инструмент для сбора, анализа и отображения машинных данных. Можно анализировать и индексировать большие объемы данных в режиме реального времени, что позволяет осуществлять быстрый поиск и анализ данных для поиска закономерностей и решений.

RapidMiner: Мощная платформа интеллектуального анализа данных и машинного обучения RapidMiner позволяет как анализировать данные, так и строить модели прогнозирования. Поскольку он разработан с учетом удобства пользователя, вы можете сразу начать его использовать, даже если вы новичок в интеллектуальном анализе данных и машинном обучении [2].

Sisense — еще одна платформа для анализа данных, которая позволяет аналитикам и разработчикам сортировать и визуализировать свои данные.

Платформа проста в использовании, имеет множество инструментов перетаскивания и адаптивный пользовательский интерфейс, упрощающий работу. Sisense также позволяет пользователям получить доступ к своей технологии «In-Chip» и выбирать между оперативной памятью и процессором для обработки данных, что ускоряет вычисления при обработке больших наборов данных.

Хотя платформа имеет ограниченные возможности визуализации, она является хорошим вариантом для пользователей с базовыми потребностями

в визуализации и отчетности, которые хотят обрабатывать небольшие наборы данных [10].

Будущее искусственного интеллекта в анализе данных

Будущее искусственного интеллекта (ИИ) в анализе данных ожидает глубокое развитие и эволюцию. Новые тенденции и технологии обещают расширить возможности ИИ, сделав его более эффективным, доступным и способным решать сложные аналитические задачи. Ожидается, что в этом развивающемся ландшафте трансформеры, являющиеся ключевой инновацией в ИИ, будут играть центральную роль, оказывая влияние на различные аспекты анализа данных.

Ожидается, что постоянное совершенствование алгоритмов ИИ и разработка новых моделей значительно повысят эффективность и точность анализа данных. Инновации в области машинного обучения, глубокого обучения и, в частности, трансформеры, должны привести к созданию моделей, которые будут не только более мощными, но и более интерпретируемыми и менее ресурсоемкими.

В свою очередь возможности применения технологий искусственного интеллекта при анализе данных станет более масштабным, и охватит в конечном счете практически все сферы. Те отрасли которые со скепсисом внедряли технологии ИИ будут вынуждены ускорить данный процесс, за счет того, что это позволит сэкономить время и ресурсы, поскольку снизит нагрузку с персонала, что позволит перераспределить задачи, увеличив производительность кадров, поскольку они сфокусируются на важных задачах.

Также с каждым годом будет все больше внимания уделяться аспектам конфиденциальности и безопасности данных, которые обрабатываются и хранятся. Что в свою очередь станет катализатором в создании инновационных методов защиты данных. Которые будут также основываться на достижениях ИИ, в данном случае модели будут обучаться на основе уже зашифрованных данных, по типу такой системы как: гомоморфное шифрование. Использование данной системы станет революционным шагом в защите баз данных.

Также существует мнение о том, что ИИ при анализе данных не только заменят часть персонала, но и дополнят возможности, которыми обладают люди. То есть после анализа представленных данных ИИ выдаст отчет, в котором подробно распишет всю информацию, необходимую для человека, на основе которой сотрудник в последующем примет более взвешенное решение, которое будет наиболее подходящим в существующих реалиях.

Расширяя горизонты, можно сказать, что потенциал ИИ в ближайшем будущем включает в себя применение для спасения жизни, автоматизированное строительство зданий и доставку товаров и продуктов. Более «футуристические» сценарии предполагают использование персональных роботов-помощников, выполняющих такие задачи, как приготовление пищи,

обслуживание гостиниц, уход за пожилыми и больными людьми. Кроме того, ИИ призван совершить революцию в освоении дальнего космоса и способствовать революционным научным открытиям, в том числе в области борьбы с раком и старением. Эти примеры подчеркивают преобразующий потенциал ИИ, формируя будущее, в котором ИИ не только совершит революцию в анализе данных, но и окажет глубокое влияние на жизнь человека и функции общества.

май, 2024 г.

Заключение

Подводя итог, хотя ИИ обещает значительное улучшение в обработке данных, его успешное применение требует дальнейшего совершенствования алгоритмов, а также установления четких этических стандартов и законодательства. Стремление к балансу между техническими возможностями и этическими нормами является ключевым фактором в обеспечении безопасного и эффективного использования ИИ в обработке больших данных.

Список литературы:

1. Андреев А.В. Искусственный интеллект и его роль в обработке больших данных. Умная цифровая экономика. 2023. Т. 3. № 1. С. 65-69.

2. Инструменты искусственного интеллекта для анализа данных. [Электронный ресурс] - Режим доступа: https://www.polymersearch.com/blog/the-best-10-ai-tools-to-analyze-data (дата обращения 29.02.2024).

3. Искусственный интеллект для анализа больших данных (BigData). [Электронный ресурс] - Режим доступа: https://www.websoftshop.ru/information/articles/big_data/using_ai_in_data_analysis/ (дата обращения 29.02.2024).

4. Machine Learning, AI, Deep Learning, and Data Science. [Электронный ресурс] - Режим доступа: https://www.includehelp.com/ml-ai/machine-learning-artificial-intelligence-deep-learning-data-science.aspx (дата обращения 29.02.2024).

5. Понятный гайд по ИИ: сравниваем традиционный и генеративный искусственный интеллект. [Электронный ресурс] - Режим доступа: https://habr.com/ru/companies/itglobalcom/articles/752150/ (дата обращения 29.02.2024).

6. Применение искусственного интеллекта в процессе анализа больших объемов данных. [Электронный ресурс] - Режим доступа: https://school-science.ru/21/4/56757 (дата обращения 29.02.2024).

7. Прогнозирование спроса: выступление доходов посредством точного анализа спроса. 2024. [Электронный ресурс] - Режим доступа: https://fastercapiM.com/content/Demand-forecasting--Projectmg-Revenue-through-Accurate-Demand-Analysis.html (дата обращения 29.02.2024).

8. Профессии будущего. Как нейросети открывают новые направления в edtech. [Электронный ресурс] - Режим доступа: https://edtechs.ru/analitika-i-intervyu/professii-budushego-kak-nejroseti-otkryvayut-novye-napravleniya-v-edtech/ (дата обращения 29.02.2024).

9. Технологии искусственного интеллекта: что умеют, где используются. [Электронный ресурс] - Режим доступа: https://gb.ru/blog/tekhnologii-iskusstvennogo-intellekta/ (дата обращения 29.02.2024).

10. AI Tools For Data Analysis. [Электронный ресурс] - Режим доступа: https://translated.turbopages.org/proxy_u/en-ru.ru.ce57c639-65f55cc5-8f2400c6-74722d776562/https/www.geeksforgeeks.org/best-ai-tools-for-data-analysis/ (дата обращения 29.02.2024).

11. Artificial Intelligence vs. Machine Learning vs. Deep Learning: What's the Difference? [Электронный ресурс] -Режим доступа: https://builtin.com/artificial-intelligence/ai-vs-machine-learning (дата обращения 29.02.2024).

12. Attention Is All You Need. 2023. [Электронный ресурс] - Режим доступа: https://arxiv.org/abs/1706.03762

13. Top 10 Artificial Intelligence Tools to Analyze Data in 2023. [Электронный ресурс] - Режим доступа: https://www.analyticsinsight.net/top-10-artificial-intelligence-tools-to-analyzE-data-in-2023/ (дата обращения 29.02.2024).

*По требованию Роскомнадзора информируем, что иностранное лицо, владеющее информационными ресурсами Google является нарушителем законодательства Российской Федерации - прим. ред.

** социальная сеть, запрещенная на территории РФ, как продукт организации Meta, признанной экстремистской - прим.ред.

i Надоели баннеры? Вы всегда можете отключить рекламу.