Научная статья на тему 'Методы математической статистики и инструменты искусственного интеллекта для анализа данных психолого-педагогических исследований'

Методы математической статистики и инструменты искусственного интеллекта для анализа данных психолого-педагогических исследований Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
методы математической статистики / анализ данных / психолого-педагогические исследования / критерий Пирсона / критерий Фишера / ChatGPT / инструменты искусственного интеллекта / mathematical statistics methods / data analysis / psychological and pedagogical studies / Pearson's criterion / Fisher's criterion / ChatGPT / Artificial Intelligence tools

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Олег Леонидович Подлиняев, Жанна Сергеевна Афанасьева, Александр Диомидович Афанасьев

Введение. Использование методов математической статистики в психолого-педагогических исследованиях призвано обеспечить анализ и достоверную интерпретацию данных, полученных в результате проведения эксперимента. Математическая статистика предоставляет инструменты для проверки научных гипотез, позволяет объективно доказать их или опровергнуть, а значит, повысить качество интерпретации результатов исследования. Использование технологий искусственного интеллекта становится актуальным и перспективным в работе исследователей. Материалы, результаты и обсуждение. Используются данные оценки уровня сформированности когнитивного компонента исследовательской компетентности обучающихся. Обсуждаются подходы к представлению экспериментальных данных, их анализ с помощью методов математической статистики и границы их применимости. Рассматриваются возможности ChatGPT для дополнения методов математической статистики в психолого-педагогических исследованиях и для дополнительного анализа полученных результатов. Приведено описание применения критерия согласия Пирсона. Показано использование критерия Фишера для проверки гипотез об однородности групп — участников педагогического эксперимента и достоверности различий полученных результатов исследования в соответствующих группах. Выводы. Применение непараметрических критериев для количественного анализа данных педагогического эксперимента является его неотъемлемой частью для проверки гипотез, выдвигаемых исследователем; оценки начальных условий для проведения эксперимента и эффективности его психологопедагогического воздействия. Описанные алгоритмы применения методов математической статистики могут использоваться исследователями без специальной подготовки. Использование инструментов, таких как ChatGPT, значительно повышает эффективность планирования эксперимента и анализа данных, позволяя исследователям сосредоточиться на более значимых аспектах своей работы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Олег Леонидович Подлиняев, Жанна Сергеевна Афанасьева, Александр Диомидович Афанасьев

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Methods of Mathematical Statistics and Artificial Intelligence Tools for Analyzing Data obtained by Psychological and Pedagogical Studies

Introduction. The use of mathematical statistics methods in psychological and pedagogical studies is designed to ensure the analysis and reliable interpretation of data obtained as a result of the experiment. It provides tools for testing scientific hypotheses, ensures their objective proving or disproving, and thus improving the quality of interpretation of research results. The use of artificial intelligence technologies becomes relevant and prospective in researchers’ work. Materials, Results and Discussion. The data of estimating the level of formation of the cognitive component of students' research competence are used. The approaches to the presentation of experimental data, their analysis with the help of mathematical statistics methods and the limits of their applicability are discussed. The possibilities of ChatGPT for supplementing the methods of mathematical statistics in psychological and pedagogical studies and for additional analysis of the obtained results are under consideration. The application of the chi-squared test (Pearson's criterion) is described. The use of Fisher's criterion for testing hypotheses about homogeneity of groups — participants of the pedagogical experiment, and validity of differences of the obtained research results in the corresponding groups are shown. Conclusions. The use of nonparametric criteria for quantitative analysis of the data of a pedagogical experiment is its integral part for testing the hypotheses put forward by the researcher; assessing the initial conditions for the experiment and the effectiveness of its psychological and pedagogical impact. The described algorithms for applying mathematical statistics methods can be used by researchers without special training. The use of tools, such as ChatGPT, significantly increases the efficiency of experiment planning and data analysis, allowing researchers to focus on more meaningful aspects of their work.

Текст научной работы на тему «Методы математической статистики и инструменты искусственного интеллекта для анализа данных психолого-педагогических исследований»

Впомощь начинающемуисследователю имолодомуученому

То assist a young researcher and scientist

Научно-практическая статья

УДК 378.147; 519.234 © Подлиняев О. Л., Афанасьева Ж. С., Афанасьев А. Д., 2025

10. 24412/1999-6241-2025-1100-90-96 5.8.7. Методология и технология профессионального образования (педагогические науки) 5.8.1. Общая педагогика, история педагогики и образования

Методы математической статистики и инструменты искусственного интеллекта для анализа данных психолого-педагогических исследований

Олег Леонидович Подлиняев, доктор педагогических наук, профессор, профессор кафедры педагогики Педагогического института 1; [email protected]; https://orcid.org/0000-0002-6633-3997

Жанна Сергеевна Афанасьева, кандидат педагогических наук, старший преподаватель Института информационных технологий и анализа данных 2; [email protected]; https://orcid.org/0000-0003-0228-4644 Александр Диомидович Афанасьев, доктор физико-математических наук, профессор, профессор Института информационных технологий и анализа данных 2; [email protected]; https://orcid.org/0000-0001-8745-1725 1 Иркутский государственный университет, 664003, Иркутск, ул. Карла Маркса, 1, Россия

2Иркутский национальный исследовательский технический университет, 664074, Иркутск, ул. Лермонтова, 83, Россия

Реферат. Введение. Использование методов математической статистики в психолого-педагогических исследованиях призвано обеспечить анализ и достоверную интерпретацию данных, полученных в результате проведения эксперимента. Математическая статистика предоставляет инструменты для проверки научных гипотез, позволяет объективно доказать их или опровергнуть, а значит, повысить качество интерпретации результатов исследования. Использование технологий искусственного интеллекта становится актуальным и перспективным в работе исследователей. Материалы, результаты и обсуждение. Используются данные оценки уровня сформированности когнитивного компонента исследовательской компетентности обучающихся. Обсуждаются подходы к представлению экспериментальных данных, их анализ с помощью методов математической статистики и границы их применимости. Рассматриваются возможности ChatGPT для дополнения методов математической статистики в психолого-педагогических исследованиях и для дополнительного анализа полученных результатов. Приведено описание применения критерия согласия Пирсона. Показано использование критерия Фишера для проверки гипотез об однородности групп — участников педагогического эксперимента и достоверности различий полученных результатов исследования в соответствующих группах. Выводы. Применение непараметрических критериев для количественного анализа данных педагогического эксперимента является его неотъемлемой частью для проверки гипотез, выдвигаемых исследователем; оценки начальных условий для проведения эксперимента и эффективности его психолого-педагогического воздействия. Описанные алгоритмы применения методов математической статистики могут использоваться исследователями без специальной подготовки. Использование инструментов, таких как ChatGPT, значительно повышает эффективность планирования эксперимента и анализа данных, позволяя исследователям сосредоточиться на более значимых аспектах своей работы.

Ключевые слова: методы математической статистики, анализ данных, психолого-педагогические исследования, критерий Пирсона, критерий Фишера, ChatGPT, инструменты искусственного интеллекта

Для цитирования: Подлиняев О. Л., Афанасьева Ж. С., Афанасьев А. Д. Методы математической статистики и инструменты искусственного интеллекта для анализа данных психолого-педагогических исследований // Психопедагогика в правоохранительных органах. 2025. Т. 30, № 1(100). С. 90-96. https://doi.org/10. 24412/19996241-2025-1100-90-96

Scientific and Practical Article

UDC 378.147; 519.234© Podlinyaev О. L., Аfanasieva Zh. S., Аfanasiev А. D., 2025 doi: 10. 24412/1999-6241 -2025-1100-90-96

5.8.7. Меthodology and Technology of Professional Education (pedagogical sciences) 5.8.1. General Pedagogy, History of Pedagogy and Education

Methods of Mathematical Statistics and Artificial Intelligence Tools for Analyzing Data obtained by Psychological and Pedagogical Studies

Оleg L. Podlinyaev, Doctor of Science (in Pedagogy), Professor, Professor at the chair of Pedagogy of Pedagogical Institute 1; [email protected]; https://orcid.org/0000-0002-6633-3997

Zhanna S. Аfanasieva, Candidate of Science (in Pedagogy), senior lecturer at the Institute of Information Technologies and Data Analysis 2; [email protected]; https://orcid.org/0000-0003-0228-4644

Аlexandr D. Аfanasiev 2, Doctor of Physics and Mathematical Sciences, Professor, Professor at the Institute of Information Technologies and Data Analysis; [email protected]; https://orcid.org/0000-0001-8745-1725

1 Irkutsk State University, 1 Karl Marx st., Irkutsk, 664003, Russia

2 Irkutsk National Research Technical University, 83 Lermontov st., Irkutsk, 664074, Russia

Abstract. Introduction. The use of mathematical statistics methods in psychological and pedagogical studies is designed to ensure the analysis and reliable interpretation of data obtained as a result of the experiment. It provides tools for testing scientific hypotheses, ensures their objective proving or disproving, and thus improving the quality of interpretation of research results. The use of artificial intelligence technologies becomes relevant and prospective in researchers' work. Materials, Results and Discussion. The data of estimating the level of formation of the cognitive component of students' research competence are used. The approaches to the presentation of experimental data, their analysis with the help of mathematical statistics methods and the limits of their applicability are discussed. The possibilities of ChatGPT for supplementing the methods of mathematical statistics in psychological and pedagogical studies and for additional analysis of the obtained results are under consideration. The application of the chi-squared test (Pearson's criterion) is described. The use of Fisher's criterion for testing hypotheses about homogeneity of groups — participants of the pedagogical experiment, and validity of differences of the obtained research results in the corresponding groups are shown. Conclusions. The use of nonparametric criteria for quantitative analysis of the data of a pedagogical experiment is its integral part for testing the hypotheses put forward by the researcher; assessing the initial conditions for the experiment and the effectiveness of its psychological and pedagogical impact. The described algorithms for applying mathematical statistics methods can be used by researchers without special training. The use of tools, such as ChatGPT, significantly increases the efficiency of experiment planning and data analysis, allowing researchers to focus on more meaningful aspects of their work.

Keywords: mathematical statistics methods, data analysis, psychological and pedagogical studies, Pearson's criterion,

Fisher's criterion, ChatGPT, Artificial Intelligence tools

Citation: Podlinyaev О. L., Аfanasieva Zh. S., Аfanasiev А. D. Methods of Mathematical Statistics and Artificial Intelligence Tools for Analyzing Data obtained by Psychological and Pedagogical Studies. Psychopedagogy in Law Enforcement. 2025. Vol. 30. No. 1(100). Pp. 90-96 (In Russ.). https://doi.org/10. 24412/1999-6241-2025-1100-90-96

Основные положения

1. Применение непараметрических критериев для количественного анализа данных педагогического эксперимента позволяет проверить гипотезы, выдвигаемые исследователем, оценить эффективность психолого-педагогического воздействия и принять обоснованное решение по оптимизации исследуемого процесса и внедрению педагогических технологий.

2. К простым непараметрическим критериям относятся многофункциональный статистический критерий Фишера (угловое преобразование Фишера), который позволяет быстро обработать практически любые данные, а также критерий хи-квадрат, или критерий согласия Пирсона. Преимуществом критерия Пирсона является то, что он позволяет выполнить сопоставление распределения признаков, представленных в любой шкале.

3. В условиях быстрого развития технологий искусственного интеллекта их использование становится перспективным инструментом для повышения эффективности работы исследователей. Основные направления применения искусственного интеллекта исследователем включают поиск и анализ данных, автоматизацию процес-

са диагностики, моделирование сценариев, визуализацию данных и др.

Введение

Актуальность, значимость и сущность проблемы.

Анализ данных с применением методов математической статистики является неотъемлемой частью оценки достоверности результатов, полученных исследователем. Рассмотрим возможности ChatGPT, позволяющие дополнить методы математической статистики для анализа данных психолого-педагогических исследований.

В современных условиях интенсивного развития технологий искусственного интеллекта (далее —ИИ) стоит рассматривать их как инструменты, повышающие эффективность работы исследователя.

Использование технологий ИИ в работе исследователя облегчает поиск данных, генерацию и анализ текста, идей для исследования, создание опросников и анкет, разработку учебных материалов, интерпретацию статистических данных, анализ больших данных, выделение закономерностей в результатах опросов, тестов [1], автоматизацию процесса диагностики и оценки результатов, моделирование различных сценариев психолого-педагогического эксперимента;

визуализацию данных, обучение и использование ChatGPT как нейропреподавателя, нейрометодолога, нейроконсуль-танта в режиме non-stop на основе базы знаний, на которой обучена нейросетевая модель, и др.

В данной статье показано применение критериев Фишера и Пирсона для оценки сформированности когнитивного компонента исследовательской компетентности обучающихся, распределенных по уровням: базовый, средний (учебно-исследовательский) и высокий (творческий) [2].

Материалы, результаты и обсуждение

Исследователю необходимо заранее определиться с методами математической статистики для оценки планируемых результатов. Применение статистических методов в интерпретации психолого-педагогических исследований, как правило, затруднено формализацией полученных результатов. К числу ключевых проблем в формализации данных относятся многогранность психолого-педагогических явлений, сложных для их количественной оценки, таких как личностные качества, мотивация и др.; субъективность данных, полученных в результате исследования в ходе опроса или анкетирования; динамика исследуемых процессов, требующая учитывать временные изменения и контекст проведения психолого-педагогического эксперимента [3-5]. Таким образом, формализация данных исследования создает основу для выбора статистических критериев и последующей успешной интерпретации результатов исследования.

Практикум и алгоритм применения методов математической статистики и технологий искусственного интеллекта. Для анализа данных эмпирических исследований используют параметрические и непараметрические критерии. Выбор критериев в основном зависит от типа данных, размера выборки, от количества ожидаемых наблюдений по каждому диагностируемому параметру и целей исследования. Самым распространенным параметрическим критерием является t-критерий, который применяется исключительно для выборок, имеющих нормальное распределение. Непараметрические критерии не выдвигают такого строгого требования к распределению данных [6-7]. Для проверки достоверности психологического или педагогического эксперимента наиболее распространенными непараметрическими параметрами являются статистический критерий Фишера и критерий хи-квадрат, или критерий Пирсона. Указанные непараметрические критерии применяются , например, для проверки гипотез относительно однородности экспериментальной и контрольной групп на этапе констатирующего эксперимента (исходная диагностика) и достоверности различий полученных результатов в этих же группах после проведения формирующего эксперимента (итоговая диагностика).

В качестве примера выбрана оценка уровня сформированности когнитивного компонента исследовательской компетентности обучающихся.

В таблице 1 представлены результаты оценки уровня когнитивного компонента (КК) в экспериментальной (ЭГ) и контрольной (КГ) группах согласно количеству респондентов, имеющих соответствующий уровень.

Таблица 1. Уровни когнитивного компонента респондентов экспериментальной и контрольной групп (Table 1. Levels of the cognitive component of respondents

Группа Диагностика Уровень сформированности КК, количество респондентов Всего, количество респондентов

Базовый Средний Высокий

ЭГ Исходная 24 7 4 35

Итоговая 0 11 24 35

КГ Исходная 32 7 0 39

Итоговая 2 26 11 39

В первую очередь необходимо выяснить границы применимости критериев Фишера и Пирсона для анализа полученных данных.

К основным ограничениям применения критерия Пирсона [7, с. 117] относятся следующие:

— объем выборки должен быть не менее 30 респондентов;

— минимальное число наблюдений для каждого значения признака должно быть не менее 5;

— необходимо вносить так называемую «поправку на непрерывность», или поправку Йетса, при сопоставлении признаков, которые принимают только два значения.

Используем альтернативную возможность для выяснения перспективы применения того или другого критерия через взаимодействие с чат-ботом, размещенным на платформе Perplexity AI (AI — аббревиатура ИИ) *.

Perplexity AI (далее — Perplexity) была основана в 2022 г., обучена на данных до 2021 г., представляет собой поисковую систему и чат-бот на базе искусственного интеллекта. Платформа поддерживается мощными языковыми моделями, такими как GPT-4 и Claude-3, позволяющими не только предоставить ответ на запрос пользователя, но и выполнить анализ соответствующей информации. При этом следует отметить, что Perplexity реализует поиск в интернете в реальном времени и предоставляет актуальные ссылки текущего периода. Существенным преимуществом этой платформы является также сопровождение большинства ответов чат-бота актуальными ссылками на используемые источники информации при формировании ответов. Взаимодействие чат-бота с пользователем в интерактивном режиме происходит на основе запросов, или так называемых промтов (от англ. promt). Промт является важным инструментом для эффективного взаимодействия с нейросетями, чем конкретнее сформулирован промт, тем более релевантным будет ответ.

Сформулируем промт для нашей задачи.

«Всего респондентов в экспериментальной группе — 35, в контрольной группе — 39. В исходной диагностике 24 респондента экспериментальной группы имеют базовый уровень, 7 респондентов — средний уровень и 4 респондента — высокий уровень; в контрольной группе: 32 респондента имеют базовый уровень и 7 — повышенный, 0 респондентов — высокий уровень. Могу ли я применить критерий Пирсона (хи-квадрат)?»

* Perplexity : официальный сайт. URL: http://www.perplexity.ai/ (дата обращения: 15.10.2023). 92 ISSN 1999-6241 Психопедагогика в правоохранительных органах. 2025. Том 30, № 1(100)

Далее чат-бот выдает ответ, содержащий условия применения критерия Пирсона, которые в полной мере соответствуют ранее указанным условиям. Приведем здесь ответ чат-бота.

Условия применения критерия Пирсона (ответ чат-бота):

«1. Тип данных: Критерий Пирсона используется для анализа категориальных данных, которые можно разделить на различные группы. В вашем случае данные о респондентах с базовым, средним и высоким уровнями являются категориальными.

2. Ожидаемые частоты: Для применения критерия хи-квадрат желательно, чтобы ожидаемые частоты в каждой ячейке таблицы были не менее 5. Если это условие не выполняется, рекомендуется использовать критерий Фишера.

3. Размер выборки: Критерий Пирсона лучше всего работает при достаточно большом размере выборки. В вашем случае 35 респондентов в экспериментальной группе и 39 в контрольной группе, что является приемлемым размером выборки».

Обратим внимание на пункт 2 в условиях применения. Как видно из таблицы 1, на этапе исходной диагностики респонденты с высоким уровнем в контрольной группе отсутствовали. Данный факт относится ко второму из вышеперечисленных ограничений.

Сформулируем данный запрос чат-боту: «в моем случае доля респондентов контрольной группы для высокого уровня равна 0. Как быть с тем условием, что для применения критерия хи-квадрат желательно, чтобы ожидаемые частоты в каждой ячейке таблицы были не менее 5?»

Далее приведем только часть ответа чат-бота: «если в вашей таблице сопряженности для контрольной группы ожидаемая частота для высокого уровня равна 0, это создает проблему для применения критерия Пирсона (хи-квадрат). Давайте разберем, что это означает и как поступить в такой ситуации». Чат-бот описывает, к чему может привести проблема с нулевыми значениями, а также альтернативные подходы.

Итоговое заключение, данное чат-ботом: «таким образом, если у вас есть ячейка с ожидаемой частотой 0, применение критерия Пирсона (хи-квадрат) будет неуместным. Рекомендуется использовать критерий Фишера или рассмотреть возможность объединения категорий для обеспечения корректности анализа».

В контексте данных исследования, приводимых в настоящей статье, возможно объединить их в группы, чтобы исключить нулевые значения, в таком случае применение критерия Пирсона будет допустимым.

Проверим границы применимости критерия Фишера для анализа данных исследования. Критерий Фишера (ф*) применяется при сопоставлении выборок экспериментальной и контрольной групп, представленных в виде альтернативной шкалы «есть эффект» — «нет эффекта». В этом случае две выборки сравниваются по частоте встречаемости эффекта, который интересует исследователя. К основным ограничениям критерия Фишера

относится соблюдение пропорций в сопоставляемых выборках — при численности от 5 респондентов в каждой выборке возможны любые сопоставления, однако если в одной из выборок меньше 5 респондентов, то для выявления достоверных различий рекомендуются следующие пропорции: 2:>30; 3:>7; 4:>5 [7, с. 160].

Результаты исследования поддаются распределению на группы «есть эффект», «нет эффекта». Однако отметим, что предположить возможное разделение респондентов на группы стоит еще до начала проведения педагогического или психологического эксперимента. Исследователю необходимо подобрать такие диагностические методики, с помощью которых можно собрать данные исследования, позволяющие увидеть или не увидеть предполагаемый эффект от проведения соответствующего эксперимента. В этом случаем будет уместным применение критерия Фишера.

Резюмируя приведенный опыт использования инструментов ИИ, мы приходим к заключению, что они являются хорошим дополнением для исследователя, позволяющим значительно упростить и ускорить процесс работы над исследованием, в частности в понимании методов математической статистики в контексте проводимого исследования. Очевидно, чат-бот не должен полностью заменить чтение специальной литературы и изучение основ математической статистики, но может помочь исследователям без специальной подготовки лучше разобраться в выборе применяемых методов и последующей интерпретации полученных результатов.

Отметим, что результаты применения критериев Фишера и Пирсона в контексте рассматриваемого исследования подробно изложены нами в статье «Использование непараметрических критериев Пирсона и Фишера для анализа данных педагогических исследований» [2].

Рассмотрим основные подходы к применению критерия Фишера как наиболее простого метода математической статистики и использование чат-бота для дополнительной интерпретации полученных результатов.

Практика применения критерия Фишера ф* для проверки гипотез. Покажем применение критерия Фишера ф* для проверки гипотез:

— нулевая гипотеза (Н0) — гипотеза об отсутствии различий между распределениями признака в ЭГ и КГ. В контексте нашего исследования это значит, что доля лиц с базовым и повышенным уровнями сформиро-ванности когнитивного компонента исследовательской компетентности в ЭГ по итогам констатирующего эксперимента не больше, чем в КГ;

— альтернативная гипотеза (Н1) — доля лиц с базовым и повышенным уровнями сформированности когнитивного компонента исследовательской компетентности в ЭГ по итогам констатирующего эксперимента больше, чем в КГ.

В рассматриваемом примере объединим респондентов в группу по признаку «есть эффект» тех, у которых значения уровня когнитивного компонента соответствуют среднему и высокому, а признак «нет эффекта» будет соответствовать группе респондентов, имеющих базовый уровень. Распре-

деление эмпирических частот по двум значениям признака «есть эффект» — «нет эффекта» представлено в таблице 2.

Таблица 2. Оценка однородности групп на основе критерия Фишера для когнитивного компонента исследовательской

компетентности обучающихся (исходная диагностика) (Table 2. Assessment of group homogeneity based on Fisher's test for the cognitive component of students' research competence (initial diagnostics))

Для применения критерия Фишера необходимо сравнить долю респондентов в выборке экспериментальной группы, которые имеют признак «есть эффект», с долей респондентов в контрольной группе, имеющих тот же эффект. Затем необходимо воспользоваться таблицами критических значений угла ф [7, таблица XII, с. 330] для соответствующей процентной доли. Так, согласно указанным таблицам величина угла ф для уровня когнитивного компонента по значению признака «есть эффект» для доли 31% в экспериментальной группе составила ф1(31%)=1,182, а для доли 18% в контрольной группе — ф2(18%)=0,876 (табл. 3).

Таблица 3. Таблица критических значений величины угла ф

для процентных долей: 18 и 31%(исходная диагностика) (Table 3. Critical value table of angle ф for fractions 18 and 31% (initial diagnostics))

Значения вышеприведенных табличных критических значений используют для вычисления эмпирического значения ф* критерия Фишера по формуле [7, с. 162]:

где:

ф1 — угол, соответствующий большей процентной доле респондентов;

ф2 — угол, соответствующий меньшей процентной доле респондентов;

п1 — общее количество респондентов в выборке 1; п2 — общее количество респондентов в выборке 2. Вычисленное по формуле (1) эмпирическое значение критерия Фишера составило ф* =1,314.

Критические значения ф*, принятые в психологии как соответствующие уровням статистической значимости, имеют следующие значения [7, с. 162]:

. = (1-64(р < 0,05) 12,31 (р < 0,01)

Далее требуется провести сравнение вычисленного эмпирического значения критерия Фишера ф* =1,314 с принятым критическим значением, равным ф*кр=1,64. Сравнение этих величин показывает, что вычисленное значение критерия Фишера меньше критического. Данный результат сравнения говорит о том, что вычисленное значение не находится в зоне значимости, что позволяет принять гипотезу Н0 и считать экспериментальную и контрольную группы однородными по итогам констатирующего этапа экспериментальной работы по результатам оценки когнитивного компонента.

Далее применим инструменты ИИ для дополнительного анализа полученного результата. Сформулируем промт для чат-бота: «Я использую критерий Фишера для сравнения однородности групп — экспериментальной и контрольной. Мои гипотезы: {здесь изложены гипотезы, указанные в тексте выше}. Получено следующее значение для эмпирического значения критерия Фишера=1,314; критическое значение Фишера=1,64. Какой вывод следует сделать о принятии гипотез и почему?»

В итоге ответ чат-бота по заданному промту содержит не только заключение о принятии гипотезы, но и шаги для анализа, приведем итоговое заключение: «На основе вашего эмпирического значения критерия Фишера (¥=1,314) и критического значения (¥ =1,64) вы можете сделать

1 к крит. '

следующие выводы:

Сравнение эмпирического и критического значений

1. Эмпирическое значение Б: 1,314

2. Критическое значение Б: 1,64 (при уровне значимости а=0,05)

Принятие решения

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Поскольку Б <Б (1,314<1,64), вы не отвергаете ну' эмп. крит. 4 ' 1 '

левую гипотезу (Н0).

Итог

Нулевая гипотеза (Н0): „Доля лиц с базовым и повышенным уровнями сформированности когнитивного компонента в экспериментальной группе по итогам констатирующего эксперимента не больше, чем в контрольной группе".

Альтернативная гипотеза (Н1): „Доля лиц с базовым и повышенным уровнями сформированности когнитивного компонента в экспериментальной группе по итогам констатирующего эксперимента больше, чем в контрольной группе".

Так как ваше эмпирическое значение не превышает критическое, это означает, что нет статистически значимых различий между долями лиц с базовым и повышенным уровнями в экспериментальной и контрольной группах. Следовательно, на основании ваших данных вы не можете подтвердить альтернативную гипотезу о том, что доля лиц в экспериментальной группе выше, чем в контрольной.

В результате анализа можете заключить, что данные не предоставляют достаточных оснований для утверждения о том, что экспериментальная группа имеет более высокие

Группа «Есть эффект» «Нет эффекта» Количество респондентов Критерий Фишера

Количество респондентов Доля, % Количество респондентов Доля, %

Когнитивный компонент

ЭГ 11 31 24 69 35 1,314

КГ 7 18 32 82 39

Сумма 18 56 74

Доля, %, последний десятичный знак

К ч 0 1 2 3 4 5 6 7 8 9

« Значения угла ф

18 0,876 0,879 0,881 0,884 0,887 0,889 0,892 0,894 0,897 0,900

31 1,182 1,183 1,185 1,187 1,190 1,192 1,194 1,196 1,198 1,200

доли лиц с базовым и повышенным уровнями по сравнению с контрольной группой».

Таким образом, заключение чат-бота полностью подтверждает наши выводы и делает их более развернутыми. При необходимости чат-боту можно задать дополнительные уточняющие вопросы. Стоит отметить, что наличие нейроассистента в виде чат-бота помогает исследователю сделать обоснованные выводы, лучше понять используемые концепции, улучшить свои навыки анализа, в том числе развивать свое критическое мышление.

Далее покажем применение критерия Фишера для проверки значимости различий уровня сформированно-сти исследовательской компетентности по когнитивному компоненту. По итогам формирующего эксперимента формулируются следующие гипотезы:

Н0 — доля лиц с высоким уровнем сформированности когнитивного компонента исследовательской компетентности в экспериментальной группе по итогам формирующего эксперимента не больше, чем в контрольной группе;

Н — доля лиц с высоким уровнем сформированности когнитивного компонента исследовательской компетентности в экспериментальной группе по итогам формирующего эксперимента больше, чем в контрольной группе.

Для расчета критерия Фишера при сопоставлении двух групп респондентов по данным итоговой диагностики строится аналогичная таблица эмпирических частот по двум значениям признака «есть эффект» — «нет эффекта» для уровня когнитивного компонента исследовательской компетентности (табл. 4).

Таблица 4. Таблица для расчета критерия Фишера по уровню сформированности когнитивного компонента

(итоговая диагностика) (Table 4. Table for calculating the Fisher's test based on the level of development of the cognitive component (final diagnostics))

Группа «Есть эффект» «Нет эффекта» Количество респондентов

Количество респондентов Доля, % Количество респондентов Доля, %

ЭГ 20 57 15 43 35

КГ 11 28 28 72 39

Сумма 31 43 74

Кш = (1-711 - 1,115)

N

35 ■ 39

35 + 39

= 2,560.

Используем те же критические значения ф*, соответствующие принятым в психологии уровням статистической значимости, представленные выше в выражении (2).

На основании проведенного сравнения эмпирического и критических значений критерия Фишера видно, что эмпирическое значение в этом случае находится в зоне значимости ф* >2,31 и соответствует уровню статистической значимости р<0,01. На основании этого сравнения нулевая гипотеза Н0 отклоняется и принимается альтернативная гипотеза Н1, согласно которой доля лиц с высоким уровнем сформированности когнитивного компонента исследовательской компетентности в экспериментальной группе по итогам формирующего эксперимента больше, чем в контрольной группе.

Отметим дополнительную возможность представить визуализацию вычисленного эмпирического значения критерия Фишера на так называемой «оси значимости» (рис.). «Ось значимости» имеет три «зоны», разделенные критическими значениями критерия, соответствующие принятым в психологии уровням статистической значимости: «зону незначимости», «зону неопределенности» и «зону значимости». Принятие гипотезы или ее отклонение зависит от расположения точки эмпирического значения критерия на «оси значимости» [4, с. 145]. Эмпирическое значение критерия Фишера для проверки достоверности различий между группами находится в «зоне значимости», что позволяет отклонить нулевую гипотезу Н0 и принять альтернативную гипотезу Н1.

Величины угла ф находят в соответствующих таблицах критических значений [7, таблица XII, с. 330], исходя из процентных долей групп «есть эффект». Величины угла ф согласно таблице критических значений для доли респондентов «есть эффект» по результатам итоговой диагностики, указанных в таблице 4, имеют следующие значения: ф1(57%)=1,711 [7, с. 331], ф2(28%)=1,115 [7, с. 330].

Эмпирическое значение ф* также вычисляется по формуле (1), указанной выше. В данном случае:

Рис. «Ось значимости» для критерия Фишера (когнитивный компонент, итоговая диагностика) (Fig. «Axis of significance» for Fisher's test (cognitive component, final diagnostics))

Далее аналогично можно применить инструменты ИИ для дополнительного анализа полученного результата.

Выводы

Непараметрические критерии Фишера и Пирсона являются самыми распространенными методами математической статистики для анализа психолого-педагогических данных, позволяющих достоверно доказать или опровергнуть статистически значимые различия, способствуя принятию обоснованных решений. Выбор между критериями зависит, в первую очередь, от конкретных целей исследования, а также определяется типом данных и размером выборки. Важно заранее понять, какие методы математической статистики будут применены для анализа данных исследования, чтобы на этапе планирования эксперимента была возможность спланировать их дальнейший анализ с помощью статистических методов.

В условиях интенсивного развития технологий ИИ инструменты на их основе могут существенно повысить эффективность планирования эксперимента и последующий анализ экспериментальных данных. В частности, грамотное использование возможностей ChatGPT позволит упростить и ускорить работу над исследованием, позволяя исследователю сконцентрироваться на более важных аспектах своей деятельности.

Область применения и перспективы. Оказание помощи педагогам и психологам, молодым исследователям в использовании методов математической статистики и технологий искусственного интеллекта при обработке эмпирических данных, полученных в результате исследований в различных группах респондентов, и их интерпретации. Инструменты искусственного интеллекта могут быть при-

менены аспирантами и соискателями для количественного и качественного анализа результативности выполненных диссертационных работ по психолого-педагогическим наукам. Основные алгоритмы применения методов математической статистики и технологий искусственного интеллекта могут в дальнейшем использоваться исследователями без специальной подготовки.

Список источников / References

1. Осипенко Л. Е., Козицына Ю. В., Короткое А. В. Исследовательское и машинное обучение: от сопоставления к конвергенции // Психолого-педагогические исследования. 2022. Т. 14, № 4. С. 127-146. Шр8://<1о1.огд/10.17759/р8уес1и.2022140408.

2. Афанасьева Ж. С. Использование непараметрических критериев Пирсона и Фишера для анализа данных педагогических исследований // Вестник педагогических наук. 2023. № 8. С. 207-216.

3. Христидис Т. В., Новашина М. С. Методы математической статистики в педагогических исследованиях: теория и практика применения // Вестник Московского государственного университета культуры и искусств. 2023. № 2(112). С. 111-122.

4. Безусова Т. А. Использование методов математической статистики в педагогическом исследовании // Гуманизация образования. 2018. № 6. С. 143-149.

5. Dwivedi R. Pandey N. Analysis of Evaluation Data Collected on Likert Type Items: Humanities-Courses. Journal of Data Analysis and Information Processing. 2021. № 9. Рр. 102-121. https://doi.org/10.4236/jdaip.2021.92007.

6. Сорокова М. Г. Математические методы в психолого-педагогических исследованиях : учеб. пособие. М., 2020. 216 с.

7. Сидоренко Е. В. Методы математической обработки в психологии. СПб., 2000. 350 с.

Поступила 01.12.2023; одобрена после рецензирования 10.02.2024; принята к публикации 30.12.2024.

Все авторы внесли эквивалентный вклад в подготовку публикации.

Авторы заявляют об отсутствии конфликта интересов.

i Надоели баннеры? Вы всегда можете отключить рекламу.