ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ
УДК 004.021
М. Ю. Макарова
РАЗРАБОТКА АЛГОРИТМОВ УПРАВЛЕНИЯ ПРОФОРИЕНТАЦИОННЫМИ ПРОЦЕССАМИ В ИНФОРМАЦИОННОЙ СИСТЕМЕ
Аннотация.
Актуальность и цели. В последнее время вопросы профориентации приобретают особую актуальность, поскольку устремления большей части общества не соответствуют требованиям рынка труда: появляется множество специалистов с «модными» профессиями, а имеющиеся вакансии остаются невостребованными. Рассматриваемая в статье информационная система направлена на решение этих проблем за счет реализации дистанционного предоставления следующих возможностей: получение информации о востребованных профессиях с описанием и требуемым образованием, включая разновидности и схожие виды деятельности, определение интересов и склонностей пользователей и формирование в соответствии с ними рекомендаций по выбору будущей профессии. Цель данной работы - разработка алгоритмов управления процессами профориентации для информационной системы, которая обеспечивает профориентационное просвещение, диагностику и консультирование.
Материалы и методы. Под управлением профориентационными процессами понимается реализация процедур оказания помощи пользователям при выборе профессии, предоставляя при этом наиболее подходящие для их освоения направления обучения и объединяя схожие виды профессиональной деятельности. Этот подход реализован с помощью метода латентно-семантического анализа, который, используя сингулярное разложение частотной матрицы встречаемости слов и значение косинусной меры сходства, позволяет устанавливать соответствия между описаниями профессий и компетенциями, описанными в государственных образовательных стандартах.
Результаты. Рассмотрен алгоритм расчета коэффициента соответствия для профессий, в основе которого лежит метод латентно-семантического анализа. Разработан алгоритм добавления новых профессий, уникальный тем, что в процессе добавления записи на основе указанного описания предоставляются схожие профессии, имеющие наибольшие значения коэффициента соответствия. Предложен алгоритм формирования рекомендаций по выбору будущей профессии в соответствии с данными профориентационной диагностики пользователя. Представлены результаты программной реализации описанных методов и алгоритмов, которые демонстрируют корректность и правильность информационной системы.
Выводы. Разработанные алгоритмы позволяют повысить эффективность осуществления процессов профориентации за счет предоставления свободного доступа к современному миру профессий с указанием требований к должно-
сти, квалификации и предоставлением схожих видов деятельности. Использование рассмотренной информационной системы школьниками при выборе учебного заведения или соискателями при поиске места работы поможет устранить существующие противоречия между интересами и склонностями общества и актуальными требованиями рынка труда.
Ключевые слова: метод латентно-семантического анализа, алгоритмы управления профориентационными процессами, информационная система управления профориентацией.
M. Yu. Makarova
DEVELOPMENT OF ALGORITHMS OF VOCATIONAL GUIDANCE PROCESSES MANAGEMENT IN THE INFORMATION SYSTEM
Abstract.
Background. Recently, vocational guidance issues have become particularly important due to the fact that ambitions of the majority of society do not correspond to labor market requirements: there are lots of experts with "fashionable" professions and the existing vacancies remain unclaimed. The information system, considere in the article is aimed at solving these issues by implementing the remote provision of the following capabilities: obtaining information on popular professions with description and required education, including similar professions, definition of interests and aptitudes of users and formation of recommendations on choosing professions. The aim of this work is to develop control algorithms of vocational guidance processes for the information system that provides vocational-oriented education, diagnostics and counseling.
Materials and methods. Management of professional orientation processes is the implementation of procedures to assist users when choosing a profession, offering the training directions in which it is possible to master suitable professions and grouping similar types of professional activity. This approach is implemented using the method of latent semantic analysis, which, using the singular value decomposition of the frequency matrix of words and the cosine similarity measure value, allows to set the correspondence between the profession description and competencies in the educational standards.
Results. The artilce considers the algorithms of vocational guidance management in the information system on the basis of the latent semantic analysis method. The author developed an algorithm for adding new professions distinguished by the fact that in the process of adding a user can receive information about similar professions. The researcher also suggests an algorithm of recommendations for user’s choice of future profession after career guidance diagnostics. The article presents the results of the software realization of the described methods and algorithms that demonstrate correctness and accuracy of this system.
Conclusions. The developed algorithms allow to raise the efficiency of vocational guidance processes by providing free access to modern professions with indication of jpb requirements, including qualification and similar professions. Using the information system matriculants or applicants can select suitable profession, and it will help to resolve the existing contradictions between the interests and inclinations of the society and the relevant requirements of the labor market.
Key words: method of latent semantic analysis, algorithms of vocational guidance processes management, information system of career guidance management.
Введение
В настоящее время на рынке труда наблюдается следующий дисбаланс: все больше появляется специалистов по «модным» специальностям, что усиливает конкуренцию, а многие вакансии остаются невостребованными. Профориентация направлена на устранение противоречий между устремлениями общества и требованиями рынка труда. Но, к сожалению, профориентационная работа зачастую не осуществляется своевременно, что влечет за собой ошибки при выборе направления обучения и сложности с трудоустройством впоследствии. Рассматриваемая в данной статье информационная система обеспечивает профориентационную поддержку: позволяет определить личностные качества пользователей и получить не только наиболее подходящие в соответствии с ними профессии, но и направления обучения, которые необходимы для освоения той или иной профессии.
Цель работы - разработка алгоритмов управления профориентационными процессами для информационной системы, обеспечивающей профориентационную диагностику и консультирование.
1. Метод управления процессом профориентации
Сущность профориентации заключается в том, чтобы направить личностные устремления пользователей, определенные с помощью известных профориентационных методик (например, методика Климова, карта интересов, опросник профессиональной готовности и др.), на освоение профессий, востребованных на рынке труда. Иными словами, профориентационная деятельность заключается в установлении соответствия между профессиональными интересами и знаниями людей и потребностями общества в кадрах.
В результате построения модели процесса профориентации [1] был сделан вывод о необходимости разработки механизма установления соответствий между профессиями и направлениями обучения. Для этого был выбран метод латентно-семантического анализа (ЛСА) [2], основанный на идее, что совокупность всех документов, в которых встречается и не встречается данное слово, задает множество обоюдных ограничений, позволяющих в значительной степени определить похожесть лексических значений слов между собой, используя значение косинусной меры сходства [3].
В качестве входных данных для латентно-семантического анализа в системе используются описания профессий согласно квалификационному справочнику должностей [4] и компетенции, представленные в государственных образовательных стандартах (ГОС). С помощью данного метода для каждой профессии были получены коэффициенты соответствия (ОСЯ) имеющимся в базе данных системы направлениям обучения, максимальные значения рассчитанных коэффициентов определяют соответствующее для той или иной профессии высшее образование.
Алгоритм расчета коэффициента соответствия с использованием метода латентно-семантического анализа представлен на рис. 1.
Рассмотрим более подробно процессы, описанные в данном алгоритме. Составление частотной матрицы заключается в предварительной обработке входных данных: исключении стоп-слов и выделении основы слов (термов), так называемая операция стемминга, которая реализована по алгоритму Пор-
тера [5], а затем представлении данных в виде матрицы, в которой строки -полученные термы, нулевой столбец означает описание профессии, а остальные столбцы - блоки компетенции в ГОС. В каждую ячейку записывается, сколько раз тот или иной терм используется в данном текстовом блоке. Стоит отметить, что в частотной матрице не учитываются термы, встречающиеся один раз в исходных текстовых блоках, что позволяет сократить размерность матрицы и, соответственно, упростить дальнейшие математические вычисления.
Рис. 1. Алгоритм расчета коэффициента соответствия (OCR) для профессий
Поскольку исходные тексты разной длины, полученную на предыдущем этапе частотную матрицу необходимо нормализовать. Для этого была использована мера TF-IDF:
П: I.DI
TF • IDF = ----lg 1 1 .., (1)
Lknk d 3 {i)
где ц - число использования данного терма в текстовом блоке; I * пк - общее количество термов в данном блоке; |.0| - количество текстовых блоков;
|(( з ) - количество блоков, в которых встречается данный терм.
Таким образом, каждой ячейке будет присвоено значение в соответствии с рассчитанной мерой ТР-ГОР, причем большой вес получат термы с высокой частотой в пределах конкретного документа и с низкой частотой употреблений в других документах.
Сингулярное разложение полученной нормализованной матрицы позволяет выделить ключевые составляющие матрицы и игнорировать шумы и реализуется по следующей формуле:
где и - ортогональная матрица; Ж - диагональная матрица, которая содержит
ся вывод о степени схожести текстовых документов.
Расчет косинусной меры сходства выполняется на основе трехмерной
где Cj - коэффициенты сходства компетенций в ГОС с описанием профессии; Voo, V\q, V20 - значения нулевого столбца (описание профессии); Vq¿, VU, V2 j - значения i-го блока компетенций.
Следует также отметить, что метод латентно-семантического анализа применяется в рассматриваемой системе для объединения схожих видов профессиональной деятельности в группы: в процессе добавления новой профессии в базу данных производится расчет коэффициентов сходства с уже имеющимися записями.
Таким образом, рассмотренный метод управления процессом профориентации позволяет устранить существующие противоречия в понимании сущности профессий и облегчить профессиональный выбор. Пользователь системы сможет не просто определить профессиональные личностные качества с помощью известных профориентационных методик, а выбрать наиболее подходящую для него будущую профессию (или несколько профессий) и возможные варианты получения требуемого для этой профессии образования.
2. Алгоритмы поддержки профориентационных процессов
В рассматриваемой информационной системе предоставляется возможность добавления новых профессий работодателями или администратором, что позволит иметь в базе данных (БД) актуальные сведения рынка труда и профессионально ориентировать пользователей в соответствии с ними. Алгоритм добавления новой профессии представлен на рис. 2.
M = U ■ W ■ VT ,
(2)
T
сингулярные числа; V - ортогональная матрица, на основе которой делает-
Сг V(Vq,g)2 + (Vi,o)2 + (V2,o)2 V(Vo,i)2 + (Vl,i)2 + (Vm)2 ’
(3)
Рис. 2. Алгоритм добавления новой профессии в базу данных информационной системы
Данный подход позволит избежать сложностей в понимании сущности профессий, поскольку при появлении на рынке труда новой профессии можно увидеть схожие по описанию. В свою очередь установление соответствий между профессиями и направлениями обучения значительно облегчает выбор учебного заведения, поскольку большинство школьников (которым чаще всего приходится делать данный выбор) не имеют представления о том, какие знания необходимы для той или иной профессии.
Для обеспечения поддержки профориентационных процессов также был разработан алгоритм, реализующий подбор наиболее подходящих для пользователя профессий, включающий в себя процедуру диагностики пользователей и формирование результата (рис. 3).
Рис. 3. Алгоритм подбора наиболее подходящих для пользователя профессий
Пользователям информационной системы предлагаются различные профориентационные методики с целью определения наиболее подходящих ему профессий, тесты и их количество выбирает сам пользователь. Результатом прохождения тестирования является список профессий, причем по разным тестам могут быть получены разные профессии, а некоторые из них могут повторяться. В связи с этим был введен коэффициент СЯ, означающий, насколько (в процентном отношении) пользователю подходит та или иная профессия. Расчет СЯ осуществляется по формуле:
CR = И -100%,
T
(4)
где - количество одинаковых профессий, полученных по разным методикам; |г| - количество выбранных пользователем тестов.
Стоит отметить, что данный алгоритм обеспечивает не просто формирование результатов прохождения профориентационных тестов, как большинство существующих информационных систем по профориентации [6],
а представляет наилучшим образом отвечающие личностным устремлениям и возможностям пользователя профессии и их разновидности, а также направления обучения, по которым можно освоить эти профессии. Это позволит избежать сложностей при выборе будущей сферы профессиональной деятельности, так как схожие профессии сгруппированы.
3. Результаты реализации методов и алгоритмов управления профориентацией
Описанные выше методы и алгоритмы управления профориентационными процессами были программно реализованы в информационной системе. В качестве программных средств были выбраны PHP, JavaScript, использование которых позволило обеспечить свободный дистанционный доступ к системе.
Программная реализация алгоритма добавления профессии в базу данных системы показана на примере профессии «Адвокат» и представляет собой последовательное выполнение следующих шагов. На рис. 4 указаны необходимые для заполнения исходные данные (название и описание профессии).
Добавить профессию:
'Название:
'Описание:
Адвокат
изучение законов, подзаконных актов, нормативно-правовых актов, международных договоров (также учет действующего законодательства и других нормативных актов) и применение их на практике; оказание юридической помощи посредством консультаций, предоставление устных и письменных справок по законодательству (разъяснение действующего законодательства как в целом по возникшей проблеме, так и по отдельным ее нюансам): правовая защита граждан, организаций, государства, составление исковых заявлений жалоб претензий и других документов правового характера: запрос через юридическую консультацию справок, характеристик и иных документов, необходимых в связи с оказанием юридической помощи, из
Изображение:
Выберите файл
Добавить Отмена
Рис. 4. Фрагмент программной реализации заполнения исходных данных при добавлении профессии
Как было сказано ранее, с использованием метода ЛСА для данной профессии производится расчет коэффициентов сходства с уже имеющимися в системе профессиями, результат этих расчетов представлен на рис. 5.
В случае указания одного из предложенных вариантов (в данном случае был выбран «Юрист», поскольку коэффициент сходства имеет наибольшее значение), запись добавляется как разновидность выбранной профессии в базу данных системы (рис. 6).
На рис. 7 представлен фрагмент программной реализации подбора наиболее подходящих для пользователя профессий на основе проведенной профориентационной диагностики.
Для "Адвокат" являются схожими
Наименование профессии Коэффициент сходства
Юрист 99.3%
Социолог 95%
Добавить новую профессию Добавить разновидность профессии |
Рис. 5. Фрагмент полученных результатов расчета коэффициентов сходства для профессии «Адвокат»
Профессии
@ Дсбаєить @ Удалить Выделить все kj Снять Еыделенне
Ж Название Разновидности прецессии Подходящие ГОС
Юрист «А адвокат, налоговый инспектор С?0&0С Юриспруденция (SS.S'K)
Рис. 6. Фрагмент таблицы «Профессии» после завершения процесса добавления профессии «Адвокат» в БД системы
Поскольку пользователем были выбраны две профориентационные методики, в ходе выполнения расчетов коэффициента СЯ были получены различные значения. Как видно из рис. 7, для профессии «Экономист» коэффициент сходства составляет 50 %, иными словами, согласно одному тесту данная профессия подходит для соискателя, а по-другому - нет. Для более успешной профессиональной деятельности рекомендуется выбирать профессии, имеющие наибольшие значения коэффициентов СЯ. Следует также отметить, что для каждой профессии представлено необходимое профессиональное образование, при нажатии на которое можно увидеть подробную информацию, в частности, вступительные испытания.
Заключение
Разработанная на основе вышеописанных методов информационная система управления профориентационными процессами обеспечивает профориентационную диагностику пользователей и представляет рекомендации относительно выбора будущей профессии. Использование метода латентносемантического анализа позволяет определить, какие направления обучения необходимо освоить для успешной профессиональной деятельности, а также облегчить процесс выбора будущей профессии за счет объединения схожих по описанию специальностей. Разработанные алгоритмы направлены на решение главной проблемы профориентации - устранение противоречий между
потребностями общества и устремлениями большей части этого общества -за счет установления соответствий между личностными качествами пользователей и актуальными требованиями рынка труда.
Рис. 7. Результат, предоставляемый пользователю после проведения профориентационной диагностики в информационной системе
Данная информационная система предназначена в первую очередь для школьников, которые решают, в какое высшее учебное заведение поступать, но также может быть полезна соискателям, так как работодатели размещают в системе новые вакансии.
Список литературы
1. Макарова, М. Ю. Проектирование информационной системы поддержки профориентационных процессов различных уровней / М. Ю. Макарова // Наука и образование. - 2012. - 9 сент. - URL: http://technomag.edu.ru/doc/452460.html
2. Landauer, T. K. Introduction to Latent Semantic Analysis / T. K. Landauer, P. W. Foltz, D. Laham // Discourse Processes. - 1998. - URL:
http://lsa.colorado.edu/papers/dp1.LSAintro.pdf
3. Макарова, М. Ю. Применение латентно-семантического анализа для автоматизации процесса профориентации / М. Ю. Макарова // Системный анализ в науке и образовании. - 2012. - № 3. - URL: http://www.sanse.ru/archive/25.
4. Квалификационный справочник должностей руководителей, специалистов и других служащих. - URL: http://base.consultant.ru/cons/cgi/online.cgi?req=doc;
base=LAW;n=146850;dst=0;ts=D1D14DEE146A26A19EB5B10503915C7C;rnd=0.48 932670685462654
5. The Porter Stemming Algorithm. - URL: http://tartarus.org/~martin/PorterStemmer
6. Макарова, М. Ю. Принципы функционирования информационных систем поддержки профориентации / М. Ю. Макарова // Алгоритмы, методы и системы обработки данных. - 2012. - № 2. - URL: http://amisod.ru/index.php?option= com_content&view=article&id=131:amisod-2012-2-20-makarova&catid=20:amisod-2012-2-20.
References
1. Makarova M. Yu. Nauka i obrazovanie [Science and education]. 2012, 9 Sept. Available at: http://technomag.edu.ru/doc/452460.html
2. Landauer T. K. Discourse Processes. 1998. Available at: http://lsa.colorado.edu/ papers/dp1.LSAintro.pdf
3. Makarova M. Yu. Sistemnyy analiz v nauke i obrazovanii [System analysis in science and education]. 2012, no. 3. Available at: http://www.sanse.ru/archive/25.
4. Kvalifikatsionnyy spravochnik dolzhnostey rukovoditeley, spetsialistov i dru-gikh slu-zhashchikh [Qualification reference of positions of managers, specialists and other personnel]. Available at: http://base.consultant.ru/cons/cgi/online.cgi?req=doc;base=LAW; n=146850;dst=0;ts=D1D14DEE146A26A19EB5B10503915C7C;rnd=0.489326706854 62654
5. The Porter Stemming Algorithm. Available at: http://tartarus.org/~martin/
PorterStemmer
6. Makarova M. Yu. Algoritmy, metody i sistemy obrabotki dannykh [Algorithms, methods and systems of data processing]. 2012, no. 2. Available at: http://amisod.ru/ index.php?option= com_content&view=article&id=131:amisod-2012-2-20-makarova& catid=20:amisod-2012-2-20.
Макарова Мария Юрьевна
аспирант, Муромский институт (филиал) Владимирского государственного университета имени А. Г. и Н. Г. Столетовых (Россия, Владимирская область, г. Муром, ул. Орловская, 23)
E-mail: [email protected]
Makarova Mariya Yur'evna Postgraduate student, Murom Institute (branch) of Vladimir State University named after A. G. and N. G. Stoletov (23 Orlovskaya street, Murom, Vladimir region, Russia)
УДК 004.021 Макарова, М. Ю.
Разработка алгоритмов управления профориентационными процессами в информационной системе / М. Ю. Макарова // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2014. -№ 2 (30). - С. 5-15.