537.591.15
О. В. ЖУРЕНКОВ
Алтайский государственный университет
КЛАССИФИКАЦИЯ ПЕРВИЧНЫХ ЯДЕР СВЕРХВЫСОКОЙ ЭНЕРГИИ НА ОСНОВЕ МНОГОМЕРНОГО АНАЛИЗА ПРОСТРАНСТВЕННО-ВРЕМЕННЫХ ХАРАКТЕРИСТИК ЧЕРЕНКОВСКОГО СВЕТА ШАЛ_
Основываясь на данных численного моделирования ШАЛ был проведён анализ возможности классификации первичных ядер космических лучей (Н, О и Ре) в диапазоне 10 -г 200 ТэВ на ядро по пространственно-временному распределению черенковского света ШАЛ. Для этого использовалось как параметрическое представление временного импульса с применением метода комплексирования аналогов, так и полная информация о пространственно-временном распределении с применением метода опорных векторов (БУМ). Оба подхода позволили провести хорошую классификацию для трёхкомпонентной модели ПКИ.
В настоящее время для изучения химического состава первичных космических лучей (ПКЛ) сверхвысокой энергии (Е - 0,1 -г 100 ТэВ) используются установки наземного базирования, которые регистрируют широкие атмосферные ливни (ШАЛ), порождаемые первичными частицами, вошедшими в атмосферу. Такие установки, как правило, включают в себя систему атмосферных черенковских телескопов (АЧТ), которые часто размещаются в виде периодической решётки. Информация, полученная на основе черенковской компоненты ШАЛ выгодна тем, что обеспечена большей статистикой по сравнению с электронной и мюонной компонентами. С помощью такой системы можно измерять такие характеристики, как пространственное и пространственно-временное распределение черенковского света ШАЛ.
В работах [1,2] было показано, что некоторые параметры пространственно-временного распределения черенковского света ШАЛ существенно зависят от атомного номера первичного ядра. Там же была показана возможность эффективной режекции (подавления) протонов с использованием этих параметров на основе критерия X ■ Такой подход может успешно применяться в гамма-астрономических экспериментах (например, на установке РАСТ[3]), однако для классификации трёх и более групп ядер он не пригоден.
Для классификации сложных многопараметрических объектов (каким и является пространственно-временное распределение черенковского света ШАЛ) используют алгоритмы самоорганизации, такие как адаптивные нейронные сети, эволюционные, генетические алгоритмы и т. п.
В наших расчётах использовались данные о времени регистрации черенковских фотоэлектронов, полученные в результате моделирования ШАЛ программой "Алтай". Эта программа предназначена для детального моделирования методом Монте-Карло черенковского света ШАЛ, инициированного первичной частицей сверхвысокой энергии (у, е, р или ядрами) и откликов детекторов черенковского света. Она хорошо зарекомендовла себя в течение многих лет эксплуатации, в т. ч. в международном проекте
HEGRA. Подробное описание алгоритмов вычислительной программы можно найти в работе [4].
Для моделирования эксперимента была выбрана геометрия установки в виде квадратной решётки (5x5 телескопов) с шагом 50 м (подробное описание установки см. в [5]). Моделировались только вертикальные ливни, положение оси ливня разыгрывалось в центральном квадрате размером 150 м х150 м.
Мы использовали трёхкомпонентную модель первичного космического излучения (ПКИ): р — 60%, ядра О — 30% и ядра Fe — 10%. Эти данные взяты из работы [6] и пересчитаны для нашей модели в данном диапазоне энергий.
Для каждого типа первичного ядра было смоделировано по 6 банков событий, соответствующих различным диапазонам энергии (см. табл. 1). Для обучающих данных для каждого типа ядра число событий в каждом банке взято одинаково, оно уменьшается с 1500 (д\я 1 -го бацка) до 100 (для 6-го банка), при этом количество фотоэлектронов от всех событий в каждом банке примерно одинаково. Соответствие банков разных первичных частиц выбиралось из условия близости среднего значения полного вклада черенковского света в показания детекторов, при этом внутри одного банка отличия числа фотоэлектронов составляет не больше 20%.
Для решения поставленной нами задачи можно использовать параметры временного распределения, которые достаточно хорошо характеризуют временной импульс ШАЛ, что было показано в [1, 2]. В дальнейших исследованиях мы показали возможность успешной классификации (в упрощённых условиях) с помощью нейросетевых алгоритмов [7].
Методмногослойного перцептрона оказался слишком трудоёмким, однако в последующих расчётах мы использовали значения весов парметров, полученные в работе [7]. Для дальнейших исследований был выбран один из алгоритмов метода группового учёта аргументов (МГУА) — метод комплексирования аналогов. Предварительные результаты классификации ядер ПКИ для трёхкомпонентной модели в условиях, приближённых к реальным, представлены в [8].
Таблица 1
Структура энергетических диапазонов (банков данных) для разных первичных ядер
Первич. Е, ТэВ
ядро 1 2 3 4 5 6
Р 10-5-15 15+20 20+30 30+50 50+70 70+100
О 15-20 20+30 30+50 50+70 70+100 100+150
Ре 20+30 30+50 50+70 70+100 100+150 150+200
Дальнейшие наши исследования были проведены с учётом неравномерного состава ПКИ. Статистика событий, используемая для обучения и классификации представлена на рис. 3. Если для обучения использовались события с известной энергией и положением оси ШАЛ, то для классификации эти характеристики события определялись из пространственно-временного распределения черенковского света ШАЛ, детали этих алгоритмов изложены в [5, 8, 9].
Некоторые результаты классификации приведены на рис. 1: вероятности правильной классификации для каждого первичного типа ядра для всех рассматриваемых энергий для г-100 м представлены на рис. 1а); для четвёртого энергетического банка (Е = 30+ 50 ТэВ, Е0 = 50 -ь 70ТэВ, ЕТс = 70 +100 ТэВ) для разных расстояний от оси ШАЛ приведены на рис. 16). Следует отметить, что распознавание на краях (г - 0 25 м и г - 200 + 225 м) не обеспечивается достаточной статистикой и не может использоваться для каких-либо заключений в наших условиях моделирования.
Чтобы оценить эффективность метода, введём эффективность классификации къ для первичного
Таблица 2
Эффективность классификации первичных ядер к и изменение скорости счёта Л/ Я
типа Ъ как к-, = -
•, где Р-, — вероятность истин-
ной классификации. Так, эффективность классификации для 4-го энергетического банка на расстоянии 100 м от оси — к — 3,1, к0 = \,\, к>е - 9,1 ■ Значения эффективности для расстояний г ~ 75 -г 125 м от оси ливня для энергий 10 — 200 ТэВ — - 1,6 + 5,2 , к0 -0,5 + 4,1, АГре —1,5 -е- 9,1. Эффективность классификации немного увеличивается с ростом энергии, что вполне согласуется с известными экспериментальными данными и результатами моделирования, использующими трёхкомпонентную модель ПКИ (см., например [10] или [11], где используются нейронные сети и данные относительно Л^ и Ыс для области ультравысоких энергий).
В астрофизических экспериментах одним из важнейших показателей эффективности работы установки является скорость счёта Я = , где Г} — телесный угол обзора установки, $ — эффективная площадь регистрации, а J — поток ПКИ. Как видно, скорость счёта зависит от конструктивных особенно-
Ъ Энергетические диапазоны
1 2 3 4 5 6
К
р 2,7 1,9 2,1 3,6 0,4 0,7
о 2,2 3,2 М 1,0 0,2 1,1
Ре 18,2 3,3 7,8 1,3 15,5 3,6
К! Я
р о 1,7 2,0 чо ОС 1,6 1,5 1,4 1,6 1,7 0,3 1,5 1,1
Ре 5,2 4,2 3,8 1,6 0,5 2,6
стеи установки и потока первичных частиц
который в свою очередь зависит от энергий и типов первичных частиц 2. Очевидно, что вклад различных первичных ядер в скорость счёта различен. Если допустить, что эффективная площадь регистрации почти не зависит от типа первичной частицы (внутри одного энергетического банка), то можно записать
Л = £ = Л
г г г
Метод классификации первичных частиц тоже влияет на скорость счёта, т. к. при этом изменяется регистрируемый поток ПКИ J = Jp + J0 + J?e. В дальнейшем будем оперировать с относительным потоком (или вкладом) первичных ядер типа 2: )г- JгIJ. Так, если изначально относительный поток у0 =0,6, ^ =0,3, у'ре = 0,1, то после применения правила отбора, нацеленного на выделения ядер определённой группы, относительный поток (вклад) различных ядер изменится, а значит, изменятся и скорости счёта этих ядер.
В связи с выше сказанным введём дополнительный критерий оценки эффективности метода — изменение вклада в регистрируемый поток (или изменение скорости счёта) первичных ядер 7]:
Лг - ./г !Л = ^г ^
На рис. 2 представлены значения Т], соответствующие результатам, приведённым на рис. 1. Почти во всех случаях изменение скорости счёта больше 1. Соответствующие вышеприведённым результатам значения Г) для 4-го энергетического банка на расстоянии ЮОмотоси— =1,6, ?70 =1,6, т]Ге = 3,2 .Уве-
1оо
р
Р?
80
Р О Ре
60
40
20 -
60 -.
20
А
к 8.
о --------
0 25
50
75
Энергетический диапазон ^
Рис. 1. Вероятности правильной классификации: а) — для расстояния от оси ШАЛ г - 100 м; б) — для четвёртого энергетического банка
Ре
Ре
5 з
« 1
У 1
I Г
£ ' г
и
X
Л £
о -I
3000 -■—
2500
2000
1500
•ч
1000 -
500 -О
3 4 5 6
Энергетический диапазон 3.)
О 25 50 75 100 125 150 175 200 225
б)
Рис. 2. Изменение потока регистрируемых ядер: а) — для расстояния от оси ШАЛ г - 100 м; б) — для четвёртого энергетического банка
Количество опорных векторов Размер обучающей выборки
1
3000 2500 2000 1500 1000 500' 0
3000 2500 2000 1500 1000 500 0
2 3 4 5 6
Энергетический диапазон а)
Количество опорных векторов * > Размер обучающей выборки
2 3 4 5
Энергетический диапазон б)
Количество опорных векторов • Размер обучающей выборки
\
\
ч
-------------
2 3 4 5 6
Энергетический диапазон в)
100
во :
<5 .
Ре *
статистика
-— 1500
1200
о4
в4
о а.
60
40
20 !■
О .........
1
100
80 >
60
40
20
900
к о
I-<0
Р
2 3 4 5
Энергетический диапазон
р
о •
Ре * ,•*•' статистика
\ Д
2 3 4 5
Энергетический диапазон
вч
100
80
о 60
Р' О /в
,статистика
40
/
20
/
J
\
ч.
2 3 4 5
Энергетический диапазон
Рис. 3. Зависимость числа опорных векторов от размера обучающей выборки для моделей Н-О (а), Н-Ре (б), Ре-О (в) и результат классификации ядер Н (г), О (д), Ре (е)
„- а 600 о
г
о ГО
300
1500
1200
Д)
1500 \ 1200
о
900 я
га &
600 &
2
<п 03
,300
е)
личение скорости счёта для расстояний г ~ 75 -г 125 м от оси ливня для энергий 10 — 200 ТзВ составили 77,-1,4-5-1,6, 77о~1>5-2,5, 77Fe ~ 1,4*4,4. При этом сохраняется = 100% полезных событий, зарегистрированных на расстоянии 50 -г 175 мот оси ливня. На более близких и далёких расстояниях количество полезных событий падает до 10 + 75%.
Более продуктивным может оказаться классификация с использованием не отдельных параметров для каждого прицельного параметра г, а полного двумерного (пространственно-временного) распределения черенковского света ШАЛ. Эта идея впервые была описана в работе [12], однако там тоже использовалось параметрическое описание. Классификация ПКИ основанная на полной информации о пространственно-временном распределении (в упрощённых условиях) была представлена нами в работе [13].
Мы продолжили эти исследования, но уже в более реальных условях. В нашем описании пространственно-временное распределение представляет собой массив размером 11 х 400 . Для классификации первичных ядер по полному двумерному распределению был использован метод опорных векторов или SVM (Support Vector Machine), подробно этот подход описан в[ 13].
Для решения многоклассовой задачи классификации методом SVM можно использовать разные стандартные подходы. Предварительно мы опробовали способы "каждый против всех" (такой подход применялся нами в работе [13]), "каждый против каждого" и "турнир на выбывание". Наилучший результат показал последний способ, к тому же он является наиболее быстрым [14], хотя способ "каждый против всех" с вероятностью, очень близкой к 1, определяет ядра Fe (этот способ можно рекомендовать для экспериментов, нацеленных на регистрацию сверхтяжёлых ядер). Для классификации способом "турнир на выбывание" было создано 3 модели: "ядра Н против ядер О", "ядра Н против ядер Fe", "ядра Fe против ядер О".
Количество опорных векторов, определяющих классифицирующую функцию, зависит не только от размера обучающей выборки, но и от класса первичных ядер, "составляющих" модель (см. рис. 3 а —в). Так как больше всего отличаются ядра Н и Fe, то для модели Н — Fe требуется меньше опорных векторов:
- 100 4- 600 при изменении размера обучающей выборки от -170 до 3000 (см. рис. 3 б). Наиболее похожими ядрами являются О и Fe, поэтому для модели Fe — О требуется больше опорных векторов:
- 160 1850 при таких же размерах обучающей выборки (см. рис. 3 в).
Для каждого типа ядра Z так же были сосчитаны вероятность правильного определения Рг, эффективность классификации кг, изменение скорости счёта Т]г. Полученные результаты представлены на рис. 3 г —ей табл. 2.
Как и при использовании метода комплексирова-ния аналогов, наибольшее число ошибок приходится на ядра О. Низкая эффективность для ядер Н (в 5 и 6 энергетическом диапазоне) и О (в 4 и 5 энергетическом диапазоне), видимо, связана с недостаточным размером (400) обучающих выборок (рис. 3 а —в) и большими ошибками оценки энергии р (рис. Зг) и Fe (рис. Зе). Вработе [13] размер обучающих выборок был взят 900. Следует отметить, что в данной работе, в отличие от [13], моделирование выполнялось в условиях, приближенных к реальным, — энергия и положения оси при моделировании ШАЛ варьировались, а затем восстанавливались по функции пространственно-временного распределения черенковского света ШАЛ.
Несмотря на близкие свойства пространственно-временного распределения черенковского света ШАЛ, инициированных различными типами первичных ядер, данная методика (в условиях надёжной статистики) всё же позволяет с высокой вероятностью распознать ядра Fe (*:Fc - 1,3 + 18,2) и с хорошей вероятностью распознать р [кр -1,9 + 3,6) и ядра О (ка -1,1 + 3,2). При этом сохраняется от 82% (для ядер Fe) до 97,5% (для р) полезных событий.
На основе полученных результатов можно сделать вывод о том, что использование МГУА (в частности — метода комплексирования аналогов) применительно к параметрическому описанию временного распределения черенковского света ШАЛ на расстояниях г ~ 75 + 125 м от оси ливня является эффективным инструментом классификации первичных ядер космического излучения.
Подход, основанный на SVM работает гораздо быстрее и эффективней метода комплексирования аналогов, особенно для ядер О и Fe. Однако следует отметить, что метод комплексирования аналогов может работать с меньшим набором обучающих данных (это хорошо видно на 5-м и 6-м банках).
Описанные подходы обладают ещё одним неоспоримым преимуществом переддругими методикам, — они сохраняют почти все полезные события. С ростом энергии ПКИ этот показатель становится очень существенным.
Библиографический список
1. Журенков О. В., Пляшешников А. В. Применение пространственно-временного распределения черенковских фотонов ШАЛ, инициированных первичными ядрами в диапазоне энергии 1 - 20 ТэВ, в изучении массового состава ПКИ // Известия АГУ, спец, выпуск Астрофизика космических лучей сверхвысоких энергий. — 1998. — С. 79 — 92.
2. Zhurenkov О. V., Plyasheshnikov А. V. About a possibility ot the analysis ol the mass composition of cosmic rays on the basis ol the space-temporal distribution of the EAS Cherenkov light // Nuclear Physics В (Proc. Suppl.). — 1999. — Vol. 75A. — Pp. 296-298.
3. Chitnis V. R., Bhat P. N. Gamma-hadron separation using Cerenkov photon timing studies // Proc. of 26-th 1CRC. — Vol. 5. — Sail Lake City: 1999. — Pp. 251 -254.
4. Konopelko A, K., Plyasheshnikov A. V. ALTAI: computational code for simulations of TeV air showers as observed with the ground based imaging atmospheric Cherenkov telescopes / / J. Phys. C: Nucl. Part. Phys. — 2000. — Vol. 26. — Pp. 183 - 201,
5. Журенков О. В. Классификация ядер ПКИ по пространственно-временному распределению черенковского света ШАЛ с использованием метода опорных векторов // Известия АГУ. — 2006. — 1. — С. ! 11 - 115.
6. Лагутин А. А.,Тюменцев А. Г. Спектр, массовый состав и анизотропия космических лучей во фрактальной Галактике // Известия АГУ. — 2004. — 5. — С. 4 - 21.
7. Бессонов А. С., Журенков О. В. Классификация ядер ПКИ по параметрам пространственно-временного распределения черенковского света ШАЛ с использованием нейронных сетей класса многослойного перцептрона // Известия АГУ. — 2004. —5. — С. 71 -75.
8. Yushkov А. V., Zhurenkov О. V. Using of the analog complexing of parameters of space-temporal distribution of [he EAS Cherenkov light for the analysis of the mass composition of cosmic rays // Proc. of 29-th 1CRC. — Vol. 3. — Puna: 2005. — Pp. 101 - 104.
9. Журенков О. В. К вопросу определения положения оси широкого атмосферного ливня в экспериментах, оснащенных системой атмосферных черенковских телескопов // Известия АГУ, —2001. — 1. —С. 106-107.
10. Alessandro В., for THE EAS-TOP COLLABORATION Study of the composition around the knee through the electromagnetic
and muon detectors data at EAS-top // Proc. of 27-th ICRC. — Vol. 1. — Hamburg: 2001—Pp. 124- 127.
11. Nonparametric determination of energy spectra and mass composition of primary cosmic rays for slant depth / M. Roth, T. Antoni. W.D. Apel et al. // Proc. of 27-th ICRC. — Vol. 1. — Hamburg: 2001.-Pp. 88-91.
12. Василенко С. H., Журенков О. В, //Представление пространственно-временного распределения черенковских фотонов ШАЛ в виде графического образа. — Барнаул. — 2003. — 16 с. —(Препринт/АГУ; 1).
13. Журенков О В., Татаринцев С. Е. Использование пространственно-временного распределения черенковского света
ШАЛ для классификации ядер ПКИ // ИэвестияАГУ. — 2004. — 5, —С. 80-84.
14. Мерков А. Б. Основные методы, применяемые для распознавания рукописного текста. — 15 апреля 2004, http:// www.recogn i tion.mccme.ru/pub/Re cognition Lab.h tml/ methods.html.
ЖУРЕНКОВ Олег Викторович, инженер кафедры теоретической физики.
Дата поступления статьи в редакцию: 29.06.2006 г. © Журенков О.В.
Книжная полка
Бублей С.М., Малюков С.П., Медведев В.П. С Физика: Задачи повышенной сложности: Решение задач:
Учебное пособие. - Ростов н-Д.: Феникс, 2005. - 253 с.
Пособие предназначено для студентов колледжей. Содержит методические указания для решения задач по разделам физики, входящих в программу курса физики высших учебных заведений (технических университетов).
Рассчитано также на студентов безотрывной формы обучения инженерно-технических специальностей высших учебных заведений.
Физика: Экзаменационные ответы школьнику - студенту: Учебное пособие / Сергеев С.П., ред. - М.: Буклайн, 2005. - 32 с.
В сжатой форме представлен теоретический курс по физике, включая механику, электричество, термодинамику, оптику, квантовую и молекулярную физику. Кроме этого, помещены основные формулы по всем разделам физики.
Для выпускников общеобразовательных школ при подготовке к экзаменам на аттестат зрелости и к вступительным экзаменам в высшие учебные заведения.
Бордовский Г. А, Кондратьев A.C., Чоудери АД. Физические основы математического моделирования:
Учебное пособие. - М.: Академия, 2005. - 316 с.
В учебном пособии рассматриваются вопросы, характерные для вводной физической части математического моделирования реальных процессов: выбор уровня описания изучаемого явления на основе анализа иерархии характерных для системы масштабов времени и выяснение возможностей натурного эксперимента, определяющих структуру физической и математической модели; выяснение причин и условий эффективности заведомо упрощенных математических моделей и анализ причин появления и роли парадоксов при изучении этих моделей.
Д\я студентов физико-математических специальностей вузов, может быть полезно для преподавателей и научных сотрудников, занимающихся проблемами математического моделирования.
Белоглазкина М.В., Щербаков Ю.В., Бурлакова С.И. Шпаргалка по физике: Учебное пособие. - М.: Проспект, 2006. - 40 с.
Пособие содержит все вопросы экзаменационных билетов по учебной дисциплине «Физика». Доступность изложения, актуальность информации, максимальная информативность, учитывая небольшой формат пособия, - все это делает шпаргалку незаменимым подспорьем при подготовке к сдаче экзамена.