Научная статья на тему 'Несколько слов об индексе разнообразия Симпсона'

Несколько слов об индексе разнообразия Симпсона Текст научной статьи по специальности «Биологические науки»

CC BY
1819
202
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЫБОРКА / ТИП РАСПРЕДЕЛЕНИЯ / ИНДЕКС РАЗНООБРАЗИЯ

Аннотация научной статьи по биологическим наукам, автор научной работы — Розенберг Г. С.

В статье кратко описана история создания индекса разнообразия и его особенности при исследовании биоразнообразия.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Несколько слов об индексе разнообразия Симпсона»

ИСТОРИЯ НАУКИ

Самарская Лука. 2007. - Т. 16, № 3(21). - С. 581-584.

©2007 Г.С. Розенберг* НЕСКОЛЬКО СЛОВ ОБ ИНДЕКСЕ РАЗНООБРАЗИЯ СИМПСОНА

Розенберг Г.С. НЕСКОЛЬКО СЛОВ ОБ ИНДЕКСЕ РАЗНООБРАЗИЯ СИМПСОНА

В статье кратко описана история создания индекса разнообразия и его особенности при исследовании биоразнообразия.

Ключевые слова: выборка, тип распределения, индекс разнообразия.

Rozenberg G.S. SOME WORDS ABOUT THE SIMPSON'S DIVERSITY INDEX

The history of index's making and its peculiarities by studying of biodiversity was described in the article.

Key words: selection, type of a distribution, diversity index.

Понятие «биологическое разнообразие» за сравнительно короткий отрезок времени получило расширенное и многоуровневое толкование (см.: Шитиков, Розенберг, 2005). Собственно его биологический смысл раскрывается через представления о внутривидовом, видовом и надвидовом (;це-нотическом) разнообразии жизни. В последнее время, в добавление к этому, стали говорить об экосистемном и ландшафтном разнообразии как объектах изучения и охраны. Традиционные положения биогеографической науки также позволяют трактовать ее как науку о географических закономерностях формирования биоразнообразия. Когда на Конференции ООН по окружающей среде и развитию (Рио-де-Жанейро, 1992 г.) была принята "Конвенция о биологическом разнообразии" (Convention.., 1992), к которой присоединилось большинство стран на планете, сложнейшая и многообразнейшая проблеме биоразнообразия приобрела еще и политическое звучание. Наконец, следует указать и на в какой-то степени эпатаж-ную статью А.М. Гилярова (1996), в которой проблема изучения и сохранения биоразнообразия трактуется в финансовом аспекте в терминах академика JI.B. Арцимовича: «Наука - лучший способ удовлетворения личного любопытства за государственный счет».

Само словосочетание «биологическое разнообразие» впервые, по-видимому, применил Г. Бэйтс в 1892 г. в работе "Натуралист на Амазонке" (Лебедева и др., 1999), когда описывал свои впечатления от встречи около 700 разных видов бабочек за время часовой экскурсии. Однако основные научные концепции биоразнообразия были сформулированы лишь во второй половине XX века - Р. Уиттекер (Whittaker, 1972; Уиттекер, 1980) структурировал уровни экосистемного разнообразия и исследовал зависимости биоразнообразия от факторов окружающей среды. А вот попытки

* Институт экологии Волжского бассейна РАН, г. Тольятти.

количественной оценки биоразнообразия предпринимались еще ранее. И среди этих показателей не последнее место занимает индекс разнообразия Симпсона (он же - индекс Херфиндаля-Хиршмана [HHI - Herfindal-Hirshman Index1], который, начиная с 1982 г., служит основным ориентиром при осуществлении антимонопольной политики в США; он же [с точностью до масштаба] - индекс лексического разнообразия [TTR - Type Token Ratio], предложенный Дж. Юлом [Yule, 1938] для оценки словарного запаса в математической лингвистике; он же - предложенный итальянским статистиком и экономистом К. Джини коэффициент, дающий алгебраическую интерпретацию кривой Лоренца [Gini, 1921]):

Пг(Пг~1)

где n¡ - число особей в группе i (всего Z групп; 2й,- = 7У), N- объем выборки.

В этой форме записи можно принять во внимание, что знаменатель 7V(7V-l)/2 означает число всех связей между парами особей независимо от их принадлежности к определенной группе, а числитель п{п-1)/2 - число возможных взаимодействий между парами особей одной группы. Тогда глубинный смысл индекса Симпсона можно объяснить (Алимов, 2000), как отношение числа степеней свободы внутривидовых взаимодействий к общему числу степеней свободы внутренних элементов экосистемы, обеспечивающих ее единство и функционирование. Другие авторы (в т.ч. и сам Симпсон - см. далее перевод его статьи; География и мониторинг.., 2002] приписывают этому индексу оценку вероятности принадлежности к разным группам любых двух особей, случайно отобранных из неопределенно большого сообщества. По мере увеличения D выравненность объема групп уменьшается. Поэтому индекс Симпсона часто используют в форме (1 - D). Эта величина варьирует от 0 до 1 и носит название «вероятность межвидовых встреч» (Pielou, 1972).

Как и для любой другой статистики «типа дисперсии», значение индекса Симпсона практически полностью зависит от удельного объема 1-2 наиболее обильных видов, так как при возведении в квадрат малых долей Pi = n/N получаются очень малые величины. Поскольку D к тому же и слабо зависит от числа групп Z, то следует признать (География и мониторинг.., 2002], что индекс Симпсона, в целом, мало пригоден для оценки биоразнообразия или видового богатства, но является весьма чувствительным индикатором доминирования одного или нескольких видов. Заметим, что статистический разброс удельных объемов групп p\,p2,...,pz может быть оценен с использованием известной в теории вероятности формулы:

D-Y.

Orris Clemens Herfindahl (1918-1972) - американский экономист, Albert Otto Hirschman (г.р. 1915) - немецкий экономист.

z

D = ^pf =Za2+\/Z ,

¿=1

где cj2 - мера дисперсии.

Следует упомянуть еще один «клон» индекса Симпсона - «индекс полидоминантности» (Williams, 1964):

D~1=l/D = ftl/pf ,

i-1

который «...многие авторы считают наилучшей мерой оценки типа распределения видовых обилий для случаев, когда число видов превышает 10» (География и мониторинг.., 2002; Шитиков, Розенберг, 2005).

Наконец, укажем и на сравнительно новый для экологии подход к описанию структуры биологического сообщества с использованием фрактальной теории (см., например, Иудин др., 2003; Гелашвили и др., 2006). В рамках описания сообщества мультифрактальным спектром, многие из известных индексов разнообразия находят свое единообразное описание. Введем моменты распределения особей по группам и выясним характер их асимптотического поведения при увеличении численности N:

i-1

где -оо < q < +оо - называется порядком момента, а показатель r(q) характеризует скорость изменения соответствующего момента при увеличении размера выборки. Dq называется обобщенной размерностью Ренъи (Иудин и др., 2003). Тогда при q=2 получаем D2 = lnD/lniV, где D - индекс Симпсона. «Местоположение» индекса Симпсона на мультифрак-тальном спектре соответствует сообществам с сильными доминантами (чем меньше абсцисса точек, тем сильнее доминирование), что согласуется с высказанным выше утверждением о том, что индекс Симпсона является хорошим индикатором доминирования малого числа видов.

Завершая эту небольшую заметку, которая предваряет перевод статьи Э. Симпсона, еще раз подчеркнем, что трудности в применении показателей разнообразия и оценке их качества заключаются как в сложном и комплексном характере самой интерпретируемой величины разнообразия (что измеряем?), так и в отсутствии какой-либо объективной шкалы отсчета, независимой от концепции, принятой исследователем на основе его субъективных (точнее, интуитивных) представлений (чем и как измеряем?). С «точки зрения» данной дефиниции - индекс Симпсона выглядит совсем неплохо: он ориентирован на вскрытие степени доминирования в сообществе и представляется достаточно корректным, так как является линейной комбинацией дисперсии удельных объемов групп.

СПИСОК ЛИТЕРАТУРЫ

Алимов А.Ф. Элементы теории функционирования водных экосистем. - СПб.: Наука, 2000. - 147 с.

Гелашвили Д.Б., Иудин Д.И., Розенберг Г.С. Фрактальная структура перколя-ционного кластера и пространственное распределение доминантных видов // Докл. Академии наук (ДАН). 2006. Т. 408. № 4. С. 560-563. - География и мониторинг биоразнообразия. М.: Издательство Научного и учебно-методического центра Моск. ун-та, 2002. 432 с. - Гиляров A.M. Мнимые и действительные проблемы биоразнообразия // Успехи соврем, биол. 1996. Т. 116, № 4. С. 493-506.

Иудин Д.И., Гелашвили Д.Б., Розенберг Г.С. Мультифрактальный анализ структуры биотических сообществ // Докл. Академии наук (ДАН). 2003. Т. 389. № 2. С. 279282.

Лебедева Н.В., Дроздов Н.Н., Криволуцкий Д.А. Биоразнообразие и методы его оценки: Учебное пособие. М.: МГУ, 1999. 94 с.

Уиттекер Р. Сообщества и экосистемы. М.: Прогресс, 1980. 328 с.

Шитиков В.К., Розенберг Г.С. Оценка биоразнообразия: попытка формального обобщения // Количественные методы экологии и гидробиологии (сборник научных трудов, посвященный памяти А.И. Баканова). - Тольятти: СамНЦ РАН, 2005. - С. 91129.

Convention on Biological Diversity of the IUCN. Rio de Janeiro: IUCN, 1992. 2 p. [Рус. пер.: Конвенция ООН о биологическом разнообразии // Конференция ООН по окружающей среде и развитии. (Рио-де-Жанейро, июнь 1992 года). Информационный обзор / Коптюг В.А. Новосибирск: СО РАН, 1993. С. 28-29].

Gini С. Measurement of inequality and incomes // The Economic Journal. 1921. V. 31. P. 124-126.

Pielou E.C. 2k contingency tables in ecology // J. Theor. Biol. 1972. № 2. P. 337-352.

Whittaker R.H. Evolution and measurement of species diversity // Taxon. 1972. V. 21. P. 213-251. [Рус. пер.: Уиттекер P. Эволюция и измерение видового разнообразия // Антология экологии (Состав, и коммент. Розенберга Г.С.). Тольятти: ИЭВБ РАН, 2004. С. 297-330]. - Williams С.В. Patterns in the Balance of Nature and Related Problems in Quantitative Ecology. N.Y.: Acad. Press, 1964. 324 p.

Yule G.U. On sentence length as a statistical characteristic of style in prose with application to two cases of disputed authorship // Biometrika. 1938. V. 30. P. 363-390.

Поступила в редакцию 7 мая 2007 г.

Самарская Лука. 2007. - Т. 16, № 3(21). - С. 585-587.

Э.Х. Симпсон** ИЗМЕРЕНИЕ РАЗНООБРАЗИЯ*

«Характеристика», определенная Юлом1 и «индекс разнообразия», определенный Фишером , - две меры степени концентрации или достигнутого разнообразия, когда особи популяции разбиты на группы. Оба [эти показателя] определены как статистики, которые вычисляются на основе выборочных данных, а не в терминах популяционных констант. Прежний индекс разнообразия основан на логарифмическом распределении. Это не общее допущение, поскольку не всегда дает значения, которые независимы от объема выборки; такой индекс нельзя использовать, например, применительно к бесконечному числу особей популяции, разбитых на конечное число групп. Уильяме3 указал на зависимость между «характеристикой» и «индексом разнообразия», когда оба используют логарифмическое распределение. Цель настоящего сообщения состоит в том, чтобы определить и исследовать меру концентрации в терминах популяционных констант.

Пусть бесконечная популяция такова, что каждая особь принадлежит одной из Z групп, и пусть 71\... К/ {Ък = 1) - доли особей в различных группах. Тогда Я, определяемая как

- мера концентрации классификации. Эта величина [Я] может принимать любое значение между и 1, старое представление наименьшей концентрации или наибольшего разнообразия, возможного с Z группами, и последней полной концентрацией, когда все особи, находятся в одной группе. Показатель Я может быть просто интерпретирован как вероятность того, что две особи, выбранные случайно и независимо из популяции, будут принадлежать одной и той же группе.

Теперь предположим, что имеем выборку из ТУ особей, случайно отобранных из популяции и п\, щ,..., Пг (2й = ТУ) - это число особей в разных группах. Легко показать, что Ь = (£п(п-1)) / (N(N-1)) - несмещенная оценка Я; это почти очевидно, если принять во внимание, что 0,57У(7У-1) - число пар в выборке и 0,5я(я-1) - число пар, с учетом разбиения на группы.

Ь - также является несмещенной оценкой Я для переменного объема выборки, если отсутствуют выборки объема 0 или 1 и вероятность получения выборки («1, «2, • • •, П/) раскладывается в эти два фактора:

Симпсон Эдуард (EdwardHugh Simpson; г.р. 1927) - математик, статистик; член Британского королевского статистического общества.

* Simpson Е.Н. Measurement of diversity // Nature. - 1949. - V. 163, № 688. - P. 688. (перевод

Г.С. Розенберга).

P(nl,n2,...,nz) = P(N)——(nlT(n2y\.. ,

nx\n2!...

где P(N) задает распределение вероятности объема выборки, 2 < N < <х>. Это тем более верно, когда выборки получены методом «постоянных (стационарных) воздействий» (fixed-exposure), традиционным в биологических исследованиях; N тогда имеет распределение Пуассона, пригодное для описания выборок с отсутствием первых двух [выборок объема 0 и 1].

Если повторная выборка объема N получена из той же самой популяции, вычисленное значение L будет распределено как Я с дисперсией

- \){N - 2)2 л"3 + 2N(N -1)^ п2 - 2N(N - 1)(2N - 3)(£ к1)1

Иа'-1)]2 '

или, если N очень велико, приблизительно

Третьи и четвертые кумулянты [накопленные частоты. - Г.Р.] распределения L также были точно определены. Они показывают, что при росте N распределение стремится к нормальному, кроме того случая, когда Я = 1/Z; в этом случае распределение LNZ стремится к распределению с (Z-1) степенью свободы, но со средней смещенной от Z-1 к N.

1 2 «Характеристика», определенная Юлом , - 1000 (2й(й-1)) / N , что

отличается от L, оценивающей Я, только наличием N вместо N-1 в знаменателе и коэффициентом масштаба 1000.

Теперь, позвольте показать, что значение Я, взятое для популяции, состоящей из Z групп, частоты которых щ = Wj/Zw, где Wi выбраны случайно и независимо, соответствует распределению Ш-го типа:

dF = —-—e-wwk-ldw , 0 < W < °о . (k~ 1)!

Это можно назвать «отрицательной биномиальной популяцией», так как выборки, полученные методом «постоянных (стационарных) воздействий», будут подчиняться отрицательному биномиальному распределению. Можно вычислить соответствующее этому значение Я, со средним значением 2wi /(Swj) по всем наборам (wi, Wz), которое может быть получено

по популяционным значениям w. Таким образом,

л = /.~/

(4-1)!

w7]k ldw,...dw7 = ^ + ^ L 1 ZJ 1 z Zk + l

Распределение Пуассона - специальный случай отрицательного биномиального распределения, в котором к стремится к бесконечности. При этом условии, Я = 1 Это именно то, что мы и ожидали, так как распределение Пуассона соответствует популяции, в которой все группы представлены одинаково, и, таким образом, вероятность, что две случайно выбранные особи будут принадлежать одной группе, должна быть 112.

Другой особый случай отрицательного биномиального распределения - «логарифмическая популяция», которая получается, если одновременно Z стремится к бесконечности, а к - к нулю так, что произведение 2к остается конечным и стремится к величине а. (Это - не совсем то же самое предположение, которое использует Фишер , но количественно а и есть его «индекс разнообразия»). Полученное значение для Я, снизу ограничено 1/(а+1).

Заметим, что это последнее значение не совместимо с уравнением,

3 1

приводимым Уильямсом , а именно, «характеристика» Юла имеет вид 1000/а, для логарифмического распределения. Этот результат был получен с использованием формулы Юла к рядам вероятных значений, тогда как предлагаемая процедура эквивалентна применению формулы сначала и затем усреднения результата. Некоторая поддержка новому уравнению найдена при рассмотрении рангов связанных переменных. Так как «характеристика» не может превысить 1000, более раннее уравнение [1000/а. -Г.Р.] отрицало бы все значения а меньше чем 1; но предлагаемое уравнение задает диапазон 0 < а < оо, в то время как 1 > Я > 0.

3 West End Avenue, Pinner {пригород в северо-западном Лондоне. - Г.Р.).

Jan. 29.

'Yule, "Statistical Study of Literary Vocabulary" (Cambridge, 1944).

2 Fisher, Corbet and Williams, J. Animal Ecol., 12, 42 (1948).

3 Williams, Nature, 157, 482 (1946).

i Надоели баннеры? Вы всегда можете отключить рекламу.