Л. К. Бабурин
СТЕПЕНЬ БЛИЗОСТИ ИСПАНСКОГО ЯЗЫКА С ФРАНЦУЗСКИМ
И С ИТАЛЬЯНСКИМ
Работа представлена кафедрой романской филологии.
Научный руководитель - доктор филологических наук, профессор Р. Г. Пиотровский
Статья посвящена определению степени системно-синергетической близости испанского языка с французским и итальянским на основании лексико-статистических данных. Результаты работы можно использовать для внутрилингвистической таксономии романских языков, которая отличается от традиционных классификаций, построенных на внешних критериях или частных лингвистических индикаторах.
4 2
The aim of the article consists in determining the degree of the system-synergic proximity of Spanish to French and Italian on the basis of lexicostatistical data. The results of the research can be used for the immanent (in L. Hjelmslev’s sense) linguistic taxonomy of the Latin languages, which differs from traditional classifications based on extra-linguistic criteria or particular linguistic indicators.
Разработка внутрилингвистической таксономии близкородственных языков представляет собой одну из самых трудных и в то же время актуальных проблем современной лингвистики. Исследования осложняются здесь прежде всего отсутствием надежных критериев, по которым отбирается материал, позволяющий формулировать выводы о сходствах или несходствах между родственными языками.
Прежде чем обратиться к вопросу о выборе лингвистических классификационных критериев, посмотрим, как решается эта проблема в современной научной методологии.
Согласно современной эпистемологии, построить «естественную классификацию» можно, только поняв «сущность явления (вещи)», т. е. смысл этой вещи, или «то, что она есть сама по себе, в отличие от всех др. вещей и в отличие от изменчивых состояний вещи под влиянием тех или иных обстоятельств...»1. И, что также важно, сущность «имеет место не вне вещей, а в них и через них, как их общее гл. свойство, как их закон»2. Для нас такая классификация должна основываться на прямо ненаблюдаемых, глубинных структурно-синергетических (фонологических и лексико-грамматических) свойствах. В рамках этого актуального подхода выполнялось и данное исследование.
Цель работы заключалась в определении степени близости основных романских языков на основе лексико-статистического анализа знаменательной лексики (ок. 150 слов), занимающей верхнюю часть их частотных списков.
Работа проводилась в синхронии. Это означает, что в ней учитываются формальные и семантические сходства лексических единиц (ЛЕ) лишь на современном этапе их существования, вне прямой связи с условиями их происхождения. Вместе с тем при
определенных затруднениях в данном исследовании использовался этимологический словарь романских языков.
Методика исследования выглядит следующим образом. Для каждой пары языков (Ь., Ь) были построены сопоставительные таблицы. Одни из этих таблиц содержат номера лексических единиц, указанные в частотных словарях (ЧС), другие - те номера, которые получаются в каждой таблице после исключения из нее служебных слов. Столбцы в таблицах распределяются следующим образом (ср. табл. 1):
1) нумерация ЛЕ языка Ь ;
2) ЛЕ языка Ь. с их грамматическими пометами;
3) частоты ЛЕ языка Ь ;
4) нумерация ЛЕ языка Ь;
5) ЛЕ языка Ь . с их грамматическими пометами;
6) частоты ЛЕ языка Ь;
7) разность между номером ЛЕ языка Ь. и номером соответствующей ей ЛЕ языка Ь. на данной строке;
8) квадрат разности по каждой строке; внизу - сумма всех квадратов разностей в столбце.
По полученным результатам построена сводная таблица (ср. табл. 2), в которой к каждой рассматриваемой паре языков приводятся коэффициенты их корреляции.
При использовании номеров общего ЧС соблюдалось следующее правило. Если номер данной ЛЕ языка Ь . (Ь ) больше, чем номер последней рассматриваемой ЛЕ языка Ь (Ь ), то Ь приписывается номер Ь +1,
г 4 гп/7 ; * * гп ’
независимо от номера Ь.п по ЧС (операция сгущения). Это облегчает вычисления и допускается ввиду того, что при удалении от начала списка в ЧС увеличивается флуктуация, т. е. возможность изменения данной ЛЕ своего номера и своей частотности в зависимости от текста.
При сопоставлении какой-либо ЛЕ языка Ь с двумя и более ЛЕ языка Ь. ее частота делится между ними по формуле:
У г =
F,Vj
F,
где q>. - частота данной ЛЕ языка L. по отношению к данной ЛЕ языка L , F. - общая частота данной ЛЕ языка L, (р. - частота данной ЛЕ языка L , F. - общая частота двух или более ЛЕ языка L приводимых в сопоставление с данной ЛЕ языка L . Например: исп. no av. 6900 - фр. ne av. 7334 + non av. 826. Вычисляем частоту исп. no относительно фр. ne: 6900-7334:(7334+826)= =50604600:8160*6202; относительно фр. non: 6900-826:(7334+826)=5699400:8160«698. Подвергаем полученные результаты проверке: 6900-6202= 698.
При таком разложении частот соответствующим образом изменяется нумерация ЛЕ языка L. Такая операция применяется и к ЛЕ языка L,, если одна и та же из них сопоставляется с разными ЛЕ языка L (ср.: исп. tan av. 674 + tanto aj. 264 - фр. tant av. 238). Кроме того, к некоторым ЛЕ языка L. применяется операция сложения. Это делается в следующих случаях :
1) если две и более из них сопоставляются с одной и той же ЛЕ языка L. как различные формы одного и того же слова (ср.: исп. uno num. 539 - фр. un num. 515 + une num. 415);
2) если в соответствующем ЧС они разделены как омонимы и вместе с тем два и более из этих омонимов оказываются эквивалентными одной и той же ЛЕ языка L (ср.: исп. historia n. 293 - фр. histoire (1) n. 97 + histoire (2) n. 873).
При этой операции частоты данных ЛЕ языка L. складываются, и соответствующим образом изменяется нумерация его ЛЕ.
Если одна и та же ЛЕ языка L. сопоставляется с двумя и более ЛЕ языка L , часть которых, в свою очередь, входит в сопоставление с другими ЛЕ языка L то сначала делится частота данной ЛЕ языка L , потом - частота тех ЛЕ языка L , которые
сопоставляются с другими ЛЕ языка L. Например, исп. después сопоставляется с ит. dopo и poi. При этом poi также входит в сопоставление с исп. luego. Сначала подвергается разложению частота слова después, затем - частота слова poi.
Из нечеткого множества степеней сход -ства при помощи операции сгущения мы получили три:
1) полное сходство; сюда входят случаи полного соответствия одновременно по форме и по основным значениям, причем допускается формальное расхождение по фонетическим и/или морфологическим законам (так, в паре исп. estar - ит. stare фонетически закономерно соответствие es - s в начале слова перед согласным и морфологически закономерно соответствие -r —re в инфинитиве), а также отнесение одной и той же ЛЕ в ЧС разных языков к разным частям речи без изменения ее значения (ср.: исп.poco aj. - фр.peu av.);
2) частичное сходство (с поправочным коэффициентом 0,5); сюда входят случаи расхождения, лишь отчасти обусловленного фонетическими и/или морфологическими законами (ср.: исп. cada - фр. chaque), префиксального и постфиксального расхождения (ср.: исп. aparecer - ит. comparire; исп. aquí - ит. qui; исп. cómo - фр. comment), а также вхождения слова в одном языке в состав эквивалентного ему сложного слова в другом (ср.: исп. hoy - фр. aujourd’hui);
3) несходство (с поправочным коэффициентом -1); сюда входят случаи полного расхождения по форме при полном или частичном совпадении основных значений.
Отдельно следует сказать о случаях супплетивизма. В алфавитных списках ЧС приводятся частоты каждой формы того или иного слова. Это позволяет разбить супплетивные формы таким образом, чтобы сопоставить их сходные в языке Li и языке L. пары по отдельности. Возьмем, например, испанский глагол ser и эквивалентный ему французский глагол Ktre. Для начала следует выделить ряды их форм по общим основам. В списке форм исп. ser выделяется
четыре таких ряда: er-, es (одна форма), fu-, s-; сходным образом - у фр. Ktre: es + est, ét- + Kt-, fu-, s-. При выделении каждого такого ряда производится сложение частот тех форм, которые к нему относятся. Выделив эти ряды, мы получаем возможность сопоставить их по отдельности. Так, в полные соответствия включаются: исп. es и фр. es + est; исп. fu- и фр. fu-; исп. s- и фр. s-. Что касается фр. ét- + Kt-, то этот ряд форм по фонетическим ключам входит в полное соответствие с исп. estar. При всех этих операциях происходит соответствующее перераспределение номеров в частотном списке как языка L , так и языка L, но лишь относительно каждой данной пары языков.
Определенные проблемы в приведенном примере вызывает исп. er-, не входящее в сопоставление ни с одним рядом французских форм. Ввиду этого исп. er-исключается из рассмотрения. Однако в том случае, если такие «лишние» основы выявляются и в языке L, ив языке L, они приводятся в таблице полных несоответствий. При этом, чтобы избежать излишней разбивки ЛЕ, основы, относящиеся к одной и той же ЛЕ, даются в таком случае на одной строке вне зависимости от того, однородны они или разнородны. Например, у испанского глагола ir выделяются следующие группы форм: fu-, i- + yendo, v-. Последняя входит в полное соответствие с основой v- эквивалентного итальянского глагола andare. В то же время две другие группы форм исп. ir, так же как основа and-ит. andare, остаются «незадействованны-ми». Поэтому они заносятся в одну строку таблицы с полными несоответствиями, что выглядит следующим образом:
55. ir v. (fu- + i- + yendo) 815 49 andare v. (and-) 1115
Несмотря на упомянутое перераспределение номеров, ЛЕ языка Ь. в каждой таблице приводятся в том порядке, в каком они даны в частотном списке ЧС.
При любом переразложении частот, независимо от того, вызвано ли оно сопоставлением с одной ЛЕ в одном языке двух
или более в другом либо наличием супплетивных форм, формы, относящиеся к одной и той же ЛЕ языка Ь входящие в одну и ту же таблицу, располагаются в порядке убывания собственных частот. В таблицах с полными несоответствиями в тех случаях, когда с одной ЛЕ языка Ь сопоставляется две или более ЛЕ языка Ь. (при таких условиях, как сказано выше, не производится перераспределения частот данной ЛЕ языка Ь.), последовательность граф определяется порядком убывания частот среди ЛЕ языка Ь; ср. исп. и фр.:
47. querer v. 998 65. vouloir v. 836
47. querer v. 998 123. aimer v. 398
Второстепенные значения в данной работе не учитываются. Ведущим критерием выделения основных и второстепенных значений является частотность: если какой-либо ЛЕ языка L в пределах области полных и частичных соответствий эквивалентны две (и более) ЛЕ языка L, одна из которых по своей частотности меньше данной ЛЕ языка L. в десять раз и более, то такая ЛЕ языка L. исключается из рассмотрения (операция сгущения). Ср.: исп. verdad n. 326 - фр. vérité n. 97 + vrai n. 27. В данном случае исключается фр. vrai, частотность которого более чем в десять раз меньше частотности исп. verdad. В то же время, если соответствие с подобным соотношением частот является единственным, то оно учитывается (ср.: исп. cuándo av. 803 - фр. quand av. 19).
В тех случаях, когда ЛЕ языка L. имеет в языке L полные и/или неполные со-
j
ответствия, а также соответствия с полным расхождением по форме, последние исключаются из рассмотрения. Например, исп. palabra имеет французские эквиваленты parole и mot. С первым из них оно обнаруживает полное сходство, со вторым - полное несходство. Соответствие исп. palabra - фр. mot не рассматривается. Вместе с тем действует правило основного значения (см. выше). Ср.: исп. ciudad
n. 318 - фр. ville n. 184 + cité n. 24. Со словом ville испанское ciudad обнаруживает полное несходство, со словом cité - полное сходство. Однако cité имеет недостаточно высокую частотность по сравнению с ciudad, в отличие от ville. Поэтому соответствие исп. ciudad - фр. ville учитывается, а соответствие исп. ciudad - фр. cité исключается из рассмотрения.
Сходства, восходящие не к латинско-романскому, а к индоевропейскому периоду, в данной работе считаются несходствами. Так, исп. luz эквивалентно фр. lumiure.
Их латинскими этимонами являются, соответственно, lux (основа luc-) и luminaria (< lumen). Слово lux, в свою очередь, происходит от и.-е. *louk-s, a lumen - от родственного ему и.-е. *leuqs-men (или *louqs-men)4. В латинский период эти два слова не воспринимались как однокоренные, так как имели уже разные основы. Поэтому указанная испанско-французская лексическая пара заносится в таблицу несходств.
Таблица 1 иллюстрирует технику лексико-статистического сопоставления рассматриваемых языков.
Таблица 1
Полные соответствия в паре испанскнй-французский с нумерацией ЧС знаменательных ЛЕ
Испанский Французский d= i(LÎ)-i(Lj) d2
i F i F
1 2 3 4 5 6 7 8
3 ser v. (es) 4731 3 Ktre v. (es + + est) 6072 0 0
4 ser v. (s-) 4250 9 Ktre v. (s-) 2359 -5 25
26 ser v. (fu-) 862 77 Ktre v. (fu-) 335 -51 2601
1 no av. 6202 1 ne av. 7334 0 0
35 no av. 698 26 non av. 826 9 81
5 haber v. 4143 2 avoir v. a. 6099 3 9
10 haber v. 2245 7 avoir v. 3305 3 9
2 su aj. 5596 4 son aj. 4093 -2 4
7 estar v. 2501 8 Ktre v. (fit- + + Kt-) 2661 -1 1
8 tener v. 2384 56 tenir v. 417 -48 2304
19 ir v. (v-) 1245 113 aller v. (v-) 196 -94 8836
68 ir v. (i- + + yendo) 472 172 aller v. (ir-) 47 -104 10816
11 decir v. 2037 14 dire v. 1713 -3 9
12 todo aj. 1951 11 tout aj. 1921 1 1
13 hacer v. 1868 13 faire v. 1749 0 0
14 poder v. 1670 12 pouvoir v. 1800 2 4
16 ver v. 1302 18 voir v. 1082 -2 4
17 otro aj. 1255 36 autre aj. 655 -19 361
18 mi aj. 1247 15 mon aj. 1650 3 9
23 dos num. 965 22 deux num. 925 1 1
24 hombre n. 941 31 homme n. 712 -7 49
25 nuestro aj. 884 23 notre aj. 915 2 4
Продолжение таблицы 1
1 2 3 4 5 6 7 8
27 mismo aj. 807 24 mKme aj. 907 3 9
28 cu6ndo av. 803 176 quand av. 19 -148 21904
29 grande aj. 795 27 grand aj. 810 2 4
31 vida n. 748 48 vie n. 480 -17 289
32 vez n. 716 55 fois n. 433 -23 529
33 primer aj. 708 38 premier aj. 567 -5 25
34 saber v. 705 20 savoir v. 978 14 196
36 SHav. 679 37 si av. 572 -1 1
38 tan av. 674 126 tant av. 171 -88 7744
87 aco n. 342 79 an n. 325 8 64
43 pasar v. 593 65 passer v. 383 -22 484
61 cymo av. 512 16 comme av. 1647 45 2025
46 venir v. 585 62 venir v. 391 -16 256
48 bien av. 577 17 bien av. 1536 31 961
49 creer v. 567 40 croire v. 560 9 81
53 parecer v. 543 90 paraître v. 258 -37 1369
55 cosa n. 539 46 chose n. 496 9 81
56 uno num. 539 21 un num. + + une num. 930 35 1225
57 deber v. 533 28 devoir v. 754 29 841
63 tiempo n. 504 45 temps n. 504 18 324
65 tres num. 488 72 trois num. 346 -7 49
142 parte n. 235 107 part n. 212 35 1225
67 bueno aj. 472 43 bon aj. 526 24 576
69 mil num. 466 133 mille num. 154 -64 4096
71 ciento num. 450 66 cent num. 381 5 25
72 mundo n. 443 75 monde n. 340 -3 9
75 vivir v. 426 92 vivre v. 255 -17 289
106 obra n. 293 137 ftuvre n. 141 -31 961
77 espacol aj. 397 175 espagnol aj. 19 -98 9604
80 pensar v. 392 68 penser v. 370 12 144
81 pueblo n. 385 141 peuple n. 126 -60 3600
82 nuevo aj. 380 67 nouveau aj. 380 15 225
84 seguir v. 346 128 suivre v. 167 -44 1936
88 conocer v. 339 69 connaître v. 364 19 361
91 tu aj. 334 70 ton aj. 358 21 441
93 poco aj. 327 33 peu av. 704 60 3600
94 verdad n. 326 153 vüritH n. 97 -59 3481
96 tal aj. 320 81 tel aj. 318 15 225
Продолжение таблицы 1
1 2 3 4 5 6 7 8
100 hora n. 311 39 heure n. 564 61 3721
101 dios n. 310 115 dieu n. 194 -14 196
102 libro n. 302 135 livre n. m. 148 -33 1089
103 mano n. 297 86 main n. 271 17 289
104 sentir v. 294 98 sentir v. 239 6 36
105 historia n. 293 118 histoire n. 184 -13 169
107 siglo n. 293 138 siicle n. 138 -31 961
108 momento n. 289 83 moment n. 299 -75 5625
109 caso n. 288 88 cas n. 269 -79 6241
111 palabra n. 288 150 parole n. 102 -39 1521
112 ojo n. 285 74 ftil n. 345 38 1444
113 hijo n. 280 152 fils n. 97 -39 1521
114 menos av. 280 42 moins av. 532 72 5184
116 cinco num. 274 129 cinq num. 161 -13 169
117 padre n. 271 121 pure n. 181 -4 16
118 punto n. 271 76 point n. 338 42 1764
120 idea n. 270 89 idife n. 267 31 961
121 noche n. 270 106 nuit n. 212 15 225
123 entrar v. 269 122 entrer v. 175 1 1
125 estado (polit.) n. 265 130 Htat n. 159 -5 25
162 tanto aj. 104 167 tant av. 67 -5 25
126 dncimo aj. 263 178 dixiame aj. 7 -52 2704
130 acabar v. 255 173 achever v. 34 -43 1849
132 cuanto aj. 254 171 quant (a) p. 48 -39 1521
134 escribir v. 251 132 ifcrire v. 154 2 4
135 nombre n. 244 116 nom n. 193 19 361
136 tierra n. 244 114 terre n. 196 22 484
137 mayor aj. 243 179 majeur aj. 6 -42 1764
138 trabajo n. 243 94 travail n. 252 44 1936
143 amor n. 232 108 amour n. 211 35 1225
144 fin n. 232 134 fin n. 149 10 100
145 autor n. 228 142 auteur n. 124 3 9
146 propio aj. 227 146 propre aj. 114 0 0
148 esperar v. 222 157 espürer v. 87 -9 81
149 cuatro num. 221 119 quatre num. 184 30 900
150 país n. 221 96 pays n. 247 54 2916
151 amigo n. 220 101 ami n. 230 50 2500
152 espíritu n. 219 102 esprit n. 222 50 2500
153 madre n. 219 136 mare n. 148 17 289
154 ciencia n. 216 161 science n. 80 -7 49
155 grupo n. 215 155 groupe n. 92 0 0
Продолжение таблицы 1
1 2 3 4 5 6 7 8
156 servir v. 213 131 servir v. 155 25 625
157 aparecer v. 212 147 apparattre v. 109 10 100
161 contar v. 112 158 compter v. 86 3 9
147512
Обозначение частей речи в таблицах (принятое в использованных ЧС):
aj. - имя прилагательное
av. - наречие
с. - союз
i. - междометие
п. - имя существительное
п. т. - имя существительное мужского рода (при наличии в данном языке омонима женского рода)
num. - имя числительное p. - предлог pn. - местоимение v. - глагол
v. а. - вспомогательный глагол
Обработка результатов, представленных в таблицах, была ориентирована на коэффициент корреляции по Спирмэну:
i=1
i=1
■ = 1 - -(n3 - n) n(nz - 1)
где й - разность между номером ЛЕ языка Ь и номером соответствующей ЛЕ языка Ь, п - количество строк с лексическими сопоставлениями в данной таблице, / - номер в ЧС.
С учетом трех перечисленных выше степеней сходства приходится усложнять математическую обработку, используя фор-мулу Спирмэна в измененном виде:
(
Р =
6|Х di2 + 0,5^ d
1 --
г=1 у
(n + n2)((n1+ n2) - 1)
n + n2 , + n2 + n3
V у
где й - разность между номером ЛЕ языка Ь. и номером соответствующей ЛЕ языка Ь. в таблице с полными сходствами, й2 -разность между номером ЛЕ языка Ь. и номером соответствующей ЛЕ языка Ь в
таблице с частичными сходствами, п1 - количество строк с лексическими сопоставлениями в таблице с полными сходствами, п2 - количество строк с лексическими сопоставлениями в таблице с частичными сходствами, п3 - количество строк с лекси-ческими сопоставлениями в таблице с несходствами.
-1 <р< 1,
где 1 обозначает большую близость языка Ь. и языка Ь. по частотности (положительную связь), -1 - их взаимную противопоставленность по частотности (отрицательную связь), а 0 - отсутствие связи по частотности между ними (внеположенность). Между родственными языками возможен показатель только выше нуля.
Приведем пример вычисления по результатам таблиц при помощи формулы Спирмэна:
Исп.-фр. (по номерам ЧС знаменатель -ных ЛЕ - ср. табл. 1):
р=(1-6(147512+0,5-30890):(104+21)
((104+21)1-1))((104+21):(104+21+55))«
*(1-6-162957:1953000)0,7* 0,499-0,7= 0,35
г=1
Таблица 2
Результаты исследования
Пара Коэффициент корреляции
По номерам общего ЧС По номерам ЧС знаменательных ЛЕ
Испанский-французский 0,15 0,35
Испанский-итальянский 0,2 0,4
Полученные результаты позволяют сделать следующие выводы. По каждой из двух процедур вычисления коэффициент корреляции в паре испанский-италь-янский больше, чем в паре испанский-французский. Это позволяет противопоставить испанский и итальянский языки как принадлежащие к так называемой непрерывной Романии (Romania continua), французскому как представите-
лю прерывной Романии (Romania discontinua)5.
Впрочем, следует иметь в виду, что эти результаты получены лишь из сопоставления испанского языка с французским и итальянским, в то время как окончательный результат, касающийся соотношения этих трех языков, может быть получен лишь по дополнении этого исследования сопоставлением французского языка с итальянским.
ПРИМЕЧАНИЯ
1 Философский словарь / Под ред. И. Т. Фролова. 7-е изд., перераб. и доп. М.: Республика, 2001. С. 247.
2 Там же. С. 550.
3 Такого рода омонимы встречаются только в ЧС французской лексики и семантизируются через английский язык, причем к самому частотному из них не приводится английского эквивалента. Поэтому значения таких французских слов в данной работе сверяются по французско-английскому словарю, после чего проверяется эквивалентность соответствующих английских слов ЛЕ испанского языка. В целях большей достоверности такая проверка ведется как от английского языка к испанскому, так и наоборот.
4 Walde A. Lateinisches etymologisches Wurterbuch. 3., neubearbeitete Aufl. von J.B. Hofmann. Heidelberg: Carl Winter’s UniversitAtsbuchhandlung. 1. Bd. (A-L), 1938. S. 824, 832.
5 Alonso A. Die Aufgliederung der westromanischen Sprachen. Aus dem Sp. // Wege der Forschung. Bd. CLXII. Zur Entstehung der romanischen Sprachen. Darmstadt: Wissenschaftliche Buchgesellschaft, 1978. S. 163-186.