В. П. Чепига
ПРОБЛЕМА «РОМЕН ГАРИ - ЭМИЛЬ АЖАР»: АТРИБУЦИЯ РОМАНОВ, ОПУБЛИКОВАННЫХ ПОД ПСЕВДОНИМОМ ЭМИЛЬ АЖАР
Работа представлена кафедрой романской филологии Санкт-Петербургского государственного университета.
Научный руководитель - доктор филологических наук, профессор М. А. Марусенко
В статье рассматриваются результаты атрибуции трех романов, опубликованных под псевдонимом Эмиль Ажар, с помощью метода распознавания образов, который предусматривает применение многомерной классификации и описания индивидуального авторского стиля в синтаксическом аспекте. Впервые данный метод применяется на материале современного французского языка.
The article considers the results of attribution of the three novels published under the pseudonym Emile Aj ar by means of the method of pattern recognition. This method provides application of multivariate classification and description of the author’s individual style in the syntactic aspect. For the first time the method is applied by the material of the modern French language.
Ромен Гари (1914-1980), являясь одним из крупных французских писателей XX в., привлекает внимание как широкого круга читателей, как и исследователей прежде всего своей экспериментальной деятельностью в области художественной литературы.
Наибольший интерес вызывает проблема авторства романов, написанных под
псевдонимом Эмиль Ажар. В период с 1974 по 1980 г. литературными критиками и сотрудниками издательских домов «Галли-мар» и «Меркюр де Франс» не ставилась под сомнение непринадлежность четырех произведений Э. Ажара Ромену Гари, хотя они вычитывали и публиковали параллельно произведения как Р. Гари, так и Э. Ажара.
Романы, написанные Ажаром, считали творением Р. Кено, Л. Арагона и М. Тур-нье, Ж. Ланцмана, работой коллектива авторов. Затем - П. Павловича, племянника Р. Гари.
После выхода в свет романа П. Павловича «Человек, которому верили»1, а также посмертной публикации Р. Гари «Жизнь и смерть Эмиля Ажара»2 литературный мир потряс тот факт, что Р. Гари и Э. Ажар являются одним и тем же человеком, к тому же Р. Гари оказался единственным писателем, получившим два раза Гонкуровскую премию.
Работы по атрибуции псевдонимных романов Э. Ажара сводятся к одному диссертационному труду 1998 г., проведенному польским исследователем А. Павловски, который использовал модель временных рядов3. Результатом работы стала атрибуция четырех произведений Э. Ажара Ромену Гари. При этом исследователь не учитывал жанровое несоответствие романов Э. Ажара и привлек в качестве потенциальных авторов ряд современников Р. Гари, основываясь только на газетных заметках того времени, появившихся до установления того факта, что в данной литературной «мистификации» участвовал П. Павлович, исполнявший роль Э. Ажара.
Таким образом, по результатам истории вопроса и исследования архивных документов мы сталкиваемся с сосуществующими противоречащими точками зрения, разрешение которых должно быть достигнуто путем проверки различных гипотез. При этом нулевую гипотезу можно формулировать следующим образом: (Н() - все тексты романов Э. Ажара полностью принадлежат Р. Гари. Соответствено, альтернативные гипотезы будут выглядеть так: ( Н\ ) - тексты романов Э. Ажара являют-
ся произведением П. Павловича и ( И2а ) -тексты романов Э. Ажара являются совместным произведением Р. Гари и П. Павловича с определенной долей участия каждого из них. Естественно, что вопрос об атрибуции того или иного романа Э. Ажара решается в каждом случае индивидуально.
Для практической реализации этой процедуры необходимо располагать минимум двумя объектами, принадлежащими к двум разным классам, известным заранее4. В нашем исследовании такими классами являются классы Qj (Gary) и Q2 (Pavlowitch).
Исходя из требования соблюдения синхронии и жанрово-стилистической однородности текстов, корпус текстов, используемых для определения координат эталонов классов, имеет следующую структуру (табл. 1):
Таблица 1
Состав и объекты априорных классов
Класс Код Произведения Год издания Объем авторской речи (N»)
Ü1 (Gary) 1G Gary R. Au-delà de cette limite 1975 5233
votre ticket n'est plus valable.
2G Gary R. Clair de femme. 1977
3G Gary R. Les Cerfs-volants. 1980
0.2 (Pavlowitch) 1P Pavlowitch P. Un autre monde. 2004 5200
2P Pavlowitch P. Tom. 2005
Относительно сформированных апри- стов), написанных под псевдонимом
орных классов будет производиться клас- Эмиль Ажар, подлежащих распознаванию
сификация многомерных объектов (тек- (табл. 2):
Таблица 2
Атрибутируемые объекты
Код Наименование Год издания Объем авторской речи (N»)
1A Gros-Câ lin 1974 1449
2A La Vie devant soi 1975 2394
3A L'Angoisse du roi Salomon 1979 3078
Из текстов каждого автора, входящих в табл. 1, были сделаны случайные предварительные выборки объемом 200 предложений, для каждой из которых были определены значения 54 параметров из исходного набора5. В соответствии с использующейся процедурой атрибуции следующим этапом является выделение из априорного набора параметров, способных разделять априорные классы. Результаты проверки
существенности разности средних для двух априорных классов с помощью /-критерия Стьюдента (формула 1) приведены в табл. 3.
Х1 - х2
1/2
(1)
Таблица 3
Проверка статистической гипотезы существенности разности двух средних
п
п
1
2
Параметр Q(Gary)/ Q(Pavlowitch) Параметр Q(Gary)/ Q(Pavlowitch)
^набп. Ьабп.
X01 1,789 X28 3,262
X02 2,093 X29 2,336
X03 2,944 X30 3,753
X04 0,096 X31 6,160
X05 1,642 X32 0,080
X06 3,506 X33 1,930
X07 3,052 X34 1,372
X08 3,038 X35 1,016
X09 1,418 X36 0,936
X10 1,000 X37 1,076
X11 5,193 X38 0,161
X12 1,926 X39 0,453
X13 1,733 X40 0,980
X14 1,807 X41 0,112
X15 1,485 X42 0,814
X16 1,662 X43 0,902
X17 1,160 X44 1,306
Х18 0,535 Х45 1,893
Х19 6,971 Х46 1,517
Х20 4,382 Х47 1,260
Х21 4,816 Х48 0,000
Х22 1,555 Х49 0,539
Х23 4,292 Х50 0,372
Х24 2,842 Х51 1,669
Х25 3,386 Х52 1,556
Х26 1,740 Х53 1,477
Х27 0,537 Х54 1,867
Из табл. 3 видно, что статистически зна- Х20, Х21, Х23, Х24, Х25, Х28, Х29, Х30, Х31,
чимой является разность средних для пара- для которых наблюдаемые значения /-кри-
метров Х02, Х03, Х06, Х07, Х08, Х11, Х19, терия превышают критические (/005 = 1,96).
На втором этапе из подмножества шестнадцати параметров удалось выделить подмножество из трех параметров, удовлетворяющих требованиям сильной корреляции с другими параметрами совокупности и способности к разделению объектов на классы. Таким образом, рабочий словарь параметров распознающей системы по атрибуции романов Э. Ажара включает
3 диагностических параметра: Х23 - число предлогов; Х24 - число союзов; Х28 - число прямых дополнений.
Поскольку произведения, входящие в корпус текстов (табл. 1), значительны по объему и сплошное статистическое обследование не является целесообразным, следующим этапом процедуры определения координат эталонов классов является оп-ределение объема выборки6 (формула 2), результаты которого представлены в табл. 4-5.
п = ----, (2)
1 +
2
N
где V= — x
V
Vx= т-л/КА
Vn
5 - выборочное среднее квадратичное отклонение, /- доля отбора, х - выборочное среднее значение признака для совокупности; V - относительная стандартная ошибка, которая показывает, сколько процентов от истинного значения составляет стандартная ошибка оценки.
При V- =0,05 стандартная ошибка состав-
ляет только 5% величины оцениваемого параметра.
Анализ данных таблиц показывает, что в каждом классе необходимый объем выборки для различных параметров варьирует в широких пределах. Например, для объекта 1Р для параметра Х23 необходим минимальный объем выборки (п = 1023), а для определения значения параметра Х24 с V = 0,05 необходима выборка объемом в 1861 предложение. Произведя случайную выборку в 1861 предложение, мы с доста-
Таблица 4
Определение объема выборки для объектов класса Ц (Gary)
Код произведения Параметр Xi СТ/ n(Vx = 0,05)
1G Х23 2,970 2,588 688
Х24 1,090 1,443 1034
Х28 1,640 1,432 690
N=1680
2G Х23 1,930 1,833 589
Х24 0,810 0,961 695
Х28 1,430 1,328 578
N=1026
3G Х23 3,600 2,741 658
Х24 1,040 1,127 1053
Х28 1,720 1,386 715
N=2527
Таблица 5
Определение объема выборки для объектов класса П2 (Pavlowitch)
Код произведения Параметр xi i П(Ух=0,05)
1P X23 1,600 1,596 1023
X24 0,450 0,783 1861
X28 1,870 0,991 1214
N=3100
2P X23 2,340 2,903 1112
X24 0,530 0,822 1339
X28 0,870 0,960 989
N=2100
точной точностью определим значение параметра Х24, а значения остальных параметров будут измерены с заведомо избыточной точностью. Результаты обработки данных, полученных методом случайной выборки, представляющие собой коорди-наты эталонов классов на нулевой итерации, приведены в табл. 6.
Таблица 6
Координаты эталонов классов на 0-й итерации
Параметр Класс
О^гу) Q0(Pavlowitch)
-1 О i -1 О i
X23 2,281 2,350 1,525 1,712
X24 0,856 1,139 0,401 0,714
X28 1,431 1,284 0,779 0,898
N=2782 N=3200
Следующим этапом процедуры распознавания является определение координат распознаваемых объектов (трех романов Э. Ажара). Статистические характеристики распределений параметров для всех атрибутируемых объектов приведены в табл. 7.
Таблица 7 Координаты атрибутируемых объектов
Объект Параметр Х1 О i N
X23 3,090 3,198 2394
X24 1,250 1,520
X28 1,430 1,451
2A X23 2,160 1,873 1449
X24 1,710 1,578
X28 1,780 1,433
3A X23 2,150 2,492 3078
X24 1,160 1,376
X28 1,570 1,533
В соответствии с применяемым алгоритмом атрибуция производится в два этапа: при помощи детерминированного алгоритма распознавания, затем, после остановки последнего, при помощи вероятностного алгоритма распознавания. В описываемом эксперименте остановка детерминированного алгоритма распознавания произошла на 0-й итерации.
После остановки детерминированного алгоритма все три атрибутируемых объекта оказались не отнесенными ни к одному
априорному классу. Реализация вероятностного алгоритма распознавания предусматривает преобразование исходной матрицы данных в матрицу евклидовых расстояний между объектами, подлежащими распознаванию, и эталонами априорных классов (табл. 8).
Таблица 8
Матрица евклидовых расстояний между классами и ^атрибутированными объектами
а (х.., о,)
Объект
Класс 3A 4A
0,900 0,931 0,359
□2 1,986 1,766 1,262
Следующим этапом процедуры вероятностного распознавания является формирование решающего правила, при котором происходит приписывание вероятности или достоверности каждому решению, что делает возможным решать любую задачу отнесения объектов к априорным классам. Вероятность принадлежности _)-го объекта к 1-му классу (табл. 9) вычисляется на основе матрицы евклидовых расстояний между объектами и априорными классами по следующей формуле:
( \~1
Р.. =--------- л а..
1
(3)
У
где А - расстояние между _)-м объектом и ьм классом, . - расстояние между _)-м объектом и остальными классами классификации7.
Таблица 9 Матрица вероятностей принадлежности объектов априорным классам Р(Х, еП.)
Р(X, еП.)
Объект
Класс 2A 3A
0,678 0,655 0,778
^2 0,322 0,345 0,222
При наличии двух априорных классов решающее правило может быть сформулировано как:
X. ёП. , p[x. е Q2 )> | p{x. eQ2).
2 2 Таким образом,
n = 1
X . е Q . , Pi X . e Q . I> 0,5 ,
1 j V 1 j )
т. e. при данном решающем правиле пороговое значение вероятности принадлежности объекта к одному из априорных классов должно превышать 0,5. По данным табл. 9, классу Q (Gary) могут быть атрибутированы все три объекта: A1 (Gros-CBlin), A2 (La Vie devant soi) и A3 (L’Angoisse du roi Salomon).
Правильность и правомочность полученных результатов после проведения вероятностной атрибуции необходимо проверить, проведя оценку однородности априорного класса по сравнению с априорным классом. Критерием однородности служит средний квадрат расстояния между объектами d (Q^) . Построим матрицу
евклидовых расстояний между объектами априорного класса (табл. 10).
В качестве мер близости между объектами одного класса Q p = 1, 2, ..., m обычно используют величину, называемую среднеквадратичным разбросом объектов внутри класса Q :
S (ф =
kp kp _l k=1 ki =1
kp kp 2 ¿ ¿ d . ,ю,
pk, pi
(4)
Качество классификации считается тем выше, чем теснее расположены объекты внутри класса.
Таблица 10 Матрица евклидовых расстояний между объектами априорного класса fl1 (Gary)
Объект d ( Xi, Xj )
Объект
1G 2G 3G
1G Q,QQQ 1,379 Q,243
2G 1,379 Q,QQQ 1,541
3G Q,243 1,541 Q,QQQ
С помощью формулы 4 вычислим среднеквадратичный разброс для объектов класса Ц (Gary): S (^3) = 1,523.
Построим следующую матрицу данных, объединив исходные данные трех объектов, составляющих класс Q1 (Gary), и всех трех атрибутируемых Гари объектов по вероятностной атрибуции (табл. 11).
Таблица 11 Матрица евклидовых расстояний между объектами апостериорного класса ..
1 1 Gary, Ajar
Объект d ( Xi, Xj )
Объект
1G 2G 3G 1A 2A 3A
1G Q,QQQ 1,379 Q,243 Q,8Q1 1,385 1,QQ8
2G 1,379 Q,QQQ 1,541 1, 15Q 1,389 Q,914
3G Q,243 1,541 Q,QQQ 1,499 1,552 1,218
1A Q,8Q1 1,15Q 1,499 Q,QQQ Q,789 Q,318
2A 1,385 1,389 1,552 Q,789 Q,QQQ Q,95Q
3A 1,QQ8 Q,914 1,218 Q,318 Q,95Q Q,QQQ
С помощью формулы (4) вычислим среднеквадратичный разброс для объектов апостериорного класс^Ц^ АшгS (Ц5) = 1,148
Gary, Ajar '_*-
Поскольку S (^) > S (ßr
), МОЖ-
r
Ъ' ^ ' Ошгу, ААшг ‘
но сделать вывод о том, что полученная классификация объектов улучшилась и близка к естественной, что подтвердило результаты работы вероятностного алгоритма и принадлежность априорному классу трех атрибутируемых объектов.
Представим полученные данные в виде матрицы решений, где 0 - отказ от распознавания, 1 - положительное решение по детерминированному алгоритму атрибуции, 1 *
1 - положительное решение по вероятностному алгоритму атрибуции (табл. 12).
Таблица 12
Матрица решений
Код Наименование Ü1 (Gary) Ü2 (Pavlowitch)
1A Gros-Calin 1* Q
2A La Vie devant soi 1* Q
3A L'Angoisse du roi Salomon 1* Q
В результате проведенного исследования была подтверждена гипотеза (#0): тексты романов Э. Ажара полностью принадлежат Р. Гари. Таким образом, атрибутируемые объекты были приписаны априорному классу Qj (Gary) и был сформирован апостериорный класс QGary Ajar, показавший высокую степень однородности.
Были опровергнуты сформулированные во второй главе гипотезы ( H) и ( H а ), согласно которым тексты романов Э. Ажара являются произведением П. Павловича ( H1 ) или совместным произведением
Р. Гари и П. Павловича с определенной долей участия каждого из них ( H2 ).
Представляется возможным отойти от рассмотрения Р. Гари и Э. Ажара как одного человека, творившего под двумя разными псевдонимами, и разграничить такие термины, как «писатель» и «автор». Данное разграничение предложено французским литературоведом Ф. Вернье. Так, писателем она предлагает признать индивидуума, писательство для которого является профессиональной деятельностью. У такого человека есть личная, творческая, социальная история, к которой мы можем обратиться в литературоведческом исследо-
вании. Автора же можно рассматривать как личность, которая раскрывается путем исследования конкретного литературного наследия, стилистики, интенциональности его произведений8. Если принять данную точку зрения, то мы можем рассматривать Р. Гари и Э. Ажара как двух разных авторов, объединенных одним писателем - Роменом Гари.
Тот факт, что все результаты получены путем вероятностной атрибуции, может быть интерпретирован следующим образом: Р. Гари, скрывавший свое авторство, намеренно старался изменить стиль с тем, чтобы его мистификация не была сразу же разгадана. Именно этим может объясняться отсутствие результатов детерминированной атрибуции. Но поскольку писатель не может значительно изменять характеристики латентных синтаксических структур при создании больших объемов текста, то вероятностная атрибуция смогла однозначно указать на истинного автора.
Результаты исследования служат еще одним показателем того, что характеристики индивидуального авторского стиля носят объективный характер и не зависят от воли пишущего.
ПРИМЕЧАНИЯ
1 Pavlowitch P. L’Homme que l’on croyait. P.: Fayard, 1981.
2 Gary R. Vie et mort d’Emile Ajar. P.: Gallimard, 1981.
3 Pawiowski A. Srnies temporelles en linguistique avec application a l’attribution de textes: Romain Gary et Emile Ajar. P.: H. Champion, 1998.
4 Марусенко М. A. Атрибуция анонимных и псевдонимных литературных произведений методами распознавания образов. Л.: Изд-во ЛГУ, 1990. С. 129.
5 Там же. С. 71-74.
6 В поисках потерянного автора: Этюды атрибуции / М. А. Марусенко, Б. Л. Бессонов, Л. М. Богданова и др.; Под ред. М. А. Марусенко. СПб.: Фил. фак-т СПбГУ, 2001. С. 14-15.
7 Терехина А. Ю. Анализ данных методами многомерного шкалирования. М.: Наука, 1986. С. 153.
8 Vernier F. L’ange de la throrie // Paragraphes. Montrnal: Presses universitaires de Montrnal, 2004. P. 120-122.