Электронное научное издание Альманах Пространство и Время Т. 10. Вып. 1 • 2015 ПРОСТРАНСТВО И ВРЕМЯ ТЕКСТА
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 'Space and Time of the Text
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1. 'Raum und Zeit des Textes'
Читать природу
УДК 167/168:94:575
Волошин М.Ю.
Интерпретация генома как текста: основания и исторические предпосылки
Волошин Михаил Юрьевич, студент Философского факультета МГУ имени М.В. Ломоносова, кафедра философии и методологии науки
E-mail: allrour95@rambler.ru
Распространенная в генетике интерпретация генома как текста не является аналогией, основанной лишь на их внешнем сходстве. Она представляет собой логическое следствие развития генетики до середины XX века, исходит из структурных особенностей генома и обладает значительными эвристическими возможностями.
Ключевые слова: генетика, генетический код, геном, ДНК, РНК, информация, семантика, синтаксис, текст.
Введение
Во второй половине XX в. в генетике начинает активно использоваться аналогия «геном — текст». Выражения вроде «текст ДНК», «текст генома», непосредственные сравнения генома с текстом и с частным случаем текста — программным кодом — вошли в повседневный обиход и постоянно встречаются в учебной, научной и научно-популярной литературе по генетике. Первое объяснение этому факту, которое приходит в голову, заключается в том, что такая аналогия эффективно выполняет иллюстративно-педагогическую функцию. Сравнивая с текстом, объясняют, как устроен геном; сравнивая конкретно с программным кодом — как он функционирует в организме. Между тем, некоторые авторы [Докинз 2013, с. 49] прямо утверждают, что такое сравнение — «не какая-то смутная аналогия, а истина в буквальном смысле»1.
1 Ричард Докинз не аргументирует этот тезис, по-видимому, считая его самоочевидным.
На наш взгляд, подобные утверждения (если им придать более аккуратную формулировку) имеют под собой некоторые основания. Геном не просто похож на текст по своей форме: он представляет собой текстуальный способ хранения информации, и это его сущностное, принципиальное свойство. Почему это так, можно понять, реконструировав историю развития генетики до (и немного после) открытия Уотсона и Крика. Наконец, если это предположение верно, и интерпретация генома как текста является частью «научной картины мира» [Степин 2011, с. 237—244]2, то эта интерпретация
2 По Степину, научная картина мира — это «образы предмета исследования, посредством которых фиксируются основные системные характеристики изучаемой реальности» [Степин 2011, с. 237].
должна быть эффективной не только в иллюстративно-педагогическом смысле, но и в эвристическом. То есть на ее основе должно быть возможным получение нового знания.
Таким образом, задачами данной работы являются: раскрытие сущностного сходства между геномом и текстом, реконструкция исторического пути развития генетики, который привел к необходимости такой интерпретации, и демонстрация ее эвристических свойств.
Историческое развитие генетики как поиск минимальной единицы наследственности
Мы кратко рассмотрим историю генетики с 1865 по 1953 гг., используя в качестве историографической методологии концепцию Г. Риккерта, утверждавшего, что для естественных наук в силу внутренней логики их развития имеет место «стремление к последним вещам» — объяснение явлений физического мира через взаимодействие все более элемен-
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1.
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
тарных объектов [Риккерт 1997]. Благодаря этому мы сможем провести различие между информационным и материальным аспектами генома — различие, которое, на наш взгляд, неявно присутствовало в генетике с момента ее возникновения и эксплицировалось лишь в середине XX в. Происхождение аналогии «геном — текст» связано с результатом этой экспликации.
Основным направлением научных исследований в генетике с момента ее зарождения в 1865 г. был поиск и выяснение природы объектов, способных хранить и передавать наследственную информацию. Законы Менделя (иногда их называют «правилами») не вызвали сколь-нибудь значимого отклика у научной общественности, потому что ничего нового в этих законах не было. Те же соотношения периодически получали и описывали другие ученые: О. Сажрэ, П. Но-ден, и даже сам Ч. Дарвин [Голубовский 2000, с. 30]. Горох, с их точки зрения, был лишь еще одним частным случаем, а под описанные соотношения не подпадали популярные в то время экспериментальные объекты — пчелы и ястребинка3.
3 Сейчас мы знаем, что проблема в особенностях их размножения. Пчелы частично, а ястребинка полностью размножается партеногенезом — без мужских гамет.
Однако законы Менделя в качестве теоретической базы имели гениальную догадку, не оцененную по достоинству современниками: гипотезу о «наследственных факторах». Мендель предположил, что каждый признак контролируется парой факторов, которые рассоединяются при образовании половых клеток и вновь соединяются у потомства, т.е. половая клетка не может обладать двумя факторами сразу [Мендель 1935]. Таким образом, задается исследовательская программа: если наличествует фенотипический признак, то должно быть нечто, определяющее такой признак (информационный аспект), и задача состоит в поиске его биологического субстрата (материальный аспект).
Грегор Иоганн Мендель (Gregor Johann Mendel, 1822—1884), австрийский биолог и ботаник, монах-августинец, аббат
Сад августинского монастыря Св. Фомы в Старе Брно, в котором Мендель проводил свои опыты
Автограф записей Г. Менделя о его экспериментах с горохом
В теории Менделя в роли биологического субстрата информации выступали сами клетки, но уже у его постоянного корреспондента К. Нэгели появляется разделение клетки на идиоплазму — субстрат наследственной изменчивости, и трофоплазму, отвечающую за приспособительные модификации. По Нэгели, только идиоплазматическая информация передается по наследству [Назаров 2007, с. 164]. К моменту «переоткрытия» законов Менделя в 1900 г. были получены некоторые данные и в области цитологии: Флеммингу в 1882 г. удалось зафиксировать расхождение хроматид в процессе деления клеток, а через год ван Бенеден доказал, что они распределяются поровну [Фогель, Мотульски 1989, с. 27]. Уже после работ Г. де Фриза, К. Корренса и Э. Чермака становится ясно, что искомые «факторы» должны быть локализованы в хромосомах: в 1902—1903 гг. Сеттон и Бовери замечают, что распределение родительских хроматид среди потомков подчиняется тем же соотношениям, что и распределение признаков по Менделю [Crow E., Crow J. 2002]. Им удается связать свойство носителя информации с еще более элементарным объектом — хромосомой.
В 1909 г. Вильгельм Иогансен вводит в научный оборот термин «ген». Иогансен вначале следует менделевскому подходу, и ген определяется как детерминант конкретного признака:
«...особенности организма обусловлены особыми, находящимися в гаметах отделимыми и потому самостоятельными состояниями, основами, зачатками... Мы легко можем говорить о гене свойства вместо громоздкой фразы «ген, который обуславливает свойство» ... Каждая особенность, в основе которой лежит особый ген, может быть названа единичной особенностью». Через четыре года, во втором издании той же работы, он откажется от этой идеи: «Мы ни в коем случае не должны себе представлять, что отдельному гену соответствует отдельная особенность, единичная особенность или признак. Подобное распространенное представление должно быть обозначено. как совершенно ложное» (цит. по [Любищев 1925, с. 10]).
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1.
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
Вальтер Флемминг (Walther Flemming, 1843— 1905), немецкий биолог, основатель цитогене-тики (слева) и рисунок клеток хромосом и митоза из его книги «Клеточная субстанция, ядро и клеточное деление» (Zellsubstanz, Kern und Zelltheilung, 1882) (справа)
Вильгельм Людвиг Иогансен (Wilhelm Ludvig Johannsen, 1857—1927), датский биолог (слева) и обложка второго издания его книги ««Элементы точного учения наследственности» (Elemente der exakten Erblichkeitslehre, 1913) (справа), где впервые было введены понятия «ген» и «генотип»
Томас Хант Морган (Thomas Hunt Morgan, 1866—1945), американский биолог, один из основоположников генетики, лауреат Нобелевской премии по физиологии и медицине 1933 г. «За открытия, связанные с ролью хромосом в наследственности»
Однако Томас Морган, который как раз в 1909 г. начал свои знаменитые опыты с Drosophila Melanogaster, будет пользоваться именно первым определением. Созданная им хромосомная теория наследственности предполагает, что гены локализованы в хромосомах и представляют собой предельные единицы (ultimate units) возможных хромосомных аберраций, неделимые при кроссинговере. По Моргану, гены, расположенные на одной хромосоме, наследуются совместно, и по тому, как проявились признаки у потомства, можно судить о произошедшем кроссинговере при делении родительских клеток [Морган 1924, с. 9—13]. Он даже предпринимает попытку картирования генов Drosophila Melanogaster и указывает их приблизительные размеры [Morgan 1922]. Для Моргана, таким образом, ген — отрезок хромосомы — является одновременно и минимальной единицей наследственности, и детерминантом конкретного признака, несущим наследственную информацию.
Первые «генетические тексты»: слева — эксперимент Т. Моргана с дрозофилами; справа — карта генов хромосом дрозофилы из седьмой главы книги Т. Моргана «Эволюция и генетика» (Evolution and Genetics, 1925)
Хромосомная теория дала толчок молекулярным исследованиям в этой области. В 1928 г. Н.К. Кольцов обосновывает концепцию «матричного синтеза» в качестве механизма передачи наследственной информации, которая, как предполага-
Электронное научное издание Альманах Пространство и Время Т. 10. Вып. 1 • 2015 ПРОСТРАНСТВО И ВРЕМЯ ТЕКСТА
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 'Space and Time of the Text
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1. 'Raum und Zeit des Textes'
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
лось, «закодирована» в виде линейной белковой молекулы [Кольцов 1936]. В 1933 г. М. Демерец на основе исследований мутационной изменчивости, в том числе работ ученика Кольцова — Тимофеева-Ресовского — выдвигает предположение, что носителем генетической информации является не белок, а дезоксирибонуклеиновая кислота, так как весьма вероятно, что мутации вызваны изменением в последовательности четырех ее азотистых оснований и разрывами слабых водородных связей [Demerec 1933]. А в 1944 г. этой гипотезе будет найдено экспериментальное подтверждение: Эвери и его коллеги установят корреляцию между изменением структуры ДНК и проявлениями мутаций у пневмококков [Avery et al 1944].
Николай Константинович Кольцов (1872—1940), биолог, основатель русской советской школы экспериментальной биологии (слева) и титульный лист немецкого журнала «Biologisches Zentralblatt» за 1928 г., в котором была опубликована статья Н.К. Кольцова «Физико-химические основы морфологии» (Koltzoff N.K.
Physikalisch-chemische Grundlage der Morphologie) (справа)
Матричный синтез гена по Н.К. Кольцову (слева) и современная схема репликации ДНК (справа)
Освальд Теодор Эвери (Oswald Theodore Avery, 1877—1955), американский молекулярный биолог, иммунолог, медик (справа) и первая страница статьи Эвери с соавт., подтверждавшей роль ДНК как носителя генетической информации ("Studies on the Chemical Nature of the Substance Inducing Transformation of Pneumococcal Types. Induction of Transformation by a Desoxyribonucleic Acid Fraction Isolated from Pneumococcus Type III." J. Exp. Med. 79 (1944): 137—158) (слева)
На протяжении всей предыдущей истории генетики направление поисков задавалось фенотипическими проявлениями наследственности. Задача, которую решали и Мендель, и Морган, и Эвери, состояла в установлении корреляции между изменениями фенотипа и некоего (все более элементарного) биологического объекта. Программа исследований молекулярной биологии не связана непосредственно с этой задачей: имея представление о существовании некоторой молекулы, будь то белок или ДНК, можно заниматься установлением ее структуры без отсылки к ее влиянию на фенотип. Появление программы, относительно независимой от проблемы наследственности, способствовало осознанию того, что информационные свойства генома связаны с его материальной структурой не так жестко, как предполагалось в предыдущих исследованиях. Аналогия «геном — текст» появится как попытка решения проблемы того, как именно они связаны (об этом подробнее в следующем параграфе).
В работу по исследованиям молекулярной биологии клетки включились не только биологи, но и физики и химики, в том числе Лайнус Полинг — ведущий химик своей эпохи. Полингу принадлежит модель альфа-спирали белков и обоснование того, как спиралевидная структура молекулы придает ей устойчивость; он же объясняет роль слабых водородных связей в спиралевидной молекуле и вводит в науку термин «комплементарность» для обозначения пространственного соответствия между элементами молекулярной структуры [Strasser 2006]. К началу 1950-х годов Полинг уже разрабатывал модель тройной спирали ДНК, и в 1953 г. совместно с Робертом Кори опубликовал статью в Nature [Pauling, Corey 1953].
В том же выпуске журнала была опубликована статья Джеймса Уотсона и Френсиса Крика. Им удалось заранее ознакомиться с моделью Полинга-Кори и обнаружить, что она плохо согласовывается с данными рентгенографического анализа. Взамен они предложили двухцепочечную модель, цепи которой удерживаются вместе благодаря комплементарно-сти азотистых оснований [Watson, Crick 1953]. Именно на основе этой модели стало возможным объяснение механизмов репликации и транскрипции ДНК. В этот момент «стремление к последним вещам» находит свое логическое завершение. Цепочка «клетка — идиоплазма — ядро — хромосома — отрезок хромосомы — молекула» завершается нуклеотидом -предельным дискретным материальным объектом, несущим материальную информацию.
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd.. 10. Ausgb. 1.
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
Американские биохимик Роберт
Кори (Robert Brainard Corey, 1897—1971) (слева) и химик и кристаллограф Лайнус Полинг (Linus Carl Pauling, 1901—1994) (справа) со своей моделью белка
Первая страница статьи Л. Полинга и Р. Кори с подробным изложением модели а-спирали белка ("A Proposed Structure of the Nucleic Acids." Proceedings of the National Academy of Sciences of the United States of America 39.2 (1953): 84—97)
Первая страница статьи Дж. Уотсона и Ф. Крика о структуре ДНК ("Molecular Structure of Nucleic Acids: A Structure for Desoxyribose Nucleic Acid." Nature 171 (1953): 737—738)
Америкканский биолог Джеймс Уотсон (James Dewey Watson, р. 1928) (слева) и британский молекулярный биолог, биофизик и нейробиолог Френсис Крик (Francis Crick, 1916—2004) (справа) со своей моделью ДНК
Геном как текст
Кратко резюмируем содержание предыдущей главы. Генетика появляется как попытка ответить на вопрос: какие объекты физического мира отвечают за проявление фенотипических признаков? То есть основным свойством искомых объектов должна быть способность хранить и передавать наследственную информацию. То, что этот объект при этом должен быть неким дискретным, выделенным, должен быть вещью материальной природы, считалось само собой разумеющимся4. Мендель приписывает соответствующие свойства «информационного объекта» половой клетке, у Нэгели это
4 Эту имплицитную предустановку научного поиска можно приписать влиянию позитивизма: описанный исторический период практически совпадает с «годами жизни» этой философской школы.
уже выделенная часть клетки, в хромосомной теории Моргана за единичный признак отвечает дискретный отрезок хромосомы, неделимый при кроссинговере. На эту имплицитную связь «вещности» и «информационности» гена указывает и то, как вводится Иогансеном термин «ген»: с одной стороны, это то, что «обуславливает свойство», с другой, — отделимые, самостоятельные «состояния, основы, зачатки». Однако в 1953 г. становится окончательно ясно, что определять некоторый признак (даже кодировать некоторый белок) и быть элементарным объектом, который способен передаваться по наследству, не делиться при кроссинговере, мутировать под радиоизлучением — это не одно и то же.
Проблема была в ясном виде сформулирована Георгием Гамовым [Gamow 1954]: есть только 4 нуклеотида и 20 аминокислот; для кодирования одной аминокислоты нужны как минимум тройки (триплеты) нуклеотидов, но тройки дают 43 = 64 варианта, что значительно больше, чем нужно. Решение этой проблемы Гамовым [Gamow, Ycas 1955] включало в себя возможность наложения триплетов друг на друга и кодирования одной аминокислоты несколькими триплетами — вырожденность кода.
Советский и американский физик-теоретик, астрофизик Георгий Антонович (Джордж) Гамов (George Gamow, 1904—1968) (слева) и предложенный им вариант кодирования аминокислот (свойство кода — перекрываемость триплетов) (в центре)
По Гамову, код должен содержать по меньшей мере три последова тельных основания. Триплетные кодоны на мРНК (матричной РНК — кодирующей генетическую информацию одноцепочечной макромолекулы рибонуклеиновой кислоты) определяют расположение аминокислот полипептидной цепи. тРНК — транспортная РНК
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1.
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
Ф. Крик подверг эту концепцию критике [Crick 1958] как неоправданно сложную — 1000 нуклеотидов могли бы кодировать 998 аминокислот. Взамен он предложил модель, в которой некоторые последовательности «не имеют смысла», т.е. не кодируют аминокислот, и путем простого подсчета вариантов установил, что максимальное количество «имеющих смысл» последовательностей, при котором еще не будет происходить наложения триплетов друг на друга, равно двадцати.
Мы можем заметить, что спор Гамова и Крика уже ведется в рамках интерпретации генома как текста. Отдельный нуклеотид ничего не кодирует сам по себе, точно так же как буква в слове сама по себе ничего не обозначает; базовой семантической единицей, таким образом, является триплет-«слово», а не нуклеотид-«буква». Вырожденный код у Гамова предполагает наличие «синонимов»-триплетов, кодирующих одну и ту же аминокислоту; в свою очередь, модель Крика предполагает наличие бессмысленных наборов «букв». Значение «слова» зависит от его включенности во «фразу», или «контекст», и наоборот, значение «фразы» зависит от последовательности «слов» в ней, так же, как свойства полипептида — конечного продукта синтеза — зависят от последовательности аминокислот, которая, в свою очередь, зависит от последовательности триплетов и «правильного» их прочтения5. Но самым важным для нас является то, что
5 Заметим, что Гамов прямо пишет об аналогии с кодом и текстом, хотя и проводит параллели несколько иначе, чем мы: «The hereditary properties of any given organism could be characterized by a long number written in a four-digital system. On the other hand, the ensymes (proteins). can be considered as long 'words' based on a 20-letter alphabet [Наследственные свойства любого данного организма могут быть охарактеризованы длинным числом, записанным в четверичной системе счисления. С другой стороны, ферменты (белки) ... можно рассматривать как длинные "слова" на основе 20-буквенного алфавита]» [Gamow 1954].
I V/ V/ I V/ V/ ^
физической природой гена, как и физической природой текста, иногда можно пренебречь и строить научные модели, основываясь на предположениях о «синтаксисе» и «семантике» генома и используя комбинаторику.
Б .Те.
А Г
Текст считывается подряд по з буквы
УУАЦГЦАЦА
J I_II_I
Дм
Оф ТЬф
Его можно прочесть тремя . рамками считывания у рамка считывания 2
АГУУАЦГЦАЦА
I_II_Л —□
Т|р@ П№
рамка считывания з
АГУУАЦГЦАЦА
I_11_М_I
Пей
Трв
Фрэнсис Крик
Свойства генетического кода: А — неперекрываемость триплетов,
Б — отсутствие межкодонных знаков препинания при наличии межгенных знаков препинания УГА УАА УАГ. Знак окончания гена — три СТОП-кодона; СТОП-кодоны не кодируют никакую аминокислоту, и синтез белка на них прекращается
Стандартный генетический код. «Буквы в кодоне» = азотистые основания мРНК: аденин (А), гуанин цитозин (С), урацил (и); в русскоязычной литературе — А, Г, Ц и У. Порядок оснований — от 5' к 3' концу мРНК
Еще одним аспектом структурного сходства генома и текста является их линейность. Физически текст существует в трех (если это печатный или рукописный текст) или в двух (если это изображение на экране) измерениях, но как носитель информации он представляет собой линейную, одномерную структуру. Геном также существует как пространственная молекула, но в качестве носителя информации он выступает в виде линейной последовательности. Мы можем утверждать, что это сущностное свойство, вытекающее из того, как устроен геном, а не «какая-то смутная аналогия», на основании того факта, что исторически были возможны и другие интерпретации. Как пишет Штрассер [Strasser 2006], для Полинга основным свойством макромолекул, которое определяет их работу в клетке, являлась их трехмерная пространственная структура, а не последовательность аминокислот. Если бы эта гипотеза подтвердилась в отношении ДНК — по свидетельству Штрассера, Полинг вполне это допускал, — мы не имели бы возможности говорить о сходстве генома и текста. Еще один альтернативный путь был предложен тем же Гамовым. Он состоял в двухмерном способе кодирования: одной аминокислоте соответствует не линейный триплет, а ромб, образованный двумя соседними комплементарными парами нуклеотидов; возможно ровно двадцать типов таких ромбов [Gamow 1954]. Эта гипотеза также была довольно быстро опровергнута. Геном, таким образом, не просто может быть представлен как линейный, похожий на текст, способ существования информации: оказалось, что он не мог быть представлен иначе6.
6 На тот момент времени. В следующем разделе будут даны коррективы этому тезису в связи с более поздними исследованиями.
Электронное научное издание Альманах Пространство и Время Т. 10. Вып. 1 • 2015 ПРОСТРАНСТВО И ВРЕМЯ ТЕКСТА
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 'Space and Time of the Text
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1. 'Raum und Zeit des Textes'
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
Все вышесказанное, на наш взгляд, позволяет утверждать, что аналогия «геном — текст» являлась логическим следствием всего предшествующего развития генетики. Когда стало ясно, что вопросы о гене как о минимальной кодирующей структуре и как о выделенном материальном объекте — это разные вопросы, предполагающие разные ответы, интерпретация генома как текста оказалась наиболее удачной попыткой объяснить его устройство.
Эвристические достоинства и недостатки аналогии «геном — текст»
Однако если рассматриваемая аналогия и оказалась полезной в «переломный» период истории генетики, вовсе не очевидно, что она является существенной частью научной картины мира. Ко многим процессам и явлениям, которыми интересуется генетика, данная аналогия не имеет никакого отношения. Возникает вопрос о ее эвристической ценности: имели ли место в последующем развитии генетики такие достижения (открытия, модели, концепты), в которых в явном или неявном виде присутствует интерпретация генома как текста?
Мы полагаем, что да. В качестве достаточно развернутого примера можно привести дальнейшую историю расшифровки значений кодонов, завершившуюся присуждением Нобелевской премии 1968 г. Маршаллу Ниренбергу, Хару Го-бинду Коране и Роберту Холли. В 1961 г. Франсуа Жакоб и Жак Моно опубликовали статью, в которой обосновали наличие в геноме особых последовательностей нуклеотидов, не кодирующих непосредственно РНК, а служащих командами для РНК-полимеразы: «начать синтез» (промотор) и «прекратить синтез» (терминатор) [Jacob, Monod 1961]7. Важным
7 Эта работа также получила Нобелевскую премию.
свойством промотора является его асимметричность, благодаря которой РНК-полимераза осуществляет транскрипцию («чтение») только в одном направлении. Но уже через год Сеймур Бензер и Сьюэлл Чамп обнаружили, что и в рамках действия промотора существуют участки ДНК, прерывающие «чтение» [Benzer, Champe 1962]. Для объяснения этому они использовали уже упомянутую идею Крика о «не имеющих смысла» триплетах, которые, однако, в их концепции получили достаточно четкий смысл: знаки препинания в тексте ДНК.
Французские микробиологи Франсуа Жакоб (François Jacob; 1920—2013) (сидит) и Жак Моно (Jacques Lucien Monod, 1910—1976) (стоит)
Сеймур Бензер (Seymour Benzer, 1921—2007), американский физик, молекулярный биолог и психогенетик
Маршалл Ниренберг (Marshall Warren Nirenberg; 1927—2010), американский биохимик и генетик
В статье Бензера и Чампа ни разу не встречается слово «ген». Это связано с тем, что несколько ранее Бензер, осознавая всю проблематичность понимания генома в новой ситуации, предложил использовать вместо ставшего неопределенным термина «ген» три других: «мутон», «рекон» и «цистрон», понимая их как минимальные единицы мутации, рекомбинации и функции соответственно [Benzer 1957]. Его терминология не прижилась: мутон и рекон оказались равны одному нуклеотиду, и концептуальная значимость этих понятий была утрачена, а под геном сейчас понимается бензе-ровский цистрон — участок ДНК, кодирующий один полипептид [Фогель, Мотульски 1989, с. 207]. Это может служить еще одним аргументом в пользу того, что говорилось выше: для решения некоторых проблем семантический аспект ДНК — способность «означать» — оказывается важнее, чем материальная природа соответствующих объектов. А в работе Бензера и Чампа значимым оказывается синтаксис текста: последовательность, «не имеющая смысла» сама по себе, в контексте всей цепочки нуклеотидов работает как прерыватель «чтения».
Как мы помним, для Крика вырожденность кода в модели Гамова была проблемой, которую он пытался решить, постулируя однозначное соответствие «триплет — аминокислота» и объявляя оставшиеся 44 триплета бессмысленными. Но уже Ниренберг во второй половине 1960-х гг. пользуется идеей синонимичности триплетов вполне свободно; иногда он даже употребляет слово «word» вместо «triplet» или «codon» [Nirenberg 1972]. У Ниренберга, в отличие от предыдущих
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1.
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
Строение гена: 1 — участок связывания фермента РНК-полимеразы (место начала транскрипции); 2 — триплеты ТАЦ в ДНК и АУГ в РНК, инициирующие начало синтеза белка; 3 — участок, кодирующий последовательность аминокислот в молекуле белка; 4 — триплеты — бессмысленные кодоны, на которых завершается трансляция; 5 — участок. Символизирующий о прекращении транскрипции
Справа — этапы транскрипции: а) структурно-функциональная единица — цистрон, б) инициация, в) элонгация (вторая после инициации стадия синтеза мРНК и белков), г) терминация. П — промотор, Т — теримнатор, РНК-п — РНК-полимераза, мРНК — матричная РНК —
случаев, аналогия с текстом наличествует в явном виде: он прямо пишет о «чтении», «пунктуации», «синонимах», не говоря уже о том, что термины «код», «кодирование», «информация», «дешифровка» стали к тому времени общеупотребительными (применительно к геному).
Еще один пример успешной эвристики приводит М.Д. Франк-Каменецкий, известный российско-американский генетик и популяризатор науки. После открытия рестриктаз (ферментов, которые способны разрезать ДНК в определенных местах) в 1970-е гг. оказалось, что большинство участков ДНК, которые узнаются рестриктазами как место разреза, являются «перевертышами»-палиндромами, то есть либо одинаково читаются в обе стороны, либо расположены на двух цепях молекулы зеркально. Франк-Каменецкий свидетельствует, что
«когда поступили первые сообщения о возможной важной роли перевертышей в ДНКовых текстах... началось повальное увлечение сочинением перевертышей на русском языке среди специалистов по ДНК» [Франк-Каменецкий 2010, с. 132].
Помимо того, что эти последовательности являются местом узнавания рестриктаз, они способны образовывать крестообразные структуры, играющие важную роль в таком явлении, как сверхспирализация ДНК. Возможность их образования напрямую зависит от «текстуальных» особенностей генома (перевертыш в ДНК — это две одинаковых линии текста, записанные в разные стороны параллельно друг другу), поэтому нам кажется справедливым утверждение, что аналогия «геном — текст» сыграла значительную роль в понимании происходящих при сверхспирализации процессов.
Область ДНК с двойной симметрией — палиндром: 1 —с последовательностью, одинаковой при чтении в противоположных направлениях непосредственно у оси симметрии; 2 — с инвертированным повтором (заштрихован) на расстоянии от оси симметрии
Справа — терминация транскрипции у бактерий в случае, когда терминаторы состоят из последовательностей, представляющих собой инвертированный повтор - палиндром. Палиндромы располагаются за 16—20 нуклеотидных пар от точки терминации и содержат большое количество Г-Ц-повторов
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 'Space and Time of the Text
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1. 'Raum und Zeit des Textes'
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
Однако существуют и свидетельства ограниченных возможностей рассматриваемой аналогии. Пожалуй, наиболее яркое из них — это открытие Стенли Прузинером белков прионов8. Фенотипический эффект этих белков зависит не только
8 Прионы (англ. prion от protein — «белок» и infection — «инфекция») — особый класс инфекционных агентов — белков с аномальной трехмерной (третичной) структурой и не содержащих нуклеиновых кислот. Прионы способны увеличивать свою численность, используя функции живых клеток (в чем они схожи с вирусами).
от вариаций последовательности аминокислот, но и от их пространственной конфигурации — способа свертывания белка в трехмерную структуру. Более того, прионы определенной пространственной конфигурации способны преобразовывать другие прионы в себе подобные [Prusiner, Scott 1997].
Стенли Прузинер (Stanley B. Prusiner, р. 1942), американский врач и биохимик
Прионный белок PrP (англ. prion-related protein или protease-resistant protein) в двух конформациях: 1 — «здоровой» PrPC нормальных клеток (C — от англ. cellular
— «клеточный») с преобладанием альфа-спирали, 2 — «патологической» PrPSc (Sc- от scrapie, скрепи, почесуха, кожное аллергическое заболевание у животных) с наличием большого количества бета-тяжей. При попадании в здоровую клетку PrPSc катализирует переход клеточного PrPC в прионную конформацию
Дальнейшие исследования показали, что и в случае с ДНК действие генов сильно зависит от трехмерной конфигурации: как минимум, она влияет на экспрессию генов, как максимум — способна «включать» или «выключать» элементы генетического кода [Valley et al. 2006]. Вышесказанное принуждает учитывать пространственную организацию молекулы как существенную часть наследственной информации и, следовательно, накладывает ограничения на использование аналогии «геном — текст».
Сложно показать, насколько активно пользовались аналогией ученые при выдвижении гипотез и создании теорий. В большинстве случаев сторонний наблюдатель имеет доступ только к конечному результату этого процесса — научной статье, из которой исключаются упоминания о «субъективных» моментах вроде вдохновения, озарения, интуиции. Тем не менее: если там, где интерпретация генома как текста прослеживается достаточно четко, она служит эвристическим целям, то мы также имеем право предполагать ее широкое использование в процессах выдвижения гипотез и интуитивного понимания научных проблем.
Заключение
Интерпретация генома как текста — действительно не «какая-то смутная аналогия». Неявные предпосылки такой интерпретации можно проследить на протяжении всей предыдущей истории генетики, а в 1950-е гг. выяснилось, что в некоторых аспектах геном просто необходимо рассматривать как текст. Но это и не «истина в буквальном смысле»: текст не является предельной реальностью для генетики. Как и всякая естественная наука, генетика отдает предпочтение материальной реалистической онтологии, и текстуальная аналогия использовалась как продуктивный способ выдвижения гипотез и построения моделей, как возможность новой, удобной терминологии, в общем, как эвристика — но не как «научный факт».
Сравнение генома с текстом до сих пор проводится в школьных и вузовских учебниках по биологии; еще чаще оно встречается в научно-популярной литературе. Однако с учетом того, что в 2000-е годы одним из приоритетных направлений исследований становится как раз пространственная структура, возможно, что текстуальная аналогия скоро перестанет употребляться. Возможно, в ближайшем будущем нам понадобится новая аналогия и новая интерпретация.
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 'Space and Time of the Text
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1. 'Raum und Zeit des Textes'
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
ЛИТЕРАТУРА
1. Голубовский М.Д. Век генетики: эволюция идей и понятий. СПб.: Борей Арт, 2000.
2. Докинз Р. Капеллан дьявола: размышления о надежде, лжи, науке и любви. М.: АСТ: Corpus, 2013.
3. Кольцов Н.К. Физико-химические основы морфологии / / Кольцов Н.С. Организация клетки. Сборник
экспериментальных исследований, статей и речей. М.: Биомедгиз, 1936. С. 461 —490.
4. Любищев А.А. О природе наследственных факторов. Пермь: 2 тип. «Пермполиграф», 1925. (Известия
Биологического Научно-Исследовательского Института при Пермском Государственном Университете, издаваемые Советом Института).
5. Мендель Г. Опыты над растительными гибридами. М.: ОГИЗ — СЕЛЬХОЗГИЗ, 1935.
6. Морган Т.Г. Структурные основы наследственности. М. — Пг.: Государственное издательство, 1924.
7. Назаров В.И. Эволюция не по Дарвину: смена эволюционной модели. М.: Издательство ЛКИ, 2007.
8. Риккерт Г. Границы естественнонаучного образования понятий. СПб.: Наука, 1997.
9. Степин В.С. История и философия науки. М.: Академический проект, 2013.
10. Фогель Ф., Мотульски А. Генетика человека: проблемы и подходы: В 3 т. Т. 1. М.: Мир, 1989.
11. Франк-Каменецкий М.Д. Королева живой клетки: от структуры ДНК к биотехнологической революции.
М.: АСТ-ПРЕСС КНИГА, 2010.
12. Avery O., Macleod C., McCarty M. "Studies on the Chemical Nature of the Substance Inducing Transformation
of Pneumococcal Types: Induction of Transformation by a Desoxyribonucleic Acid Fraction Isolated from Pneumococcus Type III." Journal of Experimental Medicine 79 (1944): 137—158.
13. Benzer S. "The Elementary Units of Heredity." The Chemical Basis of Heredity. Baltimore, Maryland: John Hopkins
Press, 1957, pp. 70 — 93.
14. Benzer S., Champe S. "A Change from Nonsense to Sense in the Genetic Code." Proceedings of the Natural Academy
of Sceinces, USA 48 (1962): 1114 — 1121.
15. Crick F. "On Protein Synthesis." The Symposia of the Society for Experimental Biology 12 (1958): 138 — 163.
16. Crow E.W., Crow J.F. "100 Years Ago: Walter Sutton and the Chromosome Theory of Heredity." Genetics 160
(2002): 1—4.
17. Demerec M. "What Is A Gene?." Journal of Heredity 24 (1933): 368 — 378.
18. Gamow G. "Possible Relation between Desoxyribonucleic Acids and Protein Structures." Nature 173 (1954): 318.
19. Gamow G., Ycas M. "Statistical Correlation of Protein and Ribonucleic Acids Composition." Proceedings of the
Natural Academy of Sceinces, USA 41 (1955): 1011 — 1019.
20. Garrod A. "The Incidence of Alkaptonuria: A Study in Chemical Individuality." Lancet 2 (1902): 1616 — 1620.
21. Jacob F., Monod J. "Genetic Regulatory Mechanisms in the Synthesis of Proteins." Journal of Molecular Biology 3
(1961): 318 — 356.
22. Morgan T.H. "Croonian Lecture. On the Mechanism of Heredity." Proceedings of the Royal Society 94 (1922): 162 — 197.
23. Nirenberg M. "The Genetic Code. Nobel Lecture, December 12, 1968." Nobel Lectures: Physiology or Medicine
(1962 -1970). Amsterdam: Elsevier Publishing Company, 1972, pp. 372 — 395.
24. Pauling L., Corey R. "A Proposed Structure of the Nucleic Acids." Nature 171 (1953): 346.
25. Pauling L., Corey R. "A Proposed Structure of the Nucleic Acids." Proceedings of the National Academy of Sciences of
the United States of America 39.2 (1953): 84 — 97.
26. Prusiner S.B., Scott M.R. "Genetics of Prions." Annual Review of Genetics 31 (1997): 139 — 175.
27. Strasser B.J. "A World in One Dimension: Pauling, Crick and the Central Dogma of Molecular Biology." History
and Philosophy of Life Sciences 28 (2006): 491 — 512.
28. Valley C.M., Pertz L.M., Balakumaran B.S., Willard H.F. "Chromosome-Wide, Allele-Specific Analysis of the His-
tone Code of the Human X Chromosome." Human Molecular Genetics 15 (2006): 2335 — 2347.
29. Watson J., Crick F. "Molecular Structure of Nucleic Acids: A Structure for Desoxyribose Nucleic Acid." Nature
171 (1953): 737—738.
Цитирование по ГОСТ Р 7.0.11—2011:
Волошин, М. Ю. Интерпретация генома как текста: основания и исторические предпосылки [Электронный ресурс] / М.Ю. Волошин // Электронное научное издание Альманах Пространство и Время. — 2015. — Т. 10. — Вып. 1: Пространство и время текста — Стационарный сетевой адрес: 2227-9490e-aprovr_e-ast10-1.2015.103.
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 'Space and Time of the Text
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1. 'Raum und Zeit des Textes'
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
INTERPRETATION OF GENOME AS TEXT: BASIS AND HISTORICAL BACKGROUND
Mikhail Yu. Voloshin, Bachelor student at Philosophical Department of Lomonosov Moscow State University
E-mail: allrour95@rambler.ru
In this article, I concern issues arisen by a widespread interpretation of genome as a textual entity and its functioning as a textual code. I maintain that this analogy is not just a transposition of a model from one scientific area to another, but it is based on an essential resemblance between genomic structure and that of a text. My subject of study is, therefore, a concept of gene in different theoretical contexts and variations of its representation in textual form. To deal with this subject I used comparative methods elaborated by the history of science and H. Rickert's conception of "ultimate things" as a logical and his-toriographical instrument.
In order to prove my opinion, I would like to consider the historical development of genetics since Mendel to figure out a role of the concept of gene in scientific research. Studying some key scientific papers of a period between 1865 and 1953, I found out that a concept of gene implicitly contained two different aspects. First of them I call a "material" one: it relates to a real physical object of unknown origin which is responsible for heredity. The second aspect is an "informational" one: it relates to an ability of gene to serve as a piece of hereditary information.
From that point of view, a discovery made in 1953 by Watson and Crick has totally broken a linkage between these aspects. A nucleotide is a minimal physical object that can mutate or descend as a whole, but it makes no sensible information since it cannot encode anything being alone. I claim that in this moment appears a possibility to work with informational aspect separately from physical nature of nucleic acid, and scientists immediately used a textual analogy for this work. My principal thesis is that informational aspect of gene is not something scientists came up with to make beautiful analogies, but it is something discovered by scientists.
Having examined some scientific papers after 1953, I came to my other thesis, which is that textual analogy appeared to be very productive in solving problems of genetics. It played a key role in decoding a genetic code, which turned out to have syntax, semantics and even punctuation. It provided a possibility for sequencing. However, at the end of 20th century we may observe a shift in research activities: most popular researches are that of a dimensional structure of DNAs, RNAs and proteins. These structures somehow relate to information, but textual interpretation is not relevant there.
My conclusion is that textual interpretation is a consequence of all historical development of genetics. It is absurd to claim that genome is a text, but such interpretation has strong basis in real nature of genetic code. However, now scientists must take into consideration a lot more than linear sequence of symbols.
Keywords: DNA, RNA, genetics, genetic code, genome, information, semantics, syntax, text.
References:
1. Avery O., Macleod C., McCarty M. "Studies on the Chemical Nature of the Substance Inducing Transformation
of Pneumococcal Types: Induction of Transformation by a Desoxyribonucleic Acid Fraction Isolated from
Pneumococcus Type III." Journal of Experimental Medicine 79 (1944): 137—158.
2. Benzer S. "The Elementary Units of Heredity." The Chemical Basis of Heredity. Baltimore, Maryland: John Hopkins
Press, 1957, pp. 70 — 93.
3. Benzer S., Champe S. "A Change from Nonsense to Sense in the Genetic Code." Proceedings of the Natural Academy
of Sceinces, USA 48 (1962): 1114 — 1121.
4. Crick F. "On Protein Synthesis." The Symposia of the Society for Experimental Biology 12 (1958): 138 — 163.
5. Crow E.W., Crow J.F. "100 Years Ago: Walter Sutton and the Chromosome Theory of Heredity." Genetics 160
(2002): 1—4.
6. Dawkins R. A Devil's Chaplain: Reflections on Hope, Lies, Science and Love. Moscow: AST Publisher, 2013. (In Russian).
7. Demerec M. "What Is A Gene?." Journal of Heredity 24 (1933): 368 — 378.
8. Frank-Kamenetsky M.D. Queen of a Life Cell: From the Structure of DNA to Biotechnological Revolution. Moscow:
AST-PRESS KNIGA Publisher, 2010. (In Russian).
9. Gamow G. "Possible Relation between Desoxyribonucleic Acids and Protein Structures." Nature 173 (1954): 318.
10. Gamow G., Ycas M. "Statistical Correlation of Protein and Ribonucleic Acids Composition." Proceedings of the
Natural Academy of Sceinces, USA 41 (1955): 1011 — 1019.
11. Garrod A. "The Incidence of Alkaptonuria: A Study in Chemical Individuality." Lancet 2 (1902): 1616 — 1620.
12. Golubovsky M.D. Age of Genetics: Evolution of Ideas and Concepts. St. Petersburg: Borey Art Publisher, 2000. (In
Russian).
Electronic Scientific Edition Almanac Space and Time vol. 10, issue 1 'Space and Time of the Text
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 10. Ausgb. 1. 'Raum und Zeit des Textes'
Волошин М.Ю. Интерпретация генома как текста: основания и исторические предпосылки
13. Jacob F., Monod J. "Genetic Regulatory Mechanisms in the Synthesis of Proteins." Journal of Molecular Biology 3
(1961): 318 — 356.
14. Kol'tsov N.K. "Physicochemical Bases of Morphology." Organisation of the Cell. Collection of Experimental Research-
es, Articles and Reports. Moscow: Biomedgiz Publisher, 1936. (In Russian).
15. Lubischew A.A. On the Nature of Hereditary Factors (News of Biological Scientific Research Institute under Perm State
University). Perm: Permpoligraf Publisher, 1925. (In Russian).
16. Mendel G. Experiments on Plant Hybridisation. Moscow: OGIZ-Sel'khozgiz Publisher, 1935. (In Russian).
17. Morgan T.G. The Physical Basis of Heredity. Moscow and Petrograd: Gosudarstvennoe izdatel'stvo Publisher, 1924
(In Russian).
18. Morgan T.H. "Croonian Lecture. On the Mechanism of Heredity." Proceedings of the Royal Society 94 (1922): 162 — 197.
19. Nazarov V.I. Non-darwinian Evolution: The Change of Evolutionary Model. Moscow: LKI Publisher, 2007. (In Russian).
20. Nirenberg M. "The Genetic Code. Nobel Lecture, December 12, 1968." Nobel Lectures: Physiology or Medicine
(1962 -1970). Amsterdam: Elsevier Publishing Company, 1972, pp. 372 — 395.
21. Pauling L., Corey R. "A Proposed Structure of the Nucleic Acids." Nature 171 (1953): 346.
22. Pauling L., Corey R. "A Proposed Structure of the Nucleic Acids." Proceedings of the National Academy of Sciences of
the United States of America 39.2 (1953): 84 — 97.
23. Prusiner S.B., Scott M.R. "Genetics of Prions." Annual Review of Genetics 31 (1997): 139 — 175.
24. Rickert H. The Limits of Concept-formation in Natural Science. St. Petersburg: Nauka Publisher, 1997. (In Russian).
25. Stepin V.S. History and Philosophy of Science. Moscow: Akademichesky proekt Publisher, 2011. (In Russian).
26. Strasser B.J. "A World in One Dimension: Pauling, Crick and the Central Dogma of Molecular Biology." History
and Philosophy of Life Sciences 28 (2006): 491 — 512.
27. Valley C.M., Pertz L.M., Balakumaran B.S., Willard H.F. "Chromosome-Wide, Allele-Specific Analysis of the His-
tone Code of the Human X Chromosome." Human Molecular Genetics 15 (2006): 2335 — 2347.
28. Vogel F., Motulsky A. Human Genetics: Problems and Approaches. Moscow: Mir Publisher, 1989, volume 1. (In
Russian).
29. Watson J., Crick F. "Molecular Structure of Nucleic Acids: A Structure for Desoxyribose Nucleic Acid." Nature
171 (1953): 737—738.
Cite MLA 7:
Voloshin, M. Yu. "Interpretation of Genome as Text: Basis and Historical Background." Elektronnoe nauchnoe izdanie Al'manakh Prostranstvo i Vremya: 'Prostranstvo i vremya teksta' [Electronic Scientific Edition Almanac Space and Time: Space and Time of Text'] 10.1 (2015). Web. <2227-9490e-aprovr_e-ast10-1.2015.103>. (In Russian).