Страницы Миллбурнского клуба, 2 - Слава Бродский
Шрифт:
Интервал:
Закладка:
В т о р о й (улыбаясь). Не заняться ли мне всерьез языком?
П е р в ы й. А что если вместе, как думаешь?
Кабинет 1-ой сцены. П е р в ы й и В т о р о й.
Входит сотрудник с военной выправкой. Стоя смирно, докладывает.
С о т р у д н и к. Двадцать минут назад перехвачена радиограмма из Н-ска.
П е р в ы й. Расшифрована?
C о т р у д н и к. Так точно.
П е р в ы й. Прочтите.
C о т р у д н и к. Операция «Спутник» прошла успешно. Продолжаю выполнять задание. Агент тридцать восемь–двадцать четыре.
КОНЕЦ
Ленинград – Нью-Джерси
Михаил Малютов – профессор математического факультета Северо-Восточного университета в Бостоне с 1995 года. До этого работал в Колмогоровской статистической лаборатории в Московском университете, был профессором Московского технического университета. Автор более 150 научных статей и книг по математике, статистике и приложениям, среди них – медико–биологическим, инженерным, лингвистическим.
Как и почему я заинтересовался проблемой авторства литературных текстов – описано ниже. Кому и зачем написаны эти строки? Автор надеется заинтересовать читателей увлекательной загадкой и побудить их продолжить ее исследование. Для этого дан конспект «путеводителя» по этой проблеме. Неуместные для литературного сборника математические детали опущены. Их можно найти в статьях автора из списка литературы.
Рискованное интернет-знакомство
1. Предыстория
Как видно из справки в начале страницы, я не лирик, скорее, – типичный «физик». В начале моей службы в лаборатории великого математика Колмогорова я дружил с группой его сотрудников и аспирантов, делавших для него трудоемкие вычисления статистики ритма русских стихов. Я играл с ними в футбол два раза в неделю (однажды в азарте борьбы за мяч слегка подбил ногу Наташе Светловой, будущей Солженицыной), но их деятельность считал труднообъяснимым капризом Колмогорова и был согласен с Е. С. Вентцель (она же – писатель И. Грекова), отчитавшей Ю. М. Лотмана за статистический анализ «10-й главы» Евгения Онегина, считая статистику неприменимой к стихам. После семи лет изучения статистики однородности литературных текстов моя точка зрения на этот счет поменялась: как оказалось, статистика является мощным инструментом атрибуции текстов. И мне удалось создать статистически достоверный метод атрибуции. Здесь я рассказываю историю своей вовлеченности в исследование авторства произведений Шекспира и делюсь знаниями по этой проблеме. Приношу читателю извинения за то, что по необходимости мне приходится быть лаконичным, прибегать к сокращенному изложению и аббревиатуре.
2. Знакомство с проблемой
Все началось после того, как я получил статус «tenure» в 2001 году, гарантирующий сохранение моей должности, пока я выполняю свои обязанности в моем американском университете. Настроение было приподнятое! Осенью 2002 года я, будучи в гостях у когда-то подготовленного мною кандидата наук (а всего их было двадцать), профессора одного из университетов штата Мичиган, заодно прочел там пару лекций. Его жена дала мне книгу И. Гилилова [3], в которой автор излагает «доказательства» идеи Пороховщикова, что под именем Шекспира скрывалась чета графа и графини Рэтленд. Я «проглотил» книгу за ночь. Согласился с вескими аргументами противников официальной версии авторства и не поверил в версию Пороховщикова, дополненную собственными «находками» И. Гилилова, позднее оказавшимися чепухой.
Я полез в Интернет узнать больше об этой незнакомой мне проблеме и нашел сайт Альфреда Баркова, содержащий другую версию авторства и яркую статью «Интеллект» с критикой академика Фоменко (и поддержавшего его Г. Каспарова) за недостаток интеллекта. Статья понравилась, и я послал Баркову предложение дополнить ее примером «интеллекта» поспоривших сатирика И. Иртеньева и поэтессы, которая ответила на его оскорбительные стишата в адрес женщин. Каждый из них классифицировал представителей противоположного пола, забыв о возможности совмещения в любом индивидууме сразу нескольких из выбранных ими признаков.
Барков представился горным инженером, насильно взятым в армию и покинувшим ее сразу после путча 1991 года. Он отверг мое предложение – не хотел связываться с сатириком, и стал уговаривать проверить математически достоверность анаграмм, якобы найденных Робертой Баллантайн (США) [12] в произведениях Шекспира (ПШ). Я отказался по причине моей некомпетентности в английской литературе и криптографии. Его версия авторства была любопытней, но аргументы казались спорными. Потом оказалось, что Барков соврал: он был произведен в генералы КГБ в конце 80-х за успешное контролирование коротковолновой связи, но это продвижение по службе не состоялось из-за неосторожной активности одного из его подопечных. Это рискованное знакомство в Интернете тем бы и закончилось, но случились два маловероятных события. Я провел в Москве Рождественские праздники 2002 года, где посетил семейную пару моих друзей-математиков, которые рекомендовали познакомиться с юным гением Дмитрием Хмелевым, защитившим диссертации в МГУ и Институте Ньютона в Кембридже. Вместе с английскими компьютерными лингвистами он атрибутировал авторство одной пьесы Шекспира. И я познакомился с малознакомым со статистическими методами, но весьма упрямым и самоуверенным гением и его методами исследования. Это было первое из двух маловероятных событий.
Второе: после Москвы я приехал в Билефельд (Германия) на три месяца к Руди Альсведе, гиганту теории информации, для исследований в программе «Перенос информации». Он первым на Западе оценил важность моих открытий в теории поиска. Когда-то в лихие девяностые, во время моих скитаний по Европе его склад инструментов на полгода был моей «штаб–квартирой».
Я планировал продолжить эти исследования, но проболтался Руди об анаграммах Баллантайн. Деспот Руди приказал мне подготовить доклад на эту тему через месяц. Я поплелся в отдел английской литературы их сказочно богатой библиотеки и обомлел, увидев сотни метров книг о стиле и авторстве ПШ на полках!
(Профессор Галланд из Северо-Западного университета США составил в 1947 году библиографию АПШ на 1500 стр. Сейчас такая библиография заняла бы в несколько раз больше места: львиная доля неортодоксальных работ теперь – в Интернете: их практически невозможно опубликовать в академических журналах.)
3. Первые результаты
Разобравшись, я нашел несколько подходящих книг [14, 20], сделал одобренный Руди четырехчасовой обзор на его семинаре, ставший основой моих статей и многочисленных докладов 2003 – 2006 годов. Обученный замечательной книгой [20], я начал с проверки реальности анаграмм в 154 сонетах Шекспира. Я быстро сообразил: по традиции, известной со времен авторов греческих трагедий [29] помещать «водяные знаки» в свои творения, наличие таких знаков (в данном случае – анаграмм имени Марло или его вариантов) в первых двустишиях сонетов эквивалентно аномально частой встречаемости там неупорядоченного множества букв, составляющих эту фамилию. Хмелев, компьютерный гений, после долгих уговоров, сосчитал эту частоту, оказавшуюся аномально высокой! Вскоре я доказал чрезмерную множественность анаграмм на английском языке к тексту, написанном тоже на английском. По этой причине, а также из-за чрезмерной сложности анализа, их использование для передачи информации, занимающей много строк, практически невозможно, несмотря на популярность анаграмм среди великих ученых тех времен (Ньютон, Кеплер, Галилей и др.). Все эти результаты опубликованы в [4] почти на 40 страницах по-русски вместе с основанным на сжатии текстов новым методом, названным CCC, проверки однородности стиля. Прототип CCC впервые появился у Хмелева [8] за три года до его скоропостижной смерти в Техасе осенью 2004 года. Первое применение теста ССС в [4] показало, что поэма «Венера и Адонис», самое первое печатное издание под именем «Шекспир», ближе по стилю к ранним переводам Марло лирики Овидия, чем поэма «Геро и Леандр», зарегистрированная Марло в то же время, что и сданная издателям анонимно «Венера и Адонис». Но опубликована поэма «Геро и Леандр» была только через пять лет. Позже мы изучили аналогичные соотношения для поэмы «Похищение Лукреции». Я довел метод до статистически достоверного инструмента, не сделавшего осечек в сотне разобранных примеров на русском, английском и иврите, см. [4, 5, 28]. Затем я построил строгую математическую теорию метода CCC, опубликованную в [6]. Примененный к ранним поэмам Шекспира, метод показывает весьма высокую вероятность того, что они были написаны Марло [4, 5, 28].