Игра в имитацию - Эндрю Ходжес
Шрифт:
Интервал:
Закладка:
В течение мая 1940 г. аналитики GC&CS смогли прочитать зашифрованные «Энигмой» сообщения за шесть дней предыдущего месяца. Это дало важную дополнительную информацию об организации системы радиосвязи и шифрования германского военно-морского флота. GC&CS смогла подтвердить это, хотя немцы, прибегая в простым ручным кодам и шифрам для таких вещей как легкие корабли, судоверфи и торговое судоходство. Однако части кригсмарине, даже самые маленькие, всегда использовали «Энигму». GC&CS установило также, что они используют только два шифра «Энигмы» (Внутренний и Внешний), и что подводные лодки и надводные корабли используют одни и те же шифры, переходя на внешний шифр только во время операций в дальних водах.
В оставшиеся месяцы 1940 г. удалось прочитать сообщения только за пять дней в апреле и мае, и «дальнейшая работа также подтвердила худшие опасения GC&CS о трудности взлома даже Внутреннего шифра, который использовался для зашифровки 95 процентов сообщений, передаваемых германским военно-морским флотом». Работа группы Алана показала, что они не могут рассчитывать на успех без новых захватов (инструкций или шифровальных машин). Но пока они ждали, Алан не сидел без дела. Он разработал математическую теорию, которая потребуется для их использования. Теория шла намного дальше, чем постройка «Бомбы».
Изучая поток зашифрованных сообщений, опытный глаз может сказать, что такие-то вещи «кажутся вероятными», но сейчас, когда целью является серийное производство, необходимо перевести зыбкие, интуитивные оценки в нечто более точное и механистическое. Основа психического аппарата, необходимая для этого, была создана в восемнадцатом столетии, хотя это было ново для GC&CS. Английский математик Томас Байес понял, как описать математически концепцию «обращенной вероятности» — это термин для того, чтобы переставить местами причину и следствие — по известному факту вычислить вероятность того, что следствие было вызвано данной причиной.
Основная идея представляет собой не что иное, как простой расчет «вероятности» причины, который люди постоянно применяют, даже не задумываясь об этом. Классическое представление его выглядит так: предположим, что у нас есть два одинаковых ящика, в одном находятся два белых и один черный шар, в другом — один белый и два черных шара. Затем нужно угадать, в каком ящике находится какой набор шаров. Допускается даже эксперимент — можно сунуть руку в каждый из ящиков и вынуть по шару (конечно, не заглядывая внутрь). Если вынимается белый шар, то здравый смысл подсказывает, что два раза более вероятнее, что он вытащен из ящика с двумя белыми шарами, чем из второго ящика. Теория Байеса дала точный расчет этой идеи.
Одна из особенностей этой теории заключалась в том, что она опиралась не на происходящие события, но на изменения отношения. На самом деле, было очень важно помнить о том, что эксперименты могут только создать относительные изменения «вероятности», но не абсолютные значения. Сделанный вывод всегда будет опираться на априорную вероятность, которую экспериментатор держал в уме в начале эксперимента.
Чтобы лучше прочувствовать теорию, Алан любил размышлять с точки зрения разумного человека, вынужденного делать ставки, основываясь на предположении. Ему нравилась идея пари, и он представил теорию в форме шансов. Например, последствия эксперимента увеличивает шансы вдвое тем или иным способом. Если разрешены дальнейшие эксперименты, то шансы возрастут до очень больших значений, хотя, в принципе, полная определенность достигнута все равно не будет. Или же процесс можно представить по-другому: как сбор все большего и большего количества данных. С этой точки зрения, будет более естественным подумать о суммировании чего-либо каждый раз, когда сделан эксперимент, а не об умножении шансов, существующих на данный момент. Это можно проделать, используя логарифмы. Американский философ Ч.С.Пирс описал сходную идею в 1878 г., дав ей название «значение данных». Ее принцип заключался в том, что научный эксперимент дает выраженное количественно «значение данных», которое можно прибавлять или вычитать из вероятности верности гипотезы. В нашем примере обнаружение белого шара дает прибавление «значения данных» в количестве log2 к гипотезе, что ящик, из которого его вынули, был ящиком с двумя белыми шарами. Это была не новая идея, но…
«Тьюринг был первым, кто понял значение присвоения названий единицам, в которых измеряется значение данных. Если основанием логарифма было е, он называл единицу «естественный бан» и «простой бан», если основание равнялось 10… Тьюринг ввел название «децибан» — понятно, что он равнялся одной десятой бана по аналогии с децибелом. Причиной появления названия «бан» были десятки тысяч листов, отпечатанных в городе Бэнбери (Banbury), на которые наносились «значения данных» в децибанах, необходимые для выполнения важного процесса, названного Banburismus».
Поэтому «бан данных» представлял собой нечто, что делало верность гипотезы в десять раз более вероятной, чем до этого. Тьюринг механизировал процесс разгадывания и был готов перевести его на машины, которые будут суммировать децибаны, приближаясь к разумному решению.
Алан развивал теорию в нескольких направлениях. Очень важным ее применением была новая процедура проведения экспериментов, которую со временем назвали «последовательным анализом». Идея Тьюринга заключалась в определении цели для «значения данных», которая требовала продолжения наблюдений для достижения цели.
Такой метод был намного эффективнее, чем решать заранее, сколько экспериментов провести.
Тьюринг также ввел принцип оценки значения эксперимента с помощью учета количества значений данных, который он дает в среднем. Он даже продолжал обдумывать понятие «дисперсии» значений данных, полученных в ходе эксперимента, как критерия возможной случайности полученных результатов. Сведя эти идеи вместо, он перевел искусство угадывания, применяемое в криптоанализе, в 40-е годы двадцатого века. Он работал для себя, либо не зная о более ранних работах других ученых (того же Пирса), либо предпочитая собственную теорию статистическим методам, предложенным Р.А.Фишером в 30-х годах.
Поэтому теперь, когда они думали, что ключ, присутствующий в тексте, «вероятно», верен, или одно сообщение было, «вероятно», передано дважды, иди что одни и те же настройки были, «вероятно», использованы дважды, или что какой-то ротор — крайний в ряду, можно было проверить вероятность суммированием полученных значений данных рациональным способом. Сэкономленный на этом час равнялся часу, в течение которого субмарина проходила шесть миль, гонясь за конвоем.
(adsbygoogle = window.adsbygoogle || []).push({});