69820.fb2 Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию книги . Страница 65

Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию книги . Страница 65

Будем считать "династический вектор a" случайным вектором в R^k, пробегающим множество vir(D). Тогда по множеству vir(D) мы можем построить функцию z плотности вероятностей. Для этого все пространство R^15 было разбито на стандартные кубы достаточно малого размера так, чтобы ни одна точка из множества vir(D) не попала на границу какого-либо куба. Если x - внутренняя точка куба, то положим

число точек из множества vir(D), попавших в куб

z(x) = ------------------------------------------------- .

общее количество точек в множестве vir(D)

Ясно, что для точки x, лежащей на границе какого-либо куба, можно считать. что z(x)=0. Функция z(x) достигает максимума в области, где сосредоточено особенно много династий из множества vir(D), и падает до нуля там, где точек из множества vir(D) нет. См.рис.3.32. Тем самым, график функции z(x) наглядно показывает, как именно распределено множество династий vir(D) по пространству R^k. Другими словами, где это множество "густое", "плотное", а где оно разрежено.

Пусть теперь нам заданы две династии

a=(a_1,...a_k) и b=(b_1,...,b_k), и мы хотим оценить - насколько они близки или далеки. Построим k-мерный параллелепипед P'(a,b) с центром в точке a, имеющий в качестве диагонали вектор a-b. См. рис.3.33. Если спроектировать параллелепипед P'(a,b) на i-ю координатную ось, то получится отрезок с концами

[a_i - |a_i - b_i|, a_i + |a_i - b_i|].

В качестве "предварительного коэффициента" c'(a,b) мы возьмем число

число точек из множества vir(D), попавших в P'(a,b) c'(a,b) = ---------------------------------------------------- .

общее число точек в множестве vir(D)

Ясно, что число c'(a,b) является интегралом функции плотности z(x) по параллелепепиду P'(a,b).

Смысл этого "предварительного коэффициента" c'(a,b) ясен. Династии, то есть векторы из vir(D), попавшие в параллелепипед P'(a,b), естественно назвать "похожими" на династии a и b. В самом деле, каждая из таких династий удалена от династии a не более чем от династии a удалена династия b. Следовательно, в качестве меры близости двух династия a и b, мы берем долю династий, "похожих" на a и b, в множестве всех династий vir(D).

Однако такой коэффициент c'(a,b) пока недостаточно хорош, поскольку он никак не учитывает то обстоятельство, что летописцы определяли длительность правлений царей с какой-то ошибкой, причем обычно тем большей, чем дольше длительность правления. Другими словами, нам нужно учесть ошибку летописцев (3), обсужденную выше.

Перейдем к моделированию ошибки (3). Пусть T - это длительность правления. Ясно, что длительность правления можно рассматривать как случайную величину, определенную на "множестве всех царей". Обозначим через g(T) число царей, правивших T лет. В работе [375] я экспериментально вычислил эту гистограмму частот g(T) (плотность распределения указанной случайной величины) на основе данных, приведенных в "Хронологических Таблицах" Ж.Блера [20]. Положим h(T)=1/g(T) и назовем h(T) функцией ошибок (летописцев). Ошибка h(T) в определении длительности T тем больше, чем с меньшей вероятностью случайная величина, - то есть длительность правления, - принимает значение T. Другими словами, небольшие, "короткие" длительности правлений царей лучше поддаются вычислению. Здесь летописец ошибается незначительно. Напротив, большие длительности правлений царей, встречающиеся довольно редко, летописец обычно вычисляет с существенной ошибкой. Чем больше длительность правления, тем большую ошибку он может совершить.

Функция ошибок h(T) для указанной плотности вероятностей случайной величины (длительности правления) была определена экспериментально [375], с.115. Разобьем отрезок [0,100] целочисленной оси T на десять отрезков одинаковой длины, а именно:

[0,9], [10,19], [20,29], [30,39], ... [90,99].

Тогда оказывается, что:

h(T)=2, если T изменяется от 0 до 19,

h(T)=3, если T изменяется от 20 до 29,

h(T)=5([T/10]-1), если T изменяется от 30 до 100.

Здесь через [s] обозначена целая часть числа s. См.рис.3.34.

Учтем теперь ошибки летописцев при построении "окрестности" точки a. Для этого расширим параллелепипед P'(a,b) до бо'льшего параллелепипеда P(a,b), центром которого по-прежнему является точка a, и ортогональными проекциями на координатные оси являются отрезки с концами

[a_i - |a_i - b_i| + h(a_i), a_i + |a_i - b_i| + h(a_i)].

Ясно, что параллелепипед P'(a,b) целиком лежит внутри большого параллелепипеда P(a,b). См. рис.3.33. Диагональю этого большого параллелепипеда является вектор a-b+h(a), где вектор h(a) выглядит так:

h(a)=(h(a_1),...,h(a_k)).

Его можно назвать вектором ошибок летописцев.

Итак, мы смоделировали все три основные ошибки, делавшиеся летописцами при подсчете ими длительностей правлений царей. В качестве окончательного коэффициента c(a,b), измеряющего близость или удаленность друг от друга двух династий a и b, мы возьмем следующее число:

число точек из множества vir(D), попавших в P(a,b) c(a,b) = ---------------------------------------------------- .

общее число точек в множестве vir(D)

Ясно, что число c(a,b) является интегралом функции плотности z(x) по параллелепепиду P(a,b). На рис.3.35 число c(a,b) условно изображается объемом призмы, имеющей в качестве основания параллелеипед P(a,b), и ограниченной сверху графиком функции z. Число c(a,b) можно, при желании, интерпретировать как вероятность того, что случайный "династический вектор", распределенный в пространстве R^k с функцией плотности z, оказался на расстоянии от точки a, не превышающем расстояния между точками a и b, с учетом ошибки h(a). Другими словами, случайный "династический" вектор, распределенный с функцией плотности z, попал в окрестность P(a,b) точки a, имеющую "радиус" a-b+h(a).

Из предыдущего видно, что роль династий a и b при подсчете коэффициента c(a,b) неодинакова. Династия a была помещена в центр параллелеипеда P(a,b), а династия b определяла его диагональ. Конечно, можно было "уравнять в правах" династии a и b, поступив по аналогии с предыдущим коэффициентом p(X,Y). То есть, можно поменять местами династии a и b, вычислить коэффициент c(b,a), а затем взять среднее арифметическое чисел c(a,b) и c(b,a). Мы этого не делали по двум причинам. Во-первых, как показали конкретные эксперименты, замена коэффициента c(a,b) на его "симметризацию" фактически не меняет получающихся результатов. Во-вторых, в некоторых случаях династии a и b действительно могут быть неравноправными в том смысле, что одна из них может быть оригиналом, а вторая - всего лишь ее дубликатом, фантомным отражением. В этом случае естественно помещать в центр параллелепипеда династию a, претендующую на роль оригинала, а "фантомное отражение" b рассматривать как "возмущение" династии a. Возникающие различия между коэффициентами c(a,b) и c(b,a) хотя и невелики, но могут послужить полезным материалом для дальнейших, более тонких исследований, которых мы пока не проводили.

2.3. УТОЧНЕНИЯ МОДЕЛИ И ПРОВЕДЕННОГО ВЫЧИСЛИТЕЛЬНОГО ЭКСПЕРИМЕНТА.

Сформулированный выше принцип малых искажений проверялся на основе коэффициента c(a,b).

1) Для проверки были использованы хронологические таблицы Ж.Блера [20], содержащие практически все основные хронологические данные (в скалигеровской версии) из истории Европы, Средиземноморья, Ближнего Востока, Египта, Азии от якобы 4000 года до н.э. до 1800 года н.э. Эти данные были затем дополнены списками правителей и их правлений, взятых нами из других таблиц и монографий, как средневековых, так и современных. Упомянем здесь, например, следующие книги: Ш.Бемон, Г.Моно [16], Э.Бикерман [19], Г.Бругш [22], А.А.Васильев [26], Ф.Грегоровиус [46], [47], Д.Эссад [56], Ш.Диль [60], Кольрауш [104], С.Г.Лозинский [125], Б.Низе [145], В.С.Сергеев [187], [188], Chronologie egiptienne [246], F.K.Ginzel [266], L.Ideler [284], L`art de verifier les dates faites historiques [293], T.Mommsen [306], Isaac Newton [314], D.Petavius [327], I.Scaliger [344].

2) Как мы уже отмечали, под династией мы понимаем последовательность фактических правителей страны, безотносительно к из титулатуре и родственным связям. В дальнейшем мы иногда будем, для краткости, условно называть их царями.

3) Из-за наличия соправителей иногда возникают трудности при расположении этих династов в ряд. Мы приняли простейший принцип их упорядочения - по серединам периодов правлений.

4) Последовательность чисел, выражающих длительности правлений всех правителей на протяжении всей истории данного государства (то есть длина последовательности априори не ограничивается), будем называть ДИНАСТИЧЕСКИМ ПОТОКОМ. Подпоследовательности, получающиеся отбрасыванием тех или иных соправителей, назовем ДИНАСТИЧЕСКИМИ СТРУЯМИ. От каждой такой струи требуется, чтобы она была МОНОТОННОЙ, то есть чтобы середины периодов правлений монотонно возрастали. Требуется также, чтобы династическая струя была ПОЛНОЙ, то есть чтобы она без пропусков и разрывов покрывала весь исторический период, охваченный данным потоком. Перекрытия периодов правлений при этом допускаются.

5) В реальных ситуациях по понятным причинам перечисленные выше требования могут быть несколько нарушены. Например, из рассказа летописца может быть год, или несколько лет, междуцарствия. Поэтому приходится разрешать незначительные ПРОБЕЛЫ. Мы допускали лишь такие пробелы, длительность которых не превышает одного года. Кроме того, при анализе династических потоков и струй приходится постоянно иметь в виду возможность искажения подлинной картины в результате описанных выше ошибок (1), (2), (3), допускаемых летописцами.

6) Имеется еще одна причина нарушения четкой формальной картины. Она заключается в том, что иногда трудно с определенностью установить время начала правления царя. Например, считать ли его от момента фактического прихода к власти, или от момента формальной интронизации. Для начала правления Фридриха II, например, в разных таблицах приводятся различные варианты: 1196, 1212, 1215, 1220 годы н.э. В то же время, с концом правления обычно никаких трудностей нет. Чаще всего, это смерть царя. Таким образом, мы приходим к необходимости "раздвоения" царя, или даже к рассмотрению его в трех вариантах. Бо'льшее число вариантов на практике, к счастью, появлялось исключительно редко. Все эти варианты включались в общий династический поток. При этом требовалось, чтобы ни одна из выделяемых в дальнейшем для исследования династических струй не содержала двух различных вариантов одного и того же правления царя.

7) Для всех государств из указанных выше географических регионов был составлен (на основе собранных нами хронологических данных в скалигеровской версии) полный список D всех летописных династий длины 15. То есть, был составлен список всех династий из 15 последовательных царей. Каждый царь может при этом попасть в несколько 15-членных династий, то есть династии могут "перекрываться". Перечислим основные династические потоки, подвергнутые статистическому анализу. Это: епископы и папы в Риме, патриархи Византии, сарацины, первосвященники в Иудее, грекобактрийцы, экзархи в Равенне, фараонские династии Египта, средневековые династии Египта, династии Византии, Римской империи, Испании, России, Франции, Италии, Османской = Оттоманской империи, Шотландии, Лакедемона, Германии, Швеции, Дании, Израиля, Иудеи, Вавилона, Сирии, Португалии, Парфии, Боспорского царства, Македонии, Польши, Англии.

8) После применения к списку D возмущений типов (1) и (2) (см. выше) оказалось, что получается примерно 15x10^11 виртуальных династий. То есть, в множестве vir(D) оказывается 15x10^11 точек.

2.4. РЕЗУЛЬТАТ ЭКСПЕРИМЕНТА: КОЭФФИЦИЕНТ c(a,b) ХОРОШО РАЗЛИЧАЕТ

ЗАВИСИМЫЕ И НЕЗАВИСИМЫЕ ДИНАСТИИ ЦАРЕЙ.

Вычислительный эксперимент, проведенный в 1977-1979 годах мною совместно с М.Замалетдиновым и П.Пучковым, подтвердил принцип малых искажений. А именно, оказалось, что для заведомо зависимых летописных династий a и b число ВССД = c(a,b) всегда не превышает 10^{-8} и обычно колеблется от 10^{-12} до 10^{-10}. При вероятностной интерпретации это означает, что если рассматривать наблюдаемую близость двух зависимых летописных династий как случайное событие, то его вероятность мала, событий исключительно редкое, поскольку реализуется единственный из ста миллиардов шансов.

Выяснилось далее, что если две летописные династии a и b изображают две заведомо разные реальные династии, то коэффициент ВССД = c(a,b) "существенно больше". А именно, он всегда не меньше чем 10^{-3}, то есть "велик" . Как и в случае с коэффициентом p(X,Y) здесь важны, конечно, не абсолютные значения ВССД = c(a,b), а разница в несколько порядков между "зависимой зоной" и "независимой зоной". См. рис.3.36.

Итак, при помощи коэффициента ВССД удалось обнаружить существенное различие между заведомо зависимыми и заведомо независимыми летописными династиями.

2.5. МЕТОДИКА ДАТИРОВАНИЯ ЦАРСКИХ ДИНАСТИЙ И МЕТОДИКА ОБНАРУЖЕНИЯ

ФАНТОМНЫХ ДИНАСТИЧЕСКИХ ДУБЛИКАТОВ

Итак, при помощи коэффициента с(a,b) можно уверенно различать зависимые и независимые пары летописных династий. Важный экспериментальный факт состоит в том, что летописцы ошибаются "не слишком сильно". Во всяком случае, их ошибки существенно меньше величины, различающей независимые династии.