69820.fb2 Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию книги . Страница 71

Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию книги . Страница 71

Эксперименты с конкретными историческими анкет-кодами показали, что во многих случаях значение коэффициента E_i приходится полагать равным нулю, так как довольно часто сравниваемые сведения о двух царях и не совпадают, и не противоречат друг другу. Тем самым возрастает роль +1 и -1, когда они появляются. Далее, оказалось, что в подавляющем большинстве случаев приходится полагать E_34 = 0. Дело в том, что обычно при сравнении "остатков биографий" двух царей обнаруживается, что сравниваемые второстепенные, не очень важные сведения настолько разнохарактерны, что их вообще трудно сопоставить. Например, про одного царя в "остатке биографии" АК-34 говорится, что он любил искусство и даже пел, а про другого царя сказано, что он у него были черные волосы. Эти сведения можно, конечно, принять к сведению, но сравнивать их бессмысленно. В таких случаях естественно приходилось полагать балл Е_34 равным нулю.

Пусть теперь нам даны две летописные династии a и b, каждая из которых состоит из k последовательных царей. "Заполняя на каждого из них анкету", то есть составляя на каждого царя его анкет-код, мы получаем последовательность, поток анкет-кодов

АК_1, АК_2, АК_3, ... , АК_k для династии a, и другую последовательность, поток анкет-кодов

АК'_1, АК'_2, АК'_3, ... , АК'_k для династии b.

Последовательность анкет-кодов царей

(АК_1, АК_2, АК_3, ... , АК_k)

естественно назвать ПОТОКОМ АНКЕТ-КОДОВ ДИНАСТИИ a. Обозначим его через AK(a). Аналогично, последовательность "анкет царей"

(АК'_1, АК'_2, АК'_3, ... , АК'_k)

назовем ПОТОКОМ АНКЕТ-КОДОВ ДИНАСТИИ b и обозначим его через AK(b). Другими словами, поток анкет-код династии - это просто последовательность анкет-кодов составляющих ее царей, фактических правителей.

Теперь мы хотим сравнить между собой потоки анкет-кодов AK(a) и AK(b) двух династий a и b. Для каждой пары сравниваемых анкет-кодов царей мы вычисляем коэффициент f(AK_i,AK'_i). Наконец, можно определить число

f(AK_1,AK'_1) + f(AK_2,AK'_2) + ... + f(AK_k,AK'_k) e(a,b) = ----------------------------------------------------,

k

то есть попросту среднее арифметическое всех коэффициентов f(AK_i,AK'_i). Другими словами, шаг за шагом, мы сравниваем каждую пару последовательных царей двух сопоставляемых династий, подсчитываем для каждой такой пары "меру близости" f(AK_i,AK'_i), после чего берем среднее арифметическое по всем царям династии.

Таким образом, близость или удаленность друг от друга потоков анкет-кодов двух династий a и b можно оценивать парой чисел

(c(a,b), e(a,b)),

где коэффициент c(a,b)=ВССД описан выше.

Мы опускаем здесь описание численных экспериментов со сравнением потоков анкет-кодов летописных династий. Сообщим только результат: оказалось, что описанная выше методика позволяет довольно уверенно отделять "зависимые анкет-коды" от "независимых". Детали см. в [416], [438], [375]. Экспериментальная проверка подтвердила верность принципа малых искажений и в этом случае: оказалось, что потоки анкет-кодов, изображающие одну и ту же династию, отличаются друг от друга существенно меньше, чем потоки анкет-кодов разных реальных династий. Ясно, что это позволяет датировать потоки анкет-кодов династий, следуя схеме, описанной выше.

Ниже мы приведем конкретные примеры зависимых потоков анкет-кодов некоторых пар династий-дубликатов. Этот сравнительный материал очень полезен, так как показывает - насколько иногда ярко проявляется то обстоятельство, что перед нами два дубликата, попросту два разных летописных описания одной и той же реальной династии.

В заключении остановимся на одном важном обстоятельстве. Изложенная выше методика сравнения анкет-кодов является не просто "данью статистической моде", а чрезвычайно полезным орудием исследования. Важно, что методика нацелена на сравнение не просто какой-то пары отдельных летописных биографий, а на сравнение ДВУХ ДЛИННЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ТАКИХ БИОГРАФИЙ. Например, мы будем сравнивать двадцать последовательных биографий царей из одной династии с двадцатью последовательными биографиями царей из другой династии. Такие примеры см. ниже. Вывод о зависимости двух династий можно делать только на основе сравнения двух "длинных потоков биографий".

Напротив, близость, "похожесть" двух ОТДЕЛЬНЫХ ИЗОЛИРОВАННЫХ биографий каких-то персонажей ни о каком хронологическом дублировании может не говорить. Ведь не составляет особого труда подобрать пару "похожих биографий" двух разных исторических деятелей из современной нам эпохи, выдергивая из их жизни близкие, иногда поразительно похожие факты. Причем, таких "похожих фактов" можно иногда набрать довольно много. В то же время совершенно ясно, что делать отсюда какие-то "хронологические выводы" не следует. Все эти совпадения могут оказаться просто игрой случая. Но совсем другое дело, когда мы обнаруживаем две близкие ДЛИННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ, два ДЛИННЫХ "ПОТОКА" удивительно похожих биографий. Когда формальная статистическая методика "вылавливает" в огромном наборе древних документов пару "ПОХОЖИХ ДЛИННЫХ ПОТОКОВ БИОГРАФИЙ", - причем "похожесть" эта устанавливается не "на глазок", а формальным образом, становится ясно, что мы обнаружили нечто весьма серьезное. Тем более, что наши методы позволяют (хотя и грубо) оценивать вероятность того, насколько такая "близость" случайна. Если оказывается, что вероятность случайного совпадения мала, это усиливает подозрения, что мы действительно натолкнулись на "размножение" одной и той же реальной династии в разных летописях.

Подчеркнем далее, что во всех примерах пар зависимых династий a и b, которые мы вскоре продемонстрируем, однозначно прослеживается следующее обстоятельство. Пусть, например, a - это римская династия, b германская династия. Оказывается, что:

Биография первого римского царя "похожа" на биографию первого германского царя.

Биография второго римского царя "похожа" на биографию второго германского царя.

Биография третьего римского царя "похожа" на биографию третьего германского царя.

И так далее, вплоть до конца всей династии, в которой пятнадцать или двадцать царей.

Но при этом, внутри самой римской династии (как и внутри самой германской династии) биографии ее царей весьма индивидуальны и отнюдь не похожи друг на друга. То есть, среди 15 или 20 биографий римских царей нет ни одной пары "похожих". Точно так же, среди 15 или 20 биографий германских царей нет ни одной пары "похожих. А вот поток римских биографий оказывается удивительно "похожим" на поток германских биографий. Если эта похожесть, оцененная статистически, оказывается "весьма сильной", это указывает, что мы натолкнулись на пару династий-дубликатов.

9. МЕТОД ПРАВИЛЬНОГО ХРОНОЛОГИЧЕСКОГО УПОРЯДОЧИВАНИЯ

И ДАТИРОВКИ ДРЕВНИХ ГЕОГРАФИЧЕСКИХ КАРТ.

В [438], [416] была предложена также методика хронологически правильного упорядочивания древних карт. Каждая географическая карта отражает состояние науки о земле в ту эпоху, когда эта карта была составлена. По мере развития научных представлений, карты улучшаются. То есть, количество ошибочных сведений в целом уменьшается, а количество правильных сведений увеличивается. На основе изучения конкретных древних карт мы составили оптимальный карт-код, позволяющий представить каждую карту, изображенную графически или описанную словесно, в виде таблицы, аналогичной АК. Эту таблицу можно условно назвать карт-кодом. Карт-код строится по тому же принципу, что и анкет-код, и состоит из нескольких десятков пунктов, признаков. Приведем здесь лишь начало этой таблицы.

1) Вид карты:

а. Глобус.

б. Плоская карта.

2) а. Всемирная карта (карта мира).

б. Региональная карта (отдельной области, какой именно).

3) В случае всемирной карты нужно указать следующие параметры:

а. Структура "границы мира" (вода, суша и т.д.).

б. Расположение полюсов, экватора, тропиков, климатических

поясов, часовых поясов.

4) Ориентировка карты, то есть употребление следующих терминов:

а. Названия сторон света (север и т.д.).

б. Термины "выше", "ниже" и т.д.

в. Где расположен север карты (вверху или внизу), где расположен

восток карты (справа или слева).

5) Изображение или описание морей в следующем виде:

а. "Реки", то есть узкие протоки.

б. Обширные водоемы.

6) Перечисление основных водоемов:

а. Океаны.

б. Моря.

в. Озера.