Негауссовое моделирование лексико-статистической структуры вариативного текста: на примере "Сказания о Мамаевом побоище" тема диссертации и автореферата по ВАК РФ 10.02.21, кандидат наук Ковригина, Любовь Юрьевна

  • Ковригина, Любовь Юрьевна
  • кандидат науккандидат наук
  • 2014, Санкт-Петербург
  • Специальность ВАК РФ10.02.21
  • Количество страниц 356
Ковригина, Любовь Юрьевна. Негауссовое моделирование лексико-статистической структуры вариативного текста: на примере "Сказания о Мамаевом побоище": дис. кандидат наук: 10.02.21 - Прикладная и математическая лингвистика. Санкт-Петербург. 2014. 356 с.

Оглавление диссертации кандидат наук Ковригина, Любовь Юрьевна

Введение............................................................................................................................................6

ГЛАВА I. «Сказание о Мамаевом побоище» как вариативный текст и объект исследования

..........................................................................................................................................................25

§1.1 Вариативный текст как объект исследования........................................................................25

§ 1.2 Текстология «Сказания о Мамаевом побоище»....................................................................28

§ 1.3 Принципы отбора текстов для исследования........................................................................36

§ 1.4 Списки «Сказания о Мамаевом побоище», выбранные для исследования в настоящей

работе...............................................................................................................................................38

§ 1.5 Текстологическое и палеографическое описание исследуемых списков «Сказания о

Мамаевом побоище».......................................................................................................................41

§ 1.6 Методика обработки списков «Сказания о Мамаевом побоище» для лексикостатистического анализа.................................................................................................................50

1.6.1 Правила компьютерного набора списков «Сказания о Мамаевом побоище» ..........................................................................................................................................................50

1.6.2 Методика формирования частотных словарей списков «Сказания о Мамаевом побоище»

..........................................................................................................................................................56

§ 1.7 Основные количественные характеристики частотных словарей списков «Сказания о

Мамаевом побоище».......................................................................................................................64

§ 1.8 Заключение.............................................................................................................................67

§ 1.9 Выводы....................................................................................................................................68

ГЛАВА 2. Моделирование структуры текста как поликомпонентного объекта

..................................................!.......................................................................................................70

§ 2.1 Моделирование статистической структуры поликомпонентных объектов

...............................................................................!..........................................................................72

§ 2.2 Концепции описания структуры поликомпонентных объектов...........................................88

2.2.1 Принцип максимума диссимметрии М.В.Арапова-Ю.А.Шрейдера.....................................89

2.2.2 Исправление эффекта рангового искажения по В.П.Маслову..............................................96

2.2.3 Ценологический подход Б.И.Кудрина...................................................................................97

2.2.4 «Ядро» и «периферия» в подходе Г.Я.Мартыненко............................................................109

2.2.5 Рангово-энтропийный подход и информационный язык/Ш/i Т.Г.Петрова......................116

2.2.6 Структурно-топологическая динамика В.В.Фуфаева и модель изменения словаря во времени М.В.Арапова-М.М.Херц................................................................................................. 124

2.2.7 Точка h Хирша и геометрическая модель в исследованиях И.-И.Попеску. Я.Машутека и

Г.Альтманна................................................................................................................................... 135

§ 2.3 Сопоставление рассматриваемых методик с помощью набора концептуально значимых

признаков....................................................................................................................................... 139

§ 2.4 Заключение...........................................................................................................................155

§ 2.5 Выводы..................................................................................................................................158

ГЛАВА 3. Лексико-статистическая структура списков «Сказания о Мамаевом побоище» ........................................................................................................................................................160

§ 3.1 Анализ частотных словарей «Сказания о Мамаевом побоище» в рамках разных подходов ........................................................................................................................................................160

3.1.1 Анализ ЧС «Сказания о Мамаевом побоище» с применением методики В.П.Маслова ........................................................................................................................................................161

3.1.2 Анализ ЧС «Сказания о Мамаевом побоище» с применением методик Б.И.Кудрина ........................................................................................................................................................165

3.1.3 Анализ ЧС «Сказания о Мамаевом побоище» с применением скользящего коэффициента вариации по Г.Я.Мартыненко....................................................................................................... 168

3.1.4 Анализ ЧС «Сказания о Мамаевом побоище» с применением рангово-энтропийного подхода Т.Г.Петрова.....................................................................................................................173

3.1.5 Анализ ЧС «Сказания о Мамаевом побоище» с применением структурно-топологической динамики В.В.Фуфаева.................................................................................................................177

3.1.6 Анализ ЧС «Сказания о Мамаевом побоище» с применением точки h Хирша (по методике

И.-И.Попеску, Я.Машутека и Г.Альтманна)................................................................................195

§ 3.2 Заключение...........................................................................................................................196

§ 3.3 Выводы..................................................................................................................................196

ГЛАВА 4. Многомодельное представление лексико-статистической структуры «Сказания о

Мамаевом побоище» как вариативного текста............................................................................200

§ 4.1 Проблемы сопоставимости результатов, полученных с применением разных подходов

'........................................................................................................................................................201

§ 4.2 Сопоставление значений пойнтер-точки R, границ монотонности скользящего

коэффициента вариации и точки h...............................................................................................203

§ 4.3 Сопоставление групп списков с применением индекса Я/С и диаграммы НА

........................................................................................................................................................212

§ 4.4 Сопоставление групп списков, полученных с помощью диаграммы НА и долей ноевой и

сараичёвой каст.............................................................................................................................213

§ 4.5 Ранговый состав стабильной зоны ^-распределения и устойчивость лексики разных

ранговых групп..............................................................................................................................214

§ 4.6 Количественные особенности характера сокращения текста.............................................228

§ 4.7 Заключение...........................................................................................................................234

§ 4.8 Выводы..................................................................................................................................234

Заключение....................................................................................................................................236

Список сокращений и условных обозначений.............................................................................242

Список литературы........................................................................................................................243

Список иллюстративного материала............................................................................................259

Список приложений......................................................................................................................262

Пояснительная записка к приложениям диссертации.................................................................264

Приложения...................................................................................................................................271

Приложение А. Примеры обработанных текстов (по списку Основной редакции РНБ O.IV.22).

........................................................................................................................................................271

Приложение А. 1. Фрагмент текста Основной редакции, записанный рукописными

словоформами................................................................................................................................271

Приложение А.2. Фрагмент текста Основной редакции, записанный стандартизованными

словоформами................................................................................................................................273

Приложение А.З. Фрагмент текста Основной редакции, записанный лексемами......................274

Приложение Б. Таблицы с разночтениями эпизодов...................................................................275

Таблица Б.1 — Примеры разночтений в ряде эпизодов по спискам типового варианта Основной редакции (РНБ O.IV.22) и беллетризованного варианта Основной редакции (РНБ Собр.

Михайловского. Q.509).................................................................................................................275

Таблица Б.2 — Примеры разночтений в ряде эпизодов по спискам типового варианта Распространенной редакции (РНБ Q.IV.354) и сокращенного варианта Распространенной редакции (РНБ Q.XVII.70)............................................................................................................278

Таблица Б.З — Разночтения эпизода, в котором повествуется об интриге князя Олега Рязанского и Ольгерда Литовского против великого князя Дмитрия Ивановича, по 8 спискам

«Сказания».....................................................................................................................................283

Приложение В. Фрагменты частотных словарей рукописных словоформ, стандартизованных

словоформ и лексем списка Основной редакции РНБ 0.1У.22...................................................288

Приложение Г. Тексты вставных повестей Распространенной редакции («О Захарии» и «О

новгородцах»), записанные стандартизованными словоформами..............................................291

Приложение Г. 1. Текст повести о Захарии по сокращенному варианту Распространенной

редакции РНБ р.ХУ11.70...............................................................................................................291

Приложение Г.2. Текст повести о новгородцах по сокращенному варианту Распространенной

редакции РНБ д.ХУН.70...............................................................................................................293

Приложение Д. Фрагмент таблицы соответствий «словоформа-лексема» для проведения

лемматизации.................................................................................................................................295

Приложение Е. Графики с результатами обработки по В.П.Маслову для ЧС лексем...............297

Лист Е. 1..........................................................................................................................................297

Лист Е.2..........................................................................................................................................298

Лист Е.З..........................................................................................................................................299

Лист Е.4..........................................................................................................................................300

Приложение Ж. Графики прироста скользящего коэффициента вариации по ЧС всех типов. 301 Рисунки Ж. 1.1-Ж. 1.8 — Графики прироста скользящего коэффициента вариации по ЧС

рукописных словоформ.................................................................................................................301

Рисунки Ж.2.1-Ж.2.8 — Графики прироста скользящего коэффициента вариации по ЧС

стандартизованных словоформ.....................................................................................................309

Рисунки Ж.3.1-Ж.3.8 — Графики прироста скользящего коэффициента вариации по ЧС лексем

........................................................................................................................................................317

Приложение И. Эмпирические и аппроксимирующие //-распределения для ЧС всех типов.... 325 Приложение И.1. Эмпирические и аппроксимирующие Я-распределения списков «Сказания» по

ЧС рукописных словоформ...........................................................................................................325

Приложение И.2. Эмпирические и аппроксимирующие //-распределения списков «Сказания» по

ЧС стандартизованных словоформ...............................................................................................326

Приложение И.З. Эмпирические и аппроксимирующие //-распределения списков «Сказания» по

ЧС лексем.......................................................................................................................................327

Приложение К. Аппроксимация эмпирических распределений с помощью модели простых

чисел...............................................................................................................................................328

Приложение Л. Фрагменты частотного и рангового инвариантных словарей словоформ для расчета коэффициента конкордации и таблицы для построения ¿'-распределения (по 8 спискам

««Сказания»)..................................................................................................................................329

Приложение Л.1. Инвариантный частотный словарь 8 списков «Сказания» по ЧС

стандартизованных словоформ.....................................................................................................329

Приложение Л.2. Инвариантным ранговым словарь 8 списков «Сказания» по ЧС стандартизованных словоформ (внутри групп с одинаковой частотой словоформы упорядочены

по алфавиту) и таблица данных для построения ¿-распределения.............................................333

Приложение Л.З. Инвариантный ранговый словарь 8 списков «Сказания» по ЧС стандартизованных словоформ (внутри групп с одинаковой частотой словоформы упорядочены последовательности их появления в тексте) и таблица данных для построения ¿'-распределения.

........................................................................................................................................................337

Приложение М. Совмещение значений натуральнозначного аргумента, границ монотонности

скользящего коэффициента вариации, пойнтер-точки Я и точки /гХирша................................341

Таблица М.1 — Совмещение значений натуральнозначного аргумента, границ монотонности скользящего коэффициента вариации, пойнтер-точки II и точки И (по ЧС рукописных словоформ).....................................................................................................................................341

Таблица М.2 — Совмещение значений натуральнозначного аргумента, границ монотонности скользящего коэффициента вариации, пойнтер-точки Я и точки И (по ЧС стандартизованных

словоформ).....................................................................................................................................342

Таблица М.З — Совмещение значений натуральнозначного аргумента, границ монотонности

скользящего коэффициента вариации, пойнтер-точки Я и точки /? (по ЧС лексем)..................343

Приложение Н. Диаграммы НА для ЧС всех типов.....................................................................344

Рисунок Н.1 —Диаграмма НА для списков «Сказания» по ЧС рукописных словоформ..........344

Рисунок Н.2 ■— Диаграмма НА для списков «Сказания» по ЧС стандартизованных словоформ

........................................................................................................................................................345

Рисунок Н.З — Диаграмма НА для списков «Сказания» по ЧС лексем......................................346

Приложение П. Графики ¿"-распределений..................................................................................347

Лист П. 1.........................................................................................................................................347

Лист П.2.........................................................................................................................................348

Лист П.З.........................................................................................................................................349

Лист П.4.........................................................................................................................................350

Приложение Р. Группировка списков по долям ноевой и саранчёвой каст................................351

Рисунок Р.1 — Группировка списков «Сказания» по доле экстремально частотных элементов

(по ЧС рукописных словоформ)...................................................................................................351

Рисунок Р.2 — Группировка списков «Сказания» по доле экстремально частотных элементов

(по ЧС стандартизованных словоформ).......................................................................................352

Рисунок Р.З — Группировка списков «Сказания» по доле экстремально частотных элементов

(по ЧС лексем)...............................................................................................................................353

Приложение С. Структура стабильной зоны ¿'-распределения...................................................354

Таблица С.1 — Структура стабильной зоны ¿"-распределения Распространенной редакции и

сокращенного варианта, неалфавитное упорядочивание, ИС словоформ..................................354

Таблица С.2 — Структура стабильной зоны ¿"-распределения Распространенной редакции и

сокращенного варианта, неалфавитное упорядочивание, ИС лексем.........................................355

Таблица С.З — Структура стабильной зоны ¿-распределения Основной редакции и беллетризованного варианта, неалфавитное упорядочивание, ИС лексем.................................356

Рекомендованный список диссертаций по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК

Введение диссертации (часть автореферата) на тему «Негауссовое моделирование лексико-статистической структуры вариативного текста: на примере "Сказания о Мамаевом побоище"»

Введение

К настоящему времени лингвостатистика достигла определённой степени зрелости. Это выражается в наличии, по крайней мере, трех областей исследований, которые находятся в тесной взаимосвязи друг с другом.

Во-первых, это изучение статистики языковых единиц разных уровней (фонем, букв, слогов, морфем, словоформ, лексем, словосочетаний, синтаксических конструкций) в текстах самой разной природы и их фрагментах. Начавшись в 1930-х гг. с работ Дж. К. Ципфа, подобные исследования продолжаются по настоящее время, а их результатом является формирование представления о резкой неравночисленности единиц разных уровней в тексте, накопление всё более точных количественных характеристик этих распределений для тех или иных лингвистических объектов (современных и древних текстов, технической документации и художественной литературы, спонтанной устной речи и поэтических текстов с жесткой структурой, такой как у сонетов и канцоны, и т.д.).

Во-вторых, это широкий круг практических разработок, основанных на изучении статистики лексических единиц. Прежде всего, это частотные словари разных национальных языков, профессиональных и социальных диалектов, идиолектов отдельных авторов1 и т.д. Такие словари являются основой для

1 Засорина Л.Н. Частотный словарь русского языка : Около 40000 слов. М.: Рус. яз., 1977. 935, [I] с. ; Ляшсвская О.Н., Шаров С.А. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М.. 2009. 1087, [I] с. ; Kucera H., Francis W., Computational analysis of present-day American English, Providence, 1967. XXVI, 424 p. ; Частотный словарь рассказов И.А. Бунина / С.-Петерб. гос. ун-т; [авт.-сост.: А.О. Гребенников науч. ред.: Г.Я. Мартыненко]. СПб, 2011. 294, [1] с. ; Частотный словарь рассказов А.П. Чехова /С.-Петерб. гос. ун-т; [Авт.-сост. А. О. Гребенников]; Под ред. Г. Я. Мартыненко. - СПб., 1999. 171,

[1] с. ; Шайкевич А.Я., Андрющенко В.М., Ребецкая П.А. Статистический словарь языка Достоевского. М., 2003. XLVIII, 832 с. ; Urai Y., Ando A., Renansky A. A Lemmatized Concordance To The Idiot Of F.M.Dostoevsky. Vol. 1-4. Sapporo: Hokkaido University, 2003. XXXII, 1911 p., 505 p. Частотный словарь романа Л.Н. Толстого «Война и мир» /[Сост. 3.11. Великодворская, Г.С. Галкина, Г.Б. Куперман, В.М. Цапникова]. Тула, 1978. 380 с. Творогов О.В. Лексический состав «Повести временных лет» : (Словоуказатели и частот, словник). Киев, 1984. 218 с. ; Алексеев П.М. Частотный словарь Ветхого Завета // Структурная и прикладная лингвистика. Выпуск 6. СПб., 2004. С. 223—237.

решения широкого круга прикладных задач - лингводидактики (учебные частотные словари)1, стилеметрии2, атрибуции анонимных и псевдонимных текстов , в том числе, для целей осуществления судебно-криминалистических экспертиз и т.д.

В-третьих, это теория лингвостатистических распределений, которая формируется на стыке теории вероятности и математической статистики, лингвистики и лингвостатистики, психолингвистики и эстетики и т.д. Несмотря на примерно восьмидесятилетнее развитие этой области, она полна дискуссий и противоречий, представляя собой поле жесткой борьбы порою резко различающихся точек зрения'1.

Одной из самых острых проблем теории лингвостатистических распределений является вопрос об их гауссовости или негауссовости3. При этом надо отметить, что в большинстве случаев этот вопрос обсуждается с обращением к выборкам языкового материала большего или меньшего объема (при том, что современные принципы и практика корпусной лингвистики позволяет оперировать с объемом материала, измеряемым миллионами словоупотреблений6), и вопрос в большой мере сводится к обсуждению репрезентативности тех или иных выборок этого материала.

1 Алексеев U.M. Серийные учебные частотные словари // Структурная и прикладная лингвистика: Межвузовский сб. / Под ред. А.С.Герда. Вып.5. СПб., 1998. С. 140—151 : Зубов A.B. Учебные частотные словари в системе компьютерною обучения. Статистическая лексикография и учебный процесс. // Сб. науч. тр. Отв. Ред.

B.И.Перебейиос. Киев. 1990. С. 18—26.

2 Мартыненко Г.Я. Основы стилеметрии. Л., 1988. 173, [11 с.

3 Марусенко М.А. Атрибуция анонимных и псевдонимных литературных произведений методами распознавания образов. Л., 1990. 164 с.

4 Арапов М.В., Шрейдер Ю.А. Закон Ципфа и принцип диссимметрии системы // Семиотика и информатика. 1978. Вып. 10. С.74—95 ; Бычков В. Н. Построение, обоснование и интерпретация базисных лингвостатистических моделей : (На материале отраслевых частотных словарей) : автореф. дисс. ... канд. филол. наук. Л., 1986. 16 с. ; Пиотровский Р.Г., Бектаев К.Б., Пиотровская A.A. Математическая лингвистика. M., 1977. 382 с. ; Herdan G. Quantitative Linguistics. Berlin, Heidelberg, London. 1964. 284 p.

3 Мартыненко Г.Я. Некоторые закономерности концентрации и рассеяния элементов в лингвистических и других сложных системах // Структурная и прикладная лингвистика. 1978. Вып.1. С.63—79 ; Его же. Основы стилеметрии. Л., 1988. 173. [1] с. ; Его же. Введение в теорию числовой гармонии текста. СПб., 2009. 252 с. ; Чебанов C.B. Концепции ранговых распределений: консенсуспый анализ // Ценологические исследования. 2012. Вып.46.

C.72—85. Popescu I.-I., Macutek J., Altmann G. Aspects of word frequencies. Studies in Quantitative Linguistics. Vol.3. 2009.

6 Корпус как язык: от масштабируемости к дифференциальной полноте / В.И.Беликов, Н.Ю.Копылов. А.Пиперски и др. // Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной международной конференции Диалог-2013. Т.1. из Вып. 12(19). М., 2013. С. 84—95.

Вместе с тем, как па это обращал внимание еще Ципф1, а позднее отмечали

другие исследователи" (Налимов, 1979, Арапов, Шрейдер, 1978) лингвостатистические распределения дают представление не о статистике отдельных репертуарных единиц (морфем, лексем, словаря) в языке, но об их статистике в тексте. В таком случае, лингвостатистические распределения оказываются инструментом изучения не языка, а речи, текста. Тем не менее, изучение статистики текста остается до сих пор делом новаторским, не вполне концептуально проясненным, хотя и пересекается с работами по интенсивно развивающейся ныне лингвистике текста.

Однако, если говорить о лингвостатистике текста, то ситуация как с теоретической, так и с практической точки зрения не является абсолютно ясной.

Дело в том, что при всем разнообразии" текстов, наиболее изучаемыми являются авторские художественные тексты нового и новейшего времени, тиражируемые с помощью традиционной гутенберговской полиграфии, обеспечивающей идентичность разных отпечатков одного тиража.

Ситуация же с устными и рукописными текстами, произведениями самиздата, современной городской (авторской) песней, текстами, циркулирующими в интернете, и т.д. оказывается совсем иной. Для таких текстов не существует эталонного, окончательного, подлинного авторского варианта, который и должен быть предметом исследования с позиций лингвистики текста.

Прецеденты рассмотрения таких текстов были и ранее4. Однако, целенаправленно концентрируясь на изучении таких текстов, Ю.В.Доманский обосновывает представление о том, что они должны рассматриваться в качестве особого класса текстов - вариативных текстов, трактуемых им следующим образом «категория варианта ... важна уже потому, что в неклассической

' ZipfG. К. Human behavior and the principle of least effort. An introduction to human ecology. Addison-Wesley, Cambridge, 1949. 574 p.; Zipf G. K. The psycho-biology of language. Boston, 1935. 336 p.

" Налимов В.В. Вероятностная модель языка : о соотношении естеств. и искусств, языков М., 1979. 304 с. ; Арапов М.В., Шрейдер 10.А. Закон Ципфа и принцип диссимметрии системы // Семиотика и информатика. 1978. Вып. 10. С.74—95.

J Филиппов К.А. Лингвистика текста : Курс лекций. СПб, 2003, 333.[1] с.

4 Лихачев Д. С. Текстология. На материале русской литературы X-XVII в. / Д.С.Лихачев при участии А. А. Алексеева и А. Г. Боброва. М., 2001. 758 с. ; Корона В.В. Поэзия Анны Ахматовой: поэтика авювариаций. Екатеринбург, 1999. 263, [1] с.; Пропп В. Я. Морфология волшебной сказки. М., 2003. 143, [1] с.

художественности произведение не реализуется только в каком-то одном варианте, а представляет из себя совокупность текстуальных (в широком смысле) манифестаций, каждая из которых обладает относительно самостоятельными смыслами. Это сближает словесность парадигмы неклассической художественности с фольклором и древней литературой»1. Такими текстами являются и сказки (см. на эту тему работы В.Я.Проппа), рукописные тексты Средневековья, многие тексты замкнутых профессиональных и полупрофессиональных сообществ и т.д.

По отношению к таким текстам возникает новый круг задач из области лингвистики текста, которые лишь отчасти пересекаются с задачами, рассматриваемыми в текстологии, - как в авторско-гутенберговской, так и в средневековой". Очевидно, что описание особенностей вариативных текстов — серьезная самостоятельная задача, решение которой предполагает формирование обширной самостоятельной исследовательской программы.

В контексте же лингвостатистических исследований может быть поставлен вопрос об особенностях лингвостатистических распределений вариативных текстов. Этот вопрос тем более интересен, что не было не только каких-то попыток его изучения на конкретном материале, но он даже не ставился в такой форме. Предлагаемая же постановка вопроса позволяет по-новому обсуждать всю лингвостатистическую проблематику.

В связи с этим важно иметь в виду то, что к настоящему времени сложилось несколько методологически различных подходов к описанию статистической структуры текстов и других поликомпонентных объектов - внутренних систем по терминологии Ю.А.Шрейдера3.

Начало таким исследованиям заложили работы В.Парето, Дж.Юла, Дж.Виллиса, Дж.Ципфа, Б.Мандельброта (конца XIX - первой половины XX вв.),

1 Доманский Ю.В. Вариативность и интерпретация текста (парадигма неклассической художественности): автореф. дне. ... д.филол.и. М., 2006, 43 с.

" Лихачев Д.С. Текстология. На материале русской литературы Х-ХУП в. / Д. С. Лихачев при участии А.А.Алексеева и А.Г.Боброва. М., 2001. 758 с.

1 Шрейдер Ю.А. Теория множеств и теория систем // Системные исследования: Ежегодник, 1977. М., 1978. С. 149-

165.

обнаруживших сходный тип распределения, репрезентирующий резкую неравномерность численности объектов. Несмотря на неадекватность аппроксимации для отдельных участков кривой эмпирического распределения, наиболее известным оказалось ранговое распределение Ципфа (гипербола, или, как оно называется в лидирующей сейчас отечественной школе Б.И.Кудрина, - Н-распределение).

В практике описания подобных ранговых и спектровых распределений применяется множество аппроксимирующих функций, каждая из которых может быть оспорена. Разногласия наблюдаются не только в выборе аналитической модели, по и во мнении исследователей относительно объема (достаточности) материала репрезентативной выборки (этот вопрос нерелевантен только при изучении выборки, совпадающей с генеральной совокупностью, т.е. при описании частотной структуры целых объектов).

Характеристики гиперболических ранговых распределений частот лексики текстов на естественном языке указывают на негауссовость таких распределений: дисперсия увеличивается с объемом выборки, выборочная средняя величина неинформативна и даже бессмысленна из-за неопределенности генеральной средней1. При этом в лингвостатистике на протяжении более чем полувека широко применяются методы классической статистики, в том числе установление характеристик генеральной совокупности по выборке и многочисленные методы оценки. Таким образом, исследователь оказывается перед выбором одного из альтернативных классов распределений: гауссовых или негауссовых.

С одной стороны, представляется несомненной негауссовость совокупностей (в настоящей работе принимается гипотеза именно о негауссовой природе лексико-статистических распределений), имеющих резко асимметричное распределение, и невыполнение для них центральной предельной теоремы (ЦПТ, даже существование которой не принимается во внимание некоторыми исследователями), а также неопределенность для них моментов любого порядка, в

1 Шелухин О.И., Беляков И.В. Негауссопские процессы. СПб., 1992. 312 с. ; Кудрин Б.И. Математика ценозов: видовое, ранговое, ранговое по параметру гиперболические //-распределения и законы Лотки, Ципфа, Парето, Мандельброта // Ценологические исследования. 2002. Вып. 19 : Философские основания технетики. С.357—412.

частности, дисперсии, что определяет некорректность использования традиционных статистических методов моделирования и оценки (см., напр., работу С.Д.Хайтуна1). Принятие идеи негауссовости для лингвостатистических распределений делает неправомерным приписывание слову в языке определенной вероятности, оставляя возможность говорить только о частоте по корпусу.

Вслед за констатацией этого факта, исследователь оказывается в ситуации отсутствия удовлетворительных способов описания негауссовых распределений при наличии нескольких вариантов техники осуществления такого описания. Последнее обстоятельство ставит вопрос о необходимости либо выбора лучшей из имеющихся моделей, либо создания новой универсальной модели.

В связи с этим к рассмотрению привлекаются модели из других предметных областей, тем более, если эти модели самими их создателями трактуются как универсальные (метод RHA, ^-распределение, //-распределение), применимые к любому материалу с подобными свойствами (когда можно говорить только о частоте по корпусу — выборочной частоте).

При этом, как показывает опыт моделирования, если модель обладает высокой степенью адекватности, то её приложение к новому, в данном случае лингвистическому, материалу может обнаружить новые нетривиальные свойства последнего. Однако, подобная универсальность для части обсуждаемых в диссертации моделей ранее никогда не подтверждалась на едином текстовом материале.

С другой стороны, кривая распределения (при разбиении на зоны) неплохо описывается некоторыми гауссовыми (в смысле выполнения для них ЦПТ) законами распределения (см. Г.Я.Мартыненко, 19782, 20093, Herdan, 19644).

Таким же спорным вопросом, как и адекватность статистического аппарата, является аналитический вид распределения, его

одномодальность / полимодалыюсть (споры проистекают из соображений о

1 Хайтун С.Д. Феномен негауссовости социальных явлений. [20--?]. URL: http://kudrinbi.ru/public/481/index.litm

(дата обращения: 20.10.2013).

: Мартыненко Г.Я. Некоторые закономерности концентрации и рассеяния элементов в лингвистических и других сложных системах // Структурная и прикладная лингвистика. 1978. Вып. 1. С.63—79.

3 Мартыненко Г. Я. Введение в теорию числовой гармонии текста. СПб., 2009. 252 с.

4 Herdan G. Quantitative Linguistics. Berlin, Heidelberg, London. 1964. 284 p.

смешанной / однородной природе генеральной совокупности), параметры теоретического распределения и некоторые другие.

Таким образом, методологические вопросы моделирования структуры текста как поликомпонентного объекта требуют прояснения. Дискуссионные методологические основания были исследованы в настоящей работе с точки зрения их реализации в конкретных статистических моделях и проинтерпретированы с помощью изучения сопоставимости полученных результатов моделирования.

Содержательно исследование представляет собой построение метамодели лексико-статистической структуры вариативного текста - «Сказания о Мамаевом побоище» («Сказания»), Частотные словари «Сказания о Мамаевом побоище» после подтверждения роста дисперсии в спектровых распределениях вариантов текста были обработаны с помощью каждого из выбранных средств изучения совокупностей, после чего были произведены сопоставления характеристик этих средств и содержательный анализ результатов применительно к тексту «Сказания».

Степень разработанности проблемы. Проблема природы гауссовости / негауссовости //-распределений является одной из тех проблем, обсуждение которых, несмотря на его напряженность, не получило своего завершения1. Нередко при моделировании компонентной структуры текстов принимается не принципиальное, а операциональное допущение об устойчивости / неустойчивости частот (без обсуждения вопроса о существовании вероятности), определяемое на основании опыта исследователя и эмпирического материала, в то время как собственно математический аппарат негауссовых распределений слабо разработан, не говоря уже о практике его использования при

' Яблонский А.И. Модели и методы математического исследования науки : Иауч.-аналит. обзор. М., 1977. 128 с. ; Налимов В.В. Вероятностная модель языка : о соотношении естеств. и искусств, языков М., 1979. 304 с. ; Хайтун С.Д. Негауссовость социальных явлений // Социологические исследования. 1983. №1. С.144—152 ; Хайтун С.Д. Негауссовость социальных явлений и эволюция // Электрификация металлургических предприятий Сибири. 2005. Вып.12. С.291—300 ; Кудрин Б.И. Математика ценозов: видовое, ранговое, ранговое по параметру гиперболические //-распределения и законы Лотки, Ципфа, Парето, Мандельброта// Ценологнческие исследования / Технетика. 2002. Вып. 19 : Философские основания технетики. С.357—412 ; Шелухин О.И., Беляков И.В. Негауссовские процессы. СПб., 1992. 312 с. ; Мартыненко Г.Я. Некоторые закономерности концентрации и рассеяния элементов в лингвистических и других сложных системах // Структурная и прикладная лингвистика. 1978. Вып. I. С.63—79 ; Его же. Введение в теорию числовой гармонии текста. СПб., 2009. 252 с.

описании конкретного материала. В силу этого, сам факт того, что настоящая работа — первая, в которой исследуется сопоставимость моделей, которые не используют представления о гауссовости лингвостатистических распределений, принципиально отличает её от подавляющего числа исследований в данной области.

Указанное положение дел, связанное с содержательно-типологической ограниченностью материала исследований и научными позициями авторов, привело к тому, что для разных дискретных и недискретных объектов были разработаны концептуально различные методы без попыток апробации методики на инородном (в частности, лингвистическом) материале достаточного объема.

При этом, хотя накапливается всё больше аргументов в пользу того, что речь идет об использовании нового класса теоретических статистик, проводятся новаторские работы (причем на эмпирическом материале разных дисциплин), статус - предметно-специфический или универсальный - получаемых результатов не прояснен. Таким образом, сама история моделирования количественных соотношений компонентов в объекте, характеризующемся свойствами целостности и системности, предполагает проведение именно междисциплинарных исследований в этой области.

Следует отметить, что вопрос об аппроксимации одного и того же эмпирического материала разными математическими моделями неоднократно ставился в исследованиях по математической лингвистике1. Однако подавляющее большинство исследований сводится к подтверждению адекватности одной модели для разного эмпирического материала, поэтому эквивалентность/специфичность моделей компонентной структуры негауссовых совокупностей равно как и методы оценки качества их аппроксимации остается совершенно неразработанной областью.

1 Кромер В.В. Ранговые полисемнческие распределения в синхронии и диахронии // Квантитативная лингвистика и семантика: Сб. науч. тр. Новосибирск, 2001. Вып. 3. С.25—33 ; Крылов Ю.К. Вероятностно-статистические модели синергетизма // Ценологические исследования. Вып. 1-2. Математическое описание ценозов и закономерности технетики. М.-Абакан, 1996. С.110—142 ; Мартыненко Г.Я. Некоторые закономерности концентрации и рассеяния элементов в лингвистических и других сложных системах // Структурная и прикладная лингвистика. 1978. Вып.1. С.63—79 ; Пиотровский Р.Г., Бектаев К.Б., Пиотровская A.A. Математическая лингвистика. М., 1977. 382 с. ; Тулдава Ю.А. О частотном спектре лексики текста // Квантитативная лингвистика и автоматический анализ текстов. 1986. С. 139—162.

Компонентная же структура вариативного текста как самостоятельный предмет изучения ранее не исследовалась вовсе, и статистические данные о соотношении компонентов в вариантах одного текста представлены впервые именно в настоящей работе. При этом впервые средневековый рукописный текст представлен как текста вариативный, несмотря на подготовленность такой трактовки текста результатами, полученными текстологами и палеографами.

Актуальность проведенного исследования обоснована отсутствием данных о сопоставимости результатов, получаемых с помощью разных моделей, в том числе, моделей, созданных в разных дисциплинах, в которых были предложены модели статистической структуры поликомпонентных объектов, часть из которых опирается на гауссовость распределения совокупности компонентов, а часть - на негауссовость.

В силу вышесказанного проведенное исследование является крайне актуальным, поскольку результаты исследования проясняют характер и степень универсальности наиболее распространенных техник изучения негауссовых совокупностей. Актуальность усиливается тем, что, при наличии большого объема эмпирических данных по лингвостатистике, отдельные массивы этих данных разрабатываются внутри нескольких альтернативных версий представлений о природе лингвостатистических распределений, поскольку развитие этой области идет не путем накопления и обобщения данных, полученных предшествующими исследователями, а путем выдвижения нового взгляда на предметную область. Такая ситуация характерна для революционного, а не кумулятивного типа развития и свидетельствует о дефиците обобщающих концепций в этой области.

Кроме прояснения теоретических вопросов, выявление интерпретационной силы и активизация применения негауссовых моделей, описывающих компонентную структуру текста, являются крайне важными для задач, связанных с машинным обучением, поскольку в этой области проблема сходимости параметров выборки к параметрам генеральной совокупности относится к критичным. При проецировании модели, построенной по обучающей выборке и

улучшенной по проверочной, на тестовые данные1 часто происходит ухудшение качества, что объясняется принадлежностью выборок к разным генеральным совокупностям. Можно выдвинуть гипотезу, что ухудшение качества обусловлено также и негауссовостью лингвистических совокупностей, проявляющейся в постоянном появлении маргинальных значений признаков и приводящей к изменению средних значений признака в обучающей и тестовой выборке и, что еще хуже, к чрезмерно близкой подгонке параметров имитационной модели.

Кроме того, идея негауссовости распределений лексики по числу употреблений полностью соответствует взглядам на порождение текста, как на процесс, определяющийся не вероятностью появления слова, а целями индивидуума, порождающего этот текст".

Вышеизложенное свидетельствует об обоснованности и необходимости учета негауссовости при обработке данных и установлении универсальности моделей, не опирающихся на гауссовские статистики.

Цель настоящего исследования заключается в построении метамодели лингвостатистических распределений частот лексики вариативного текста, которая позволит, с одной стороны, выявить сопоставимые меры и параметры рассматриваемых моделей и показать различия моделей, а с другой - выявить содержательно интерпретируемые количественные характеристики диахронических изменений текста. В соответствии с поставленной целью в работе осуществляется прояснение универсальности и интерпретационной силы моделей, не учитывающих гауссовость лингвостатистических распределений, сравнение характера аппроксимации эмпирических распределений лексики разными теоретическими распределениями и обсуждение характера получаемых результатов и их интерпретируемости.

Достижение этой цели потребовало решения следующих задач:

1. Описание и критический анализ разных подходов (статических и динамических) к изучению поликомпонентных объектов, а также выявление

1 Ripley B.D. Pattern Recognition and Neural Networks. Cambridge, 1996 404 p.

3 Налимов В. В. Вероятностная модель языка : о соотношении естеств. и искусств, языков. M., 1979, 303, [1] с. ; Шрейдер Ю. А. Ранговые распределения как системное свойство // Ценологические исследования / Центр системных исследований. 1996. Выи. 1-2 : Математическое описание ценозов и закономерности техники. С.34—42.

концептуальных признаков для их сопоставления. В работе рассматриваются следующие средства1 изучения совокупностей:

— информационный язык ЯНА Т.Г.Петрова, применяемый для описания объектов разной природы2;

— структурно-топологический анализ временных рядов В.В.Фуфаева"5, аналогичный модели изменения словаря во времени М.В.Арапова и М.М.Херц'1, но разработанный совершенно независимо;

— методы описания текстов как ценозов посредством модели простых чисел и пойнтер-точки Б.И.Кудрина3, сложившиеся внутри ценологического подхода;

— методика Г.Я.Мартыненко, с выделением в структуре неоднородной совокупности ядра и периферии6;

— принцип максимума диссимметрии Ю.А.Шрейдера-М.В.Арапова , ориентированный на целостность структуры объекта;

— методика В.П.Маслова8, направленная на улучшение аппроксимации эмпирических данных распределением Ципфа, принятым в качестве эталонного;

1 Было принято решение ro Введении обозначить рассматриваемые «модели», имеющие разный методологический статус (подход, метод, методика, модель), под общим названием «средство». Там. где каждое из средств рассматривается отдельно, оно именуется так, как это делает его автор.

Похожие диссертационные работы по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК

Список литературы диссертационного исследования кандидат наук Ковригина, Любовь Юрьевна, 2014 год

Список литературы

1. Автоматизированный отбор лексики для информационно-поисковых тезаурусов / Г. А. Негуляев, Ю. J1. Покрас, J1. И. Колесников // Научно-техническая информация. Сер. 2. — 1973. — № 2. С. 8—21.

2. Александров И.А. Некоторые типы негауссовых совокупностей случайных чисел и генерирование их на ЦВМ / И. А. Александров // Труды акустического института / Акустический ин-т. — 1971. — Вып. 16. — С. 103—108.

3. Алексеев П.М. Серийные учебные частотные словари / П.М.Алексеев // Структурная и прикладная лингвистика: Межвузовский сб. / Под ред. А.С.Герда. Вып.5. — СПб.: Изд-во Санкт-Петербургского ун-та, 1998. — С. 140—151.

4. Алексеев П.М. Частотный словарь Ветхого Завета / П.М.Алексеев // Структурная и прикладная лингвистика. Вып. 6. — СПб.: Изд-во Санкт-Петербургского гос. ун-та, 2004. — С. 223—237.

5. Алексеев П. М. О ранговых распределениях в квантитативной типологии текста / П. М. Алексеев / Тартус. гос. ун-т // Квантитативная лингвистика и автоматический анализ текстов. — 1987. — С. 3—14. — (Ученые записки / Тартус. гос. ун-т ; вып. 774).

6. Алексеев П. М. Квантитативная типология текста : Учеб. пособие к спецкурсу / П. М. Алексеев. — Л. : ЛГПИ, 1988. — 76 с.

7. АОТ: автоматическая обработка текста : [сайт] / А. В. Сокирко [и др.]. -М., [2002-2012]. — URL: http://www.aot.ru (дата обращения 27.10.2013).

8. Арапов М. В., Херц М. М. Математические методы в исторической лингвистике. / М. В. Арапов, М. М. Херц. — М. : Наука. — 1974. — 167, [1] с.

9. Арапов М. В., Шрейдер Ю. А. Закон Ципфа и принцип диссимметрии системы / М. В. Арапов, Ю. А. Шрейдер // Семиотика и информатика. — 1978. — Вып. 10. — С. 74—95.

Ю.Арапов М. В., Шрейдер Ю. А. Классификации и ранговые распределения / М. В. Арапов, Ю. А. Шрейдер // Научно-техническая информация. Сер. 2. — 1977. -№.11-12. — С. 15—21.

11.Арапов М. В. Квантитативная лингвистика / М. В. Арапов. — М. : Наука. — 1988,— 184 с.

12. Арапов М. В. О смысле ранговых распределений / М.В.Арапов, Е. Н. Ефимова, Ю. А. Шрейдер // Научно-техническая информация. Сер. 2. — 1975. — № 1. — С. 9—20.

И.Арапов М. В. Ранговые распределения в тексте и языке / М. В. Арапов, Е. Н. Ефимова, Ю. А. Шреидер // Научно-техническая информация. Сер. 2. — 1975. — №2.— С. 3—7.

14. Арапов М. В., Херц М. М. Изменение словаря во времени (опыт теории) / М. В. Арапов, М. М. Херц // Информационные вопросы семиотики, лингвистики и автоматического перевода. — 1972. — Вып. 3. — С. 3—85.

15.Басина Г. И., Басин М. А. Синергетика. Эволюция и ритмы человечества [Электронный ресурс] / М. А. Басин, Г. И. Басина. — [2003]. — 1ЖЬ: http://314159.ru/basin/basinl00.htm (дата обращения 19.05.2013).

16.Бахтин М. М. Вопросы литературы и эстетики : Исследования разных лет / М. М. Бахтин. — М. : Худож. литература, 1975. — 502 с.

17.Бешелев С. Д., Гурвнч Ф. Г. Математико-статистические методы экспертных оценок / С. Д. Бешелев, Ф. Г. Гурвич. — М. : Статистика, 1980. — 263, [1] с.

18.Бешелев С. Д., Гурвич Ф. Г. Экспертные оценки / С. Д. Бешелев, Ф. Г. Гурвич. — М. : Наука, 1973. — 159, [1] с.

19.Божков М. И., Пущин С. Л. Алгоритм вычисления параметров гиперболического //-распределения / М. И. Божков, С. Л. Пущин // Ценологпческие исследования / Технетика. — 2012. — Вып. 46 : Специфика ценологических представлений разных школ. — С. 99—101.

20.Бондалетов В. Д. Стилистика русского языка : учеб. пособие / В. Д. Бондалетов. — Л. : Просвещение, 1989. — 286 с.

21.Бородкин Л. И. Количественные методы в исторических исследованиях : учеб. пособие / Л. И. Бородкин, И. Д. Ковальченко, Т. Ф. Изместьева ; под. ред. И. Д. Ковальченко. — М. : Высшая школа, 1984. — 384 с.

22.Будагов Р. А. Определяет ли принцип экономии развитие и функционирование языка? / Р. А. Будагов // Вопросы языкознания.— 1972. — № 1. — С. 17—36.

23.Бычков В. Н. Построение, обоснование и интерпретация базисных лпнгвостатистических моделей : (На материале отраслевых частотных словарей) : автореф. дисс. ... канд. филол. наук : 10.02.21 / Бычков Валерий Николаевич. — Л., 1986. — 16 с.

24.Винер Н. Кибернетика, или управление и связь в животном и машине / Н. Винер. — М. : Советское радио, 1968. — 326 с.

25.Виролайнен М.Н. Четыре типа русской словесной культуры (Исторические трансформации) : автореф. дисс. ... д. филол. наук : 10.01.01 / Виролайнен Мария Наумовна. — СПб, 2005. — 39, [1] с.

26.Воронцов К. В. Слабая вероятностная аксиоматика и надежность эмпирических предсказаний / К. В. Воронцов // Математические методы распознавания образов-13. — М. : МАКС-Пресс, 2007. — С.21—25.

Вып. 19 : Философские основания технетики. — М., 2002. — 628 с.

27.Герд А. С. Эталонные типы морфологических парадигм древнеславянских текстов / А. С. Герд // Квантитативная лингвистика и автоматический анализ текстов. — 1987. — С. 55—72. — (Ученые записки / Тартус. гос. ун-т ; вып. 774).

28.Гете И.-В. Избранные сочинения по естествознанию / И.-В. Гете. — М. : Изд-во АН СССР, 1957. — 553, [1] с.

29.Гнатюк В. И. Закон оптимального построения техноценозов / В. И. Гнатюк // Ценологические исследования / Технетика. — 2005. — Вып. 29. — 384 с.

30.Гнеденко Б. В. Курс теории вероятностей : Учебник / Б. В. Гнеденко. — М. : Наука, 1988.—448 с.

31.Гнеденко Б. В., Хинчин А. Я. Элементарное ввердение в теорию вероятностей / Б. В. Гнеденко, А. Я. Хинчин. — М. : Наука, 1970. — 168 с.

32.Гребенников А. О. Исследование устойчивости лексико-статистических характеристик текста : автореф. дисс. ... канд. филол. наук : 10.02.21 / Гребенников Александр Олегович. — СПб., 1998. — 26 с.

33.Гринбаум О. Н. Роман A.C. Пушкина «Евгений Онегин»: ритмико-смысловой комментарий. Главы первая, вторая, третья: учеб. пособие / О. Н. Гринбаум. — СПб., 2010. — 228 с.

34.Гринбаум О. Н., Мартыненко Г. Я. Русский сонет и "золотая пропорция" ритма / О. Н. Гринбаум, Г. Я. Мартыненко. — СПб., 1999. — 160 с.

35.Демкова Н. С. Заимствования из «Задонщины» в текстах Распространенной редакции «Сказания о Мамаевом побоище» / Н. С. Демкова // «Слово» и памятники. — С. 440—476.

36.Дмитриев JI. А. Сказания и повести о Куликовской битве / Л. А. Дмитриев. — Л., 1982. — 422 с.

37.Доманский Ю.В. Вариативность и интерпретация текста (парадигма неклассической художественности): автореф. дис. ... д. филол. наук : 10.01.08 / Доманский Юрий Викторович. — М., 2006. — 43 с.

38.Жерихин В.В. Избранные труды по палеоэкологии и филоценогенетике / В. В. Жерихин. — М. : Товарищество науч. изд. КМК, 2003. — VI, 542 с.

39.3асорина Л.Н. Частотный словарь русского языка : Около 40000 слов. / Л.Н.Засорина. — М.: Рус. яз., 1977. — 935 с.

40.Захаров В. П. Корпусная лингвистика: учебно-методическое пособие / В. П. Захаров. — СПб. : Изд-во Санкт-Петербургского гос. ун-та, 2005. — 48 с.

41.Зубов A.B. Учебные частотные словари в системе компьютерною обучения. Статистическая лексикография и учебный процесс. / А.В.Зубов // Сб. науч. тр. Отв. Ред. В. И. Перебейнос. — Киев: КГПИИЯ, 1990. — С. 18—26.

42.Карский Е. Ф. Славянская кирилловская палеография / Е. Ф. Карский. — Л. : Изд-во АН СССР, 1928. — 491, [1] с.

43.Квантитативная лингвистика и автоматический анализ текстов. — 1989. — 171, [1] с. — (Ученые записки / Тартус. гос. ун-т ; вып. 628).

44.Кириллин В. М. Таинственная поэтика «Сказания о Мамаевом побоище» / В. М. Кириллин. — М., 2007. — 98 с.

45.Клейн Л. С. Археологическая типология / Л. С. Клейн. — Л. : ЛФ ЦЭНДИСИ, 1991,—447, [1] с.

46.Клепиков С. А. Филиграни и штемпели на бумаге русского и иностранного производства XVII-XX века / С. А. Клепиков. — М. : Изд-во Всесоюзной книжной палаты, 1959. — 306 с.

47.Клосс Б. M. Никоновский свод и русские летописи XVI-XVÍI веков / Б. М. Клосс. — М., 1980. — 312 с.

48.Кобрин Р.Ю. Дингвостатистический анализ терминологических систем / Р. Ю. Кобрин // Вычислительная лингвистика. М., 1976. — С. 144—158.

49.Коваль С. А. Лингвистические проблемы компьютерной морфологии / С. А. Коваль. — СПб. : Изд-во Санкт-Петербургского гос. ун-та, 2005. — 150 с.

50.Ковригина Л. Ю. К вопросу: описывается ли структура поликомпонентного объекта одним или несколькими распределениями? / Л.Ю.Ковригина // Ценологическне исследования. — 2012. — Вып. 46 : Специфика ценологических представлений разных школ. — С. 203—210.

51.Ковригина Л. ТО., Чебанов C.B. Предельность //-распределений [Электронный ресурс] : Доклад на семинаре по ценологическим исследованиям 09.11.12 г. — [2012]. — URL: http://iskri.ru/q/Misc/index.htm (дата обращения 19.08.2013).

52.Ковригина Л. Ю. Применение лингвопроцессора NooJ для морфологической разметки вариативного текста (на примере «Сказания о Мамаевом побоище») / Л. Ю. Ковригина // Вестник СПбГУ. Серия 9. — 2014. — № 1. — С. 161 — 166.

53.Козлова Т. В. Художественное проектирование костюма / Т. В. Козлова. — М. : Лег. и пищ. промышленность, 1982. — 143, [1] с.

54.Колесов В. В. Введение в историческую фонологию / В. В. Колесов. — Л. : Изд-во Ленингр. ун-та, 1982. — 120 с.

55.Колесов В. В. История русского языка / В. В. Колесов. — М. : Academia ; СПб. : Филологический факультет Санкт-Петербургского гос. ун-та, 2005. — 669, [1]с.

56.Колесов В. В. Русская историческая фонология / В. В. Колесов. — СПб. : Изд-во Санкт-Петербургского гос. ун-та, 2008. — 398, [1] с.

57.Количественные методы в исторических исследованиях : Учебное пособие для вузов / Гарскова И. М., Изместьева Т. Ф., Милов Л. В. и др. ; под ред. И. Д. Ковальченко. — М. : Высшая школа, 1984. — 384 с.

58.Колмогоров А. Н. Теория информации и теория алгоритмов /

A. Н. Колмогоров. — М. : Наука, 1987. — 304 с.

59.Корпус как язык: от масштабируемости к дифференциальной полноте /

B.И.Беликов, Н.Ю.Копылов, А.Ч.Пиперски, В.П.Селегей, С.А.Шаров // Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной международной конференции Диалог-2013. — Т. 1. — Вып. 12 (19). —М., 2013. — С. 84—95.

60.Кромер В. В. Ранговые полисемические распределения в синхронии и диахронии / В. В. Кромер // Квантитативная лингвистика и семантика: Сб. науч. тр. — Новосибирск: Изд-во НГПУ, 2001. — Вып. 3. — С. 25—33.

61.Кромер Виктор Вильгельмович : [сайт] / В. В. Кромер. — [2009-2013]. — URL: http://kromer.newmail.ru/ (дата обращения 19.05.2013).

62.Крылов Ю. К. Вероятностно-статистические модели синергетизма / Ю.К.Крылов // Ценологическне исследования. Вып. 1-2. Математическое

описание ценозов и закономерности технетики. — М.-Абакан, 1996. — С. 110—142.

63.Крылов 10. К. Об одной парадигме лингвостатистических распределений / Ю. К. Крылов // Квантитативная лингвистика и автоматический анализ текстов.

— 1982. — С. 81 —102. — (Ученые записки / Тартус. гос. ун-т ; вып. 628).

64.Крылов Ю. К. Стационарная модель порождения связного текста / Ю. К. Крылов // Квантитативная лингвистика и автоматический анализ текстов.

— 1987. — С. 81—102. — (Ученые записки / Тартус. гос. ун-т ; вып. 774).

65.Кудрин Б. И. Лекция «Моделирование //-распределения простыми

числами и пойнтер-точка /?» [Электронный ресурс]. — [20--?]. — URL:

http://www.kudrinbi.ru/public/10782/index.htm (дата обращения 15.05.2013).

66.Кудрин Б. И. Лекция «Негауссовость гиперболических Н-

распределений» [Электронный ресурс]. — [20--?]. — URL:

http://www.kudrinbi.ru/public/10780/index.htm (дата обращения 15.05.2013).

67.Кудрин Б. И. Математика ценозов: видовое, ранговое, ранговое по параметру гиперболические //-распределения и законы Лотки, Ципфа, Парето, Мандельброта / Б. И. Кудрин // Ценологические исследования / Технетика. — 2002. — Вып. 19 : Философские основания технетики. — С. 357—412.

68.Кудрин Б. И. Мои семь отличий от Ципфа / Б. И. Кудрин // Общая и прикладная ценология. — 2007. — № 4. — С. 25—33.

69.Кудрин Б. И. Некоторые итоги становления и развития ценологической

теории [Электронный ресурс]. — [20--?]. — URL:

http://kudrinbi.ru/modules.php?name=Biblio&&Authors=10 (дата обращения 15.05.2013).

70.Кудрин Б. И. Онтология и гносеология ценозов и их структурная устойчивость / Б. И. Кудрин // Ценологические исследования / Центр системных исследований. — 1996. — Вып. 1-2 : Математическое описание ценозов и закономерности технетики. — С. 8—32.

71.Кудрин Б. И. Распределение электрических машин по повторяемости как некоторая закономерность // Электрификация металлургических предприятий Сибири. — 1974. — Вып. 2. — С. 31—40.

72.Кудрин Б. И. Два открытия: явление инвариантности структуры техноценозов и закон информационного отбора / Б. И. Кудрин // Ценологические исследования. — 2009. — Вып. 44. — 82 с.

73.Кузнецова Н. Г. О негауссовом характере распределений сильных флюктуаций поля // Акустический журнал / АН СССР. — 1972. — Т. 18. — Вып. 2.

— С. 323—324.

74.Левич А. П. Структура экологических сообществ / А. П. Левич. — М. : Изд-во Московского гос. ун-та, 1980. — 181, [1] с.

75.Левич А. П. Феноменология, применение и происхождение ранговых распределений в биоценозах и экологии как источник идей для техноценозов и

экономики [Электронный ресурс]. — [20--?]. — URL:

http://www.chronos. msu.ru/RREPORTS/levich_fenomenologiya/levich_fenomenologiy a.htm (дата обращения 15.05.2013).

76.Лихачев Д. С. Текстология. На материале русской литературы X-XVII в. / Д. С. Лихачев при участии А. А. Алексеева и А. Г. Боброва. — М., 2001. — 758 с.

77.Ляшевская О.Н., Шаров С.А. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка) / О.Н.Ляшевская, С.А.Шаров. — М.: Азбуковник, 2009. — 1087 с.

78.Мандельброт Б. Фрактальная геометрия природы / Б. Мандельброт. — М.-Ижевск : Ижевский институт компьютерных исследований, НИЦ «Регулярная и хаотическая динамика», 2010. — 656 с.

79.Мартыненко Г. Я. Введение в теорию числовой гармонии текста. / Г. Я. Мартыненко. — СПб. : Изд-во Санкт-Петербургского гос. ун-та, 2009. — 252 с.

80.Мартыненко Г. Я. Некоторые закономерности концентрации и рассеяния элементов в лингвистических и других сложных системах / Г. Я. Мартыненко // Структурная и прикладная лингвистика. — 1978. — Вып. 1. — С. 63—80.

81 .Мартыненко Г. Я. О статистических характеристиках ранговых распределений / Г. Я. Мартыненко // Квантитативная лингвистика и автоматический анализ текста. — 1989. — С. 50—68. — (Ученые записки / Тартус. гос. ун-т ; вып. 872).

82.Мартыненко Г. Я. Основы стилеметрии / Г. Я. Мартыненко. — Л. : Изд-во Санкт-Петербургского ун-та, 1988. — 17, [1] с.

83.Мартыненко Г. Я. Неоднородность ценотических распределений / Г. Я. Мартыненко // Общая и прикладная ценология. — № 4. — 2007. С. 33—40.

84.Мартыненко Г. Я., Чебанов С. В. Основные типы представлений о структуре языка / Г. Я. Мартыненко, С. В. Чебанов // Lingüistica. Исследования по общему и структурному языкознанию. — 1990. —Вып. 911. — С. 112—133.

85.Марусенко М.А. Атрибуция анонимных и псевдонимных литературных произведений методами распознавания образов / М.А.Марусенко. — Л. : Изд-во Ленингр. ун-та, 1990. — 164 с.

86.Марусенко М. А. Коэффициент статистической устойчивости как критерий отбора учебного материала / М. А. Марусенко // Материалы семинара «Статистическая оптимизация преподавания языков и инженерная лингвистика». Чимкент, 1980. — С. 253—254.

87.Маслов В. П. Закон «отсутствия предпочтения» и соответствующие распределения в частотной теории вероятностей / В. П. Маслов // Математические заметки. — 2006. — Т. 80. — Вып. 2. — С. 220—230.

88.Маслов В. П., Маслова Т. В. О законе Ципфа и ранговых распределениях в лингвистике и семиотике / В. П. Маслов, Т. В. Маслова // Математические заметки. — 2006. — Т. 80. — Вып. 5. — С. 718—732.

89.Маслова Т. В. Об уточнении закона Ципфа для частотных словарей / Т. В. Маслова // Научно-техническая информация. Сер. 2. — 2006. — № 11. — С. 37—44.

90. Математические методы и ЭВМ в историко-типологических исследованиях / под ред. И. Д. Ковальченко. — М. : Наука, 1989. — 272 с.

91.Мейен C.B. Морфология растений в номотетическом аспекте / С. В. Мейен // In memoriam. С. В. Мейен: палеоботаник, эволюционист, мыслитель. М. : ГЕОС, 2007. — С. 162—233.

92.Мейен С. В. Олигомеризация и полимеризация в эволюции древнейших растений / С. В. Мейен // Значение процессов полимеризации и олигомеризации в эволюции. Л. : Зоологический ин-т АН СССР, 1977.

93.Мейен С. В. Основные аспекты типологии организмов / С.В.Мейен // Журнал общей биологии. — 1978. — Т. 39. —№ 4. — С. 495—508.

94.Мейен С. В., Налимов В. В. Вероятностный мир и вероятностный язык / С. В. Мейен, В. В. Налимов // Химия и жизнь. — 1979. — № 6. — С. 22—27.

95.Мейен С. В., Шрейдер Ю. А. Методологические аспекты теории классификации / С. В. Мейен, Ю. А. Шрейдер // Вопросы философии. — 1976. — № 12. — С. 67—79.

96.Мелихов В. М. Вновь найденный текст «Сказания о Мамаевом воинстве» / В. М. Мелихов // Литература Древней Руси. Источниковедение. — 1988. — С. 26—38.

97.Методы количественного анализа нарративных источников : сб. ст. / отв. ред. Б. М. Клосс. — М. : Ин-т истории АН СССР, 1983. — 132 с.

98.Налимов В. В. Вероятностная модель языка : о соотношении естеств. и искусств, языков / В. В. Налимов. — 2-е изд., перераб. и доп. — М. : Наука, 1979. -30,[1]с.

99.Налимов В. В. Непрерывность против дискретности в языке и мышлении / В. В. Налимов. — Тбилиси : Изд-во Тбил. ун-та, 1978. — 8, [1] с.

100. Налимов В. В. Спонтанность сознания: Вероятностная теория смыслов и смысловая архитектоника личности / В. В. Налимов. — М. : Прометей, 1989. — 287, [1] с.

101. Научные коммуникации и информатика / А.И.Михайлов, А. И. Черный, Р. С. Гиляревский. — М. : Наука, 1976. — 458 с.

102. Нечунаева H.A. Языковые разночтения в древнерусских списках майской минеи / Н. А. Нечунаева // Функционирование языковых единиц и категорий / под ред. А. Я. Баудера. — Таллинн : ТПУ, 1986. — С. 75-81.

103. Олескин А. В. Сетевые структуры в биосистемах и человеческом обществе / А. В. Олескин. — М. : Книжный дом «ЛИБРОКОМ», 2012. — 30, [1] с.

104. Орлов Ю. К. Динамика ранговых распределений и проблемы статистики редких событий. / Ю. К. Орлов // Ценологические исследования / Центр системных исследований. — Вып. 1-2 : Математическое описание ценозов и закономерности технетики. — 1996. — С. 79—93.

105. Орлов Ю. К. О статистической структуре сообщений, оптимальных для человеческого восприятия / Ю. К. Орлов // Научно-техническая информация. Сер. 2. — 1970. — № 8. — С. 11—16.

106. Орлов Ю. К. Обобщенный закон Ципфа-Мандельброта и частотные структуры информационных единиц разных уровней / Ю. К. Орлов // Сообщения АН Грузинской ССР. — 1970. — Вып. 57. — № 1. — С. 37—40.

107. Орлов Ю.К. Модель частотной структуры лексики / Ю.К.Орлов // Исследования в области вычислительной лингвистики и лингвостатистики. М. : Изд-во Московского ун-та, 1978. — С. 59—118.

108. Основы информатики / А.И.Михайлов, А. И. Черный, Р. С. Гиляревский. — М. : Наука, 1968. — 756 с.

109. Основы теории проектирования костюма. Конспект лекций / Т. В. Козлова, Р. А. Степучев, Л. Б. Рытвинская, Г. И. Петушкова. — М. : Легпромбытиздат, 1980. — 6, [1] с.

110. Петров А. Е. «Александрия сербская» и «Сказание о Мамаевом побоище» / А. Е. Петров // Древняя Русь. Вопросы медиевистики. — 2005. — № 2 (20). — С. 54—64.

111. Петров Т. Г. Метод RHA как решение проблемы систематизации аналитических данных о вещественном составе геологических объектов. / Т. Г. Петров // Отечественная геология. — 2008. — № 4. — С. 98—105.

112. Петров Т. Г., Краснова Н. И. /?-словарь-каталог химических составов минералов / Т. Г. Петров, Н. И. Краснова. — СПб. : Наука, 2010. — 150 с.

113. Петров Т. Г. Информационный язык для описания составов многокомпонентных объектов / Т. Г. Петров // Научно-техническая информация. Сер. 2. — 2001. — № 3. — С. 8—18.

114. Петров Т. Г. Обоснование варианта общей классификации геохимических систем. / Т. Г. Петров // Вестник Ленинградского гос. ун-та. — 1971. — № 18. — Вып 3. — С. 30—38.

115. Петров Т. Г., Фарафонова О. И. Информационно-компонентный анализ. Метод RHA: учеб. пособие / Т.Г.Петров, О. И. Фарафонова. — СПб. : НИИЗК Санкт-Петербургского гос. ун-та, 2005. — 165, [1] с.

116. Пиотровский Р. Г. Лингвостатистический эффект Бектаева / Р. Г. Пиотровский // Материалы семинара «Статистическая оптимизация преподавания языков и инженерная лингвистика». Чимкент, 1980. С. 25—26.

117. Пиотровский Р. Г. Математическая лингвистика : учеб. пособие для пед. ин-тов / Р. Г. Пиотровский, К. Б. Бектаев, А. А. Пиотровская. — М. : Высшая школа, 1977. — 382 с.

1 18. Плахотя В. В., Чебанов С. В. Лингвостатистические последствия орфографической реформы 1918 г. / В. В. Плахотя, С. В. Чебанов // Структурная и прикладная лингвистика. — 2010. — Вып. 8. — С. 60—90.

119. Плохинский Н. А. Биометрия / Н. А. Плохинский. — 2-е изд. — М.: Изд-во Московского гос. ун-та им. М. В. Ломоносова, 1970. — 36, [1] с.

120. Повести о Куликовской битве / Изд. подгот. М. Н. Тихомиров, В. Ф. Ржига, Л. А. Дмитриев. — М., 1959. — 51, [1] с.

121. Поддубный В. В., Поликарпов А. А. Диссипативная стохастическая динамическая модель развития языковых знаков / В. В Поддубный, А. А. Поликарпов // Компьютерные исследования и моделирование. — 2011. — Т. 3, —№2. — С. 103—124.

122. Полани М. Личностное знание: На пути к посткритической философии / М. Полани. — М.: Прогресс, 1985. — 344 с.

123. Пропп В. Я. Морфология волшебной сказки / В.Я.Пропп. — М. Лабиринт, 2003. — 143, [1] с.

124. Пущин С. Л. Сравнительный анализ структуры потребления электроэнергии двух территориальных районов Северо-Запада РФ [рукопись] : дипломный проект / ФГОУ ВПО Национальный минерально-сырьевой ун-т «Горный» / С. Л. Пущин. — СПб., 2012. — 117 с.

125. Разметка корпуса древнерусских текстов / Е. Л. Алексеева, А. М. Лаврентьев, И. В. Азарова, Л. А. Захарова // Труды международной конференции «Корпусная лингвистика-2004», 11-14 октября 2004 г., Санкт-Петербург = Proceedings of the international conference «Corpus linguistics - 2004», October 11-14, 2004, St. Petersburg. — СПб : Изд-во Санкт-Петербургского гос. унта, 2004. — С. 16—24.

126. Раутиан А. С., Жерихин В. В. Модели филоценогенеза и уроки экологических кризисов геологического прошлого / А. С. Раутиан, В. В. Жерихин // Журнал общей биологии. — 1997. — Т. 58. — № 4. — С.20—47.

127. Руссо Г. В., Чебанов С. В. Основные понятия кристалломорфологии в системе кристаллографических и морфологических дисциплин / Г. В. Руссо, С. В. Чебанов // Физика кристаллизации. — 1985. — Вып. 8. — С. 113—123.

128. Руссо Г. В., Чебанов С. В. Примеси в особо чистых веществах: общеморфологические аспекты / Г. В. Руссо, С. В. Чебанов // Физика кристаллизации. — 1987. — Вып. 10. — С. 92—97.

129. Савостьянов Г. А. Основы структурной гистологии. Пространственная организация эпителиев / Г. А. Савостьянов. — СПб. : Наука, 2005. — 374 с.

130. Сайт профессора Кудрина: ценология, технетика, электрика : [сайт] / Б.И.Кудрин [и др.]. — [2001-2013]. — URL: http://kudrinbi.ru (дата обращения 30.08.2013).

131. СКАТ : Санкт-Петербургский корпус агиографических текстов : [сайт] / Кафедра матем. лингвистики С.-Петербургского гос. ун-та. — [200 —?-2012]. — URL: http://project.phil. spbu.ru/scat/page.php?page=project (дата обращения 19.05.2013).

132. Словарь русского языка XI-XVII вв. / АН СССР, Рос. акад. наук. — Вып. 1 (1975)- . — Вып. 1 -29. — М., 1975-2011.

133. Сппвак Д. Л. Измененные состояния сознания: психология и лингвистика / Д. Л. Спивак. — СПб.: «Издательский Дом Ювента»; Филологический факультет СПбГУ, 2000. — 296 с.

134. Спивак Д. Л. Лингвистика измененных состояний сознания / Д. Л. Сппвак. — Л.: Наука, 1986. — 92 с.

135. Спивак Д. Л. Матричные построения в стиле «плетения словес» / Д. Л. Спивак // Труды отдела древнерусской литературы. — СПб., 1996. — Т. 49. — С. 99—111.

136. Срезневский И. И. Материалы для словаря древнерусского языка по письменным памятникам : в 3 т. / И. И. Срезневский. Репр. воспроизведение изд. 1903-1912 гг. — [М. : ГИС, 1938].

Т.1 : А-К. — 1893 ; Т. 2 : Л-П. — 1903 ; Т. 3 : Р-П и дополнения А-Я. —

137. Творогов O.B. Лексический состав «Повести временных лет» : (Словоуказатели и частот, словник) / О.В.Творогов. — Киев : Наукова думка, 1984. — 218 с.

138. Ткачев Ю. А., Юдович Я. Э. Статистическая обработка геохимических данных / Ю. А. Ткачев, Я. Э. Юдович. — Л. : Наука, 1975. — 233 с.

139. Трубников Б. А. Распределение конкурентов / Б.А.Трубников // Ценологические исследования / Центр системных исследований. — 1996. — Вып. 1-2: Математическое описание ценозов и закономерности технетики. — С. 33—42.

140. Труды международной конференции «Корпусная лингвистика -2011», 27-29 июня 2011 г., Санкт-Петербург = Proceeding of the international conference «Corpus linguistics - 2011». — Санкт-Петербург : Филологический факультет Санкт-Петербургского гос. ун-та, 2011. — 347, [1] с.

141. Тулдава Ю. А. О частотном спектре лексики текста / Ю. А. Тулдава // Квантитативная лингвистика и автоматический анализ текстов. — 1986. — С. 139—162. — (Ученые записки / Тартус. гос. ун-т ; вып. 745).

142. Тулдава ТО. А. Проблемы и методы квантитативно-системного исследования лексики / Ю. А. Тулдава. — Таллин : Валгус, 1987. — 203, [1] с.

143. Филиппов К.А. Лингвистика текста : Курс лекций./ К.А.Филиппов. — СПб, Изд-во Санкт-Петербургского гос. ун-та, 2003. — 333,[1] с.

144. Фрумкина Р. М. Статистические методы изучения лексики / Р. М. Фрумкина. — М. : Наука, 1964. — 115, [1] с.

145. Фуфаев Владимир Валентинович. Структурно-топологический анализ. Общая теория ценозов: [сайт]. — URL: http://fufaevvv.ru (дата обращения 15.05.2013).

146. Фуфаев В. В. Общеценологический метод структурно-топологического анализа самоорганизующихся систем / В. В. Фуфаев // Общая и прикладная ценология. — 2007. — № 3. — С. 23—32.

147. Фуфаев В. В. Основы теории динамики структуры техноценозов / В. В. Фуфаев // Ценологические исследования / Центр системных исследований. — 1996. — Вып. 1-2: Математическое описание ценозов и закономерности технетики. — С. 156—193.

148. Фуфаев В. В. Структурно-топологическая самоорганизация S-распределений электропотребления техноценозов на примерах организаций региона, предприятий отрасли и регионов России / В. В. Фуфаев // Междисциплинарность ценологических исследований. Ценологические исследования. — 2010. — Вып 43. — С. 14—26.

149. Фуфаев В. В. Структурно-топологический анализ динамики сообщества банков России в условиях финансового кризиса / В. В. Фуфаев // Технетика и ценология: от теории к практике. Ценологические исследования. — 2009. — Вып. 35. — С. 139—146 ; То же [Электронный ресурс]. — [2009]. — URL: http://fufaevvv.ru/index.php?option=com_content&view=articIe&id=6&Itemid=7 (дата обращения 19.05.2013)

150. Фуфаев В. В. Ценологическое определение параметров электропотребления, надежности, монтажа и ремонта электрооборудования

предприятий региона / В. В. Фуфаев. — М. : Центр системных исследований, 2000. — 320 с.

151. Фуфаев В. В. Структурно-топологическая устойчивость динамики ценозов / В. В. Фуфаев // Кибернетические системы ценозов: синтез и управление : Междисциплинарный семинар «Кибернетические проблемы биологии». IX чтения памяти А. А. Ляпунова : сб. ст. / Московское общ-во испытателей природы. — М. : Наука, 1991. — С. 18—26.

152. Фуфаев В. В., Фуфаева Л. Д. Каноническая модель структурно-топологической динамики Я-распределения / В. В. Фуфаев, Л. Д. Фуфаева // XI сессия Всесоюзного научного семинара «Кибернетика электрических систем». — 1989. — С. 42.

153. Хайтун С. Д. Негауссовость социальных явлений / С.Д.Хайтун // Социологические исследования. — 1983. — №1. — С. 144—152.

154. Хайтун С. Д. Негауссовость социальных явлений и эволюция / С. Д. Хайтун // Электрификация металлургических предприятий Сибири. — 2005.

— Вып. 12.— С. 291—300.

155. Хайтун С. Д. Феномен негауссовости социальных явлений

[Электронный ресурс]. — [20--?]. — URL:

http://kudrinbi.ru/public/481/index.htm (дата обращения 19.09.2013).

156. Ценологические исследования : сб. науч. тр. / под ред. Б. И. Кудрина.

— Вып. 1-2 (1996)—. — М. : Технетика, 2002.

157. Ценологические исследования распределений простых чисел (30-летие открытия) / под. ред. В. В. Фуфаева. — М.-Абакан : Центр системных исследований, 2004. — 144 с.

158. Ценологический ранговый анализ в электрике / Б.И.Кудрин, О. Е. Лагуткин, М. Г. Ошурков // Ценологические исследования / Технетика. — 2008. — Вып. 40. — 116 с.

159. Чайковский Ю. В. Активный связный мир. Опыт теории эволюции жизни / Ю. В. Чайковский. — М. : Товарищество научных изданий КМК, 2008. — 726 с.

160. Частотный словарь рассказов А.И.Куприна. Авторы-составители А.О.Гребенников, Н.А.Данилова; Под ред. Г.Я.Мартыненко. — СПб.: Изд-во Санкт-Петербургского гос. ун-та, 2006. — 552 с.

161. Частотный словарь рассказов А.П.Чехова /С.-Петерб. гос. ун-т; [Авт.-сост. А.О.Гребенников]; Под ред. Г.Я.Мартыненко. — СПб. : Изд-во Санкт-Петербургского гос. ун-та, 1999. — 171,[1] с.

162. Частотный словарь рассказов И.А.Бунина /С.-Петерб. гос. ун-т; [авт.-сост.: А.О.Гребенников науч. ред.: Г.Я.Мартыненко]. — СПб, Изд-во Санкт-Петербургского гос. ун-та, 2011 (макет 2012). — 294, [1] с.

163. Частотный словарь романа Л.Н. Толстого «Война и мир» /[Сост. З.Н. Великодворская, Г.С.Галкина, Г.Б.Куперман, В.М.Цапникова]. — Тула : Тул. ГПИ, 1978. — 380 с.

164. Чебанов С. В. Концепции ранговых распределений: консенсусный анализ / С. В. Чебанов // Специфика ценологических представлений разных школ. Ценологические исследования. — 2012. — Вып. 46.— С. 72—85.

165. Чебанов С. В. Концепция рефрена / С. В. Чебанов // Палеофлористнка и стратиграфия фанерозоя. М. : Геологический институт АН СССР. — 1989. — С. 120—122.

166. Чебанов С. В. О стиле организмов / С. В. Чебанов // Структурная и прикладная лингвистика. — 2004. — Вып.6. — С. 38—71.

167. Чебанов С. В. Оптимальность и экстремальность в культуре, ципфиада и закон Лотмана / С. В. Чебанов // Техногенная самоорганизация и математический аппарат ценологических исследований. Ценологическне исследования. — 2005. — Вып. 28 : Техногенная самоорганизация и математический аппарат ценологических исследований. — С. 411—428.

168. Чебанов С. В. Представления о форме в естествознании и основания общей морфологии / С. В. Чебанов // Orgaanilise vormi teoría. X teoreetilise bioloogia kevadkool. Tartu. Tartu Riiklik Ulikool. — 1984. — C. 25—40.

169. Чебанов С. В. Принцип адаптивности и «экстремальные» условия / С. В. Чебанов // Гомологии в ботанике: Опыт и рефлексия. Труды IX школы по теоретической морфологии растений «Типы сходства и принципы гомологизации в морфологии растений», Санкт-Петербург, 31 января - 3 февраля 2001 г. — СПб. : Санкт-Петербургский союз ученых, 2001. — С. 81—99.

170. Чебанов С. В. Рефренность мира [Электронный ресурс] : Публичные лекции. / С. В. Чебанов. — [2009]. — URL: www.polit.ru/lectures/2009/l l/26/chebanov.html (дата обращения 15.05.2013).

171. Чебанов С. В. Святая Русь, И-цзин и ранговые распределения / С. В. Чебанов // Общая и прикладная ценология. 2007. — № 3. — С. 11 —13.

172. Чебанов С. В. Язык описания таксонов. Т. 2.: дис. ... канд. филол. наук : 10.02.21 / Чебанов Сергей Викторович. — Л., 1987. — 510 .

173. Чебанов С. В., Петров Т. Г. Язык-метод RH А для описания составов многокомпонентных объектов и процессов / С. В. Чебанов, Т. Г. Петров // Ценологическне исследования / Центр системных исследований. — Вып. 21 : Технетика и семиотика. — 2004. — С. 6—30.

174. Чижаковский В. А., Бектаев К. Б. Статистика речи, 1957-1985 : библиогр. указ. / В. А. Чижаковский, К. Б. Бектаев ; отв. ред. П. М. Алексеев. — Кишинев : Штиинца, 1986. — 109, [1] с.

175. Численко Л. Л. Структура фауны и флоры в связи с размерами организмов / Л. Л. Численко. — М. : Изд-во Московского гос. ун-та, 1981. — 206 с.

176. Чупров А. А. Очерки по теории статистики / А. А. Чупров. — М. : Госстатиздат, 1959. —443, [1] с.

177. Шайкевич А.Я., Андрющенко В.М., Ребецкая H.A. Статистический словарь языка Достоевского / А.Я.Шайкевич, В.М.Андрющенко, Н.А.Ребецкая. — М.: Яз. слав, культуры, 2003. — XLVIII, 832 с.

178. Шамбинаго С. К. Повести о Мамаевом побоище / С. К. Шамбинаго. — СПб. : тип. Акад. наук, 1906. — VIII, 376, 190 с.

179. Шахматов А. А. Отзыв о сочинении С.К.Шамбинаго: «Повести о Мамаевом побоище» (Отдельный оттиск из «Сборника Отделения русского языка

и словесности Академии наук», т.81), составленный акад. А.А.Шахматовым / А. А. Шахматов. — СПб. : тип. Акад. наук, 1910. — 126 с.

180. Шейнин О. Б. Теория вероятностей : Исторический очерк [Электронный ресурс] / О. Б. Шейнин. — URL: http://www.sheynin.de/download/modamo_Geschichte.pdf (дата обращения 15.05.2013).

181. Шелухин О. И., Беляков И. В. Негауссовские процессы / О. И. Шелухин, И. В. Беляков. — СПб. : Политехника, 1992. — 311, [1] с.

182. Шеннон К. Э. Работы по теории информации и кибернетике / К. Э. Шеннон. — М. : Изд-во иностранной литературы, 1963. — 829, [1] с.

183. Шрейдер Ю. А. О возможности теоретического вывода статистических закономерностей текста. (К обоснованию закона Ципфа) / Ю. А. Шрейдер // Проблемы передачи информации. — 1967. — T.III. — Вып. 1. — С. 57—63

184. Шрейдер Ю. А. Ранговые распределения как системное свойств / Ю. А. Шрейдер // Ценологические исследования / Центр системных исследований. — 1996. — Вып. 1-2 : Математическое описание ценозов и закономерности техники. — С. 34—42.

185. Шрейдер Ю. А. Теория множеств и теория систем / Ю. А. Шрейдер // Системные исследования: Ежегодник, 1977. М. : Наука, 1978. — С. 149—165.

186. Шрейдер Ю. А., Шаров А. А. Системы и модели / Ю. А. Шрейдер,

A. А. Шаров. — М. : Радио и связь, 1982. — 152 с.

187. Штейнфельд Э. А. Частотный словарь современного русского литературного языка (2500 слов) / Э. А. Штейнфельд. — Таллинн, 1963. — 316 с.

188. Экологический словарь / Под ред. Б. А. Быкова. — Алма-Ата : Наука, 1983. — 215, [1]с.

189. Электронный корпус текстов по памятникам древнерусской агиографической литературы / А. С. Герд, Е. JI. Алексеева, И. В. Азарова, JI. А. Захарова // Научно-техническая информация. Сер. 2. — 2004. — Вып. 9. — С. 16—20.

190. Юдович Я. Э. Геохимия редких щелочей и редких тиофилов в черных сланцах / Я. Э. Юдович, И. В. Козырева, М. П. Кетрис. — Сыктывкар : ТОО «ACT», 1993. — 74 с.

191. Юл Дж., Кендэл М. Теория статистики / Дж. Юл, М. Кендэл. — 14-е издание., пересмотр, и расшир. — М. : Госстатиздат, 1960. — 779 с.

192. Яблонский А. И. Модели и методы математического исследования науки : Науч.-аналит. обзор / А.И. Яблонский. — АН СССР, Ин-т науч. информации по обществ, наукам. — М. : ИНИОН, 1977. — 128 с.

193. Adamic L., Huberman В. Zipfs law and the Internet / L. Adamic,

B. Huberman // Glottometrics. — 2002.—N 3. — P. 143—150.

194. Baroni M. Distributions in text. / M. Baroni // Corpus linguistics: An international handbook. — Berlin : Mouton de Gruyter, 2009. — Vol. 2. — P. 803—821.

195. Baroni M., Evert S. Words and echoes: Assessing and mitigating the non-randomness problem in word frequency distribution modeling. / M. Baroni, S. Even //

Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics. — 2007. — P. 904—911.

196. Best K.-H. Probability Distributions of Language Entities / K.-H Best // Journal of Quantitative Linguistics. — 2001. — Vol. 8. — N 1. — P. 1 — 11.

197. Caron Y. Use of power law models in detecting region of interest / Y. Caron, P. Makris, N. Vincent // Pattern Recognition. — 2007. — Vol. 40, N 9. — P. 2521—2529 ; Same [Electronic resource] // UFR Mathématiques et Informatique / Univ. Paris Descartes. - Paris, [2007]. - URL: http://www.math-info.univ-paris5.fr/~vincent/articles/ROIandZIPFlaw_PR.pdf (дата обращения: 19.05.2013).

198. Findre J. The expression structure of the matter-of-fact text / J.Findre // Recueil linguistique de Bratislava, 1984. — P.229—276.

199. Garrouste P., Iôannidês S. / P. Garrouste, S. Iôannidës. — Evolution and Path Dependence in Economic Ideas: Past and Present. Mass., 2001. — 247 p.

200. Glottometrics. // Eds. R. Köhler. — 2002. — N 4. — 98 p.

201. Harremoës P., Topsoe F. Zipfs law, hyperbolic distributions and entropy loss / P. Harremoës, F. Topsoe // General Theoiy of Information Transfer and Combinatorics. — 2005. — Vol. 21. — P. 315—318.

202. Heaps H. Information retrieval: computational and theoretical aspects / H. Heaps // Library and information science. — Academic Press, 1978. — 368 p.

203. Herdan G. Quantitative Linguistics / G. Flerdan. — Berlin, Heidelberg, London, 1964. —284 p.

204. I-Ierdan G. Type-Token Mathematics: A Textbook of Mathematical Linguistics / G. Herdan. — Mouton, 'S-Gravenhage, 1960. — 448 p.

205. Hirsh J. E. An index to quantify an individual's scientific research output / J.E.Hirsch // Proc. Natl. Acad. Sei. U.S.A. — 2005. — Vol.102. — N46. P. 16569—165724 ; Same [Electronic resourse]. — [2005]. — URL: http://arxiv.org/PS_cache/physics/pdf/0508/0508025.pdf (дата обращения: 19.05.2013).

206. Kay M. Zipfs Law and l'Arbitraire du Signe [Electronic resourse] / M. Kay // Linguistic Issues in Language Technology. — 2011. — Vol. 6. — URL: http://elanguage.net/journals/lilt/issue/archive (дата обращения: 19.05.2013).

207. Kendall M. G., Smith В. B. The problem of m rankings [Electronic resourse] /М. G. Kendall, В. В. Smith // Annals of Mathematical Statistics. — 1939. — Vol.10. — N3. — URL: http://projecteuclid.org/DPubS?service:::=UI&version=1.0&verb=Display&handle=euclid .aoms/1177732186 (дата обращения: 19.05.2013).

208. Köhler R. Quantitative Analysis of Syntactic Structures in the Framework of Synergetic Linguistics / R. Köhler // Aspects of Automatic Text Analysis. Studies in Fuzziness and Soft Computing. — 2007. — Vol.209. — P. 191—209 ; Same [Electronic resourse]. — [2007]. — URL: http://link.springer.eom/chapter/l 0.1007%2F978-3-540-37522-7_9#page-1 (дата обращения: 19.05.2013).

209. Kucera H., Francis W., Computational analysis of present-day American English /Н. Kucera, W. Francis. — Providence : Brown univ. press, 1967. — XXVI, 424 p.;

210. Li W. Random texts exhibit Zipfs-law-like word frequency distribution. / W. Li // IEEE Transactions on Information Theory. — 1992. Vol. 38. — N 6. P. 18421845.

211. Lotka A. J. The Frequency Distribution of Scientific Productivity / A. J. Lotka // Journal of the Washington Academy of Sciences. — 1926. — N 16. — P. 317—323.

212. Manning C. An introduction to information retrieval / C. Manning, H. Schütze, P. Raghavan. — MIT Press, Cambridge, 2009. — 482 p.

213. Manning C., Schütze H., Foundations of Statistical Natural Language Processing / C. Manning, H. Schütze. — MIT Press, Cambridge, 1999. — 680 p.

214. Montemurro M. Beyond the Zipf-Mandelbrot law in quantitative linguistics / M. Montemurro // Physica A. — 2001. Vol.300. P. 567—578 ; Same [Electronic resource], — [2001]. — URL: http://www-stat.stanford.edu/~owen/courses/306a/ZipfAndGutenberg.pdf (дата обращения: 19.05.2013).

215. Müller H. An Introduction to Giobal-Scaling-Theory [Electronic resourse] / H. Müller. — [s.n.]. — URL: http://www.raum-energie-forschung.de/IREF-home-engl/Theor.htm (дата обращения: 19.05.2013).

216. Neumann P. : [Электронный ресурс] / P.Neumann. — URL: http://www.csl.sri.com/users/neumann/ (дата обращения: 19.05.2013).

217. Newman M.E.J. Power laws, Pareto distributions and Zipfs law / M.E.J.Newman // Contemporary Physics. — 2005. — Vol. 46, N 5. — P. 323—351.

218. NooJ [Electronic resourse] / M. Silberstein. — [s.n.]. — URL: http://www.NooJ4nlp.net/pages/NooJ.html (дата обращения: 19.05.2013).

219. Popescu I.-I. Aspects of word frequencies. / I.-I. Popescu, J. Macutek, G. Altmann // Studies in Quantitative Linguistics. — 2009. — Vol. 3. — 198 p.

220. Popescu I.-I. Zipfs law - another view (2009) / I-I. Popescu, G. Altmann, R. Köhler// Quality & Quantity. 2010. — Vol. 44. —Issue 4. — P. 713—731.

221. Ripley B. D. Pattern Recognition and Neural Networks / B. D. Ripley // Cambridge, 1996. — 404 p.

222. Russell M. Data Mining [Electronic resourse]: lecture 3 / M. Russell. — [2008]. — URL: http://www.eee.bham.ac.uk/russellm/ee3j2.htm (дата обращения: 19.05.2013).

223. Scharnhorst A. Information sciences and digital humanities [Electronic resourse] / A. Scharnhorst // Bibliometrics, data mining, visualizations, interfaces. — [2012]. — URL: http://etraces.e-humanities.net/assets/etraces/sponsor-meeting/2012-etraces-sponsormeeting-scharnhorst-bibliometrics.pdf (дата обращения: 19.05.2013).

224. Silberztein M. NooJ Manual [Electronic resourse] / M. Silberztein. — [s.n.]. — 216 p. — URL: http://www.NooJ4nlp.net/NooJManual.pdf (дата обращения: 19.05.2013).

225. Stop-words in Keyphrase Extraction Problem / S. Popova, L. Kovriguina, D. Muromtsev, I. Khodyrev // Proceedings of the 14th Conference of Open Innovations Association FRUCT, Helsinki, Finland, 11-15 November 2013. — P. 113—121. — URL: http://www.fruct.org/publications/fructl4/files/Pop_23.pdf (дата обращения 17.12.2013).

226. Urai Y., Ando A., Renansky A. A Lemmatized Concordance To The Idiot Of F.M.Dostoevsky. — Vol. 1-4. — Sapporo: Hokkaido University, 2003. — XXXII, 1911 p., 505 p.

227. Zhu Xiaojin. Words, Zipf s Law, Miller's Monkeys [Electronic resourse] / X. Zhu. — [2007]. — URL: pages.cs.wisc.edu/~jerryzhu/cs838/words.pdf (дата обращения: 19.05.2013).

228. Zipf G. K. The psycho-biology of language / G. K. Zipf. — Boston, 1935. — 336 p.

229. Zipf G. K. Human behavior and the principle of least effort. An introduction to human ecology / G. K. Zipf. — Addison-Wesley, Cambridge, 1949. — 574 p.

Список иллюстративного материала

Таблица 1 — Списки «Сказания», привлеченные для исследования............................................39

Таблица 2 — Разночтения эпизода, в котором повествуется об интриге князей (фрагмент

приложения К).................................................................................................................................45

Таблица 3 — Основные количественные характеристики списков «Сказания о Мамаевом

побоище».........................................................................................................................................65

Таблица 4 — Сокращение индекса повторяемости при переходе от одного типа частотного

словаря к другому............................................................................................................................66

Таблица 5 — Фрагмент таблицы «Эмпирическое и теоретическое распределение функции F,(t)

для русского языка» по словарю Э.А.Штейнфельд......................................................................134

Таблица 6 — Сопоставление рассматриваемых методов с помощью набора концептуальных

признаков.......................................................................................................................................153

Таблица 7 — Сводная таблица проанализированных ЧС............................................................161

Таблица 8 — Лексика беллетризованного варианта Основной редакции с рангами 60</'<80 (по

ЧС лексем).....................................................................................................................................164

Таблица 9 — Значения параметра р //-распределения для разных типов частотных словарей

списков «Сказания».......................................................................................................................165

Таблица 10 — Иллюстрация применения методики скользящего коэффициента вариации.....169

Таблица 1 1 — Значения параметра (3 //-распределения для разных типов частотных словарей

списков «Сказания».......................................................................................................................171

Таблица 12 — Значения энтропии и анэнтропии для списков «Сказания» по ЧС разных типов

........................................................................................................................................................173

Таблица 13 — Фрагмент частотного ИС лексем для 5 редакций «Сказания»............................180

Таблица 14 — Фрагмент рангового ИС лексем для 5 редакций «Сказания»..............................180

Таблица 15 — Значение коэффициента конкордации Кендэла IV для ранговых ИС списков «Сказания» с алфавитным и неалфавитным упорядочиванием лексических единиц, имеющих

одинаковую частоту...................................................................................................................... 182

Таблица 16 — Величина покрытия комплектов и пар списков «Сказания» лексикой

построенных по ним инвариантных словарей..............................................................................183

Таблица 17 — Изменение значения коэффициента конкордации и количества лексем в инвариантном словаре при подстановке текста «Совместителя» Н.С.Лескова вместо одного из

списков «Сказания».......................................................................................................................185

Таблица 18 — Границы стабильной зоны ¿¡'-распределения по данным ранговых инвариантных

словарей с алфавитным упорядочиванием...................................................................................190

Таблица 19 — Границы стабильной зоны 5-распределения по данным ранговых инвариантных

словарей с неалфавитным упорядочиванием...............................................................................191

Таблица 20 — Лексемы на «хвостах» ¿¡'-распределения Основной редакции и ее

беллетризованного варианта (по ИС с неалфавитным упорядочиванием).................................193

Таблица 21 — Значения точки И для ЧС «Сказания» всех типов................................................195

Таблица 22 — Совмещение значений натуральнозначного аргумента, пойнтер-точки R (полужирный шрифт), левой (курсив и подчеркивание) и правой границ знакомононноети прироста скользящего коэффициента вариации (подчеркивание) и точки И (белый шрифт на

черном фоне) - но ЧС стандартизованных словоформ................................................................205

Таблица 23 — Рукописные словоформы, отсекаемые с помощью точки h (весь столбец), пойнтер-точки R (полужирный шрифт) и правой границы монотонности СКВ (серый фон)... 209

Таблица 24 — Стандартизованные словоформы, отсекаемые с помощью точки к (весь столбец), пойнтер-точки Я (полужирный шрифт) и правой границы монотонности СКВ (серый фон)... 210 Таблица 25 — Лексемы, отсекаемые с помощью точки И (весь столбец), пойнтер-точки Я

(полужирный шрифт) и правой границ монотонности СКВ (серый фон)..................................211

Таблица 26 — Абсолютная численность ядра в ЧС «Сказания»................................................212

Таблица 27 —Группировка списков «Сказания» по возрастанию индекса Я/С.........................213

Таблица 28 — Доли ноевой (Г=1) и саранчёвой (Гтах) каст для 3 типов частотных словарей

«Сказания».....................................................................................................................................214

Таблица 29 — Ранговый состав стабильной зоны ¿'-распределения Распространенной редакции

и ее сокращенного варианта (ИС словоформ, неалфавитное упорядочивание).........................216

Таблица 30 — Лексика 7-й ранговой группы...............................................................................219

Таблица 31 — Лексика 8-й ранговой группы...............................................................................220

Таблица 32 — Ранговый состав стабильной зоны ¿'-распределения Распространенной редакции

и ее сокращенного варианта (ИС лексем, неалфавитное упорядочивание)................................221

Таблица 33 — Ранговый состав стабильной зоны ¿'-распределения Основной редакции и ее

беллетризованного варианта (ИС лексем, неалфавитное упорядочивание)...............................224

Таблица 34 — Количественные аспекты сокращения текста (на примере ЧС словоформ

Распространенной редакции и ее сокращенного варианта).........................................................230

Таблица 35 — Количественные аспекты сокращения текста (на примере ЧС лексем

Распространенной редакции и ее сокращенного варианта).........................................................231

Таблица 36 — Лексемы-новации сокращенного варианта Распространенной редакции..........233

Рисунок 1 — Связи между анализируемыми редакциями «Сказания о Мамаевом побоище» и

памятниками Куликовского цикла.................................................................................................40

Рисунок 2 — Распределение последовательностей пикселей на неоднородном участке

изображения.....................................................................................................................................85

Рисунок 3 — Распределение последовательностей пикселей на однородном участке

изображения.....................................................................................................................................85

Рисунок 4 — Схема определения пограничной точки Р...............................................................86

Рисунок 5 — Фиксация пойнтер-точки Я на графике эмпирического распределения...............101

Рисунок 6 — Пример интегрального распределения для сокращенного варианта «Сказания о

Мамаевом побоище» (по частотному словарю стандартизованных словоформ)....................... 114

Рисунок 7 — Иерархическая классификация ранговых формул химических составов сильно

различающихся природных систем, упорядоченных по алфавит}' —таблице Менделеева........1 19

Рисунок 8 — Поле допустимых значений НА.............................................................................. 122

Рисунок 9 — Схематическое изображение динамики I и II рода................................................125

Рисунок 10 — Траектории ранговых переходов в структурно-топологической динамике

распределений металлургических заводов по электропотреблению..........................................127

Рисунок 1 1 — Аппроксимация ранговых переходов линейным трендом..................................129

Рисунок 12 — ¿"-распределение банков Российской Федерации по показателю........................130

«собственный капитал».................................................................................................................130

Рисунок 13 — Геометрические характеристики рангового распределения................................139

Рисунок 14 — График изменения параметра С распределения Ципфа до (верхняя линия) и после (нижняя линия) исправления эффекта рангового искажения по В.П.Маслову для частотных

словарей лексем сокращенного варианта «Сказания».................................................................162

Рисунок 15 — График прироста скользящего коэффициента вариации для списка

Распространенной редакции.........................................................................................................170

Рнсунок 16 — Совмещение характеристик энтропии и анэнтропии..........................................174

для разных типов ЧС «Сказания».................................................................................................174

Рисунок 17 — Сравнение графиков ¿'-распределения для ранговых словарей с алфавитным и неалфавитиым упорядочиванием.................................................................................................187

Рисунок 18 — ¿^-распределение инвариантного словаря лексем Основной редакции и ее

беллетризованного варианта (по ИС с неалфавитным упорядочиванием).................................194

Рисунок 19 — Активность и сохранность в пределах ранговой группы словоформ разных ранговых групп в стабильной зоне ^-распределения Распространенной редакции и ее

сокращенного варианта (по ИС с неалфавитным упорядочиванием).........................................217

Рисунок 20 — Активность и сохранность в пределах ранговой группы лексем разных ранговых групп в стабильной зоне ¿»-распределения Распространенной редакции и ее сокращенного

варианта (по ИС с неалфавитным упорядочиванием).................................................................222

Рисунок 21 — Активность и сохранность в пределах ранговой группы лексем разных ранговых групп в стабильной зоне ¿»-распределения Распространенной редакции и ее сокращенного

варианта (по ИС с алфавитным упорядочиванием).....................................................................223

Рисунок 22 — Активность лексем разных ранговых групп в стабильной зоне и сохранность в пределах ранговых групп ¿^-распределения Основной редакции и ее беллетризованного варианта (по ИС с неалфавитным упорядочиванием).................................................................225

Список приложений

Приложение А. Примеры обработанных текстов (по списку Основной редакции РНБ 0.1У.22).

Приложение Б. Таблицы с разночтениями эпизодов.

Приложение В. Фрагменты частотных словарей рукописных словоформ, стандартизованных словоформ и лексем списка Основной редакции РНБ О.IV.22.

Приложение Г. Тексты вставных повестей Распространенной редакции («О Захарии» и «О новгородцах»), записанные стандартизованными словоформами.

Приложение Д. Фрагмент таблицы соответствий словоформа-лексема для проведения лемматизации.

Приложение Е. Графики с результатами обработки по В.П.Маслову для ЧС лексем, 16 рисунков на 4 листах.

Приложение Ж. Графики прироста скользящего коэффициента вариации по Г.Я.Мартыненко для ЧС всех типов, 24 рисунка.

Приложение И. Эмпирические и аппроксимирующие //-распределения для ЧС всех типов, 3 таблицы.

Приложение К. Моделирование структуры списков «Сказания» с помощью модели простых чисел.

Приложение Л. Частотный инвариантный словарь и ранговые инвариантные словари для расчета коэффициента конкордации и таблицы для построения распределения (по 8 спискам «Сказания», 3 таблицы).

Приложение М. Совмещение значений натуральнозначного аргумента, границ монотонности скользящего коэффициента вариации, пойнтер-точки Я и точки И Хирша, 3 таблицы.

Приложение Н. Диаграммы НА для ЧС всех типов, 3 рисунка.

Приложение П. Графики ^-распределений, 16 рисунков.

Приложение Р. Группировка списков по долям ноевой и саранчёвой каст, 3 рисунка.

Приложение С. Структура стабильной зоны 8-распределения, 3 таблицы.

Пояснительная записка к приложениям диссертации

Приложение А.

Примеры обрабатываемых текстов (по списку Основной редакции РНБ 0.1У.22).

В приложении приводятся фрагменты текста «Сказания о Мамаевом побоище» по списку Основной редакции РНБ ОЛУ.22, записанные 1) рукописными словоформами (приложение А.1), 2) стандартизованными словоформами (приложение А.2) и 3) лексемами (приложение А.З).

Приложение Б.

Приложение содержит 3 таблицы следующего содержания:

Приложение Б.1 — таблица с разночтениями ряда эпизодов по спискам типового варианта Основной редакции и беллетризованного варианта Основной редакции;

Приложение Б.2 - таблица с разночтениями ряда эпизодов по спискам типового и сокращенного вариантов Распространенной редакции;

Приложение Б.З - таблица с разночтениями эпизода об интриге князей Олега и Ольгерда против великого князя Дмитрия по всем спискам «Сказания».

Приложение В.

В приложении приводятся фрагменты частотных словарей рукописных словоформ, стандартизованных словоформ и лексем списка Основной редакции РНБ ОЛУ.22. г„„£ - абсолютная частота, г — ранг.

Приложение Г.

В приложении приводятся тексты вставных повестей Распространенной редакции (Приложение Г. 1 - «О Захарии» и Приложение Г.2 - «О новгородцах»), записанные стандартизованными словоформами.

Приложение Д.

Приложение содержит фрагмент таблицы соответствий стандартизованная словоформа-лексема.

Приложение Е.

В приложении приводятся графики изменения параметра С распределения Ципфа без исправления эффекта рангового искажения по В.П.Маслову и с его учетом для ЧС лексем, листы ЕЛ, Е.2 - графики без учета логарифмической поправки, листы Е.З, Е.4 - на одном рисунке совмещены графики, построенные с учетом и без учета логарифмической поправки.

Приложение Ж.

В приложении приводятся графики прироста скользящего коэффициента вариации по ЧС всех типов. На графиках отмечены буквами А и В точки левой и правой границ знакомонотонности, пунктирной линией - ядерная и периферическая зоны.

На рисунках Ж. 1.1-Ж. 1.8 представлены графики, построенные по ЧС рукописных словоформ, на рисунках Ж.2.1-Ж.2.8 - графики, построенные по ЧС стандартизованных словоформ, на рисунках Ж.3.1-Ж.3.8 - графики, построенные по ЧС лексем.

Приложение И.

В приложении помещены таблицы, содержащие эмпирические и теоретические Я-распределения списков «Сказания» по ЧС всех типов.

Таблица И.1 — Эмпирические и аппроксимирующие Я-распределения списков «Сказания по ЧС рукописных словоформ;

Таблица И.2 — Эмпирические и аппроксимирующие Я-распределения списков «Сказания по ЧС стандартизованных словоформ;

Таблица И.З — Эмпирические и аппроксимирующие Я-распределения списков «Сказания по ЧС лексем.

Расшифровка условных обозначений в таблицах И. 1—И.З: п — численность класса;

Яп)эмпир ~ количество классов с такой численностью (по эмпирическому распределению);

Г(п)геор - количество классов с такой численностью (по аппроксимирующему распределению).

Приложение К.

В таблице К. 1 содержатся эмпирические распределения словоформ списков «Сказания» по числу их употреблений (столбцы 1 и 2 для каждого списка) и аппроксимирующее распределение, построенное по модели простых чисел Б.И.Кудрина (столбцы 3 и 4 для каждого списка). В столбце 5 для каждого списка приведено отношение между значениями эмпирических и аппроксимирующих частот.

В силу особенностей модели (распределение частот классов и количество классов определяется объемом генеральной совокупности), существует только одно аппроксимирующее распределение для эмпирических распределений списков «Сказания», построенных по разным типам частотных словарей.

Расшифровка условных обозначений таблицы К. 1: п - численность класса (в эмпирическом распределении);

Р(п) — количество классов с такой численностью (в эмпирическом распределении);

1 - численность класса (в аппроксимирующем распределении);

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.