Информационные технологии в изучении историко-культурного наследия Восточной и Центральной Азии тема диссертации и автореферата по ВАК РФ 00.00.00, доктор наук Ринчинов Олег Сергеевич

  • Ринчинов Олег Сергеевич
  • доктор наукдоктор наук
  • 2021, ФГБУН Институт монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук
  • Специальность ВАК РФ00.00.00
  • Количество страниц 378
Ринчинов Олег Сергеевич. Информационные технологии в изучении историко-культурного наследия Восточной и Центральной Азии: дис. доктор наук: 00.00.00 - Другие cпециальности. ФГБУН Институт монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук. 2021. 378 с.

Оглавление диссертации доктор наук Ринчинов Олег Сергеевич

ВВЕДЕНИЕ

ГЛАВА 1. ФОРМИРОВАНИЕ БУДДИЙСКОГО ИНФОРМАЦИОННОГО ПРОСТРАНСТВА ВОСТОЧНОЙ И ЦЕНТРАЛЬНОЙ АЗИИ

1.1. Становление буддийской письменной культуры

1.2. Распространение буддизма за пределы Индийского субконтинента

1.3. Формирование буддийского канона в Восточной Азии

1.4. Буддийское письменное наследие в тибетской традиции

1.5. Буддийская книжная культура в монгольском мире и Байкальском регионе

ГЛАВА 2. ЦИФРОВЫЕ ТЕХНОЛОГИИ В СОХРАНЕНИИ И ПРЕДСТАВЛЕНИИ ПИСЬМЕННОГО НАСЛЕДИЯ ВОСТОЧНОЙ И ЦЕНТРАЛЬНОЙ АЗИИ

2.1. Технологии цифровизации письменного наследия

2.2. Методические центры цифровизации историко-культурного наследия

2.3. Цифровой буддийский канон в Восточной Азии

2.4. Тибетское наследие в цифровом пространстве

2.5.Цифровые модели кодикологии книг в тибето-монгольской традиции

ГЛАВА 3. ЦИФРОВЫЕ ПОДХОДЫ В ИЗУЧЕНИИ ИСТОРИКО-КУЛЬТУРНОГО НАСЛЕДИЯ В ФОНДАХ ИМБТ СО РАН

3.1. Источниковая база исследований

3.2. Цифровые библиографические и архивные ресурсы

3.3. Геоинформационные системы

3.4. Корпусные методы исследований

3.5. Мультимедийные ресурсы

ЗАКЛЮЧЕНИЕ

ГЛОССАРИЙ И СПИСОК СОКРАЩЕНИЙ

СПИСОК ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЯ

Приложение 1. Свидетельства о регистрации базы данных

Приложение 2. Заявка на регистрацию базы данных «Коллекция тибетоязычной литературы класса THOR BU в ИМБТ СО РАН»

Введение

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Информационные технологии в изучении историко-культурного наследия Восточной и Центральной Азии»

Актуальность темы исследования.

Буддийская культура с ее особым почитанием учения, Дхармы, воплощением которого является книга, способствовала формированию информационного пространства особого типа в Восточной и Центральной Азии. Это информационный континуум, включающий страны и народы, занимавшие огромные пространства от Японии до Синьцзяна и от Байкала до Гималаев, который начал формироваться после пересечения буддизмом границ Индийского субконтинента на рубеже н.э. и функционирует в настоящее время. В его основе лежит индийская буддийская литературная традиция. Он характеризуется интенсивным обменом идеями и технологиями, сходными процессами развития и смены парадигм накопления и распространения информации; его пространство было пронизано сетями экономических связей, паломничества, государственного и частного патронажа, взаимосвязанными технологическими, производственными и логистическими цепочками, тянувшимися на тысячи километров и функционировавшими на протяжении сотен лет. Благодаря накопленным технологиям, сложившимся социальным институтам, он способствовал формированию локальных культурных традиций, не связанных напрямую с религией.

В настоящее время большинство исследователей обозначают три основных технологических революции и связанных с ними смены парадигмы распространения и передачи информации, которые самым глубоким образом затронули буддийское пространство Восточной и Центральной Азии - этап письменной передачи, этап ксилографической и современной печати и этап цифрового распространения информации, который начался относительно недавно и продолжается в настоящее время. Каждая из этих парадигм включает собственный комплекс взаимосвязанных информационных, материальных и социальных технологий. В этом контексте к информационным технологиям относятся определение взаимопонятной системы символов, создание вокабуляра, выработка способов организации информации и пр., к

материальным - выбор носителя и материала фиксации информации, способов ввода и хранения информации и т.д., к социальным - формирование сетей генерации, распространения и потребления информации, их институциональное оформление.

Буддийский информационный континуум Восточной и Центральной Азии формировал культурный контекст, который на протяжении нескольких столетий определял развитие многих культурных традиций в Байкальском регионе. Среди разных аспектов этого длительного и всеохватывающего процесса особенно важным было принятие и укоренение традиций и технологий, связанных с письменной и книжной культурой. Принятие буддизма стало основным фактором устойчивого развития письменной культуры среди монгольских народов, в том числе бурят. Поэтому проблемы изучения и сохранения историко-культурного наследия Байкальского региона нужно рассматривать в общем контексте, связанном с историей и бытованием буддийского наследия в современном мире. Памятники письменного наследия Байкальского региона являются свидетельствами того, как буддизм способствовал совершению информационных революций на огромных пространствах Азии.

Представляемая работа посвящена рассмотрению вопросов истории развития и становления информационных технологий на пространстве Восточной и Центральной Азии, напрямую повлиявших на формирование письменных традиций в Байкальском регионе, выявлению, обзору и анализу наиболее релевантных методологий цифровизации историко-культурного наследия, описанию опыта применения цифровых технологий для сохранения, изучения и представления письменного наследия народов Байкальского региона в Центре восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук.

Актуальность темы исследования определяется, во-первых, тем, что цифровизация науки является национальным приоритетом, особенно в сфере

сохранения и изучения многонационального историко-культурного наследия Российской Федерации. Во-вторых, цифровизация является очередным этапом трансформации информационного пространства Восточной и Центральной Азии, сформировавшегося под влиянием буддизма, которое включает Байкальский регион. Эти факторы обуславливают важность исследования и внедрения цифровых подходов в сохранение и изучение историко-культурного наследия Байкальского региона.

Степень научной разработанности проблемы.

Тезис о культурном единстве Азии в свете общего буддийского наследия был сформулирован Ю. Н. Рерихом еще в первой половине XX в. Анализ результатов международных исследований в области буддологии, ведущихся на протяжении последних десятилетий, подтверждает справедливость этого тезиса.

Так, в конце XX - начале XXI вв. были получены значительные результаты в изучении проблем формирования буддийских литературных корпусов в Южной, Восточной и Центральной Азии, определении структурных и содержательных аспектов крупных собраний буддийских произведений, в первую очередь канонических, периодизации их истории, оценки их исторической и социальной значимости. Во многом это произошло благодаря новым источникам, появившимся в результате сенсационных находок в Афганистане и Пакистане, за счет ввода в научный оборот дуньхуанских и других рукописных коллекций, рассредоточенных по библиотекам и научным архивам мира. Этими проблемами активно занимаются М. И. Воробьева-Десятовская, Е. П. Островская, И.Ф. Попова, Р. Саломон, М. Эллон, Й. Браарвиг, Ф. Лилэнд, Дж. Нилис, П. Каллиери, С. ван Шайк, благодаря которым составлено целостное представление о древнейших буддийских письменных традициях, возникших на северо-западе Индийского субконтинента и их роли в распространении буддизма в других частях Азии.

Особенности аккультурации буддизма в Восточной Азии были рассмотрены на основе работ Э. Цюрхера, Э. Грина, Л. Е. Янгутова, А. К.

Хабдаевой, Е. А. Торчинова, В.В. Малявина, Дж. Нилиса, Т. Де Рау и др. Так, был установлен сложный характер формирования буддийских традиций в Китае, обусловленный неравномерными разнонаправленными контактами с буддийскими общинами в «западных землях» и Индии, сильным влиянием автохтонных идеологий и китайской культуры в целом, особенностями политической системы Китая. Сложение буддийских традиций и литературного корпуса в Китае заняло несколько сотен лет. Периодизация связанных с этим процессов, их социальное и общекультурное значение освещены в работах Фан Гуанчана, Л. Ланкастера, Т. Сторч, У Цзяна, Ли Фухуа, Дай Ляньбиня. Процессы трансформации буддийского канона в Восточной Азии в русле модернизма, в которых ведущую роль играли японские ученые-буддологи, раскрыты в трудах Г. Уилкинсона, Ч. Хотта, М. Киёта, М. Мора и др. Интегрирующие подходы, выработанные тогда под влиянием европейской буддологии, способствовали сложению идеи о пан-азиатском единстве в контексте буддийской культуры.

Необходимо отметить значительный прогресс в области изучения письменных традиций тибетского и монгольского буддизма, который наблюдается в мире в последние десятилетия. Во многом это связано с открытием тибетской культуры в результате известных событий в Тибете в 1950-х гг., когда за его пределами возникла большая эмигрантская община, и стал возможен прямой диалог между учеными и носителями живых традиций тибетского буддизма. В изучение истории формирования тибетских и монгольских канонических собраний, их структурно-жанровой классификации, содержательного анализа большой вклад сделан Э. Дж. Смитом, Тулку Тхондупом, В. Хайссигом, П. Харрисоном, Дж. Самтеном, Х. Эймером, Дж. Силком, Х. Кабезоном, Р. Джексоном, С. ван Шайком, А. Херрманн-Пфандт, Дж. Халкиасом, Д. Джермано, В. Уоллес, К. Кольмар-Пауленц и др. Выполненная нами реконструкция тибето-монгольской письменной традиции в определяющей степени опирается на работы российских исследователей К.М. Герасимовой, Г.Р. Галдановой, Ц.П. Ванчиковой, Т. Малановой, И.С.

Урбанаевой, А.А. Базарова, К.В. Алексеева, В. Л. Успенского, А. В. Зорина, Н.В. Цыремпилова, М.В. Аюшеевой, С.-Х.Д. Сыртыповой, А.Д. Цендиной, Р. Отгонбаатара, А. А. Шиманской, Е. Ю. Харьковой, С.В. Мирзаевой и др.

Необходимо отметить значительные результаты, полученные в изучении кодикологических и материаловедческих аспектов тибетской книжной традиции А. Хельман-Важны и Б. Дотсоном, благодаря их работам сформировано направление «археологии» тибетской книги.

Историографический обзор литературы, выполненный в рамках диссертационного исследования, показал, что идея объединяющей, трансформирующей роли буддизма в истории Восточной и Центральной Азии является красной линией большинства научных изысканий в этой области. Поэтому лежащий в основе нашего исследования тезис об информационном континууме, формирование которого связано с распространением буддийской культуры, выглядит вполне обоснованным.

В последние десятилетия происходит формирование новой дисциплины -исторической информатики. В России в этой области активно сообщество ученых, сложившееся вокруг ассоциации «История и компьютер» (АИК) под эгидой кафедры исторической информатики МГУ, участники которого заняты проблемами разработки цифровых методов исторических и источниковедческих исследований. В этой связи необходимо упомянуть таких авторов, как Л.И. Бородкин, В.Н. Владимиров, И.М. Гарскова, вклад которых связан в определении наиболее перспективных направлений использования вычислительных, статистических, геоинформационных подходов и методов, что представлялось важным при планировании диссертационного исследования.

Цифровизация историко-культурного наследия Восточной и Центральной Азии началось около 30 лет назад. Историографическое изучение этой области исследований находится еще в самом начале, поэтому основная информация собирается непосредственно из работ, посвященных решению той или иной проблемы цифровизации историко-культурного наследия Восточной и

Центральной Азии. Исследования в этой области активно проводятся на Тайване, в США, Японии и других странах. Среди исследователей, получивших важные результаты теоретического и практического уровня, можно отметить Л. Ланкастера, А. Мюллера, К. Виттерна, М. Баклэнда, Д. Боденхамера, А. Вилсона, С. Лин, П. Хакетта, К. ван Лита, С. Уитфилд, Амин Ту, М. Бингенхаймера, Хун Чжэньчжоу, М. Шимоду, К. Нагасаки, С. Уайлса, З. Ровински и др. Первые историографические работы, обобщающие опыт цифровой трансформации историко-культурного наследия Восточной и Центральной Азии, появились в 2019 г. Значимыми для понимания современной ситуации в этой области являются такие коллективные труды, как «Digital Humanities and Buddhism» (2019) и «Digital Humanities and Research Methods in Religious Studies: An Introduction» (2021).

Важными источниками информации для выполнения диссертационного исследования послужили онлайн-ресурсы, раскрывающие тему цифровой трансформации историко-культурного наследия Восточной и Центральной Азии. Необходимо отметить хорошо структурированные, богатые информацией и предоставляющие разнообразные текстовые и мультимедийные данные веб-порталы международных и национальных проектов IDP, CBETA, DBRC, THL, ACIP, EAP, TELDAP. Большое количество ресурсов предлагает веб-портал Dharma Drum Institute of Liberal Arts (Тайвань). Рассмотренные цифровые инициативы активны на протяжении уже 20-30 лет, что позволяет сделать вывод об устойчивости положенных в их начало организационных и методологических принципов. Благодаря информации, почерпнутой на указанных онлайн-ресурсах, можно реконструировать историю цифровой трансформации буддийского информационного пространства в контексте как мотиваций участников, так и развития и современного состояния цифровых подходов и методов.

Таким образом, в последние два десятилетия был сделан огромный шаг к достижению полного научного представления об истории формировании буддийского информационного пространства в Восточной и Центральной Азии.

В результате находок рукописей в Афганистане и Пакистане обрел законченную форму доступный для научного изучения корпус древнейших буддийских письменных источников, формирование которого началось в конце XIX в. после изысканий в оазисах Шелкового пути. Получены плодотворные результаты международных усилий по его изучению с применением цифровых технологий. В этом направлении значительную работу проводит Британская библиотека, инициировавшая важные для этой сферы долгосрочные программы IDP и EAP, которые предлагают интегрированную цифровую платформу для сохранения, обеспечения доступа и изучения древних памятников письменности.

В области изучения и актуализации буддийского наследия Восточной Азии на основе цифровых технологий необходимо отметить такие проекты, как CBETA (Тайвань) и SAT (Япония). Наследие живых традиций центрально -азиатского буддизма изучается консорциумами ACIP, BDRC, THL, которые открывают новые формы функционирования и возможности развития для тибетских и монгольских письменных и литературных традиций в цифровую эпоху. В этом ряду находятся работы в сфере цифровизации историко-культурного наследия в ИМБТ СО РАН.

Одной из важных особенностей изучения буддийского культурного наследия в последние десятилетия стал их международный и мультидисциплинарный характер. Современные исследования древних памятников все больше интегрируют естественнонаучные подходы, которыми занимаются международные коллективы, объединяющие разные области науки. Для поддержки деятельности таких коллективов созданы цифровые инструменты, позволяющие эффективно обмениваться большими объемами структурированных цифровых данных, такие как TEI/XML (обработка текстов), IIIF (работа с изображениями), авторитетный контроль (поиск и агрегация данных) и т.д. Еще одной заметной тенденцией является использование современных естественнонаучных методов для изучения материальной истории рукописей в рамках кодикологического подхода. Получаемые при этом

результаты позволяют по новому рассмотреть многие гуманитарные аспекты исследований, особенно связанные с пространственно-временными и материальными аспектами культурного взаимодействия в Восточной и Центральной Азии, включая Байкальский регион.

Дальнейшее развитие рассматриваемой области исследований связано с применением технологий искусственного интеллекта, таких как нейросетевые системы распознавания символов и машинного перевода, внедрением корпусных методов в текстологических исследованиях, использующих современные подходы big data, и других цифровых инструментов. Цифровая трансформация информационного пространства Восточной и Центральной Азии, сформированного под влиянием буддизма, даст возможность в полной мере раскрыть культурный и интеллектуальный потенциал восточных цивилизаций для современного общества.

Объектом исследования являются информационные технологии, которые способствовали формированию и трансформациям письменного наследия народов Восточной и Центральной Азии, с особым вниманием к буддийским каноническим собраниям, как важнейшим объектам приложения интеллектуальных усилий и технологических новшеств в традиционных и современных азиатских обществах.

Предметом исследования являются формирование и трансформации буддийского информационного пространства в Восточной и Центральной Азии и связанным с ними исторически и культурно Байкальском регионе в контексте исторического и технологического развития. Особое внимание уделено современному цифровому этапу в сохранении и изучении историко-культурного наследия, в том числе памятников письменности, и применению цифровых подходов и методов в этой области.

Хронологические рамки исследования охватывают период с первых веков н.э. до настоящего времени. Столь широкий временной период связан с тем, что в работе рассматриваются вопросы формирования и трансформаций буддийского информационного пространства в странах Южной, Восточной и

Центральной Азии и его влияния на развитие локальных культурных традиций, не обязательно религиозных, и формирование локальных корпусов источников.

Согласно археологическим данным, становление буддийской письменной традиции происходило на северо-западных рубежах индийского субконтинента в последние годы до н.э. - первые века н.э. Трансконтинентальный перенос буддизма состоялся благодаря Шелковому пути, сухопутные маршруты которого в тот период связали Южную и Восточную Азию. Надежные свидетельства о распространении буддизма в Китае относятся ко II в. н.э., и с этого периода можно вести историю формирования буддийского информационного пространства в Восточной Азии. Центральная Азия, несмотря на свой транзитный статус, приобщилась к буддийской культуре несколько позже, но благодаря географической и культурной близости к Северной Индии эта религия получила здесь быстрое развитие, свидетельством чему являются многочисленные археологические находки и памятники письменности.

К VII в. относится начальный этап внедрения буддизма в Тибете и создания тибетского буддийского книжного корпуса. Шелковый путь сыграл значительную роль в развитии тибетской письменной культуры, особенно в период экспансии Тибетской империи и установления ее контроля над Дуньхуаном и другими оазисами в ХШ-ГХ вв. В этот период в зоне интенсивных межкультурных контактов и обменов вдоль Шелкового пути происходит освоение буддистами новой технологии воспроизводства и распространения информации - ксилографии. Период ксилографической печати длился вплоть до конца первой половины ХХ в., он затронул все буддийские страны Восточной и Центральной Азии без исключения, включая Байкальский регион.

Модернизационные процессы проникали в культурное пространство указанного макрорегиона неравномерно. Если в Японии уже в конце XIX в. под влиянием европейской науки начались интенсивные трансформации способов функционирования и социализации буддийского письменного наследия, то

тибетская культура была вовлечена только в 1960-х гг. после формирования большой тибетской общины в изгнании.

Цифровые инициативы в области письменного наследия Восточной и Центральной Азии были начаты практически синхронно в разных странах многими энтузиастами и группами на рубеже 1980-1990-х гг. Необходимо отметить, что получили развитие проекты, которые имели выраженный академический характер и обладали сильной институциональной поддержкой. В конце 1990-х гг. были начаты первые проекты цифровизации фондов в Центре восточных рукописей и ксилографов ИМБТ СО РАН. В этой области также проявляются интеграционные процессы, позволяющие говорить о сохранении единства информационного пространства, сформированного буддийской культурой.

Территориальные рамки исследования включают обширные регионы Восточной и Центральной Азии, где происходило формирование буддийского информационного континуума, который характеризуется единым источником, восходящим к индийской литературной традиции, интенсивным обменом идеями и технологиями, сходными процессами развития и изменения парадигм накопления и распространения информации. Особое внимание уделено Байкальскому региону, который является частью указанного информационного пространства.

С точки зрения территориального аспекта в работе рассматриваются северо-западное пограничье Индийского субконтинента, где формировались религиозные традиции, затем получившие распространение в Восточной и Центральной Азии; восточная часть Шелкового пути, которая служила транзитной зоной для проникновения буддизма в Восточную Азию и, позже, пространством интенсивного межкультурного взаимодействия, повлиявшего на многие аспекты китайского, тибетского и монгольского буддизма.

В работе рассматриваются географические характеристики процессов формирования, функционирования и трансформации буддийских литературных корпусов в Восточной (Китай, Корея, Япония) и Центральной Азии (Тибет,

Монголия, Байкальский регион) на протяжении длительного периода времени от начала н.э. до современности.

Территориальный аспект особенно важен при рассмотрении историко-культурного наследия Байкальского региона. Это связано с наличием территориальных групп бурят, обладающих культурной спецификой, которые в разной степени были затронуты грамотностью, технологиями, приобщением в целом к информационному пространству буддийской культуры. Среди бурятских этно-территориальных групп одновременно сосуществовали разные парадигмы передачи исторического знания, духовных традиций, что необходимо учитывать при изучении историко-культурного наследия Байкальского региона.

Цель исследования: рассмотреть историю развития и становления информационных технологий в области письменного наследия на пространстве Восточной и Центральной Азии, напрямую повлиявших на формирование письменных традиций в Байкальском регионе, выявить и проанализировать наиболее релевантные методологии цифровизации историко-культурного наследия, обобщить опыт применения информационных технологий для сохранения, изучения и представления письменного наследия народов Байкальского региона в Центре восточных рукописей и ксилографов ИМБТ СО РАН.

Задачи исследования:

— составить обобщенную картину процессов формирования буддийского информационного пространства Восточной и Центральной Азии, связанного с функционированием Шелкового пути как контактной зоны интенсивных межкультурных взаимодействий; показать место Байкальского региона в этом пространстве;

— рассмотреть историю и ход цифровизации буддийского наследия Восточной и Центральной Азии на примере успешных международных цифровых инициатив в этой области;

— определить и проанализировать основные методологические подходы к цифровизации историко-культурного наследия Восточной и Центральной Азии;

— разработать и применить методы и инструментальные средства цифровой обработки больших массивов письменных источников электронной каталогизации письменных памятников из фондов Центра восточных рукописей и ксилографов;

— исследовать и применить для цифровизации памятников культурного наследия Байкальского региона такие методы цифровой обработки, как стандарты метатекстовой и корпусной разметки TEI, геоинформационные системы, средства авторитетного контроля, разработать и внедрить методы корпусных исследований, структурной и семантической разметки текстов на старописьменном монгольском языке;

— разработать платформу метаданных на основе авторитетных баз данных категорий «лицо», «место», «род/семья», «произведение», «воплощение», и осуществить интеграцию разнородных информационных ресурсов на этой основе;

— разработать методы и средства цифровизации мультимедийных технотронных источников информации - фотографий, аудио- и видеозаписей, в том числе бурятского фольклора и визуальных материалов;

— разработать и осуществить ресурсное наполнение веб-портала Центра восточных рукописей и ксилографов ИМБТ СО РАН;

— исследовать и обобщить опыт цифровизации историко-культурного наследия Байкальского региона на примере Центра восточных рукописей и ксилографов ИМБТ СО РАН и определить перспективы использования цифровых методов в дальнейших исследованиях Центра.

Источниковой базой исследования послужили памятники письменного наследия, архивные аудио- и видеоматериалы из фондов Центра восточных рукописей и ксилографов ИМБТ СО РАН, а также цифровые информационные ресурсы, размещенные онлайн в сети Интернет, посвященные тематике

диссертационного исследования - письменному наследию Восточной и Центральной Азии, методам его цифровизации и т.д.

Основная масса затронутых исследованием памятников письменности относится к тибетскому и монгольскому фондам ЦВРК и архивным фондам личного происхождения. В общей сложности методами цифровой обработки в разной степени охвачено более 40 тыс. ед. хранения из фондов ЦВРК. Среди них важное место занимают следующие тематические группы источников: сочинения по традиционной медицине на тибетском и старописьменном монгольском языках, источники по бурятским генеалогиям, аудиозаписи бурятских фольклорных произведений жанра «улигер», материалы видеоархива Центрального института высших тибетологических исследований (Варанаси, Индия) и т.д.

Содержательное разнообразие источников определяет необходимость применения специфических методов и разработки специальных методик их цифровой обработки.

Методология и методы исследования.

Методологической основой диссертационного исследования является совокупность общенаучных и специально-научных методов и подходов.

Для работы характерен междисциплинарный подход, отражающий тенденцию к интеграции наук. Он используется на уровне анализа теоретических концепций, методологии исследований и методов исторической информатики.

Основополагающий для диссертационного исследования системный подход связан с изучением явлений и процессов как систем с присущими им объектами, атрибутами и отношениями, который применяется для изучения трансформаций информационного пространства традиционной культуры Восточной и Центральной Азии в широком контексте глобального культурного и технологического взаимодействия. В качестве приложения системного подхода к предметной области исследования нами реализована схема периодизации исторического процесса, основным критерием которого

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования доктор наук Ринчинов Олег Сергеевич, 2021 год

IV. Литература о пути

A. Стадии учения (bstan rim)

B. Стадии пути (lam rim)

C. Тренировка ума (blo sbyong)

D. Обеты и клятвы (sdom gsum)

F. Трактаты по основаниям и путям (sa lam)

E. Предписания и наставления (gdams es ngag)

G. Трактаты по различным практикам: Дзогчен, Махамудра, Ламдре (путь-плод), различным тантрическим божествам

V. Ритуал

A. Освящение (rab gnas)

B. Обряд жертвоприношения (mchod pa)

C. Садхана (grub thabs)

D. Молитвы долгой жизни (zhabs brten)

E. Посвящение (dbang bskur)

F. Ритуалы поста (myung gnas)

G. Ритуалы огня (sbyin sreg)

H. Ритуалы смерти

I. Построение мандалы

VI. Художественная литература

А. Эпос (sgrung)

Б. Народные песни / поэзия (glu)

C. Поэзия

1. Религиозная поэзия (nyams mgur)

2. Витиеватая поэзия (snyan ngag)

3. Хвалебные песни (bstod tshogs)

D. Роман

E. Трактаты по поэтике и композиции (tsom rigs)

VII. Искусства и науки

A. Грамматика

B. Право

C. Медицина и фармакология

D. Астрономия / астрология

E. Математика / иконометрия

F. География / космология

G. Живопись, скульптура, архитектура

H. Драма

I. Музыка

VIII. Справочники

A. Путеводители (lam yig)

B. Каталоги (dkar chag)

C. Словари (tshig mdzod)

D. Энциклопедии.

Эта схема, по мнению составителей, предоставляет относительно управляемое количество общих категорий, в которые можно поместить большинство типов, жанров и поджанров тибетской литературы [Cabezón; Jackson 1996: 30-31]. Тем не менее, помимо вопроса о том, являются ли предложенные общие категории адекватным отражением проблемы типологии

тибетской литературы, существуют более частные проблемы, касающиеся конкретных категориальных соотнесений. Важное преимущество данной типологии заключается в том, что применяемые категории имеют прямые соответствия в современных системах библиотечно-библиографической классификации, что является немаловажным для включения тибетского наследия в глобальный культурный контекст [Smith 2001: xii].

Проблема выработки жанровой таксономии, наиболее полно отражающей тематическое и содержательное разнообразие литературы, всегда стоит при исследовании и организации большого корпуса, в том числе при выполнении крупных проектов по цифровизации письменного наследия. Типология остаётся актуальной задачей для всех занятых в этой сфере, поэтому необходимо иметь ясное представление о разных взглядах на эту проблему и ее традиционных и современных решениях.

Краткие сведения о ксилографических изданиях тибетского Кангьюра

В современной тибетской историографии упоминаются 12 ксилографических изданий Кангьюра, из них 8 дошли до наших дней. Считаются утерянными следющие издания: Кангьюр императора Ваньли (начало XVII в.), выполненный по образцу издания Юнлэ; Чамдоский (Ябцанский) Кангьюр (1950-е гг.), основанный на Лхасском издании; издания Рагья (1814-1820) и Вара (Wa ra, 1940-е гг.), за основу которых было взято Дергеское издание [Мирзаева 2018.].

1. Кангьюр императора Юнлэ ^ Цалпаский Кангьюр

Место: Нанкин

Время: 1410

Сохранность: Хорошая

2. Литангский (Чжанский) Кангьюр ^ Цалпаский Кангьюр

Место: Чжан, затем Литанг

Время: 1608-1621

Сохранность: Хорошая

3. Пекинский Кангьюр, или Кангьюр императора Канси ^Кангьюр Юнлэ ^ Цалпаский Кангьюр

Место: Пекин Время: 1683-1700 Сохранность: Хорошая

4. Чонэский Кангьюр ^Кангьюр Юнлэ, литангское издание, рукописный Кангьюр местности Уй ^ Цалпаский Кангьюр

Место: Чонэ Время: 1721-1731 Сохранность: Хорошая

5. Дергеский Кангьюр ^ Литангское издание, рукописный Кангьюр из Лходзонга ^ Цалпаский Кангьюр

Место: Дерге Время: 1726-1733 Сохранность: Хорошая

6. Нартанский Кангьюр ^ Цалпаский Кангьюр Место: Нартанг

Время: ?-1730 Сохранность: Хорошая

7. Монгольский, или ургинский, Кангьюр ^ Дергеское издание ^ Литангское издание ^ Цалпаский Кангьюр

Место: Урга Время: 1908-1910 Сохранность: Хорошая

8. Лхасский, или Щолпаский, Кангьюр ^ нартанское, дергеское, издание Темпангма

Место: Лхаса (Щол) Время: 1920-1934 Сохранность: Хорошая

1.5. Буддийская книжная культура в монгольском мире и Байкальском регионе

Байкальский регион является своеобразным анклавом буддийской цивилизации в культурном пространстве России. В течение почти трехсотлетнего бытования буддизма на этой территории сформировалась его институциональная структура, взгляды и принципы этой религии стали составной частью народного мировоззрения и мировосприятия. Одним из важнейших институтов буддийской культуры, укоренившихся в общественной жизни, стала развитая книжная традиция.

Байкальский регион исторически принадлежал большому монгольскому культурному и политическому пространству до рубежа ХУП-ХУШ вв. Его тесные связи с монгольским миром не прекращались и позже, хотя и испытывали колебания, связанные с состоянием межгосударственных отношений, изменениями внутриполитической ситуации и т.д. Поэтому культуру Байкальского региона необходимо рассматривать в контексте истории монгольского буддизма, являющегося интегральной частью буддийского пространства Восточной и Центральной Азии.

Письменные традиции монгольского буддизма

Монголы впервые плотно соприкоснулись с центрально-азиатскими формами буддизма в ходе своей военной экспансии в самом начале XIII в., когда они подчинили буддийские государства уйгуров (Турфанское идыкутство) и тангутов (Западное Ся). К тому времени тюркоязычные уйгуры, занявшие оазисы Шелкового пути в IX в. после гибели своего каганата, политический центр которого находился в Орхонской долине на территории современной Монголии, практически ассимилировали местное тохароязычное и ираноязычное население, многое переняв у него в культурной сфере. В начале XIII в. они выступали наследниками блестящей буддийской культуры Центральной Азии, которая постепенно приходила в упадок из-за наступления ислама. Тангутское государство, занимавшее территории вдоль восточной

части Шелкового пути от излучины Хуанхэ до Дуньхуана (Хэси), было многонациональным и поликультурным. Буддизм Западного Ся объединял китайскую, тибетскую, уйгурскую традиции. В начальный период Монгольской империи особенно сильным было влияние уйгуров, поскольку монголы приняли уйгурскую письменность, а вместе с ней переняли богатейший культурный вокабуляр, в котором немалую часть составляла буддийская терминология [Berzin (a): электронный ресурс]. Таким образом, знакомство с культурой Шелкового пути дало первоначальный толчок для принятия буддизма монголами.

В середине XIII в. были установлены прочные связи со школами тибетского буддизма, в первую очередь, линией Сакья. Сакья-пандита Кунга Гьялцен Пэлсангпо (1182—1251) и его преемник Дрогён Чогьял Пагба-лама (1235—1280) стали наставниками при дворах монгольских правителей, а Пагба-лама был особо возвышен Хубилаем, первым императором монгольской династии Юань, воплотив модель политико-религиозного союза «наставник -покровитель» (тиб. mchod yon). В то время монгольская верхушка активно поддерживала и перенимала центрально-азиатские формы буддизма, однако сведения об этом в источниках противоречивы, и поэтому трудно составить целостную картину широты и глубины первой волны распространения буддизма среди монголов [Рерих 1999: 164].

Первые достоверные сведения о целенаправленных переводах буддийских сочинений на монгольский язык, как и дошедшие до нашего времени тексты, относятся к периоду правления императора Хайсан Кулук-хана (1307-1311) и связываются с именем известного религиозного деятеля Чойджи-Одсера [Рерих 1999: 167]. Ему приписывается честь перевода на монгольский «Панчаракши» (gZungs gra lnga) и «Бодхичарьяватары» Шантидевы. Согласно В. Хайссигу, перевод Чойджи-одсера стал первой известной печатной книгой на монгольском языке, изданной в 1431 году в Пекине [Heissig 1980: 26]. Это был четырёхъязычный сборник буддийских молитв-дхарани с изображениями божеств. В. Хайссиг указывает, что существенное количество канонических

произведений было переведено в последний период правления Юань в Китае (в основном они были утрачены), но в целом буддизм мало проникал в широкие слои монгольского общества [Ие1вв1§ 1980: 25].

Падение династии Юань во второй половине XIV в. спровоцировало культурную деградацию монгольского общества, «тёмный» период в жизни которого продлился около двух столетий. Влияние буддизма в Монголии, хотя и сохранялось в определенной степени, не оставило ясных свидетельств.

В середине XVI в. начался новый военно-политический подъем монголов. Они снова стали доминировать на огромных пространствах Центральной Азии, выступая на равных даже с правящей Китаем династией Мин. Крупнейший военно-политический деятель того периода Алтан-хан Тумэтский (1507-1582) в поисках легитимации своих притязаний на главенство в монгольском мире обратился к традиционной модели «наставник - покровитель», в 1579 г. пригласив к своему двору Сонама Гьяцо, иерарха влиятельной новой школы тибетского буддизма Гелуг. Хан преподнес тибетскому наставнику титул «Далай-лама», который был также распространен на предшествовавших Сонаму Гьяцо глав школы Гелуг. Алтан-хан в своих владениях основал несколько монастырей, в которых началась активная деятельность по переводу буддийских сочинений на монгольский язык. Другие монгольские феодальные правители также приглашали тибетских учителей и строили монастыри разных школ, в том числе Сакья, Кагью и др. [Владимирцов 1927: 216]

Существенная часть канонических сочинений, включая тексты Праджняпарамиты, была переведена в конце XVI в. под руководством Ширэту Гуши-цорджи, настоятеля монастыря Их Дзу (Дачжаосы) в Хухэ-хото [Владимирцов 1927: 228]. Для решения проблемы фонетической передачи тибетских и санскритских терминов на монгольском языке ученый и просветитель Аюши-гуши составил в 1587 г. транслитерационный алфавит галик (монг. али-гали Yсэг), нашедший широкое применение [ИевЫ^о^аИи 2013].

В результате обширной, но мало согласованной переводческой деятельности, которая развернулась в быстро растущих буддийских центрах Монголии в конце XVI - начале XVII вв., появились многочисленные версии и редакции переводов буддийских сочинений [Музраева 2016]. За относительно короткий срок была подготовлена почва для формирования буддийского канонического свода на монгольском языке. В 1628-1629 гг. по велению Лигдан-хана в монастыре Хотала-Баясху была учреждена редакционная коллегия из 33 наиболее авторитетных монгольских учёных лам и тибетских переводчиков под руководством Хутухту-пандиты Манджушри номун-хана Гунга-Одсэра, Самдан Сэнгэ, Гунтан-гуши дархан-ламы [Ванчикова 2016: 159].

Коллегия собрала и проверила все существовавшие на тот момент монгольские переводы; затем были переведены с тибетского языка ранее не переводившиеся сочинения. Результаты редакторской работы были сведены в единый корпус канонических текстов. Первое монгольское издание Ганджура состояло из 113 томов, оно было написано золотыми и серебряными чернилами на синей бумаге, и поэтому получило название «Золотого». После смерти Лигдан-хана и падения монгольской династии Северная Юань, этот комплект Ганджура в качестве почетного трофея хранился в Мукдене, первой столице маньчжурских императоров [Успенский 2011: 250].

Предание о распространении Ганджура среди монголов, весьма напоминающее тибетские сюжеты о Каньгюре, сохранилось в биографии Нейджи-тойна (1557-1653), выдающегося буддийского просветителя, выходца из ойратской аристократии. В нем говорится, что пребывая у хорчинского Цамба Дархан-бэйлэ, Нейджи-тойн заказал из Пеикна тушь, бумагу и киноварь. Собранными им переписчиками было сделано 108 копий Ганджура, которые были розданы «ванам, княгиням и принцессам, большим и малым нойонам, тойнам, хуваракам и тушимэлам каждого хошуна с наказом: «Ревностно их почитайте!». Копии Ганджура были посланы также восьми знамёнам в Пекин с повелением «Читайте и почитайте!» [Пурбуева 1984]

В. Хайссиг указывает, что в монгольском Ганджуре содержится 1161 работа, включая сочинения красношапочных школ и тантрические учения; для перевода теологической и философской литературы необходимо было ввести в монгольский язык множество новых концепций. По мнению ученого, монголы за 50 лет совершили необычайный интеллектуальный скачок, который затронул не только буддийскую литературу, но привел также к становлению светских жанров, в частности, исторического [Ие1вв1§ 1980: 31].

До наших дней дошло немного экземпляров монгольского рукописного Ганджура. Комплектные варианты сохранились в Восточном отделе Научной библиотеки Санкт-Петербургского государственного университета (113 томов), библиотеке Академии общественных наук Автономного района Внутренняя Монголия в Хухэ-хото (109 томов), Национальной библиотеке Монголии в Улан-Баторе (70 томов), Центре восточных рукописей и ксилографов ИМБТ СО РАН в Улан-Удэ (109 томов). Еще несколько рукописных экземпляров представлены во фрагментарном состоянии, включая 20 полных и неполных томов, по видимому, оригинального Золотого Ганджура, которые ныне хранятся в Хухэ-Хото [Алексеев 2015: 202-209].

Золотой Ганджур стал, по-видимому, основой для предпринятого цинским двором ксилографического издания монгольского буддийского канона, выполненного в Пекине в 1717-1720 гг. Маньчжурская династия придавала большое значение апроприации религиозной харизмы для легитимации своей власти над покоренными народами. С этой целью цинские власти осуществляли проекты ксилографического издания буддийских канонических собраний на разных языках, в том числе монгольского Ганджура. Подготовка ксилографа была выполнена особой комиссией учёных, приглашенных из всех монгольских хошунов, под руководством Лобсан Чултэма. Ими были сличены переводы из рукописного Золотого Ганджура, другие монгольские списки с тибетскими вариантами, включенными в пекинские ксилографические издания Кангьюра. Поскольку печать 108 томов этого издания была выполнена с использованием пигмента на основе киновари,

оно получило известность под названием «Красный Ганджур». Согласно указу императора Канси, его экземпляры были переданы в дар многим монгольским монастырям. Это печатное издание имело большое значение для монгольского мира, потому что оно способствовало широкому распространению буддизма и буддийской культуры, приобщению к многовековым знаниям Востока [Ванчикова 2016: 160].

Еще более грандиозным стал проект по изданию монгольского Данджура, который был предпринят в период правления императора Цяньлуна в 1742-1749 гг. Работа над переводом на монгольский язык этого огромного собрания буддийских сочинений, более чем в два раза превосходящего по объему Ганджур, выполнялась специальной группой переводчиков, лучших знатоков текстов и редакторов, собранных со всех монгольских земель и Тибета, общим числом более 200 человек [Mongyol 2002: 10]. Для работы столь большого коллектива необходимо было решить задачу унификации буддийских терминов, в связи с чем была создана терминологическая комиссия для выработки единых стандартов для перевода с тибетского языка на монгольский под руководством известных монгольских учёных лам Джанджахутухты Ролбийдорджи (1717-1786) и Лубсандамбинимы (1689-1762). Комиссия составила терминологический словарь «Источник мудрецов» (Merged yarqu-yin oron) [Источник мудрецов 1968]. Его билинговый тибето-монгольский вариант был вырезан и напечатан в 1742 г. Этот словарь стал основным руководством для перевода и редактирования монгольского Данджура. Перевод осуществлялся по тибетскому ксилографическому Тенгьюру, изданному в Пекине в 1724 г. Работа по вырезанию и печатанию монголоязычного Данджура в 225 томах была завершена в 1749 г. [Mongyol 2002: 11] Помимо основного содержания, дополнительно были вырезаны и напечатаны переводы сумбумов Цзонхавы в 20 томах и Джанджа-хутухты Агванчойдана в 7 томах. Общий объем составил 252 тома.

Издание монгольских буддийских канонических собраний, Ганджура и Данджура, оказало огромное влияние на общее культурное развитие

монгольского мира, включая Байкальский регион. Оно способствовало развитию классического монгольского литературного языка, расширению интеллектуального слоя в обществе, формированию собственно монгольских письменных и книжных традиций [Отгонбаатар; Цендина 2014: 8]. Извлечения из канона, переписанные от руки или отпечатанные ксилографически отдельными книгами, получили распространение среди ординарных верующих, положив начало развитой традиции буддийской книжной повседневности.

Среди монгольских народов появились выдающиеся учёные ламы, которые занимались не только переводами текстов, но и написанием собственных трудов по всем отраслям буддийских наук [Введение 1989]. Как и повсюду в буддийском пространстве Восточной и Центральной Азии, монгольский канон обладал не только религиозным значением. Он выступал фокусом приложения интеллектуальных сил общества, важным регулятором социальных отношений, полигоном развития и внедрения новых технологий в информационной сфере. Как и в других странах, буддийский канон был объектом апроприации со стороны верховной власти, сначала в лице монгольских ханов, затем - маньчжурских императоров. Властный патронаж способствовал концентрации интеллектуальных и материальных ресурсов и обеспечивал функционирование буддийского канона как важного социального и даже политического института, значение которого выходило далеко за рамки религиозной жизни.

Литургическая ценность монгольской буддийской литературы, в целом, была невелика, поскольку религиозные службы и большая часть иных практик в монастырях велись на тибетском языке, за исключением Мэргэн-сумэ в Уратском хошуне Внутренней Монголии [Аюшеева М.В. 2010Ь: 78]. Однако становление корпуса монгольской литературы способствовало широкому распространению монгольской грамотности. Связанные с ним письменные традиции в существенной степени формировали структуру и содержание книжной повседневности как среди светской и религиозной элиты, так и в ординарной среде. Среди широких масс населения были популярны

произведения разных жанров на монгольском языке, в частности, дидактического характера, ввиду возможности их непосредственного восприятия народной массой [Музраева 2013]. Именно в контексте буддийской литературы происходило освоение монголами существовавших на тот момент информационных технологий - принципов формирования и структурирования большого корпуса текстов, лингвистических (терминологических и грамматических) исследований, технологий массового воспроизводства текстов и т.д., область применения которых постепенно перетекала религиозные рамки и распространялась на разные сферы социальной жизни. И в этих важных функциях заключается вклад буддийской письменной традиции в развитие культуры монгольского мира, включая Байкальский регион.

Издательская деятельность бурятских дацанов

Начало формирования бурятской этнической общности на территории Байкальского региона относится ко второй половине XVII в., когда вступившая в стадию распада феодальная Монголия стала объектом экспансии двух растущих гигантов - российского государства и маньчжурской Цинской империи [Базаров Б.В. 2011]. Проживавшие на территории Прибайкалья и Забайкалья монголоязычные группы и присоединившиеся к ним выходцы из других частей Монголии сформировали этническое ядро бурятского народа. Многие группы, принимавшие участие в формировании новой общности, к этому времени уже исповедовали буддизм. Принимая русское подданство, они становились частью созданной царскими властями административной структуры, в которой основной единицей выступал «административный род». Каждому роду предоставлялась территория для хозяйственного освоения, делегировались определённые функции самоуправления, которые осуществляли родовые начальники, происходившие обычно из числа степной аристократии - тайши, зайсаны и шуленги. Их полномочия утверждались русской администрацией [Шагдурова 2011: 118].

Принципы этой системы сохранились и после административной реформы М. М. Сперанского, которую царское правительство осуществило в 1 822 г. Органы самоуправления бурятского населения были реорганизованы, но родовой принцип его организации остался. Согласно «Уставу об управлении инородцев» были созданы Степные думы и родовые управы с выборными начальниками, исполняющими властные полномочия на определенной территории [Борисов; Дамешек 2011: 130].

Эта «родовая» административная структура стала одним из основных факторов формирования этно-территориальных групп в составе бурятского народа. Она консервировала сохраняющиеся до настоящего времени этноразличительные черты в диалектах, материальной культуре, способах хозяйствования, традиционной обрядности и т.д., поскольку в сложении родовых групп участвовали разные монголоязычные этно-политические образования средневековья.

Родовой принцип поначалу отражался и на распространении буддизма в Байкальском регионе. Изначально буддийская община формировалась по территориально-родовому принципу, когда отдельные группы бурятского населения стремились учредить собственный штат священнослужителей, построить свои культовые сооружения и т.д. Но уже к 1740-м гг. укрепилась тенденция к формированию единой церковной организации [Цыремпилов 2014 102]. Принято считать, что буддизм получил инвеституру из рук императрицы Елизаветы Петровны в 1741 г., когда один из наиболее влиятельных буддийских деятелей в бурятских землях, тибетский лама Агван Пунцок, получил полномочия по организационному оформлению буддийской церкви среди российских подданных. В те же годы произошла и легализация существовавших у бурят культовых сооружений, появилась возможность строить их стационарные варианты. Буддизм быстро распространялся в Байкальском регионе. Особо показателен в этом плане рост сети стационарных монастырей-дацанов, число которых менее чем за столетие достигло 34 на территории от Ангары до Онона.

На протяжении длительного времени официальная буддийская церковь была единственным институтом, объединявшим разные территориальные группы бурят, поэтому буддизм сыграл существенную роль не только в развитии этнокультурной специфики бурятского социума, но и в формировании национальной идентичности [Цыремпилов 2011: 92].

Дацаны в Байкальском регионе в те времена являлись не просто культовыми сооружениями, но и центрами культуры и социальной жизни. При них действовали школы, где послушники и монахи изучали тибетский язык и письменность, монгольскую грамоту, буддийскую схоластику и искусства. Особое место среди изучаемых буддийских наук занимала тибетская медицина. Местные дацаны поддерживали глубокие связи с монастырями Монголии и Тибета, осуществляли обширные культурные и экономические обмены. Бурятские ламы активно перенимали религиозные традиции, берущие начало в буддийских центрах Центральной и Восточной Азии. Одним из значительных результатов этой неустанной культуртрегерской деятельности было укоренение на территории Байкальского региона буддийской книжной традиции в полной форме.

Литургическая, образовательная активность в монастырях, распространение книжной повседневной культуры в мирской среде требовали значительных объемов религиозной литературы. Поначалу потребности покрывались за счет импорта. Большие объемы книг приобреталась и завозились из Тибета, Китая и Монголии, в том числе дорогостоящие ксилографические издания буддийского канона [Сыртыпова и др. 2006а: 44]. Однако со временем ситуация менялась, все большее количество книг создавалось на месте с использованием доступных на территории Байкальского региона материалов, в первую очередь, бумаги российского производства.

Развитие книгопроизводства в Байкальском регионе было обусловлено несколькими факторами. Во-первых, на местной почве начал складываться специфический книжный репертуар, спрос на который не мог быть удовлетворен за счет импорта, причем запросы на литературу различались у

территориально-родовых групп бурятского населения. В разных локусах региональной буддийской культуры из огромного количества буддийских произведений выбирались те, что особенно часто использовались в храмовой ежедневной службе, в бытовой обрядности, в образовательной системе монастырей-университетов [Сыртыпова и др. 2006а: 39]. Во-вторых, существенным фактором была жесткая надзорная политика российского государства, таможенная и цензурная, которая усиливалась по мере укрепления в Байкальском регионе позиций царской администрации. Политика властных органов на протяжении ХУШ-Х1Х вв. была направлена на ограничение роста позиций буддизма в Байкальском регионе, сокращение контактов местного населения с этнически и культурно близким зарубежьем, предотвращение вывоза за границу серебра и других ценных ресурсов для приобретения книг и предметов культа. Контроль над ввозом религиозной литературы, который пыталось претворять российское правительство, был одной из главных мер для решения этих задач.

В этих условиях ответ бурятских буддистов заключался в развитии местного книгопроизводства и массовом освоении технологии ксилографической печати. Документальных свидетельств о первых этапах этого процесса не сохранилось. Вероятно, это связано с тем, что бурятские буддисты стремились скрывать книгоиздательскую деятельность от надзорных органов царской администрации. Первое известное упоминание находится в реестре книг на монгольском языке, составленном в 1820 г. хамбо-ламой Ишижамсуевым совместно с монголистом А.В. Игумновым по запросу М.М. Сперанского. В нем значится книга «Дара эхэ-ийн хорин нигэн мургул», напечатанная красной краской в Гусиноозерском дацане [Галданова и др. 1983: 74]. Сведения о бурятском книгопечатании приведены в летописи Д.-Ж. Ломбоцыренова «История селенгинских монгол-бурят» в связи с экспедицией барона П. Л. Шиллинга фон Канштадта в 1830-1832 г. по изучению состояния «ламайской религии» среди российских подданных, которая была проведена по поручению Министерства иностранных дел с целью составления проекта

законодательства в отношении буддистов Восточной Сибири [Цыремпилов 2013: 104]. Высокий чиновник тщательно изучал все стороны монастырской жизни, обратив внимание на книгоиздательскую деятельность. Согласно летописи Д.-Ж. Ломбоцыренова, в Иройском дацане специально для него были напечатаны книги с матриц, изготовленных из дерева дикой яблони [Ломбоцыренов 1995: 122]. В материалах экспедиции есть и другие упоминания о применении ксилографической печати, в частности, в Цугольском дацане [Жамсуева 2016: 76]. Российским монголистом А. Г. Сазыкиным были установлены 12 ранних бурятских ксилографов на монгольском языке, доставленных в Санкт-Петербург комиссией Шиллинга фон Канштадта, которые в настоящее время хранятся в фондах ИВР РАН [Сыртыпова и др. 2006а: 48]. И все же, имеющихся данных недостаточно, чтобы составить полное представление о начальном этапе книгопечатания в буддийских монастырях Байкальского региона.

Более определенные сведения об издательской деятельности бурятских дацанов относятся уже ко второй половине XIX в. Так, согласно списку хамбо-ламы Дампила Гомбоева, представленному ревизору департамента духовных дел иностранных исповеданий Министерство иностранных дел Э. Ухтомскому в 1887 г., в 29 из 34 дацанов имелись свои печатни, которые издавали 600 названий текстов на тибетском и монгольском языках. Печатни имелись при Агинском, Цугольском, Эгитуйском, Аннинском, Гусиноозерском и других монастырях. Наиболее активным в этой деятельности был Цугольский дацан, выпускавший 169 наименований книг [Галданова и др. 1983: 75]. Печатание книг на тибетском языке в несколько раз превышало количество изданных монголоязычных изданий.

Динамика книгопроизводства на рубеже XIX - XX вв. особенно видна по информации из сводного списка опубликованных работ дацанов Байкальского региона, который был составлен в 1911 г. канцелярией хамбо-ламы Д.-Д. Итыгилова [Сыртыпова и др. 2006а: 16]. В нем перечислено 1696 названий печатных изданий, из них в Цугольском дацане было выпущено 326

наименований. Таким образом, менее чем за 25 лет количество только официально учтенных изданий увеличилось более чем в 2,5 раза. Бурятское книгопечатание в первых десятилетиях XX в. приобрело зрелую форму, хотя и основывалось на устаревающей технологии ксилографии.

Освоение ксилографического книгопечатания в Байкальском регионе являлось безусловным культурным достижением. Особенности и значение книгопечатания в бурятских дацанах заключались в том, что оно гибко отражало спрос читающей и внимающей публики, монашеской и мирской, в ритуальной, учебно-схоластической, дидактической, религиозно-художественной литературе, который формировался в соответствии с местными культурными традициями и литературными предпочтениями. Изучение репертуара печатных дворов, зафиксированного в указанных списках и опубликованных гарчиках-каталогах монастырских печатен, а также на основе анализа состава коллекций памятников письменности, сохранившихся в академических и музейных фондах, позволяет определить интересы и повседневные запросы буддистов Байкальского региона. Созданная в ЦВРК ИМБТ СО РАН база данных «Коллекция тибетоязычной литературы класса THOR BU в ИМБТ СО РАН» предоставляет большой объем количественных данных для осуществления такого анализа [Базаров А.А., Ринчинов. 2017].

Традиционная книжная культура в Байкальском регионе

Формирование традиции книжной повседневности ординарного буддиста является характерной чертой буддизма Махаяны. Её становлению способствовали особенности махаянской доктрины, которая утверждает активный прозелитический характер буддийского учения с целью «спасения всех живых существ». С этой точки зрения, донесение знания до мирян является составной частью «пути бодхисаттвы» - этического идеала Махаяны, что поощряет разные способы передачи, в том числе и посредством книг [van Schaik 2012]. Немалое значение для формирования интенсивной книжной культуры имела концепция «заслуг», являющихся своеобразной мерой

продвижения личности по пути буддийского спасения: принято считать, что любые действия, предпринимаемые для распространения учения, генерируют заслуги. Письменная передача способствовала распространению буддизма в Восточной и Центральной Азии, поэтому копирование книг, распространение книжного знания, его почитание признаются деяниями, приносящими множественные заслуги. Это подтверждает текстологическое изучение множества колофонов буддийских книг [Morgan, Walters 2011: 138-140].

Выходя за пределы монастырей и вступая в повседневную жизнь мирских приверженцев буддизма, книжная традиция стала важным фактором приобщения народных масс к общей культуре, этическим и нравственным нормам, проповедуемым буддизмом. Буддийские философско-этические взгляды, которые транслировались в бурятское общество во многом благодаря развитой книжной культуре, существенным образом повлияли на формирование ценностных установок населения Байкальского региона, паттернов его социальной жизни и поведенческих стереотипов. Поэтому реконструкция книжной повседневности среди бурят чрезвычайно важна для целостного восприятия мира буддийской культуры в Байкальском регионе.

Книга в буддийской традиции имеет сакральное значение, считаясь воплощением одной из буддийских «драгоценностей» - Дхармы (учения). Церковь старательно транслировала такое отношение к книге в общество. Технологии ксилографического воспроизведения книг были освоены буддистами достаточно рано, что обеспечивало массовое тиражирование литературы и относительную доступность книг для ординарных верующих. Почиталось благочестивым занятием и всячески поощрялось рукописное копирование книг. Укоренение буддийской книжной традиции в Байкальском регионе происходило за счет широкого распространения среди бурятского населения монастырского религиозного образования, поскольку практически в каждой семье один из сыновей становился послушником. Это способствовало распространению грамотности в народных массах и благоприятствовало восприятию, поддержанию и трансляции книжной культуры через поколения. В

домашних алтарях верующих буддистов в Байкальском регионе почетное место, среди статуэток и живописных изображений божеств, занимали буддийские книги на тибетском и монгольском языках [Содномпилова 2013: 134].

Антирелигиозные кампании, развернутые в СССР в 1920-30-х гг., нанесли невосполнимый урон буддийским социальным и культурным институтам Байкальского региона. Были разрушены монастыри, уничтожены монастырские библиотеки и книгопечатни, репрессировано духовенство. Изменились принципы массового образования, из которого были исключены тибетский и классический монгольский языки, служившие ранее носителями буддийской культуры. Это затруднило практическое использование сохранившейся у населения раритетной религиозной литературы. Тем не менее, традиция благоговейного отношения к буддийской книге среди бурят сохранялась на протяжении всего периода репрессий и после них, особенно в консервативных сельских сообществах.

Исследования повседневной книжной культуры позволили выявить комплекс наиболее распространенных текстов среди буддистов-мирян Байкальского региона. Сведения об этих произведениях приведены в таблице.

Таблица. 1.5.1.

Книжный репертуар частных коллекций буддийской литературы

в Байкальском регионе [Базаров А.А., Ринчинов. 2016: 13]

Название Часто та Вид Языки Происхожде ние Назначение

«Суварнапрабха- 49/89 Рук., Монг., Тибет, Материальное благополучие

соттамасутра» ксил. тиб., Китай, семьи, хорошее

(тиб. gSer 'od, бур. Монголия, перерождение, защита

«Алтан гэрэл») Бурятия родовой территории от внешних угроз, достижение высокого социального статуса представителями рода

«Панчаракша» 30/89 Ксил, Тиб., Защита от опасностей, опора

(«Банзаракша») рук. монг. благополучия детей

«Аштасахасрика-праджняпарамита » (8 тысяч шлок, «Джадомба») 15/89 Ксил., рук. Тиб., монг. Китай, Тибет, Монголия, Бурятия

«Ваджрачхедика- праджняпарамита » («Доржо жодбо», «Алмазная сутра») 15/89 Ксил., рук. Тиб., монг. Китай, Тибет, Монголия, Бурятия Улучшение микроклимата в семье, предупреждение ссор и конфликтов, удаление из сознания плохих побуждений и мыслей, достижение внутреннего равновесия, спокойствия и удовлетворения, успех в любой деятельности, перерождение в благоприятных сферах

«Шатасхасрика-праджняпарамита » (100 тысяч шлок, «Юм») 6/89 Ксил., рук. Тиб., монг.

«Манджушри-нама-самгити» 7/89 Ксил. Монг.

«Улигер-ун далай» («Море притч»). 3/89 Ксил. Монг. Сочинения дидактического характера

«Зундуй» (дхарани) Тиб., монг. Защита от различных негативных воздействий. Очищение негативной кармы, укрепление жизненных сил.

«Этигел» (тиб. Skyabs ^о sems bskyed, «Прибежище») Монг.

«Найман гэгэн» Монг. Достижение счастливых

(тиб. Snang brgyad, «Восемь светлых») перерождений, утихимиривание семейных ссор и конфликтов.

В буддийских традициях Байкальского региона вокруг религиозных книг сложилась разветвлённая культовая практика. Она включает разные формы хранения, почитания и способов использования. Традиционное место размещения книг в доме буддиста-мирянина - хоймор, северная сторона, наиболее почетное место в помещении. Обычно книги кладут стопкой сверху алтарного шкафчика, в котором размещаются культовые предметы - статуэтки, иконы, фотографии учителей и т.д. Таким образом, они занимают самое высокое место на домашнем алтаре [Содномпилова 2013: 134]. Традиционным способом хранения книг формата потхи является заворачивание в специально сшитые из шелковых или хлопчатобумажных тканей чехлы жанши, которые обвязываются шнуром и идентифицируются ярлычком-дондором. Иногда книги хранят в специальных деревянных ящиках-футлярах хайрсаг (абдар). В буддизме Махаяны существует традиция закладывания книг в особые реликварии, которые устраиваются и замуровываются внутри субурганов -ступ, молитвенных барабанов-хорло, жалсанов - украшений храмовых крыш. В такие реликварии помещаются как множественные копии определенного текста, так и целые библиотеки.

Культовая практика включает в себя различные ритуальные действия, связанные с книгой. Среди них можно указать хранение на «чистом» месте и поклонение (тахиха), ежедневное очищение (арюулха), перебирание листов (Ъэбихэ, эридэхэ), регулярное освящение во время служб в дацане (далга хэхэ), когда книги приносят в храм и держат их на коленях во время службы, обход вокруг дома или населенного пункта с книгой в руках (гороо хэхэ) [Базаров А.А., Бураева 2015: 119].

Важной частью культовой практики является громкое чтение (рецитация) религиозных книг. Такие чтения могут проводиться на семейном, родовом,

общинном уровнях, для каждого случая используется особый репертуар текстов. Для чтения тибетоязычной литературы приглашают лам. Книги на монгольском языке, помимо лам, могут читать миряне, владеющие монгольской грамотой. Чтения книг обычно устраиваются зимой накануне или во время празднования Нового года по восточному лунному календарю (Саагаалгана) и во время ежегодных родовых и общинных ритуалов в начале лета (конец мая - начало июня). Помимо предписываемых религиозным календарем случаев ритуальное чтение буддийских книг устраивают в трудных жизненных ситуациях, связанных с работой, переездами, путешествиями, семейными неурядицами и т.д. Некоторые глубоко посвященные в религиозную жизнь миряне самостоятельно выполняют ритуальное чтение буддийской литературы, индивидуальное или коллективное, в качестве повседневной регулярной практики.

Сохранение книжной традиции повседневности связано с проблемой передачи ее между поколениями. В бурятском обществе преемственность сохраняется, хотя многое было утрачено в советский и тяжелый для сельской общины постсоветский периоды. Буддизм в результате демократических перемен получил импульс к возрождению, что отражается в связанной с ним традиционной книжной культуре. Восстанавливается бережное отношение к старым буддийским книгам, у верующих появляются новые издания буддийской литературы. Одной из тенденцией среди буддистов в Байкальском регионе является стремление перевести литургию на родной язык, для этого выполняются переводы и переложения текстов с тибетского и монгольского на бурятский язык [Базаров А.А. 2020: 656]. Среди мирян широкое хождение получили буддийские произведения, издаваемые на кириллической графике и адаптированные к современной бурятской фонетике. Таким образом, традиционная книжная культура трансформируется в соответствии с нуждами и запросами верующих.

Выводы по первой главе

Буддийские писания существуют на удивительном разнообразии языков, они принадлежат многим жанрам. Существует несколько крупных, сложным образом пересекающихся канонических собраний на пали, китайском, тибетском, монгольском и маньчжурском языках. На протяжении XX в. было обнаружено большое количество археологических свидетельств о письменной фиксации буддийских учений в приграничном северо-западном регионе Индийского субконтинента и прилегающих районах Центральной Азии. Обнаруженные здесь комплексы источников позволили в значительной степени реконструировать содержание буддийской передачи в Восточную и Центральную Азию и ее основные маршруты.

Передача буддийских письменных традиций, сформировавшихся в исторической области Гандхара на северо-западе Индийского субконтинента и получивших распространение в макрорегионе Восточной и Центральной Азии, стала возможной благодаря сети сухопутных маршрутов, известных как Шелковый путь. На протяжении многих сотен лет связывая огромные пространства Азии, Шелковый путь служил зоной интенсивных межкультурных коммуникаций и обмена идеями и технологиями, которые напрямую повлияли на формирование буддийских письменных традиций.

Межкультурное взаимодействие вдоль Шелкового пути способствовало сложению крупнейших корпусов письменных источников в разных культурных традициях, в первую очередь, китайской и тибетской, и производных от них -корейской, японской, монгольской. Таким образом, можно вести речь о сформировавшемся информационном континууме в Восточной и Центральной Азии, который распространяется на Байкальский регион как части монгольского мира. Это пространство строилось вокруг единого источника -индийского буддийского наследия, оно объединялось сетями экономических связей и патронажа, производственными и логистическими цепочками, маршрутами паломничества, политико-религиозными системами. За почти две тысячи лет его формирования и функционирования произошло несколько смен

парадигм воспроизводства и распространения информации - устная передача, освоение письменности, внедрение ксилографической печати, в настоящее время происходит его цифровая трансформация.

Можно выделить много общих черт в освоении буддийского учения в разных культурах Восточной и Центральной Азии. Так, буддисты этой части Азии стремились адаптировать учение к своим языкам, поэтому большое значение придавалось точности и аутентичности переводов. Лексикографические, лингвистические исследования, разнообразные способы структурирования корпуса были важной составной частью комплекса информационных технологий, которые внедряли буддисты в каждой культурной традиции.

Освоение информационных технологий в буддийской среде требовало интеграции многих технологических и социальных навыков, которые способствовали общему культурному развитию в обществах Восточной и Центральной Азии. Разработанная к IX в. ксилографическая печать отвечала потребностям буддистов в воспроизведении текстов, которые диктовались доктринальными установками, и потому была воспринята в буддийской среде раньше прочих социальных групп, о чем свидетельствуют наиболее древние сохранившиеся памятники ксилографической печати. Ксилографическая печать способствовала унификации содержательной части буддийского корпуса. Вместе с тем, даже наиболее регулярная его часть, канон, никогда не был статическим. Буддийское наследие является динамической системой, активно трансформирующейся и имеющей множество разновременных локальных вариаций. Эпоха модернизации внесла новые элементы в способы организации и освоения буддийского наследия, связанные с внедрением элементов европейской науки и технологическими усовершенствованиями. Цифровой этап открывает новые возможности и определяет новые вызовы, связанные с неограниченным накоплением и передачей информации.

Между моделями аккультурации буддизма и развития связанной с ним письменной культуры в странах Восточной и Центральной Азии наблюдаются

существенные сходства, объединенные общим источником литературной традиции, активным обменом идеями и технологиями. Различия обусловлены разными политическими режимами, разницей в религиозной ситуации в странах региона на ранних этапах. В частности, в начальный период распространения буддизма в Тибете был характерен государственный патронаж в отношении новой религии, в то время как в Китае в начале н.э. существовало множество параллельных многоуровневых линий буддийской передачи, а государственный контроль был установлен только при появлении сильных режимов имперского типа, в силу разных причин заинтересованных в апроприации религиозной харизмы.

Трансформации буддийского информационного континуума в Восточной и Центральной Азии характеризуются специфическим комплексом взаимосвязанных технологических, материаловедческих и социальных факторов, которые, в свою очередь, оказали огромное влияние на формирование локальных письменных традиций, в том числе выходящих за пределы религиозного контекста, во всех обществах, где происходила аккультурация буддизма и связанных с ним институтов. В этой связи культурное пространство Байкальского региона, памятники которого сконцентрированы в Центре восточных рукописей и ксилографов ИМБТ СО РАН, сформировалось в условиях определяющего влияния буддийской тибето-монгольской культуры, и его дальнейшее изучение и актуализация неразрывно связано с современными трансформациями буддийского наследия Восточной и Центральной Азии в целом.

Глава 2. Цифровые технологии в сохранении и представлении письменного наследия Восточной и Центральной Азии

2.1. Технологии цифровизации письменного наследия

Кодирование текста

Цифровое кодирование текста для языков, использующих отличные от латиницы системы символов, являлось нетривиальной задачей на заре компьютерной революции. Это было вызвано разнообразием вычислительных платформ и разным логическим устройством компьютерных систем, малым объемом оперативной и внешней памяти ЭВМ, различиями в поддержке символьных данных в разных операционных системах, недостатком или отсутствием шрифтовой поддержки и т.д. Важным фактором являлся также недостаток международного индустриального и академического сотрудничества в области стандартизации кодовых таблиц для разных языков.

Даже для кириллицы проблема компьютерного представления стояла весьма остро еще пару десятков лет назад. На разных операционных системах и компьютерных платформах существовало несколько независимых кодовых таблиц, обозначаемых как КОИ8 (для систем на UNIX-совместимых операционных системах), CP866 (для DOS), CP 1251 (для Microsoft Windows). Несовместимость кодировок между собой затрудняла обмен данными, их долговременное хранение, служила серьезным препятствием для поиска информации.

Еще большие проблемы вызывало адекватное представление восточных языков. Для иероглифической письменности, которую используют страны Восточной Азии, проблемами являются огромное количество письменных знаков, измеряющееся десятками тысяч, необходимость создания громоздких шрифтов для таких наборов символов, а также наличие двух систем написания китайских иероглифических символов - традиционных (на Тайване, в Гонконге и Макао) и упрощенных (в КНР и Сингапуре), и частично несовместимых с

ними японской кандзи и корейской ханча. Вместе с тем, научный и технологический потенциал стран Восточной Азии позволял решать эти проблемы с высокой степенью эффективности, а наладившееся со временем международное сотрудничество позволило выработать общие принципы представления иероглифической письменности. Общим термином, обозначающим контекст компьютерного представления национальных восточноазиатских систем письма, включающих иероглифические символы, является CJK (Chinese, Japanese, Korean) или CJKV (+ Vietnamese).

В Японии в течение нескольких десятилетий были выработаны стандарты кодирования символов семейства JIS (Japanese Industrial Standard). Первая версия была 7-битной для достижения совместимости со стандартом ASCII (ISO 646) и только частично поддерживала японскую азбуку катакана. Последующие решения были расширены за счет 16-разрядного представления кода символа, что обеспечивает большее адресное пространство. Основным нововведением стало появление кодовых плоскостей размерностью 94 х 94 элементов, позволяющих отображать значительное количество символов сложной японской системы письменности, включающей азбуки и логограммы кандзи. Основные характеристики стандартов JIS приведены в таблице.

Таблица 2.1.1.

Название Год первой публикации Разрядность кодировки Представленные символы Примечание

JIS X 0201 1969 7 бит 64 знака катаканы расширение ISO 646 (ASCII)

JIS X 0208 1978 2 байта 6355 кандзи и 524 других знака

JIS X 0212 1990 2 байта дополнительные 6879 символов кандзи дополнение к JIS X 0208

JIS X 0213 2000 2 байта расширение JIS X 0208

Пока JISC разрабатывал кодовые таблицы и методы кодирования для японского языка, в других странах Восточной Азии внимательно наблюдали, как наиболее технологически продвинутая страна в регионе компьютеризирует национальную письменность. Поэтому неудивительно, что национальные системы кодирования, созданные для применения в Китае, Корее и на Тайване, переняли некоторые особенности кодовых таблиц JIS. Например, как и JIS, они обернуты вокруг локального варианта ISO 646, который включает знак местной валюты вместо обратной косой черты, используют кодовые плоскости размерностью 94 x 94, включают символы из других письменностей и элементы псевдографики [Searle: электронный ресурс]. Однако национальные кодовые системы стран Восточной Азии имеют свои особенности.

Для поддержки традиционной китайской иероглифики в 1984 г. был создан индустриальный стандарт кодировки Big-5 (по названиям пяти крупнейших тайваньских ИТ-корпораций, составивших консорциум для разработки системы кодирования), который применяется в странах, где используются традиционные иероглифы - Тайване, Гонконге и Макао. Помимо цифр, символов разных алфавитов, стандарт предлагает 2 набора идеограмм по 5401 и 7652 единиц соответственно.

Поскольку оригинальная система кодирования Big-5 включала малое число иероглифов, в корпоративном секторе, образовательными и государственными учреждениями разрабатывались многочисленные расширения для нее, например, Microsoft Code Page 950 или HKSCS (Hong Kong Supplementary Character Set), которые отличаются большим количеством кодовых плоскостей, но сохраняют совместимость с основным стандартом. На основе Big5 разработан и принят в 1986 г. официальный стандарт Китайской республики (Тайвань) CNS 11643, включающий уже 7 плоскостей 94 х 94 и обеспечивающий ввод около 35 тыс. иероглифов.

В Корее по схожим принципам была создана своя система кодирования KS C 5601 (KS X 1001), представленная в 1986 г. Её основной задачей было

цифровое представление хангыля (корейского алфавита) и ханча (иероглифов, используемых в корейской письменности). Помимо основных алфавитных письменностей, включая собственно хангылъ, катакану и хирагану, кодовая система включает 2350 предварительно скомбинированных слогов хангыля и 4888 знаков ханча.

В материковом Китае (КНР) выработан стандарт для упрощенных иероглифов GB 2312. Эта система кодирования также следует основным принципам, реализованным в ЛБ X 0208. Она предлагает в общей сложности 6763 иероглифа, покрывающих 99,9% употребляемых в повседневной практике знаков, которые организованы в две группы. В первой упорядочение осуществляется согласно транскрипции пинъинъ, во второй используется более традиционный способ с использованием иероглифических ключей (радикалов).

Таким образом, развитие компьютерного представления языков Восточной Азии шло одновременно с развитием информационных технологий, и проблемы представления текстов решались своевременным образом благодаря высокразвитой ИТ индустрии, международному взаимодействию и академическому сотрудничеству.

Иная ситуация была с языками Центральной Азии - тибетским и классическим монгольским, за которыми не стояли мощные государственные структуры или корпоративная поддержка. Решения, разрабатываемые в КНР для тибетского и монгольского как официальных языков национальных меньшинств, мало подходили для использования зарубежными пользователями, поскольку были тесно завязаны на китайские аппаратные и программные платформы, поначалу несовместимые с индустриальными и международными стандартами.

В 1980-х гг. стартовали несколько проектов по цифровому вводу тибетского письменного наследия, которые сразу же столкнулись с проблемой отсутствия полноценной поддержки тибетской письменности в компьютерных системах того времени. Одним из решений было использование транслитерации на основе латинского алфавита вместо оригинальной тибетской

графики. Стандартом де-факто среди тибетологов в США была транслитерационная схема американского тибетолога Таррелла Уайли (Turrell Wylie) [Wylie 1959], которая легла в основу цифрового представления тибетских текстов в большинстве проектов по цифровизации тибетского наследия. Транслитерация взаимно-однозначна, поэтому существует возможность быстрой конвертации романизированного текста в оригинальную тибетскую графику и наоборот с использованием специализированных программ-парсеров. Романизированное представление обеспечивает независимость от потенциально несовместимых кодировок тибетских символов и возможность кросс-платформенного обмена электронными текстами. Ее использование заметно облегчает создание поисковых и аналитических инструментов, необходимых для текстологических исследований.

Этот подход был основным для проекта «Barkhang» Рональда Шварца, выполненного для платформы Apple II в 1983 г. Позже Шварц портировал поддержку тибетского языка на операционные системы Unix и MS DOS с помощью кастомизированной версии кросс-платформенного текстового процессора LaTex [Hackett 2019].

Наиболее успешно эту методологию реализовал один из пионерских проектов - Asian Classics Input Project (ACIP), инициированный в 1987 г. ACIP применяет модифицированную версию транслитерации Wylie с улучшенной поддержкой санскрита и другими усовершенствованиями. Полнотекстовые базы данных тибетского письменного наследия, созданные в рамках этой инициативы, до настоящего времени являются крупнейшими по объему из публично доступных.

В рамках разных инициатив было разработано несколько семейств растровых и векторных шрифтов, содержащих глифы тибетских символов. Одним из наиболее известных было семейство TrueType шрифтов Sambhota, которое комбинировало символы и наиболее распространённые слоговые комбинации из нескольких шрифтовых файлов. Программа-конвертор с поддержкой Sambhota входила в состав пакета программного обеспечения,

который распространял ACIP. Все подобные решения в 1980-1990-х гг. не были совместимы со стандартными кодовыми таблицами, и потому имели ограниченную сферу применения, в основном для настольной издательской деятельности.

Одновременно предпринимались попытки решения вопроса ввода тибетских символов с помощью стандартной клавиатуры с латинскими символами. Для этого разрабатывались программные клавиатурные драйверы, которые конвертировали в тибетскую графику транслитерацию Extended Wylie (без диакритических знаков) подобно вводу иероглифических CJK символов с помощью пинъиня.

Схожая ситуация складывалась и для традиционной монгольской письменности. В 1990-х гг. существовало несколько несовместимых между собой систем кодировки монгольских символов, нарушающих стандарт ASCII. Этой особенностью обладал даже введенный в КНР стандарт кодирования монгольской письменности GB 8045-87, который размещал монгольские символы поверх знакомест Basic Latin. В Монголии наибольшую популярность для настольных издательских приложений, цифрового набора и обработки текстов получил пакет шрифтовой поддержки CMs (Classical Mongolian Scripts), созданный Peter Cheung и включавший TrueType шрифты CMs Ulaanbaatar, CMs Huree and CMs Urga [Biligsaikhan et al. 2011].

Текстовые данные с нестандартными схемами кодирования символов должным образом не индексируются поисковыми системами и не могут передаваться без потери информации по общедоступным каналам цифровых коммуникаций, основанных на стандарте ASCII, а потому не пригодны для долговременного хранения и обмена. Для этих целей, а также академических текстологических исследований, как и в случае с тибетской письменностью, единственным надежным решением являлась романизированная транслитерация монгольской графики.

В КНР решение проблемы поддержки тибетской и монгольской письменностей, совместимое с ASCII, было достигнуто их внедрением в

национальный стандарт GB 18030-2000, заменивший GB 2312, но оно не получило широкого признания за пределами КНР. Международный обмен текстами, созданными в этой кодировке, остаётся проблематичным.

Универсальное решение проблемы компьютерного представления восточно- и центральноазиатских письменностей появилось с утверждением стандарта Юникод, первая версия которого была принята в 1991 г. и включала 24 письменности. Изначально Юникод базировался на 16-разрядных (2-байтовых) кодах символов, и обеспечивал отображение 65636 символов. Начиная со второй версии стандарта максимальный размер кода символов был увеличен до двух 2-байтовых слов со специальным алгоритмом формирования кода за пределами диапазона стандартного 16-разрядного Юникода. Этот механизм, получивший название UTF-16 (Unicode Transformation Format), обеспечивает отображение до 1 112 064 символов. Еще одним способом представления символов в семействе стандартов Юникод стал UTF-8, который основан на использовании для кодирования символов от одного до четырёх 8-разрядных слов [UTF-8: электронный ресурс]. Преимущество UTF-8 заключается в том, что для текстовых данных, соответствующих базовой таблице ASCII (на английском и большинстве европейских языков), код символа занимает только 1 байт, и это существенно снижает требования к емкости устройств хранения информации и пропускной способности коммуникационных каналов по сравнению с 2-байтовым UTF-16.

Большинство компаний и организаций в технической, научной и образовательной сферах поддерживают или рекомендуют Юникод, что сделало его стандартом де-факто. В версии стандарта 13.0, опубликованной в марте 2020 г., из общего адресного пространства заполнены 143859 позиций. Всего в Юникод 13.0 поддерживается 154 отдельных видов письменности, включая 91 современную и 63 исторических. Таким образом, Юникод предоставляет широчайшие возможности для оцифровки мирового письменного наследия.

Важным вопросом, помимо универсальной системы кодирования символов, является шрифтовая поддержка восточных письменностей. Кодовая

таблица Юникод, в настоящее время включающая более 143 тыс. символов, сама по себе является абстрактным перечнем числовых кодов, а для визуального отображения текста на нужном языке на дисплее компьютера или мобильного устройства необходимы компьютерные шрифты. Эта проблема остро стояла для мало распространенных языков, таких как тибетский и монгольский, вплоть до появления операционной системы Microsoft Windows Vista в 2007 г., в которую была полностью интегрирована поддержка UTF-16, а шрифты для большинства поддерживаемых актуальной на тот момент версией стандарта Юникод письменностей вошли в стандартную поставку. Гарнитуры Microsoft Himalaya и Mongolian Baiti для тибетского и монгольского письма были лицензированы корпорацией Microsoft у разработчика - компании Beijing Founder Electronics Co., Ltd., аффилированной с Пекинским университетом [About Beijing Founder: электронный ресурс]. Вместе с тем, операционная система MS Windows не обеспечивала полной поддержки UTF-8 до 2017 г., что могло вызывать ошибки с отображением онлайн-ресурсов, для которых UTF-8, согласно рекомендациям стандарта HTML5, является базовой кодовой таблицей [HTML Unicode: электронный ресурс].

Таким образом, начиная со второй половины 2000-х гг., по мере внедрения новых версий операционных систем с полной интеграцией UTF-16 и UTF-8, ситуация с отображением текстов на восточных языках в любых случаях их использования - для просмотра онлайн-ресурсов в веб-браузерах, набора и редактирования в текстовых редакторах, активном кросс-платформенном обмене информацией и т.д. - существенно улучшилась, и в настоящее время большинство проблем разрешены.

Поскольку размер шрифтов ограничен 65 535 (64K) символами, ни один шрифт не может содержать все символы Юникода. Иногда бывает, что компьютер корректно определяет двоичную кодировку символа Юникода, но не может подобрать, какой глиф соответствуют этому символу. В этом случае отображается пустая прямоугольная рамка или черный ромб со знаком вопроса. Такая проблема нередко возникает при совместном использовании документов.

При вводе текста в текстовом редакторе в файл электронного документа помещаются не только набранные символы, но и информация об использованном шрифте. При открытии документа на другом компьютере вызывается функция отображения символов этого шрифта. Если на другом компьютере не установлена соответствующая гарнитура, то программа осуществит подстановку шрифта, который система посчитает подходящим. Проблема возникает, если шрифт на другом компьютере не содержит глифов, необходимых для визуализации символов закодированного текста. Такая проблема при экспорте в формат PDF решается тем, что в настройках можно указать, чтобы все используемые гарнитуры были включены в PDF-файл. Это позволяет отображать документ нужным образом в любой операционной системе.

Еще одним необходимым средством языковой поддержки в операционных системах является возможность набора символов определённого языка с клавиатуры. Эта проблема также находит свое решение с развитием операционных систем, дистрибутивы которых включают в себя стандартизованные клавиатурные раскладки и программные средства ввода символов. Так, для тибетского и монгольского языков клавиатурные раскладки и средства языковой поддержки входят в состав дистрибутива операционной системы MS Windows [Creating and Supporting: электронный ресурс].

Стандартизованные раскладки клавиатуры отлично подходят для общесистемного доступа к часто используемым символам. Но если необходим редкий символ, применяемый для транслитерации в конкретном проекте, или многократный ввод полных имен или заголовков, можно использовать стороннее приложение для расширения текстового ввода. Это небольшая программа - утилита, работающая в фоновом режиме, в которой можно настроить ввод нужного текста при наборе определенных комбинаций символов. Такая утилита может существенно ускорить ввод иноязычного текста, даже если он не поддерживается установленными на компьютере клавиатурными раскладками. Среди такого программного обеспечения можно

отметить приложение Hotkeycontrol [Hotkey control: электронный ресурс]. В текстовом процессоре MS Word имеется встроенный инструмент вставки произвольных символов. Для более сложных (или, наоборот, рутинных) случаев можно программировать макросы на языке Visual Basic for Applications (VBA), вызов которых осуществляется назначением комбинаций клавиш, с помощью кастомизации панелей инструментов и другими способами.

Разметка текста

Цифровые данные, будь то тексты, звуки, изображения, требуют определенной формы воплощения. Эта форма, в свою очередь, диктует способ ее использования. Файлы на компьютере имеют определенный формат, который устанавливает для операционной системы правила относительно того, как правильно открыть файл и интерпретировать содержащиеся в нем данные. Например, если попытаться открыть файл .jpg с помощью простого текстового редактора (например, Блокнота для MS Windows), то отобразится не визуальный образ, а несколько строк на первый взгляд случайных символов. Это происходит, потому что текстовый редактор ожидает, что открываемый файл будет текстом, и пытается преобразовать любые биты и байты, из которых состоит файл, в коды для отображения соответствующих символов на экране.

Существует важное различие между форматами текстовых и двоичных (бинарных) файлов. Все форматы текстовых файлов допускают два ограничения: (1) они содержат только простой текст (письменные знаки в широком смысле) и (2) этот текст организован в строки, разделенные кодом новой строки (CR+LF). Открытие текстового файла в любом приложении обработки текста отобразит содержимое файла. Форматы текстовых файлов в основном определены для хранения текстовых и числовых данных (например, .txt, .xml, .csv) или кода (например, .py и .js). Эта универсальность резко отличается от ситуации с двоичными файлами, каждый из которых подразумевает уникальный способ хранения и интерпретации данных. Существуют широко распространенные двоичные форматы файлов, такие как

.jpg или .mp3, которые могут читаться и отображаться огромным количеством приложений. Однако многие другие форматы могут быть записаны и прочитаны только определенной программой. Фактически, большая их часть относятся к проприетарным, и конкретный способ кодирования данных является охраняемой коммерческой тайной.

Наиболее важными форматами текстовых файлов являются .txt и .xml. Формат .doc, применявшийся ранее Microsoft Word и до сих пор широко поддерживаемый ради совместимости, является бинарным. Это связано с тем, что Microsoft предложила в своем текстовом процессоре значительные, но не стандартизованные на тот момент возможности разметки и макетирования документа. В течение многих лет его кодировка не разглашалась. Его преемник формат .docx представляет собой гибрид бинарного и текстового файла: сам по себе это двоичный файл, который представляет собой zip-архив, хранящий в себе набор файлов и папок, где в основном представлены текстовые файлы в формате xml, содержащие текст документа и информацию о его макете.

Другой популярный формат Adobe .pdf, пользующийся большой популярностью в гуманитарных науках из-за способности отображать макетированный текст в наиболее близком к печатному виде, представляет собой двоичный формат файла. Поэтому из PDF-файлов, даже содержащих преимущественно текст, не всегда можно его корректно извлечь. Практическая разница между текстовыми и двоичными файлами заключается в том, что текстовые форматы намного предпочтительнее, когда необходимо выполнять сложные или автоматизированные манипуляции с текстовыми данными, они облегчают кросс-программный и кроссплатформенный обмен. В то же время двоичные файлы несут в себе больше служебной информации, благодаря которой они могут предоставить пользователю богатый функционал или лучшее визуальное отображение при использовании соответствующего программного обеспечения. При обмене файлами в формате .pdf отображение информации будет идентичным на любом компьютере в любой программе просмотра, поддерживающей этот формат. В отличие от .pdf использование

формата .doc/.docx не гарантирует точного отображения документа, особенно со сложным макетированием - таблицами, сносками, внедренными изображениями, оформлением элементов документа разными шрифтами.

Форматы текстовых файлов предлагают базовые средства организации письменного текста, связанные со знаками пунктуации - пробелы, табуляции, знаки препинания, символы, обозначающие конец строки (CR+LF), даже если их нельзя строго классифицировать как обычный текст (например, это может быть код на одном из языков программирования). Эти простые средства позволяют формировать файлы CSV (comma-separated values - значения, разделенные запятыми) или TSV (tab separated values - значения, разделённые табуляцией), предназначенные для хранения и обмена простыми табличными данными. В таком файле каждая текстовая строка представляет собой запись (табличную строку), а каждое поле (столбец) выделяется запятой или табуляцией. Исходные коды программ также хранятся в текстовых форматах, например, файлах с расширением .py для Python или .js для JavaScript. Некоторые языки программирования, например, BASIC, воспринимают начало новой строки как инструкцию для чтения и выполнения новой команды.

Текстовые файлы обладают хорошим сочетанием удобочитаемости для пользователей и машиночитаемости, поэтому они отлично подходят для хранения кода, текстовых и числовых данных. Они используются как средство промежуточного хранения и переноса больших объемов текстовых данных между разными программами обработки.

Двоичные файлы лучше подходят для представления мультимедийных материалов, таких как изображения, аудио и видео, и, следовательно, с их форматами чаще сталкиваются пользователи. В современных гуманитарных исследованиях часто приходится применять гибридный подход, применяя для решения задачи файлы разных форматов, например, цифровые изображения рукописей для чтения и текстовые файлы для их цифрового ввода.

Проблема разметки текста возникает, когда необходимо дополнить текст научным аппаратом - критическими ссылками, сносками, цитатами, выделить

структуру текста и т.д. Современные текстовые процессоры могут выполнять такие манипуляции с текстами, но они предлагают универсальные инструменты, которые трудно настроить на специфическое применение, а их форматы мало пригодны для обработки сторонними программами.

При анализе древних текстов часто появляется необходимость снабдить их комментариями текстологического, орфографического или палеографического характера, добавить сведения о грамматике, семантике отдельных слов, ссылки на места, даты, персон, упоминаемых в тексте или связанных с ним. Другими сторонами этой же проблемы являются соединение транскрипций разных рукописных копий одного и того же текста, указание вариантов слова или отрывка. Возможность зафиксировать все эти аспекты письменного памятника в цифровом виде является насущной необходимостью.

Если рассматривать современный контекст изучения древних письменных памятников, основанный на широком использовании цифровых технологий и цифровых данных, то формируется несколько отличная от принятых прежде модель рабочего процесса. Нидерландский исследователь-арабист Корнелис ван Лит описывает рабочий процесс своих исследований следующим образом [van Lit 2020: 147]:

Оцифровка ^ Транскрипция ^ Анализ ^ Публикация В этой схеме на передний план выходит оцифровка, получение цифрового описания и цифровых изображений памятника. По мнению ван Лита, ранее основное внимание уделялось тексту как абстрактному объекту, тем самым создавалась «слепая зона» для материального аспекта работы исследователей и изображений, с которыми они работают. Предлагаемый им рабочий процесс включает анализ изображений, а не только цифрового текста, извлеченного из них. К. ван Лит также указывает на взаимозависимость транскрипции и анализа, при которой небольшие текстовые фрагменты («тестовые упражнения») могут помочь при анализе, например, для поиска стеммы и обнаружения особенностей рукописных текстов. Эти упражнения могут, в свою

очередь, влиять на определение новых аспектов текста, которые требуют разметки во время транскрипции.

Для небольших проектов, которые ориентированы исключительно на печатное критическое издание и имеют дело с текстом, который почти наверняка не будет использоваться для других более крупных проектов, достаточным инструментом является универсальный текстовый процессор (например, MS Word). Для создания и поддержания крупной текстовой базы данных, обеспечения тематической, структурной, содержательной связности крупных собраний цифровых текстов, необходимо использовать специализированные цифровые инструменты, основанные на разметке (тегировании) электронных текстов.

Одно из приемлемых решений основано на использовании «плоского» текста (plain text), в который добавляются специальные теги, которые компьютерное приложение интерпретирует определенным образом. Есть три способа реализации этого подхода.

Один простой способ - отделить транскрипцию от разметки, как это сделано в TextFabric, программе, изначально разработанной для анализа Библии на иврите, но все чаще используемой для анализа других древних корпусов [Roorda 2018]. TextFabric использует набор текстовых файлов, связанных по строкам. В исходном файле корпуса каждая строка содержит элемент текста, чаще всего отдельное слово. Затем создаются новые текстовые файлы с равным количеством строк и определенной информацией в той же строке, что и связанный элемент. Например, можно создать файлы, в каждой строке которых назначены грамматическая функция или перевод соответствующего слова в исходной транскрипции. После создания таких файлов TextFabric позволяет выполнять расширенный анализ текста. Такой подход особенно подходит, если необходимо глубоко проанализировать текст и есть возможность потратить время на его подготовку и разметку соответствующим образом.

@node

(3author=Eep Talstra Centre for Bible and Computer @dataset=BHSA

@datasetNane=BibUa Hebraica Stuttgartensia Amstelodamensis taeniail=shebanq@ancient-data, org

@encoders=Constantijn Sikkel (QDF), Ulrik Petersen (HQLi and Dirk Roorda {TF)

@valueType=str

@version=20l7

@website=https: //shebanq,ancient-data, org

@writtenBy=Text-Fabric

@dateWritten=2017-10-10T10:00: 06Z

and 100+ more columns

3 be prep В

П'УМ! reS,it subs R>CJT/

кщ bar' a verb BR>f

7* löh'im subs >LHJM/

S)H ?. et prep >T

ъ ha art H

очру ssäfn, ayim subs СЮМ/

1 con j w

ПН prep

hä a rt H

упм ? äres subs >RY/

g word utfS.tf phono.tf sp.tf lex.tf

and 400,000+ more in each column Рис.2.1.1. Пример разметки TextFabric. Каждый элемент разметки хранится в отдельном

файле. Источник: Roorda, D. (2018).

Другой подход заключается в размещении облегченной разметки прямо в тексте. Памятники письменности могут насчитывать многие тысячи слов, поэтому для структурирования больших текстов необходим облегченный способ разметки. В таких случаях имеет значение длина тега, поскольку он добавляется в текстовый файл несколько тысяч раз. Одним из популярных подходов в цифровых исторических и текстологических исследованиях является применение легкой разметки Markdown [Schmidt Ben: электронный ресурс], которую используют такие популярные сайты, как GitHub и Reddit. С помощью Markdown можно размечать заголовки, абзацы и номера страниц, стихотворные строфы, элементы словаря или биографии, имена, даты и другие структурные и семантические элементы текста. Сложные теги обычно начинаются с хеш-символа #. Например, начало биографии мужчины

обозначается ### $, женщины - ### $$. Отличительной чертой Markdown является его ориентированность на семантическое представление текста.

Схожий подход реализован в wiki-разметке, в которой используется набор облегченных тегов. Несмотря на простоту wiki-разметки, с ее помощью можно создавать обширные интегрированные семантически связанные информационные пространства, подобные проектам фонда Викимедия, включающие Википедию, Викисловарь, Викицитатник, Викитеку, Викисклад, Викиданные и т.д.

Облегчённая разметка широко используется крупными сетевыми сообществами, ориентированными на совместную работу с базами знаний. Однако, ее использование имеет ограничения, связанные с трудностями интеграции новых элементов разметки и согласования конвенций по их применению и парсингу (визуализации с помощью соответствующего программного обеспечения).

Наиболее популярным в гуманитарных науках является третий способ, занимающий промежуточное положение между тяжелой и легкой разметкой, который заключается в использовании XML (extensible Markup Language). Простым текстовым файлам, соответствующим правилам XML, обычно назначается расширение .xml. Два основных принципа XML заключаются в следующем:

(1) .xml-файл состоит из элементов, которые идентифицируются тегами, обозначающими их начало и конец. Начальный и конечный теги выглядят как <N> и </N> соответственно, где N - это название тега по выбору пользователя;

(2) в XML-файле все элементы должным образом закрыты и не перекрываются, но при этом допускается вложенность размеченных элементов.

Эти два принципа объявляют некую мета-структуру, но ничего не говорят о том, как нужно размечать конкретные элементы текста. Выбор конкретных тегов остается за отдельным пользователем или консорциумом, если предполагается разработать универсальную разметку для некоторой предметной области. Наиболее значительный результат в вопросе создания

диалекта XML, предназначенного для работы с текстами письменного наследия, был достигнут консорциумом Text Encoding Initiative (TEI), впервые организованным в Вассарском колледже (США) в 1987 г. и поддержанным Национальным фондом гуманитарных наук (National Endowment for the Humanities) [TEI History: электронный ресурс]. Основополагающим документом является «Руководство по кодированию и обмену электронными текстами» («Guidelines for Electronic Text Encoding and Interchange»). Его нынешняя версия T5 была выпущена в 2007 г. и ежегодно обновляется. Документ, предназначенный для специалистов в области текстологии и цифровых гуманитарных наук, дает рекомендации, каким образом размечать элементы текстов разных типов и жанров, и предлагает множество тегов для решения задач структурно-семантической разметки текстов [TEI P5 2021]. Учитывая широкий спектр исследований в области текстологии, спецификации TEI достигли объемов, которые поначалу могут показаться чрезмерными. Так, вышеупомянутое руководство насчитывает больше 1000 страниц. Однако большинство проектов используют лишь небольшое подмножество TEI, что упрощает ознакомление с правилами и тегами, которые предлагает эта технология, и делает использование TEI-разметки более управляемым.

В модели документа, которую использует TEI, определены два основных раздела, обозначенные тегами <teiHeader> и <text> соответственно. Наличие метаразметки документа, размещаемой в разделе заголовка, является одной из сильных сторон TEI, которая разрешает автономное существование файла. В этом разделе сохраняется контекст документа, и поэтому всегда можно установить, что представляет собой текст и каким образом его можно анализировать.

Заголовок TEI-файла начинается с раздела описания файла, который первым элементом включает название цифрового документа под тегом <title>. С помощью тега <extent> размещается разнообразная пояснительная информация. В разделе <publicationStmt> приводится разнообразная информация, относящаяся к публикации, включая сведения об авторском праве,

дате издания и т.д. В разделе <sourceDesc> приводится информация о первоисточнике. Рекомендации TEI требуют, чтобы было установлено и описано физическое состояние источника, и этой информации посвящен раздел <physDesc>. Таким образом, спецификации TEI составлены с учетом варианта использования, когда у исследователя имеется прямой доступ к рукописям. TEI позволяет определять цифровые копии только в отдельном теге, для которого используется ссылка IIIF (International Image Interoperability Framework, см. ниже). После описания файла добавляется раздел <encodingDesc>, в котором объясняется контекст создания и цель этого файла.

Непосредственно текст оборачивается в тег <body>. Для более точного позиционирования текста первоисточника можно указывать тег абзаца <p>, теги страницы <pb> и строки <lb>. Есть возможность разметки личных имен и других семантических элементов. Все теги служат поисковыми полями для внешних запросов, таким образом, увеличивается связность размеченных текстов. Например, можно сделать запрос по личным именам, чтобы узнать, сколько раз встречается то или иное имя или сколько уникальных имен представлено в документе. Можно реализовать более сложную систему на основе авторитетных данных и включить в описание имени атрибут-идентификатор, который ссылается на запись во внешнем или внутреннем списке, содержащую подробную информацию об этом человеке. Такого же сорта обработку можно произвести для любого элемента авторитетного контроля, интересного исследователю в контексте изучения размечаемого документа или корпуса текстов.

Как и другие инструменты и технологии, для многих ситуаций TEI не может обеспечить удовлетворительного решения. Существенным недостатком стандарта TEI является то, что в нем используется модель документа (DOM), предполагающая его представление в виде дерева иерархически организованных элементов (объектов). На практике это означает, что теги не должны перекрываться. Такое ограничение проистекает из того, что TEI является разновидностью XML. Предполагается, что тексты упорядочены

линейно, и это оставляет за пределами применимости многие методы гуманитарных исследований [van Lit 2020: 155]. Например, в культурах с обширными традициями комментирования новый текст может быть построен на основе повторного использования исходного текста. Чтобы правильно редактировать и анализировать такое произведение, необходимо учитывать исходную работу и предыдущие комментарии, и в некоторых таких случаях разметка требует перекрытия тегов.

Даже если не обращать внимания на эти проблемы, раскрытие преимуществ TEI сильно зависит от опыта пользователя. Первоначально XML задумывался как форма разметки, достаточно дискурсивная, чтобы люди могли ее читать, и достаточно регулярная, чтобы ее можно было интерпретировать машинным образом. Обширный аппарат, который предлагает стандарт TEI, стал настолько громоздким, что прямое чтение и понимание размеченного текста человеком практически невозможно. Для этого необходим интерпретатор XML кода - программа-парсер, которая преобразует все теги в визуальную разметку, например, отображает заголовки крупным кеглем и полужирным начертанием, а личные имена выделяет курсивом. Большой проблемой является непосредственно процесс разметки. В отличие от форматов легкой разметки, для которых достаточно простейшего текстового редактора, в случае TEI необходимо использовать специализированный редактор XML, который способен разбирать XML Schema и/или DTD, и вставлять определенные в них схемы разметки в текст. Наиболее функциональным решением является редактор <oXygen/>, который распространяется на проприетарной основе. Полнофункциональных решений, распространяемых на условиях открытого программного обеспечения, до настоящего времени не существует. Перспективным направлением является автоматизация разметки, но она также требует большой предварительной работы по составлению глоссариев, авторитетных баз данных и т.д., а также навыков программирования для написания необходимых скриптов. Несмотря на недостатки, обусловленные специфическими особенностями XML,

спецификации XML/TEI стали стандартом де-факто для разметки текстов в большинстве проектов, связанных с цифровизацией буддийского письменного наследия, как будет показано ниже.

Цифровые изображения

Форматы цифровых изображений представляют особый интерес в контексте сохранения и изучения памятников письменности, поскольку создание изображений является важным этапом цифровизации культурного наследия. Цифровые камеры и сканеры, основные устройства для получения изображений, как правило, сначала создают цифровой образ в соответствии со своими аппаратными характеристиками. Такие данные называются файлом необработанного изображения (raw image) и имеют самые разные форматы в зависимости от изготовителя и характеристик используемого оптического и электронного оборудования. Чаще всего они несовместимы между собой и не могут применяться непосредственно для хранения, просмотра и обмена изображениями на универсальных компьютерных платформах. Для этих целей создано множество растровых форматов изображений, каждый из которых имеет свои специфические черты и область применения.

Основными характеристиками цифрового изображения является размер по горизонтали и вертикали в пикселях, разрешение (плотность размещения пикселей на единицу площади или линейного размера) и глубина цветопередачи, обычно измеряемая разрядностью в битах каждой из базовых цветовых компонент. Чем выше разрешение и глубина цветопередачи, тем выше качество изображения. Большинство форматов поддерживают RGB-модель цветопередачи, которая ориентирована на отображение цифрового изображения на дисплее; некоторые также поддерживают CMYK-модель, которая предназначена для воспроизведения изображения на цветном печатном оборудовании. В модели RGB каждый пиксель имеет три цветовых компоненты (R - красный, G - зеленый, B - синий) и определяется тремя числовыми значениями насыщенности каждой компоненты. В модели CMYK (C -

бирюзовый, M - пурпурный, Y - желтый, K - чёрный) пиксель определяется четырьмя значениями цветопередачи.

В настоящее время наиболее распространены два формата файлов: TIFF (.tiff) и JPEG (.jpg). Первый сохраняет изображение без потери качества, что означает, что он не применяет алгоритмы сжатия, которые понижают качество необработанного изображения, он также поддерживает RGB и CMYK модели изображения. Формат JPEG имеет управляемый пользователем переменный коэффициент сжатия, что позволяет найти компромисс между размером файла и качеством. Это особенно важно для размещения изображений в сети Интернет.

Другой тип цифровых изображений связан с так называемым векторным представлением и векторными форматами файлов. Изображения такого типа, в отличие от растровых, представлены не прямоугольной матрицей пикселей, а набором геометрических объектов, которые задаются начальной и конечной точками и формулой соединяющей их дуги, и имеют такие атрибуты, как стиль линии или заливки. Поскольку эти изображения задаются вычислительными формулами, их фактическая визуализация на экране - растеризация -выполняется «на лету», что гарантирует, что изображение всегда будет резким и четким независимо от масштаба. Такой формат предназначен не для фотографий или сканов, но в большей степени для цифровых рисунков. Большинство современных шрифтов имеют векторный формат, и глифы представленных в них символов являются векторными изображениями. Примером являются шрифты стандарта TrueType, наиболее распространённые на платформах Mac OS и MS Windows. Интересным аспектом векторных изображений является то, что некоторые их форматы могут храниться в текстовых файлах, например, SVG (.svg), разработанный консорциумом W3C для использования масштабируемой векторной графики на веб-страницах. Adobe PDF (.pdf) в своей основе также является форматом векторных изображений. Он является диалектом языка описания страницы Postscript, который исходно предназначался для высококачественной цифровой печати.

Определение правильного формата файла для выполняемой работы является важным навыком. Как правило, современные устройства, с помощью которых создаются изображения - цифровые камеры, сканеры разных видов, обладают большой разрешающей способностью и способны генерировать файлы огромного размера. Это накладывает особые требования на устройства хранения данных, которые должны быть достаточно емкими, чтобы обеспечить их долговременное хранение. До последнего времени для многих неспециализированных учреждений академического профиля приобретение и содержание таких накопителей было невыполнимой задачей, и исследователи были вынуждены искать компромисс в пользу некоторого ухудшения качества сканируемых/фотографируемых изображений. Например, если оцифровывать оригинал согласно требованиям проекта Британской библиотеки Endangered Archives Program (разрешение не менее 400 dpi с обязательным размещением в поле сканирования стандартизованной цветокалибровочной шкалы, сканы хранятся без применения алгоритмов сжатия), размер крупноформатного листа тибетского Кангьюра занимает около 200 Мб. Сканированные изображения более чем 100-томного издания в целом в этом случае займут около 6-8 Тб. Приобретение систем хранения такой мощности по приемлемой для научных организаций стоимости (~ 4 тыс. руб. за 1 Тб номинальной емкости) стало возможным лишь в последние годы.

Для простой обработки изображений существует множество приложений. Например, полезными являются программы с графическим интерфейсом для выполнения пакетного поворота, изменения размера, переименования, изменения формата файла для нескольких сотен цифровых фотографий или сканов, которые образуются после оцифровки рукописи. Такими функциями обладает, например, ScanTailor - инструмент для разделения страниц, автоповорота и устранения искажений, преобразования формата изображения [ScanTailor: электронный ресурс]. ПО Adobe Acrobat Pro можно использовать для объединения отдельных изображений, цифровых фотографий или сканов в один файл для облегчения хранения и дистрибуции, или, наоборот, для

извлечения всех страниц как отдельных фотографий из существующего файла PDF. В случае необходимости обработки изображений в необычном формате файла или с особыми параметрами можно применять мощные приложения, например, ImageMagick, которому инструкции для выполнения действий задаются из командной строки [ImageMagick: электронный ресурс].

В последние годы появилось большое количество онлайновых облачных сервисов, позволяющих выполнять разнообразные манипуляции с изображениями на близком к профессиональному уровне прямо в окне веб-браузера. Так, существуют редакторы растровых изображений, разнообразные конверторы, системы оптического распознавания символов, которые функционируют на бесплатной или платной основе, в последнем случае предлагая более богатый функционал. Поскольку скоростное широкополосное подключение к Интернет доступно с большинства рабочих мест, применение таких облачных инструментов позволяет не загромождать дисковое пространство и системную память персонального компьютера приложениями, которые используются нерегулярно.

Доступ к ресурсам, основанным на высококачественных изображениях, имеет основополагающее значение для исследований во многих областях, обучения и передачи культурных знаний. До сих пор большая часть таких ресурсов была изолирована, а доступ к открытым ограничивался узкими каналами связи либо необходимостью использовать специально разработанные приложения. Ныне ситуация кардинально изменилась. Широкополосные каналы подключения к Интернет позволяют передавать большие объемы цифровых данных с высокой скоростью, поэтому важным направлением является стандартизация представления крупноформатных

высококачественных цифровых изображений, необходимых для проведения исследований. В 2010-х гг. была выдвинута и нашла реализацию инициатива International Image Interoperability Framework (IIIF), нацеленная на единообразное описание и отображение цифровых образов книг, карт, свитков, рукописей, нот и архивных материалов и обеспечение их доступности для

исследователей, работающих индивидуально или в группах по всему миру [About IIIF: электронный ресурс].

Консорциум International Image Interoperability Framework (IIIF-C) был учрежден в июне 2015 г. одиннадцатью организациями, которые выделили необходимые ресурсы. Ключевыми организаторами выступили библиотеки Оксфордского и Стэнфордского университетов и Британская библиотека. К ним в рамках IIIF-C присоединились ARTstor, Баварская государственная библиотека, Корнельский университет, Национальная библиотека Франции, Национальная библиотека Норвегии, библиотека Принстонского университета, Wellcome Trust и Йельский университет (Йельский центр британского искусства, Библиотека редких книг и рукописей Бейнеке).

IIIF-C нацелен на то, чтобы предоставить ученым высочайший уровень единообразия и доступности для ресурсов на основе изображений, размещенных по всему миру. Это достигается через создание общих инструментов, которые поддерживают взаимодействие между репозиториями (цифровыми хранилищами) изображений, развитие совместно используемой инфраструктуры, включающей серверы изображений и специализированные веб-клиенты, которая обеспечивает удобство для пользователей при просмотре, сравнении, манипулировании и аннотировании цифровых изображений [Emanuel 2018].

Спецификации IIIF определяют универсальные стандарты для описания и доставки изображений и других мультимедийных материалов через Интернет и является результатом совместных усилий участников консорциума IIIF-C. Платформа активно развивается. В настоящее время предлагаются пять веб-интерфейсов прикладного программирования (API) [For Implementers - IIIF: электронный ресурс]:

1. IIIF Image API 3.0 определяет веб-службу, которая возвращает изображение в ответ на запрос HTTP или HTTPS. В URI можно задавать область, размер, поворот, характеристики качества и формат запрошенного изображения. API позволяет пользователю

регулировать качество и детализацию получаемого по сети изображения в зависимости от цели исследования, предоставляется возможность запрашивать техническую информацию об изображении.

2. IIIF Presentation API 3.0 предназначен для описания и интегрированного представления составного цифрового объекта, который может включать нескольких изображений или мультимедийных материалов, в том числе распределённых по разным цифровым хранилищам, например, многостраничной книги, фрагментированной рукописи, проекций статуи, видеозаписи события и т.д.

3. IIIF Authentication API 1.0 описывает набор рабочих процессов для руководства пользователя через существующие системы контроля доступа; это шаблон для взаимодействия с произвольными сторонними протоколами.

4. IIIF Search API 1.0 предоставляет инструменты поиска в текстовых аннотациях цифрового объекта.

5. IIIF Change Discovery 1.0 документирует происходящие изменения в структуре IIIF ресурсов, их размещении в сети, чтобы обеспечить поиск и отображение как для пользователей, так и для M2M взаимодействия (Machine-to-Machine).

Такая ключевая черта IIIF, как возможность описания составного документа, чрезвычайно важна, например, для изучения упомянутых выше хотанских и турфанских рукописей из Синьцзяна или бамианских памятников на кхароштхи, отдельные фрагменты которых оказались разнесены между коллекциями в разных странах. IIIF позволяет исследователям обращаться с ними как с единым целым вне зависимости от физического местоположения их частей.

IIIF получает все большее распространение в современных гуманитарных исследованиях, связывая в глобальное информационное пространство ранее

разрозненные цифровые хранилища материалов, относящихся к культурному наследию.

Еще одним перспективным направлением использования цифровых изображений является оптическое распознавание символов тибетской и монгольской письменностей для последующего полнотекстового ввода. В этой области существуют разнообразные подходы, например, на основе эвристических моделей [Бычков и др. 2016]. В области оптического распознавания тибетской письменности наиболее успешным является проект Namsel OCR, который реализовывается в Калифорнийском университете в Беркли [Rowinski; Keutzer. 2016]. Пока доступно распознавание только текстов, напечатанных типографским способом. Распознавание ксилографов, по всей видимости, требует применения гораздо более сложного программного обеспечения искусственного интеллекта на основе нейросетевых технологий.

Авторитетный контроль

Одной из важных проблем в цифровом представлении обширных коллекций библиографических, текстовых и иных сопутствующих им данных является обеспечение связности больших массивов разнородной информации. Удобным средством решения такой проблемы является использование средств авторитетного контроля, базирующегося на специализированном унифицированном описании информационных объектов, которое позволяет однозначно идентифицировать их вхождения в исследуемой совокупности данных, например, корпусе текстов или библиографической базе данных.

Базовым понятием авторитетного контроля является авторитетная запись, которая включает уникальный идентификатор, возможные варианты названия объекта и ряд атрибутов. В авторитетной базе данных каждому понятию или информационному объекту ставится в соответствие, помимо нормативного имени и идентификатора, целый набор данных, организованный в авторитетную запись, в том числе возможные варианты названия.

Контролируемая точка доступа - установленное и обозначенное тем или иным способом вхождение объекта авторитетного контроля в совокупность данных.

Основным нормативным документом для создания авторитетных баз данных являются «Функциональные требования к авторитетным данным: концептуальная модель: заключительный отчет» [Функциональные 2011]. В нем определены разные типы объектов, для которых создаются авторитетные записи, стандартизованы основные атрибуты таких объектов, устанавливаются отношения между объектами авторитетного контроля.

БЯЛО определяет следующие объекты авторитетного контроля:

1. Лицо

2. Род/семья

3. Организация

4. Произведение

5. Выражение

6. Воплощение

7. Физическая единица

8. Концепция

9. Предмет

10. Событие

11. Место

12. Имя

13. Идентификатор

14. Контролируемая точка доступа

15. Правила

16. Учреждение

Очевидно, что эти объекты неявно формируют несколько контекстов описания библиографического объекта. Контекст семантико-содержательного описания источника формируют следующие объекты:

1. Лицо

2. Род/семья

3. Организация

4. Предмет

5. Событие

6. Место

Контекст библиографического описания отражают следующие объекты:

1. Произведение

2. Выражение

3. Воплощение

4. Физическая единица

Непосредственно с контекстом авторитетного контроля связаны следующие объекты:

1. Имя

2. Идентификатор

3. Контролируемая точка доступа

4. Правила

5. Учреждение

Атрибуты некоторых объектов авторитетного контроля согласно БЯЛО приведены в таблице. Чаще всего в реализациях авторитетных баз данных атрибуты используются частично, только необходимые для решения целевой задачи. Полное заполнение атрибутивной части авторитетной базы данных часто составляет самостоятельную исследовательскую задачу.

Таблица 2.1.2.

Атрибуты объектов авторитетного контроля

Лицо Даты, ассоциируемые с лицом, включают год или полную дату

(год, месяц, день) рождения, смерти и т.д.; период или век, в

который лицо было известно, как активный деятель.

Звание лица: ранг, должность, дворянский титул, почетное звание

и т. д., связанные с лицом. [FRBR], в том числе светские или

религиозные информационные элементы

Пол

Место рождения Место смерти Страна: Страна, названием которой лицо идентифицируется. Язык лица Область деятельности Биография/история

Род/семья Тип рода/семьи: включает такие категории, как клан, династия, семья, объединение, патриархат, матриархат и т.д. Даты рода/семьи Места, связанные с родом/семьёй Область деятельности История рода/семьи

Организация Место, ассоциируемое с организацией: Географическое место, каким-то образом ассоциируемое с организацией. Даты, ассоциируемые с организацией Язык организации* Адрес* Область деятельности* История* Другая информация, ассоциируемая с организацией

Произведение Форма произведения: форма, жанр и т.д., например, роман, пьеса, стихотворение, эссе, биография, симфония, концерт, соната, карта, рисунок, картина, фотография). Даты произведения: Включает дату создания (обычно год); дату первой публикации или выпуска в свет. Предмет произведения: тематические аспекты произведения и его содержание; включает информацию о теме/предмете произведения. Порядковое обозначение: номер, присвоенный произведению создателем. Место происхождения произведения: страна или другая территориальная юрисдикция, или культурный регион, где создан оригинал произведения. История: информация относительно истории произведения.

Воплощение Место публикации/ распространения воплощения

161

Издатель/ распространитель: индивидуум, группа или

организация, указанные в воплощении в качестве ответственных за

издание, распространение, опубликование или выпуск в свет

воплощения. [FRBR].

Дата публикации/ распространения: дата (обычно год)

публичного выпуска воплощения. При отсутствии даты, обо-

значенной в качестве даты издания или выпуска

Форма носителя: конкретный класс материала, к которому

принадлежит физический носитель воплощения Нумерация:

обозначение томов/выпусков и т.д. и/или дат, имеющихся в

сериальных воплощениях. [FR.BR]

Примечание: В перечень атрибутов воплощения включены только

те, которые обычно используются в контролируемых точках досту-

па или в других элементах данных, вносимых в авторитетные запи-

си.

В явном или неявном виде концепция авторитетных данных находит отражение во многих широко используемых информационных ресурсах, предназначенных для упорядочения и организации обширных массивов данных. К таким ресурсам можно отнести проекты Wikidata (Викиданные), разрабатываемый Фондом Викимедиа, Getty Vocabulary Program, осуществляемую Исследовательским институтом Гетти и т.д.

Викиданные - это свободная, совместно наполняемая, многоязычная, вторичная база данных, в которой собрана структурированная информация для обеспечения поддержки вики-проектов фонда Викимедиа (Википедия, Викисклад и др.). Этот проект имеет черты, сближающие его с методологией авторитетных данных. Базовым понятием Викиданных является элемент (Item), обладающий меткой (Label), описанием (Description) и синонимами (Aliases). Элементы имеют уникальный идентификатор с префиксом Q и числовой частью. Например, элемент с меткой «Chinese Buddhist canon» имеет идентификатор Q17023673 [Викиданные: электронный ресурс].

Другим понятием Викиданных является утверждение (Statement), которое предназначено для описания элемента. Каждое утверждение состоит из свойства (Property) и его значения. Свойства в Викиданных идентифицируются кодом, имеющим префикс P и числовую часть. Например, свойство «native language» имеет идентификатор P103. Утверждение в полном виде выглядит следующим образом:

Таблица 2.1.3.

Язык Элемент Свойство Значение

English Buton Rinchen Drub languages spoken, written or signed Tibetan

Russian Будон Ринчендуб языки, на которых говорит или пишет персона тибетский язык

Кодовое представление Q1018259 P1412 Q34271

Из представленного примера видно, что элементы и их свойства однозначно определяются благодаря уникальным идентификаторам, и потому доступны для автоматизированной машинной обработки. Это значительно облегчает управление данными, особенно в многоязычных информационных пространствах, какими являются ресурсы фонда Викимедии.

Помимо ссылок на элементы Викиданных, свойства могут содержать ссылки на внешние базы данных. Свойство, которое ссылается на элемент во внешней базе данных, вроде баз данных авторитетного контроля, используемых библиотеками и архивами, называется идентификатор. Ссылки на сайты ^йеНпкз) связывают каждый элемент с соответствующими ему статьями во всех клиентских вики, такие как Википедия, Викиучебник и Викицитатник.

Для выдающегося тибетского ученого Будона Ринчендуба в Викиданных определены идентификаторы в авторитетных базах данных, которые позволяют связать элемент Викиданных с ресурсами, хранящимися в соответствующих цифровых коллекциях, и, таким образом, сформировать интегрированное

представление этой персоны в глобальном информационном пространстве (табл. 2.1.4.).

Таблица 2.1.4.

Идентификация Будона Ринчедуба в авторитетных базах данных библиотек и цифровых ресурсов

American Academy in Rome 10062598

BDRC Resource P155

Bibliothèque nationale de France 118944238

BIBSYS 90690735

CERL Thesaurus cnp01316712

Deutsche Biographie 118925636

Encyclopedia Britannica biography/Bu- ston

FAST 127222

Freebase /m/0f9gjm

GND 118925636

IdRef 026757877

ISNI 0000 0001 0913 1275

Library of Congress authority n84001807

Lotsawa House Tibetan author buton

National Diet Library 001243920

Nationale Thesaurus voor Auteurs 075030780

NE.se bu-ston

NLA Trove 892668

NUKAT n93080416

Open Library 0L7205366A

SEARCH on line catalogue 9236

Treasury of Lives 2845

Vatican Library ID ADV11182611

Vatican Library VcBA 495/6332

VIAF 69728299

WorldCat Identities lccn-n84001807

Для внешнего использования Викиданных применяется специально разработанный интерфейс прикладного программирования Wikidata API,

предоставляющий инструменты для выполнения запросов, извлечения и анализа данных.

На сходных принципах организованы авторитетные ресурсы, созданные в рамках Getty Vocabulary Program [Getty Vocabularies: электронный ресурс]. Эта программа, выполняемая Исследовательским институтом Гетти, предлагает следующие базы данных (Getty controlled vocabulary databases):

1. Art and Architecture Thesaurus (AAT) предлагает общие термины, даты, отношения, источники и примечания для произведений, материалов, стилей, культур, методов и других концепций, связанных с искусством, архитектурой и другими сферами культурного наследия;

2. Cultural Objects Name Authority (CONA) собирает названия / имена и другие метаданные для произведений искусства, архитектуры и других памятников культуры, задокументированных как отдельные предметы или в группах, вне зависимости от их физического состояния; может применяться используется для учета произведений, предсатвленных в визуальных копиях и т.д.;

3. Getty Iconography Authority (IA) охватывает темы, относящиеся к искусству, архитектуре и смежным дисциплинам; включает многоязычные имена собственные, отношения и даты для иконографических нарративов, религиозных или художественных персонажей, исторических событий, а также озаглавленных произведений литературы и исполнительских видов искусства;

4. Getty Thesaurus of Geographic Names (TGN) фокусируется на местах, связанных с искусством, архитектурой и смежными дисциплинами. Тезаурус регистрирует имена, отношения, типы мест, даты, заметки и координаты текущих и исторических городов, государств, империй, археологических памятников и физических характеристик. Тезаурус может быть связан с ГИС и картами;

5. Union List of Artist Names (ULAN) содержит имена, родственные связи, примечания, источники и биографическую информацию для художников,

архитекторов, фирм, студий, репозиториев, покровителей и других физических и юридических лиц, как названных, так и анонимных;

6. Catégories for the Description of Works of Art (CDWA) - это набор руководящих принципов и правил каталогизации для описания произведений искусства, архитектуры и других культурных ценностей. CDWA определяет, какие поля и категории метаданных об искусстве подходят для использования словарей. CDWA формирует рекомендации по каталогизации на основе обсуждения и консенсуса с сообществом пользователей.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.