Разработка и программная реализация адаптивной модели геногеографического прогноза на основе методов оптимального оценивания и планирования эксперимента тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Векшина, Анна Борисовна

  • Векшина, Анна Борисовна
  • кандидат технических науккандидат технических наук
  • 2012, Москва
  • Специальность ВАК РФ05.13.18
  • Количество страниц 127
Векшина, Анна Борисовна. Разработка и программная реализация адаптивной модели геногеографического прогноза на основе методов оптимального оценивания и планирования эксперимента: дис. кандидат технических наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. Москва. 2012. 127 с.

Оглавление диссертации кандидат технических наук Векшина, Анна Борисовна

ОГЛАВЛЕНИЕ

Введение

1 Обзор существующих математических моделей для прогноза значений генетических показателей в области геногеографии

1.1 Геногеография и картография

1.2 Краткий обзор существующих картографических методов

1.3 Принципы создания геногеографических карт

1.4 Существующий подход к геногеографическому прогнозированию на основе современной полиномиальной математической модели

1.5 Визуализация геногеографической карты, созданной на

основе полиномиальной модели

Выводы к главе 1

2 Разработка адаптивной модели геногеографического прогноза и комплекса по оптимизации плана экспедиционных популяционно-генетических исследований

2.1 Разработка адаптивной модели геногеографического

прогноза

2.1.1 Математическая постановка задачи геногеографического прогноза и ее реализация

2.1.2 Линейная модель геногеографического прогноза с переменными коэффициентами

2.1.3 Квадратичная модель геногеографического прогноза

с переменными коэффициентами

2.1.4 Кубическая модель геногеографического прогноза с переменными коэффициентами

2.2 Прогноз значений генетических показателей в рамках разработанной адаптивной геногеографической модели

2.3 Картирование результатов геногеографического прогноза, полученных с помощью разработанной адаптивной математической модели

2.4 Оптимизации плана экспедиционных популяционно-генетических исследований на основе адаптивной модели геногеографического прогноза

2.4.1 Понятие оптимального плана экспедиционных популяционно-генетических исследований и выбор критерия оптимальности

2.4.2 Математическая постановка задачи планирования экспедиционных популяционно-генетических исследований в рамках адаптивной модели геногеографического прогноза

2.4.3 Выбор D-оптимального плана экспедиционных популяционно-генетических исследований

Выводы к главе 2

3 Разработка программного комплекса, созданного на основе адаптивной модели геногеографического прогноза

3.1 Структура программного комплекса GEN, созданного на основе адаптивной математической модели

3.2 Алгоритмическая реализация программного комплекса GEN

3.3 Описание интерфейса программного комплекса GEN

Выводы к главе 3

4 Оценка эффективности адаптивной модели геногеографического прогноза и программного комплекса GEN

4.1 Сопоставление точностных характеристик модели геногеографического прогноза адаптивной структуры с точностями существующих аналогов

4.2 Получение прогнозных значений генетических показателей и их графическая визуализация с помощью программного комплекса GEN

4.3 Проверка адекватности разработанной адаптивной модели геногеографического прогноза

4.4 Оценка точности разработанной адаптивной модели геногеографического погноза

4.5 Построение D-оптимальных планов экспедиционных

популяционно-генетических исследований

Выводы к главе 4

Выводы по работе

Список использованной литературы

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка и программная реализация адаптивной модели геногеографического прогноза на основе методов оптимального оценивания и планирования эксперимента»

ВВЕДЕНИЕ

Актуальность проблемы. Основными задачами современной медицинской генетики являются профилактические программы, включающие такие основные компоненты, как выявление суммарного груза и разнообразия наследственных болезней в популяциях, а также оценка основных механизмов их формирования и распространения. Решение этих задач невозможно без оценки выраженной географической изменчивости отдельных наследственных болезней по регионам и распределения значений генетических показателей в границах исследуемых популяций.

В настоящее время основным источником знаний о распространенности наследственных патологий и распределении значений генетических показателей в границах некоторой популяции являются экспедиционные популяционно-генетические исследования, в процессе которых формируются данные о спектре наследственных заболеваний, преобладающих в популяции и о суммарном генетическом грузе в целом. Однако, проведение такого рода исследований, предполагающих организацию экспедиций с привлечением специального оборудования и высококвалифицированных специалистов, осложняется объективно существующими временными и материальными ограничениями. Иными словами, данные о популяции, как правило, представлены результатами ограниченного объема клинико-биохимических и молекулярно-генетических исследований, проведенных в конкретных населенных пунктах. Такого рода информация не позволяет получить полное представление о географической изменчивости значений тех или иных генетических показателей в границах исследуемой популяции.

Выходом из подобной ситуации является разработка и внедрение в практику популяционно-генетических исследований математических моделей, позволяющих на основе ограниченного объема данных, полученных в ходе фактически проведенных экспедиционных исследований

прогнозировать значения интересующих специалистов генетических показателей в любом населенном пункте в границах популяции.

Существует ряд работ, посвященных исследованиям в данной предметной области, однако описанные в этих работах модели геногеографического прогноза ориентированы на прогнозирование значений генетических показателей человека, характеризующих условно нормальную часть генома. Использование такого рода моделей для прогноза значений генетических показателей, связанных с наследственными заболеваниями, которые являются редкими событиями и характеризуют патологическую часть генома, не обеспечивает надлежащей точности результатов, из-за возникновения ошибок, обусловленных сложностью биологических процессов, приводящих к развитию наследственных патологий.

Учитывая вышеизложенное, актуальной задачей является создание математической модели для прогноза значений генетических показателей, позволяющей корректно формировать оценки, связанные с наследственными болезнями человека, в любых населенных пунктах исследуемой популяции. Данные, полученные с помощью подобной модели, помогут выявить районы с высоким риском заболеваний, связанных с теми или иными генами, укажут область с распространением тех генетических свойств, которые имеют значение при переливании крови, при трансплантации органов и тканей.

Кроме того, экспериментальные и прогнозные, полученные с помощью математического моделирования, значения генетических показателей служат основой для построения геногеографических карт, которые с приемлемой степенью точности заполняют обширные пробелы в знаниях о генетике населения и служат источником предварительной генетической информации.

Объект исследования - популяционные закономерности распространения генетических заболеваний. Предмет исследования -методы построения геногеографических моделей для оценки распределения значений генетических показателей.

Цель и задачи диссертационного исследования. Основной целью диссертационной работы является повышение информативности и достоверности результатов популяционно-генетических исследований на основе разработки и внедрения математических моделей и реализующих их программных комплексов, которые обеспечивают получение значений генетических показателей в населенных пунктах исследуемой популяции, не охваченных экспедиционными популяционно-генетическими

исследованиями.

Для достижения этой цели были поставлены и решены следующие

задачи:

1) анализ и обобщение существующих подходов к разработке моделей геногеографического прогноза;

2) разработка адаптивной математической модели геногеографического прогноза на основе ограниченного количества фактически полученных данных, обеспечивающей получение оценок генетических показателей в любом населенном пункте исследуемой популяции на основе его географических координат и численности проживающего населения. Адаптивность разрабатываемой модели предполагает автоматическую реконфигурацию ее структуры и уточнение параметров модели в зависимости от объема результатов экспедиционных популяционно-генетических исследований, привлекаемых для настройки модели;

3) создание алгоритмов расчета параметров модели геногеографического прогноза на основе данных экспедиционных популяционно-генетических исследований;

4) разработка метода формирования оптимального плана проведения экспедиционных популяционно-генетических исследований, использование которого гарантирует последующее получение модели геногеографического прогноза, обладающей максимальной точностью;

5) разработка программного комплекса, реализующего планирование экспедиционных популяционно-генетических исследований, прогноз значений генетических показателей, на основе адаптивной геногеографической модели и возможность визуализации полученных результатов на географической карте;

6) оценка эффективности разработанной адаптивной модели геногеографического прогноза и программного комплекса на примере обработки и анализа результатов экспедиционных популяционно-генетических исследований, охватывающих различные регионы России.

Методы исследования. Для достижения целей исследования были использованы фундаментальные методы оптимального стохастического оценивания, методы функционального анализа, методы теории планирования эксперимента, методы теории вероятности и математической статистики, а так же технология объектно-ориентированного программирования.

Научная новизна. В процессе решения поставленных задач получены следующие новые научные результаты:

1) разработана адаптивная модель геногеографического прогноза, обеспечивающая двукратное повышение точности прогноза по сравнению с моделями неизменной линейной структуры и учитывающая в процессе прогноза не только географические координаты административно-территориальных образований, но и численность, проживающего в них населения, что дает возможность более точного прогноза значений генетических показателей человека, связанных с наследственными заболеваниями;

2) создан комплекс алгоритмов, позволяющих осуществлять автоматическую адаптацию структуры моделей геногеографического прогноза и расчет их параметров в зависимости от объема доступных для анализа результатов экспедиционных популяционно-генетических исследований. Преимущество разработанных алгоритмов заключается в автоматической настройке структуры и параметров модели прогноза, что

позволяет исключить какое-либо субъективное влияние на достоверность результатов прогноза со стороны пользователей (специалистов-генетиков), не обладающих достаточной математической подготовкой;

3) разработан метод формирования D-оптимального плана экспедиционных популяционно-генетических исследований, позволяющий в условиях объективного наличия временных и материальных ресурсов наилучшим образом в смысле точности модели геногеографического прогноза выбрать населенные пункты для проведения экспедиционных популяционно-генетических исследований;

4) разработан и реализован в среде Delphi программный комплекс GEN, основу которого составляют разработанные модели геногеографического прогноза и оптимального планирования экспедиционных исследований с возможностью графического представления полученных результатов на географической карте.

Практическая значимость работы и результаты внедрения.

1) созданный программный комплекс GEN обеспечивает на основе ограниченного объема фактически проведенных популяционно-генетических исследований получение прогнозируемых значений интересующего специалистов генетического показателя в тех населенных пунктах, где исследования не проводились;

2) реализация в структуре комплекса GEN алгоритмов оптимального планирования позволяет в условиях временных и материальных ограничений обоснованно выбирать населенные пункты для проведения экспедиционных исследований, таким образом, чтобы построенная на их основе модель геногеографического прогноза обладала максимальной точностью;

3) основные результаты диссертационной работы внедрены в Федеральном государственном бюджетном учреждении «Медико-генетический научный центр» Российской академии медицинских наук в процессе планирования популяционно-генетических исследований, обработки и анализа их результатов и в учебном процессе Московского

авиационного института по специальности 200402 «Инженерное дело в медико-биологической практике», что подтверждается соответствующими актами.

Основные положения диссертационной работы, выносимые на защиту;

1) адаптивная математическая модель геногеографического прогноза, позволяющая получать значения генетических показателей в рамках исследуемой популяции. Отличие разработанной модели от известных аналогов состоит в том, что ее структура и параметры автоматически настраиваются в зависимости от объема фактически проведенных популяционно-генетических исследований, доступных для анализа;

2) комплекс алгоритмов, обеспечивающих автоматическую адаптацию и расчет параметров моделей геногеографического прогноза на основе результатов популяционно-генетических исследований;

3) метод построения D-оптимального плана для выбора населенных пунктов, являющихся объектами экспедиционных популяционно-генетических исследований, который обеспечивает получение модели геногеографического прогноза обладающей максимальной точностью;

4) программный комплекс GEN, который обеспечивает получение оценок генетических показателей в границах исследуемых популяций на основе разработанных моделей геногеографического прогноза и их визуализация путем представления полученных результатов на географической карте.

Достоверность результатов, полученных в диссертационной работе, подтверждается использованием аппарата математической статистики, теории статистических выводов, оптимального планирования эксперимента; сопоставлением результатов, полученных с помощью разработанной математической модели, с данными экспедиционных исследований, охватывающих большое число популяций России (Ростовская область, Кировская область, республика Чувашия, республика Удмуртия, республика

Мари Эл и др.); значительным объемом выполненных в работе вычислений, результаты которых являются непротиворечивыми и укладываются в рамки существующих представлений теории оптимизации и планирования эксперимента.

Апробация работы. Основные положения диссертационной работы обсуждались и докладывались на 10-ой международной конференции «Системный анализ, управление и навигация» (Крым, Евпатория, 2005), 4-ой международной конференции «Авиация и космонавтика-2005» (Россия, Москва, 2005), Европейской конференции по генетике человека 2009 (Вена, 2009), 1-ой международной научно-практической конференции «Достижения, инновационные направления, перспективы развития и проблемы современной медицинской науки, генетики и биотехнологий» (Россия, Екатеринбург, 2011), 9-ой международной научно-практической конференции «Интеллект и наука» (Россия, Железногорск, 2011), на IV Всероссийской научно-практической конференции с международным участием «Биомедицинская инженерия и биотехнология» - г.Курск, КГМУ.

Публикации. По теме диссертации опубликовано 9 печатных работ, из которых 3 в изданиях, рекомендованных ВАК Минобразования и науки РФ, одна в зарубежном издании и пять работ в сборниках конференций.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав основного материала, заключения и списка литературы из 108 наименований. Общий объем работы составляет 127 страниц основного текста, в том числе 51 рисунок и 26 таблиц.

1 ОБЗОР СУЩЕСТВУЮЩИХ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗА ЗНАЧЕНИЙ ГЕНЕТИЧЕСКИХ ПОКАЗАТЕЛЕЙ В

ОБЛАСТИ ГЕНОГЕОГРАФИИ

1.1 Геногеография и картография

Геногеография, направление исследований в пограничной между генетикой и биогеографией области. В 1928 году геногеографию, как отдельное понятие, впервые ввел в науку Александр Сергеевич Серебровский (A.C. Серебровский, 1928; Н.И. Шапиро, 1966; Материалы к библиографии ученых, 1993). Основная задача геногеографии — исследование распространения характерных гаплогрупп ДНК и других характерных генетических признаков живых организмов и человека по различным географическим районам Земли. Проведение геногеографических исследований возможно лишь у тех видов, у которых в экспериментально-генетических исследованиях установлена связь между изучаемыми признаками и генами. Геногеография имеет большое теоретическое значение в исследованиях по систематике и эволюции видов. Практическое и прикладное значение геногеография имеет в установлении генофондов домашних животных и культурных растений как одной из основ породного сортового районирования и селекции, а также в генетике человека и, особенно, медицинской генетике (A.C. Серебровский 1928, 1930).

Геногеографические исследования генофонда человека, как правило, включают в себя анализ распространения генетических маркеров (гаплогрупп) у населения крупных регионов и детальное изучение ряда конкретных популяций. Проводятся экспедиционные исследования с целью генотипирования различных ДНК, классических маркеров: мтДНК, Y-хромосом, генетико-биохимических и других генетических маркеров (A.C. Серебровский 1928, 1930). Данные исследования требуют привлечения специалистов высокого уровня, имеют высокую стоимость и растянуты по времени. Вследствие этого возник вопрос о возможности математического

прогнозирования генетических показателей, распределенных по географической территории Земли в тех районах, где не проводились экспедиционные популяционно-генетические исследования. В результате появилось новое направление исследования - геногеографическое прогнозирование.

Итак, геногеографический прогноз - это получение оценок значений генетических показателей на основе математических моделей, в населенных пунктах исследуемой популяции, не охваченных экспедиционными популяционно-генетическими исследованиями.

Основа современной геногеографии - это компьютерная картография. Картографический анализ обеспечивает создание математически строгих, объективных и унифицированных карт на основе математического моделирования, что создает новые возможности для анализа генетических карт. Картографическое исследование географической архитектоники генофонда позволяет анализировать географию и историю процессов, формирующих основные свойства генофонда.

Карта, как инструмент геногеографии, не была предложена A.C. Серебровским, создавшим науку геногеографию. Именно поэтому в дальнейшем на долгое время возобладал чисто статистический анализ популяций, изъятых из географического пространства. Карты географического распространения генов, особенно генов и фенотипов человека, создавались и до, и после постановки A.C. Серебровским проблем геногеографии. Некоторые работы, основанные на строгом картографическом методе, остались малоизвестны (Е.М. Чепурковский, 1913), однако другие работы, представляющие лишь результат иллюстрирования, а не картографического анализа распределения генов, оказались широко известны (А.Е. Mourant et al., 1976).

С 70-х годов 20 века начал формироваться картографический подход к геногеографии (W.F. Bodmer, L.L. Cavalli-Sforza, 1976; R.H.Ward, J.V. Neel, 1976; Yu. G. Rychkov, V.A. Sheremetyeva 1977, 1979). На рубеже 80-х годов в

связи с развитием вычислительной техники начался принципиально новый этап в развитии геногеографии - компьютерное генетическое картографирование (Р. Menozzi et al., 1978; А. Piazza et al., 1981a, 1981b; A.J. Ammerman, L.L. Cavalli-Sforza, 1984). Это дало толчок в развитии геногеографии. Началась эпоха компьютерной геногеографии и создания электронных карт географического распределения генетической информации. Таким образом, появилась возможность от географии генов человека перейти к географии генофондов населения мира, регионов, отдельных стран и этнических групп. Появилась возможность исследовать генофонд не только общими генетико-статистическими методами, но и собственными уникальными методами геногеографии - картографическими (Е.В.Балановская, О.П.Балановский, 2007).

В настоящее время в геногеографии существует ряд картографических методов, обзор которых проведен в следующем разделе работы.

1.2 Краткий обзор существующих картографических методов

Первый вариант программного обеспечения для компьютерного картографирования был создан коллективом под руководством L.L. Cavalli-Sforza (L.L. Cavalli-Sforza, 1966; L.L. Cavalli-Sforza, W.F. Bodmer, 1971; L.L. Cavalli-Sforza, A.W.F. Edwards, 1967; L.L. Cavalli-Sforza, A. Piazza, 1993; L.L. Cavalli-Sforza et al., 1994; A.Piazza et al., 1981a, 1981b). Этот пакет позволяет проводить как картографирование частоты отдельного гена, так и расчет синтетических карт главных компонент, хотя и не предусматривает другие виды статистического анализа и трансформации карт. Похожие, хотя еще и менее мощные программные пакеты разрабатывались и некоторыми другими коллективами популяционных генетиков (например, R.R. Sokal, 1999 а, Ь)

Дальнейшее развитие геногеографических моделей связано с появлением аналоговых карт. Первый программный пакет, реализующий их построение, был создан Ю.Г. Рычковым, Е.В. Балановской и др. В нем

используется принцип интерполяции, моделирующий распространение генов из изученных популяций на все промежуточные области. Эту процедуру разработчики назвали технологией «чернильных пятен». Ее можно представить как растекание чернильных пятен. На первом шаге - в каждую точку карты, где имеется изученная популяция, наносится такое «пятно», цвет которого соответствует концентрации частоты гена. На следующем шаге - пятна начинают расплываться во всех направлениях. На определенном шаге соседние пятна начинают смешиваться, реализуя некие промежуточные значения. Чем больше шагов итерационной процедуры, тем сильнее взаимовлияние даже самых отдаленных популяций и, таким образом, возникает некоторая «усредненная» карта. При этом географическая локализация исходных частот генов сохраняется - благодаря «маскированию» исходного значения частоты в фиксированной точке пространства. Важнейшим достоинством этого метода построения карт является то, что значения частот генов в обследованных географических точках (взаимное расположение которых может быть сколь угодно нерегулярным) интерполируется на узлы регулярной сетки. В результате получается двумерная цифровая матрица, с которой можно проводить любые операции одно- и многомерной статистики. С помощью этого программного пакета были построены различные типы «синтетических» карт - и главных компонент, и генетических расстояний (Е.В. Баллановская и др. 1990) для популяций Центральной Азии и Кавказа (Е.В.Балановская, О.П.Балановский, 1997).

Достоинством данного пакета является то, что он создает как бы аналоговую модель миграции генов. Его недостатком является то, что необходимо всякий раз волевым решением выбирать шаг, на котором должна остановиться итерация, и, кроме того, данный метод не позволяет разделить две процедуры - создание карт только на основе исходных данных и «сглаживание» этих карт, то есть устранение случайных флуктуаций для выявления основных паттернов изменчивости. Эти обе процедуры протекают

как бы одновременно - в процессе построения карты с ростом числа итераций проявляется и «сглаживающий» эффект. В результате сразу создаются карты трендов, а исходная «несглаженная» карта остается неизвестной. Эти недостатки заставили разработчиков искать иные принципы создания карт (Е.В.Балановская, О.П.Балановский, 2007).

В 1990 году было начато создание программного пакета, который лег в основу создания всех последующих компьютерных карт. Он создавался коллективом Ю.Г. Рычкова и Е.В. Балановской совместно с сотрудниками кафедры картографии МГУ, которыми руководил С.М. Кошель (Ю.Г. Рычков и др., 1990). Пакет использует библиотеку программ MAG; проблемы визуализации цифровых матриц решены с помощью оригинального пакета «Metacopy», а статистические разделы программы разрабатывались сначала совместно с сотрудниками кафедры картографии МГУ (С.М. Кошель, Д.Б. Патрикеев, A.B. Асриев, О.Р. Мусин, В.В. Иванов), а затем - с помощью программистов И.А. Краснова, В.Е. Папкова, Т.П. Папковой, A.B. Рычкова, С.Д. Нурбаева и др. (Е.В.Балановская, О.П.Балановский, 2007).

Работа по созданию программного пакета велась географами и генетиками совместно, поскольку геногеография имеет собственный предмет исследования - пространственную структуру генофонда (в пространстве трех координат географической долготы, широты и частоты генов). При этом генофонд, с одной стороны является объектом популяционной генетики, с другой - выступает как один из множества объектов математической картографии (A.M. Берлянт, 1986; A.M. Трофимов, М.В. Панасюк, 1987). Поэтому компьютерная технология геногеографического анализа генофонда создавалась в сотрудничестве с географами, картографами и математиками специально для геногеографического изучения генофонда (Е.В.Балановская, О.П.Балановский, 2007).

При создании данных карт учтены и использованы следующие методы картографической науки: методы построения интерполяционных карт, правила оформления карт, принцип анализа фоновых поверхностей.

Однако сама технология картографо-статистического моделирования направлена на решение задач популяционной генетики (Е.В. Балановская, 1990, 1994, 1995, 1997-1999, 2003). Данный пакет позволяет осуществлять корреляционный анализ и анализ показателей генетического разнообразия, картографирование главных компонент и размещение популяций в их пространстве, техника «меняющегося» окна и анализ генетических расстояний, оценка надежности картографического прогноза и многие другие методы статистического анализа карт, специально разработанные для изучения генофонда (Е.В.Балановская, О.П.Балановский, 2007).

Совокупность этих методических разработок в целом можно отнести к тематической картографии, но по классификации методов - к нескольким разделам математико-картографического моделирования (A.M. Берлянт, 1986; A.M. Трофимов, М.В. Панасюк, 1987). Наиболее корректно их обозначить как картографо-статистические методы. Их общая цель: дать количественное выражение информации, содержащейся в геногеографической карте; выявить и выразить ту информацию, которая находиться в неявном виде (закономерности, тренды, связи и т.д.); провести одно- и многомерный анализ карт для выявления важнейших характеристик генофонда. Вся процедура картографо-статистического анализа генофонда в данном пакете основана на оригинальном программном обеспечении (Е.В.Балановская, О.П.Балановский, 2007).

На основе созданной технологии построены картографические модели различных параметров генофонда и целого спектра иных признаков, имеющих отношение к пространственной структуре популяций, таких как: характеристики среды - природные (климатические) и антропогенные факторы (техногенные нагрузки); характеристики материальной культуры; частоты фамилий; особенности размера популяций и инбридинга; картографический анализ моногенной патологии (Е.В.Балановская 1995, 2003, 2004; Е.В. Балановская и др., 1996, 1997, 1999, 2000, 2001).

Значительный интерес к разработке картографических пакетов демонстрируют и зарубежные специалисты в области медицинской генетики. В последние годы определенную популярность приобрела программа Surfer (Golden Software Surfer 7.0). Этот картографический пакет не является геногеографическим, а предназначен для картографирования любых, в первую очередь климатических параметров. Но он позволяет быстро построить интерполяционные карты любых признаков - в том числе и распространения генов, и поэтому не редко используется в современных работах для картографирования распространения гаплогрупп митохондриальной ДНК и Y хромосомы (О. Semino et al., 2000; S. Rootsi et al., 2004). Но у программы Surfer есть очень крупный недостаток, отличающий ее от остальных картографических программ, используемых в геногеографии. Это отличие состоит в том, что карты, построенные Surfer, являются только изображениями. Программа нацелена только на графический результат, а не на создание цифровой модели карты. То есть для каждой точки карты нельзя получить точные численные значения признака, а значит, нельзя проводить никакие виды картографо-статистического анализа, нельзя рассчитать карты главных компонент и так далее. Программа Surfer, таким образом, оказывается весьма эффективной для иллюстрации, для изображения распространенности отдельных признаков, но не позволяет проводить статистический анализ карт и строить все множество производных карт, в том числе синтетических. Иными словами она позволяет картографировать распространенность отдельных генов, но не позволяет изучать генофонд (Е.В.Балановская, О.П.Балановский, 2007).

Исходя из вышесказанного, более подробно остановимся на рассмотрении программного пакета GGMAG, созданного коллективом Ю.Г. Рычкова и Е.В. Балановской. Процедуры построения и анализа компьютерных карт пакетом GGMAG подробно описаны в целом ряде публикаций (Е.В.Балановская и др., 1994а, 19946, 1995, 1997, 1998; С.Н. Сербенюк и др. 1990, 1991; С.Д. Нурбаев, Е.В. Балановская 1997, 1998;

О.П. Балановский и др., 1999, 2000, 2001; Е.К. Гинтер, 1993; Е.К. Гинтер и др., 1994; Е.К. Гинтер, P.A. Зинченко, 2006). Поскольку описание картографической технологии не является предметом настоящей работы, то в следующем разделе мы лишь укажем основные принципы и подходы к созданию карт.

1.3 Принципы создания геногеографических карт

Данные о генофондах обычно крайне нерегулярны. Как правило, гены изучены неравномерно - по каждому генетическому маркеру изучен свой набор популяций. Кроме того и изученные популяции расположены неравномерно. В этом проявилась не «бесплановость» изучения генофонда, а объективный фактор: резкие различия в численности и плотности коренного населения в разных регионах. Однако, для геногеографического анализа в отличие от чисто статистического, обе эти неравномерности не являются серьезным препятствием, поскольку предметом анализа становится карта, а не первичный популяционно-генетический материал (Е.В.Балановская, О.П.Балановский, 2007).

Все геногеографические карты основаны на единых методических подходах:

1) единицей геногеографического наблюдения является популяция, характеризующаяся частотой гена и ареалом (К.А. Салищев, 1982, 1990);

2) для геногеографического изучения региона выбираются популяции, находящиеся на одном уровне популяционной структуры, вне зависимости от размеров их ареала (К.А. Салищев, 1982, 1990);

3) геногеографическая карта должна обладать не только географическим, но и генетическим масштабом: например, мировой диапазон изменчивости частоты гена, континентальный, региональный, этнический. Выбор генетического масштаба диктуется задачами исследования (К.А. Салищев, 1982, 1990);

4) в генетически изученных популяциях (опорных точках карты) размещается исходная частота гена (К.А. Салищев, 1982, 1990);

5) в разработанных программных пакетах используются метод интерполяций, требующий минимум исходных данных и позволяющий изменять любые параметры построения карты (К.А. Салищев, 1982, 1990);

6) в основе метода интерполяции лежит принцип генетической проницаемости пространственных барьеров за достаточно длительный промежуток времени, то есть ненулевой вероятности генных миграций в любую точку пространства (К.А. Салищев, 1982, 1990);

7) в анализе генофонда отдельные признаки играют служебную роль -они должны помочь выявить генетическую неоднородность пространства и пространственную неоднородность генофонда. Игнорируя, в процессе построения карты, природные и социальные барьеры, можно рассчитывать, что созданные карты сами обнаружат существование в пространстве генетически значимых барьеров (К.А. Салищев, 1982, 1990);

8) для простоты чтения карты все непрерывное множество значений признака подразделяется на несколько групп - интервалов признака. Число и размер интервалов выбирается в зависимости от задачи исследования. Но для каждой карты размеры всех ее интервалов одинаковы. Размер расстояний зависит от генетических расстояний между популяциями, а площадь, занимаемая тем или иным интервалом, зависит еще и от размеров ареалов разных популяций (К.А. Салищев, 1982, 1990);

9) основная задача при построении карты - интерполяция значений частот признака в опорных точках на необследованные обозначенные точки (К.А. Салищев, 1982, 1990).

10) при построении карты географическое пространство предполагается изотропным. Это означает, что в процессе создания карты не учитываются ни природные, ни историко-культурные факторы, безусловно влияющие на распространение генов. Любой учет этих признаков всегда субъективен, связан с экспертной оценкой значимости фактора для

генофонда. Такой фактор может внести в математическую модель карты субъективный фактор научного мировоззрения эксперта. Сама карта может объективнее эксперта учесть и отразить реальное воздействие как природных, так и историко-культурных факторов на генофонд. Если анизотропность физического и культурного пространства нашла отражение в самих наблюдаемых частотах генов, то она проявится и при картографировании: барьеры, препятствующие свободному потоку генов, создадут перепад частоты гена, и чем мощнее барьер, тем более резкий перепад частот мы обнаружим на карте (Е.В.Балановская, О.П.Балановский, 2007).

В основе построения компьютерных карт лежат их цифровые модели - двумерные численные матрицы с прогнозируемыми частотами признака для каждого узла сетки карты, рассчитанные по эмпирическим значениям признака в опорных точкам - генетически изученных популяциях. Выражение «опорные точки» - не образ, а конкретный термин, поскольку исходные значения признака в изученных популяциях действительно служат опорой изображенной на карте поверхности распределения признака: поверхность как бы сетью «натянута» на ординаты значений картографируемого признака в этих точках (Е.В.Балановская, О.П.Балановский, 2007). В узлах регулярной сети цифровой модели находятся значения картографируемого признака, рассчитанные с помощью интерполяционной процедуры, которая подробно описана в следующем разделе работы.

1.4 Существующий подход к геногеографическому прогнозированию на основе современной полиномиальной математической модели

В основе программного пакета ООМАО, разработанного специалистами Лаборатории Генетики Человека Института Общей генетики РАН, лежит математическая модель прогноза распределения популяционно-

генетических данных по территории (Ю.Г. Рычков, 2000; Ю.Г. Рычков и др., 1990, 1992, 2002).

В основе модели лежит метод интерполяции - прогнозирование значений с помощью определенным образом подобранных функций, зависящих от значений признака в опорных точках. Вид этих функций может быть разным и определяется исходя из сущности интерполированного признака (Ю.Г. Рычков, 2002).

За исходное положение при составлении модели принята гипотеза изотропности географического пространства. Такой выбор сделан обдуманно. Конечно, анизотропность географического пространства при проникновении генов не вызывает сомнений, однако вопрос этот поднимает ряд проблем. Например, одни и те же водоемы в некоторые моменты исторического развития могли быть дорогой, связывающей разные популяции, а в другое время - стать непреодолимой преградой для генов. Подобное можно сказать и о горных вершинах, которые иногда выполняли роль перевалов и были единственной нитью, связывающей популяции. Но самые яркие примеры нестационарности пространства в смысле его генной проницаемости относятся к географическим изменениям, произошедшим с континентом со времени заселения его человеком. Таково исчезновение под водой обширной области суши - Берингии, соединявшей прежде Азию с Северной Америкой (Ю.Г. Рычков, 2002).

Отказ от анизотропной модели не ведет к полному игнорированию географических особенностей изучаемых территорий. Именно метод интерполяции должен выявить на географических распределениях генов те реальные преграды, которые существовали в действительности, и те связующие "дороги", по которым направлялись миграционные потоки генов. При создании модели применялся метод средневзвешенной интерполяции (С.Н. Сербенюк и др., 1990, 1991; A.M. Берлянт и др., 1991а, 19916; S.M. Koshel et al. 1991; S.M. Koshel, O.R. Musin, 1991, 1994; A.M. Berlyant et al., 1992), учитывающий только расстояние до точек с опорными данными, и

не принимающий во внимание характеристики географического пространства, в котором измеряется расстояние. Водоемы и суша, равнина и плоскогорье, низменность и возвышенность в рамках этого метода рассматриваются равнопроницаемыми для генов (Ю.Г. Рычков, 2002).

Использованный метод интерполяции состоит в следующем. Пусть известны значения признака /=1,..,и (например, частоты гена, частоты гаплотипа, частоты нуклеотида в определенной позиции последовательности ДНК, и т.п.) в некотором наборе опорных точек. Опорные точки заданы своими координатами (х^), /=1 ,..,п. Таким образом, в трехмерном пространстве задан набор точек (х^г^, г=1 ,..,п, которые являются исходными данными для построения в этом пространстве интерполирующей поверхности. Согласно методу средневзвешенной интерполяции моделируемая поверхность представляется в виде (С.Н. Сербенюк и др., 1990):

п

^Щ(х>у)р<н{х>У)

Ях,у) = ^—п-,

1=1

где весовая функция м>1(х,у) = г~а(х,у) - положительная убывающая функция

от расстояния /-(х,у) = л](х-х1 )2 + (у-у,)2, а сглаживающие полиномы имеют вид Рш(х, у) = 2,+ £ аш (х - х,. )к (у - у)'.

О <к+Ш

Из способа задания интерполирующей функции /[х,у) и равенства Рси(хьу,)=г1 следует и, то есть моделируемая в трехмерном

пространстве поверхность г=/(х,у) проходит через опорные точки (х„у1,г^. Коэффициенты аш должны выбираться так, чтобы обеспечить сходимость функции и ее производных вплоть до порядка г/. Очевидно, при ¿/=0 производные модельной поверхности в опорных точках равны нулю, следовательно, углы склонов истинной и модельной поверхностей могут существенно отличаться. Сблизить углы склонов истинной и модельной поверхностей можно при помощи сглаживающих полиномов степени ¿/=1,

для которых подбор коэффициентов несложно осуществить методом наименьших квадратов. Возможно использование сглаживающих полиномов более высокой степени, однако, по мнению разработчиков, это имеет смысл только для специальных задач, когда особое значение имеет точность моделирования крутизны перегибов и других характеристик поведения функции, определяемых производными высших порядков, и меньше внимания уделяется собственно ошибке интерполяции. При прогнозировании использованы линейные зависимости, то есть полиномы степени d= 1 (Ю.Г. Рычков, 2002).

Параметр а является обратной степенью весовой функции и определяет, насколько значения в близких опорных точках сильнее влияют на поведение функции fix,у), чем значения в удаленных опорных точках. Обратная степень весовой функции а=6 означает, что интерполированное значение включает в себя значения в опорных точках с весами, обратно пропорциональными шестой степени расстояния до соответствующих опорных точек. Выбор параметра а=6 был сделан эмпирически на основе ряда экспериментов. Замечено, что с ростом параметра а межпопуляционное генное разнообразие как правило возрастает. В то же время при изменении количества опорных точек, как это бывает при получении новых данных о генетическом полиморфизме населения и уточнении генного рельефа в географическом пространстве, межпопуляционное разнообразие сильно варьируется. Таким образом, оптимальное значение параметра а, при котором межпопуляционное разнообразие наиболее соответствует разнообразию, рассчитанному для исходных опорных данных, зависит, прежде всего, от количества исходных опорных точек (Ю.Г. Рычков, 2002).

Суть описанного метода средневзвешенной интерполяции, а именно прямая зависимость интерполированных значений от значений в опорных точках и обратная зависимость от расстояний до опорных точек, раскрывает генетический смысл интерполяционной процедуры при ее использовании для моделирования генетического рельефа: интерполяция отражает принцип

«изоляции расстоянием» введенный С. Райтом (S. Wright, 1943). В таком контексте обратная степень весовой функции а является характеристикой пространства, выражающей степень его проницаемости для генов и обеспечивающей соответствие интерполяционной модели реальным миграционным процессам. Если бы давление миграций было единственным фактором воздействия на генофонд, то оптимальное значение параметра а не зависело бы от плотности опорных точек. Однако, чем больше расстояние между опорными точками, тем более существенное влияние оказывают естественный отбор и мутации на моделируемый диффузионный процесс распространения генов посредством миграций населения. Чтобы учесть эффекты естественного отбора и мутационные процессы, параметр а должен выбираться в зависимости от объема исходных опорных данных. Таков генетический смысл параметра а и выбранного значения а =6 при прогнозировании. Из приведенных соображений методического плана следует, что для такой опорной информации, как данные о частотах генов, и иных маркеров, имеющих генетическую природу, использование средневзвешенной интерполяции вполне оправдано (Ю.Г. Рычков, 2002).

Таким образом, построение простой карты авторы представляют следующим образом. Сначала создается картографическая основа, напоминающая контурную карту (со своими картографической проекцией, морями, реками, границами) (A.M. Берлянт, 1969). На нее наносятся исходные точки - популяции, изученные по данному гену. Сверху накладывается - равномерная прямоугольная сеть. Для каждого узла новой сетки рассчитывается новое, интерполированное значение частоты гена. В каждом узле такое значение определяется всей совокупностью исходных точек в пределах заданного радиуса, но исходные значения частот гена берутся с весом, обратно пропорциональным расстоянию до исследуемой точки: чем дальше исходная популяция от узла сетки, тем меньше ее вес. После того как расчет проведен для каждого узла сетки и как бы занесен в каждую клетку, этот «листок в клетку» становится цифровой матрицей

частоты гена. Для следующего гена повторяется та же самая процедура. И если для всех генов использовать одни и те же картографическую основу и равномерную сетку, то в результате получится серия цифровых матриц всех генов - полностью сопоставимых и унифицированных (Е.В.Балановская, О.П.Балановский, 1997).

Параметры интерполяционной процедуры выбираются в соответствии с оптимальным значением дисперсии признака (по всем узлам карты). Проведен ряд экспериментов и та густота сетки, которой соответствует минимум дисперсии, принята оптимальной.

1.5 Визуализация геиогеографической карты, созданной на основе

полиномиальной модели

При статистическом анализе цифровая матрица представляется как двумерная матрица значений признака. При этом каждому узлу сети соответствуют точные значения географических координат местности. Это позволяет перейти от матрицы к картографическому образу (Е.В.Балановская, О.П.Балановский, 1997).

Для формирования карты как зрительного картографического образа разработчиками создается электронная картографическая основа: контуры территории в заданных географических проекциях в масштабе, гидрографическая сеть, внутренние водоемы и омывающие моря, административные границы, опорные точки, градусная сеть; программно обеспечивается создание легенды карты. Пространственное распределение признака изображается на картографической основе с помощью группировки значений цифровой матрицы в интервалы шкалы изменчивости признака. Интервалы на карте разграничиваются изолиниями (Е.В.Балановская, О.П.Балановский, 1997).

При визуализации карты значения признака группируются в те или иные интервалы и окрашиваются по аналогии с физической картой. На цветных картах наиболее низкие значения признака окрашиваются синими

тонами морских впадин, средние - зеленым цветом равнин, высокие значения признака - красно-коричневыми оттенками гор. На черно-белых картах - повышение частоты признака выражается в большой интенсивности окраски. Основной принцип при визуализации карт - использование равномерной шкалы интервалов (Е.В.Балановская, О.П.Балановский, 1997).

При переходе от цифровой матрицы к карте значения признака объединяются в интервалы, указанные в легенде карты и послойно окрашиваются. Благодаря интервалам шкалы не только создается образ карты, но и косвенно учитывается доверительный интервал самих значений признака. Области, окрашенные одним цветом, читаются как области, характеризуемые значением признака, варьирующим в пределах, указанных в легенде шкалы интервалов. Изолинии, соединяющие точки с одинаковым значением признака, рассматриваются как вспомогательные линии при чтении карты, а не как области точных значений (Е.В.Балановская, О.П.Балановский, 1997).

Каждая карта сопровождается легендой, которая может включать до четырех окон: статистическое окно, гистограмму картографированных значений, гистограмму исходных значений, гистограмму со стандартными исходными значениями (Е.В.Балановская, О.П.Балановский, 1997).

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Векшина, Анна Борисовна

Выводы по работе

1) На основе анализа и оценки современных методов получения значений генетических показателей в границах исследуемых популяций, обоснована актуальность и практическая ценность создания адаптивной математической модели геногеографического прогноза.

2) Разработана адаптивная модель прогноза значений генетических показателей, отличающаяся от существующих аналогов возможностью автоматической реконфигурации ее структуры в зависимости от объема доступных для анализа результатов экспедиционных популяционно-генетических исследований. Разработанная адаптивная модель геногеографического прогноза, обеспечивает повышение точности прогноза значений генетических показателей, связанных с распространением наследственных заболеваний в пределах изучаемой популяции, вследствие включения в ее структуру не только географических координат исследуемых населенных пунктов, но и численности проживающего в них населения.

3) Разработан комплекс алгоритмов, обеспечивающих автоматическую адаптацию и расчет параметров моделей геногеографического прогноза на основе результатов популяционно-генетических исследований;

4) Предложен метод и алгоритм построения £>-оптимального плана для выбора административно-территориальных единиц, являющихся объектами популяционно-генетических исследований, который обеспечивает получение модели геногеографического прогноза обладающей максимальной точностью.

5) Создан программный комплекс GEN, реализующий возможность планирования экспедиционных популяционно-генетических исследований, получение оценок генетических показателей в границах исследуемых популяций на основе разработанных моделей геногеографического прогноза и графическое представление полученных результатов на географической карте.

6) Получены практические оценки показателей отягощенности различными типами наследственных патологий Ростовской и Кировской областей, а так же составлены оптимальные планы экспедиционных популяционно-генетических исследований для Чувашской и Удмуртской республик.

Список литературы диссертационного исследования кандидат технических наук Векшина, Анна Борисовна, 2012 год

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

1. Айала Ф., Кайгер Дж. Современная генетика. Т. 3. М.: Мир, 1988. 336 с. (Ayala F.J., Kiger J.A. Modern Genetics. Second Edition. Univ. Of California, Davis).

2. Айала Ф. Введение в популяционную и эволюционную генетику // М., Мир. 1984. С.81-104.

3. Алексеев В.П. Становление человечества // М.: Политиздат, 1984. 462 стр.

4. Алтухов Ю.П. Внутривидовое генетическое разнообразие: мониторинг и принципы сохранения // Генетика. 1995. Т.31. №10. С. 13331357.

5. Алтухов Ю.П. Генетические процессы в популяциях: Учебние пособие, 3-е изд., перераб. и доп. / Ю.П. Алтухов; Отв. Ред. Л.А. Животовский. - М.: ИКЦ «Академкнига». 2003. - 431 с.

6. Амосов A.A., Дубинский Ю.А., Копченова Н.В. Вычислительные методы для инженеров // М.: Высш. шк., 1994. 544 с.

7. Балановская Е.В. Возможности компьютерной геногеографии в изучении генофонда // Генетика. 1995. Т. 31. С. 12.

8. Балановская Е.В. Стратегия комплексного изучения генофонда (по данным антропологии, дерматоглифики, археологии, антропонимики, классической и молекулярной генетики) // Вопросы антропологии. 2003. Вып. 91. С. 185-187.

9. Балановская Е.В. Генофонд народов Северной Евразии: внутренняя структура и положение в мировом генофонде // Антропология на пороге III тысячелетия / Под ред. Т.Н. Алексеевой. М.: Старый сад, 2004. Т. 1. С. 358390.

10. Балановская Е.В., Балановский О.П. Роль этноса в истории популяций: геногеографический аспект // III Конгресс этнографов и антропологов России. Тез. докл. Москва, 1999. С. 103.

И. Балановская Е.В., Балановский О.В. Русский Генофонд на Русской равнине. Луч, 2007 г. 416 стр.

12. Балановская Е.В., Балановский О.П., Нурбаев С.Д., Дерябин В.Е., Долинова H.A., Бужилова А.П., Спицын В.А. Генофондика русского народа: данные разных наук // II Съезд ВОГиС. Тез. Докл. Т.2. С.-Петерб. 2000. С. 311-312.

13. Балановская Е.В., Балановский О.П., Спицын В.А., Бычковская Л.С., Макаров C.B., Пай Г.В., Русаков А.Е., Суббота Д.С. Русский генофонд. Геногеография сывороточных генных маркеров (HP, GC, PI, TF)//Генетика. 2001. Т.37. №8. С. 1125-1137.

14. Балановская Е.В., Балановский О.П., Спицын В.А., Бычковская Л.С., Макаров C.B., Пай Г.В., Суббота Д.С. Русский генофонд. Геногеография эритроцитарных генных маркеров (ACPI, PGM1, ESD, GLOl, 6-PGD)//Генетика. 2001. Т.37. №8. С. 1138-1151.

15. Балановская Е.В., Батсуурь Ж., Белковский А.Н., Рычков A.B., Рычков Ю.Г. Геногеография народонаселения: создание регионального геногеографического атласа с помощью ЭВМ // Генетика. 1990. Т. 26. N 5. С. 925-935.

16. Балановская Е.В., ГреховаЛ.В., Рычков Ю.Г. Компьютерная геногеография и археология: методы картографического моделирования распространения материальной культуры // Горизонты антропологии. Труды Международной научной конференции памяти академика В.П. Алексеева, 1994. М.: Наука, 2003. С. 66-72.

17. Балановская Е.В., Иноземцев B.C., Нурбаев С.Д., Перепелов A.B., Петрин А.Н., Руденская Г.Е., Ситников В.Ф. Региональные особенности наследственных заболеваний нервной системы // Регионология. 1996. №2(15). С. 153-161.

18. Балановская Е.В., Нурбаев С.Д. Компьютерная технология геногеографического изучения генофонда. III. Вычисление трендовых поверхностей // Генетика. 1995. Т. 31. N 4. С. 536-559.

19. Балановская Е.В., Нурбаев С.Д. Селективная структура генофонда.

I. Возможности изучения //Генетика 1997а. Т. 33. № 11. С. 1572-1588.

20. Балановская Е.В., Нурбаев С.Д. Геногеография и генофонд. Пространство главных компонент // Новые методы - новые подходы в современной антропологии. Москва: Старый сад, 19976. С. 99-115.

21. Балановская Е.В., Нурбаев С.Д. Компьютерная технология геногеографического изучения генофонда. IV. Популяции в пространстве главных компанент//Генетика 1997в. Т. 33. № 12. С. 1693-1710.

22. Балановская Е.В., Нурбаев С.Д. Селективная структура генофонда.

II. Стандартная технология определения через FsT-статистики // Генетика 1998а. Т. 34. № 9. С. 1307-1321.

23. Балановская Е.В., Нурбаев С.Д. Селективная структура генофонда.

III. Стандартная технология определения через FsT-статистики с помощью численного ресэмплинга//Генетика 19986. Т. 34. № 10. С. 1434-1446.

24. Балановская Е.В., Нурбаев С.Д. Селективная структура генофонда.

IV. Технология определения через показатель интенсивности отбора RS // Генетика 1998в. Т. 34. № 11. С. 1559-1573.

25. Балановская Е.В., Нурбаев С.Д. Пространственная изменчивость генофонда человека: геногеография и отбор // Исследования по генетике / Под ред. С.Г. Инге-Вечтомова. Вып. 12. СПб.: Изд-во С.-Петерб. Ун-та, 1999. С. 104-116.

26. Балановская Е.В., Нурбаев С.Д.,Балановский О.П., Почешхова Э.А., Бровинских A.A., Гинтер Е.К. Геногеографический анализ подразделенной популяции. 1. Генофонд адыгов в системе кавказских генофондов // Генетика. 1999. Т. 35. N 6. С. 818-830.

27. Балановская Е.В., Нурбаев С.Д., Почешхова Э.А. Генофонд Кавказа в контексте расы // Раса: миф или реальность? Тр. 1 Международной конференции. РО Европ. антропол. ассоциации. М.: Старый сад, 1998. С. 2122.

28. Балановская Е.В., Нурбаев С.Д., Рычков Ю.Г. Компьютерная технология геногеографичеекого изучения генофонда. I. Статистическая информация карт//Генетика. 1994а. Т. 30. N 7. С. 951-965.

29. Балановская Е.В., Нурбаев С.Д., Рычков Ю.Г. Компьютерная технология геногеографичеекого изучения генофонда. II. Статистическая информация карт//Генетика. 19946. Т. 30. N 11. С. 1538-1555.

30. Балановская Е.В., Нурбаев С.Д., Спицына Н.Х. Геногеографическое положение башкир в системе Уральских генофондов // Второй международный Конгресс этнографов и антропологов. Резюме докл. и сообщ. Часть I. Уфа: Восточный унив., 1997. 64 с.

31. Балановская Е.В., Почешхова Э.А., Балановский О.П., Нурбаев С.Д., Гинтер Е.К. Геногеографический анализ подразделенной популяции. II. География случайного инбридинга (по частотам фамилий адыгов) // Генетика. 2000. Т. 36. N 8. С. 1126-1139.

32. Балановская Е.В., Рычков Ю.Г. Геногеография: Гены человека на карте СССР. М.: Знание, 1990а, 64 с.

33. Балановская Е.В., Рычков Ю.Г. Этническая генетика: Этногеографическое разнообразие народов мира // Генетика. 19906. Т. 26. №1. С. 288-297.

34. Балановская Е.В., Рычков Ю.Г. Генофонд человека на этапах освоения ойкумены: адаптивная эволюция и геногеография // Человек заселяет планету Земля. Тр. Междунар. Симпозиума «Первичное расселение человечества» / Отв. Ред. A.A. Величко, O.A. Соффер. 1997. С. 288-297.

35. Балановский О.П., Бужилова А.П., Балановская Е.В. Геногеографический анализ русских фамилий // Второй (четвертый) российский съезд медицинских генетиков. Тез. докл. Курск, 2000. С. 153-154.

36. Балановский О.П., Бужилова А.П., Балановская Е.В. Русский генофонд. Геногеография фамилий // Генетика. 2001. Т. 37. №7. С. 974-990.

37. Балановский О.П., Нурбаев С.Д., Кравчук О.И., Макаров C.B., Спицын В.А., Гинтер Е.К. «Синтетические» карты генофонда мари (по

данным об нмунно-биохимическом полиморфизме) // Генетика. 1999. Т.35. №1. С. 74-82.

38. Балановский О.П., Шадрина М.И., Соломинский П.А., Спицын В.А., Лившиц Л.А., Лимборская С.А. Полиморфизм гена CCR5, связанного с ВИЧ-1 инфекцией, в народонаселении Старого Света: экологический и этнографический аспекты // III Конгресс этнографов и антропологов России. Тез. докл. Москва, 1999. С. 149-150.

39. БерлянтА.М. Карты фоновых и остаточных поверхностей и их применение в географических исследованиях // Вести. МГУ. 1969. №4. С. 8089.

40. Берлянт A.M. Образ пространства: карта и информация. М.: Мысль, 1986. 240 с.

41. БерлянтА.М., Кошель С.М., Мусин O.P., Суетова И.А. Использование геоинформационных систем в геоморфологическом анализе и картографировании // Всесоюзное совещание «Новые методы и технологии в геоморфологии для решения геоэкологических задач». 1991а. С. 20-21.

42. Берлянт A.M., Кошель С.М., Мусин O.P., Суетова И.А. Опыт создания глобальной цифровой базы данных по гипсометрической карте мира в масштабе 1:15000000 // Геоморфология. 19916. №2. С. 25-31.

43. Генетическая структура и наследственные болезни чувашской популяции / Под редакцией: Гинтера Е.К., Зинченко P.A. // Чебоксары: Издательский дом «Пегас». 2006. 232 стр.

44. Генофонд и геногеография народонаселения Том 1. Генофонд населения России и сопредельных стран. / Под редакцией Рычкова Ю. Г.. — Санкт-Петербург: Наука, 2000. — 611 с.

45. Генофонд и геногеография народонаселения. Том 2. Геногеографический атлас населения России и сопредельных стран / под редакцией Рычкова Ю. Г. // Санкт-Петербург: Наука, 2000. — 672 с.

46. Гинтер Е.К. Влияние генетической структуры на груз наследственных болезней в русской популяции // Вестн. РАМН. 1993. №9. С. 23-26.

47. Гинтер Е.К., Мамедова P.A., Ельчинова Г.И., Брусинцева О.В. Генетическая структура популяций и особенности территориального распределения аутосомно-рецессивных заболеваний в Кировской области // Генетика. 1994. Т.ЗО. №1. С. 107-111.

48. Гинтер Е.К., Мамедова P.A., Козлова С.И., Галкина В.А., Мошкина И.С., Руденская Г.Е., Хлебникова О.В., Нурбаев С.Д., Балановская Е.В., Рассанов В. П. Разнообразие наследственной патологии у населения республики Марий Эл и ее дифференциация по частотам генов наследственных болезней // Генетика. 1998. Т. 34. N 7. С. 963-972.

49. Грехова JI.B., Балановская Е.В., Рычков Ю.Г. Разработка технологии создания компьютерных региональных археологических атласов: поздний палеолит Северной Евразии // Гуманитарная наука в России: Саровские лауреаты (История. Археология. Культурная антропология и этнография). М.: 1996. С. 286-304.

50. Евсюков А.Н., Жукова О.В., Папков В.Е., Сигнеев В.И., Шереметьева В.А., Шнейдер Ю.В., Рычков Ю.В. География генетических процессов в народонаселении. Генные миграции в Северной Евразии (Европейский регион) //Генетика. 1997. Т. 33. N 11. С. 1539-1550.

51. Ельчинова Г.И., Кадошникова М.Ю., Мамедова P.A. Выявление особенностей генетической структуры популяций с помощью метода описания «генетического ландшафта» // Генетика, 1991. Т.27. №11. С. 19942001.

52. Ельчинова Г.И., Парадеева Г.М., Ревазов A.A. Медико-генетическое изучение населения Костромской области. Сообщение IX. Интерпретация матрицы генетических расстояний //Генетика, 1988. Т.24. №11. С.2043-2049.

53. Зедгинидзе И.Г. Организация и планирование инженерного эксперимента // Тбилиси: Технический университет, 2000. 224 с.

54. Зедгинидзе И.Г. Планирование эксперимента для исследования многокомпонентных систем // М.: Наука, 1976. 390 с.

55. Ильин В.А., Садовничий В.А., Сендов Б.Х. Математический анализ /4.1. Изд. 3. Ред. А. Н. Тихонов // М.: Проспект, 2004.

56. Калиткин H.H. Численные методы // М.: Наука, 1978. 512 стр.

57. Мамаев А.Н. Основы медицинской статистики. Практическое пособие. // М.: Практическая медицина, 2011. 128 стр.

58. Материалы к библиографии ученых СССР / Александр Сергеевич Серебровский (1892—1948) // Сер. биол. наук. Генетика. Вып. 5. М.: Наука, 1993. 49 с.

59. Медик В.А., Токмачев М.С. Математическая статистика в медицине: учеб. пособие // М.: Финансы и статистика, 2007. 800 стр.

60. Налимов В.В., Теория эксперимента, изд-во «Наука», М., 1971. 208

стр.

61. НурбаевС.Д., Балановская Е.В. Геногеография и генофонд. Оценивание надежности карты // Новые методы - новые подходы в современной антропологии. М.: Старый сад, 1997. С. 116-132.

62. Нурбаев С.Д., Балановская Е.В. Компьютерная технология геногеографического изучения генофонда. V. Оценивание надежности карт // Генетики. 1998. Т. 34. №6. С. 825-838.

63. Перепелов A.B., Иноземцева B.C., Петрин А.Н., Ситников В.Ф., Нурбаев С.Д., Балановская Е.В., Руденская Г.Е. Наследственные болезни нервной системы в Мордовии // Генетическая эпидемиология наследственных болезней нервной системы. Саранск, 1996. С. 97-112.

64. Планирование эксперимента в исследовании технологических процессов. / Под редакцией Э.К. Лецкого, К. Хартман, Э. Лецкий, В. Шефер и коллектив авторов // Москва: Издательство «Мир», 1977. - 552 с.

65. Почешкова Э.А. Генетико-демографический анализ подразделенной популяции адыгов. Автореферат канд. Дис. М.: 1998. 24 с.

66. Рынков Ю.Г., Балановская Е.В. Этническая генетика: Соотношение адаптивной и нейтральной генетической дифференциации этносов // Генетика. 1999а. Т.26. №3. С. 541-549.

67. Рычков Ю.Г., Балановская Е.В. Генетическая дифференциация народонаселения: прогнозируемы ли данные о полиморфизме ДНК, исходя из иммуно-биохимического полиморфизма // Молекулярные механизмы генетических процессов. М.: Наука, 19996. С. 67-83.

68. Рычков Ю.Г., Балановская Е.В. Генофонд и геногеография народонаселения СССР // Информ. Материалы Программы «Человек, наука, общество: комплексные исследования». Программа 3. «Диалектика социального и природного в развитии человека и его отношениях с миром». Вып. 1.М., 1990в. С. 7-17.

69. Рычков Ю.Г., Балановская Е.В. Генофонд и геногеография населения СССР // Генетика. 1992. Т.28. Приложение. С. 52-75.

70. Рычков Ю.Г., Балановская Е.В., Нурбаев С.Д., Шнейдер Ю.В. Историческая геногеография восточных славян // Восточные славяне и их соседи/ Отв. Ред. Т.И. Алексеева. М.: Научный мир, 2002. С. 109-134.

71. Рычков Ю.Г., Батсуурь Ж. Монголы МНР и монголоидное население Азии в свете геногеографии // Вопросы антропологии. 1987. Вып.78. С. 44-68.

72. Рычков Ю.Г., Рычков A.B., Балановская Е.В., Батсуурь Ж., Белковский А.Н., Будилова Е.В., Терехин А.Т. Геногеография народонаселения: опыт компьютерного картографирования популяционно-генетических данных// Генетика. 1990. Т. 26. 332-340.

73. Салищев К.А. Картография М.: Высшая школа, 1982. 272 стр.

74. Салищев К.А. Картоведение М.: МГУ. 1990. 400 стр.

75. Сербенюк С.Н., Кошель С.М, Мусин О.Р. Методы моделирования геополей по данным в нерегулярно расположенных точках // Геодезия и картография. 1990. N 11. С. 31-35.

76. Сербенюк С.Н., Кошель С.М, Мусин О.Р. Программы МАГ для создания цифровых моделей геополей // Геодезия и картография. 1991. N 4. С. 44-46

77. Серебровский A.C. Геногеография и генофонд сельскохозяйственных животных СССР// Научное слово. 1928. N 9. С. 3-22.

78. Серебровский A.C. Проблемы и метод геногеографии // Труды Всесоюзного съезда по генетике, селекции, семеноводству и племенному животноводству. 1930. Т.2 С. 71-86.

79. Трофимов A.M., Панасюк М.В. Математико-географическое моделирование и автоматизация географических исследований // География в системе наук (Серия: Современные проблемы географии). JL: Наука, 1987. С. 194-206.

80. Тюрин Ю.Н., Макаров A.A. Статистический анализ данных на компьютере//М.: Инфра-М, 1998. 528 стр.

81. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления // М.: ФИЗМАТЛИТ, 2001. т. 1 - 616с.; т.2 - 810с.; т.З - 662с.

82. Фогель Ф., Мотульски А. Генетика человека // Пер. с англ. Под ред. Ю.П. Алтухова и В.М. Гиндилиса. - М.: Мир, 1989. Т.1. 312 с.

83. Фогель Ф., Мотульски А. Генетика человека // Пер. с англ. Под ред. Ю.П. Алтухова и В.М. Гиндилиса. - М.: Мир, 1990. Т.2. 378 с.

84. Чепурковский, Е. М. Географическое распределение формы головы и цветности крестьянского населения преимущественно Великороссии в связи с колонизацией ее славянами. (Материалы для антропологии России) // Тр. Антропол. отдела. 1913. Т. 28. Вып. 2. 107 стр.

85. Шапиро Н.И. Памяти A.C. Серебровского (18.11.1892 — 26.VI. 1948) // Генетика. 1966. № 9. С. 3—11.

86. Ammerman A. J., Cavalli-Sforza L.L. Neolithic Transition and the Genetics of Populations in Europe. Princeton. N. J.: Princeton University Press. 1984. 176 p.

87. Berlyant A.M., Koshel S.M., Musin O.R., Suyetova I.A. Constructing a global digital data base using a world hypsometric map 1:15,000,000 scale: preliminary results // Mapping Sciences and Remote Sensing. 1992. V. 29. N2. P. 146-154.

88. Bodmer W.F., Cavalli-Sforza L.L. Genetics, Evolution, and Man // San Francisco: W.H. Freeman. 1976. 782 p.

89. Cavalli-Sforza L.L. Population structure and human evolution // Proc. F. Soc. London. Ser. B. 1966. V. 164. P. 362-379.

90. Cavalli-Sforza L.L., Bodmer W.F. The Genetics of Human Population. San Francisco / W.H. Freeman. 1971. 965 p.

91. Cavalli-Sforza L.L., Edwards A.W.F. Phylogenetics analysis: Model and estimation procedures // Am. J. Human Genet. 1967. V.19. P. 223-257.

92. Cavalli-Sforza L.L., MenozziP., Piazza A. History and Geography of Human Genes. Princeton: Princeton University Press. 1994. 1059 p.

93. Cavalli-Sforza L.L., Piazza A. Human genomic diversity in Europe: A summary of recent research and prospects for the future // Europe Journal of Human Genetics. 1993. V.l. P. 3-18.

94. Koshel S.M., Musin O.R. Digital models for studying of environmental change // Proc. of Int. Symp. On Environmental Change and GIS (INSEG'91). 1991. Asahikawa, Japan. V. 2. P. 321-327.

95. Koshel S.M., Musin O.R. Spatial Modeling and Analysis for GIS // GIS Brno 1994. Conference "Europe in Transition". 1994. P. 30.

96. Koshel S.M., Musin O.R., Semin V.N. Digital models and Geographical Information Systems // Proc. of Int. Conf. on GIS (GIS Brno 1991), 1991. P.50.

97. Menozzi P., Piazza A., Cavalli-Sforza L.L. Synthetics maps of human gene frequencies in Europe // Science. 1978. V. 201. P. 786-792.

98. Mourant A.E., Kopec A.C., Domaniewska-Sobczak K. The Distribution of the Human Blood Groups and Other Polymorphism. London, 1976. P. 1055.

99. Piazza A., Menozzi P., Cavalli-Sforza L.L. Synthetic gene frequency maps of man and selective effects of climate // Proc. Nat. Acad. Sci. USA. 1981a. V. 78. P. 2638-2642.

100. Piazza A., Menozzi P., Cavalli-Sforza L.L. The making and tasting of geographic gene frequency maps // Biometrics. 1981b. V. 37. P. 635-659.

101. Rootsi S., Magri C., Kivisild T., Benuzzi G., Help H., Bermisheva M., Kutuev I., Barac L., Pericic M., Balanovsky O., Pshenichnov A., Dion D., Grobei M., Zhivotovsky L.A., Battaglia V., Achilli A., Al-Zahery N., Parik J., King R., Cinnioglu C., Khusnutdinova E., Rudan P., Balanovska E., Schefferahn W., Simonescu M., Brehm A., Goncalves R., Rosa A., Moisan J.P., Chaventre A., Ferak V., Furedi S., Oefner P.J., Shen P., Beckman L., Mikerezi L., Terzic R., Primorac D., Cambon-Thomsen A., Krumina A., Torroni A., Underhill P.A., Santachiara-Benerecetti A.S., Villems R., Semino O. Phylogeography of Y-Chromosome Haplogroup I Reveals Distinct Domains of Prehistoric Gene Flow in Europe // Am. J. Hum. Genet. 2004. P. 128-137.

102. Rychkov Yu. G., Sheremetyeva V.A. The genetic process in the system of ancient human isolates in North Asia // Population structure and Human Variation/ Ed. G. A. Harrison. Internat. Biol. Programme. V. 11. Cambridge Univ. Press. 1977. P. 47-108.

103. Rychkov Yu. G., Sheremetyeva V.A. The genetic of circumpolar populations of Eurasia related to the problem of human adaptation // The Human biology of Circumpolar Population. Intern. Biol. Programme. V. 21 / Ed. F. A. Milan Cambridge: Cambridge Univ. Press. 1979. P. 37-80.

104. Semino O., Magri C., Benuzzi G., Lin A.A., Al-Zahery N., Battagilia V., Maccioni L., Triantaphyllidis C., Shen P., Oefner P.J., Zhivotovsky L.A., King R., Torroni A., Cavalli-Sforza L.L., Underhill P.A., Santachiara-Renerecetti A.S., Origin, Diffusion, and Differentiation of Y-Chromosome Haplogroups E and J: Inferences on the Neolithization of Europe and Later Migratory Events in the Mediterranean Area // Am. J. Hum. Genet. 2004, 74, P. 1023-1034.

105. Sokal R.R., Oden NX., Thomson B.A. A problem with synthetic maps // Human Biology. 1999a. V. 71. N 1. P. 1-13.

106. Sokal R.R., Oden N.L., Thomson B.A. A problem with synthetic maps remain: Reply to Rendine et al. // Human Biology. 1999b. V. 71. N 3. P. 447-453.

107. Ward R.H., Neel J.Y. The genetics of a tribal population, the Yanomama Indians. XIV. Clines and their interpretation// Genetics. 1976. V. 82. P. 103-121.

108. Wright S. Isolation by distance // Genetics. 1943. V. 28. P. 114-138.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.