Управление параллельными заданиями в гриде с помощью опережающего планирования тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат физико-математических наук Семячкин, Дмитрий Александрович
- Специальность ВАК РФ05.13.11
- Количество страниц 114
Оглавление диссертации кандидат физико-математических наук Семячкин, Дмитрий Александрович
Содержание.
Введение.
Актуальность темы.
Цель и задачи работы.
Практическая значимость.
Апробация работы.
Структура и объём работы.
Краткое содержание работы.
Глава 1 Управление параллельными заданиями в локальных системах и специфика грида.
1.1. Обзор методов планирования параллельных заданий.
1.1.1. Методы разделения ресурсов.
1.1.2. Методы разделения времени.
1.2. Технологии распределённого компьютинга.
1.2.1. Распределённый компьютинг и грид.
1.2.2. Грид для организации высокопроизводительного компьютинга.
1.3. Управление параллельными заданиями в гриде.
1.3.1. Свойства грида.
1.3.2. Задача коаллокации в гриде.
1.4. Выводы.
Глава 2 Существующие подходы к планированию параллельных заданий в гриде.
2.1. Использование методов приоритетного планирования в гриде.
2.2. Системы планирования параллельных заданий в гриде.
2.2.1. KOALA.
2.2.2. Meta-Scheduling Service.
2.2.3. Job Submission Service.
2.2.4. NWIRE.
2.2.5. Computing Center Software.
2.3. Выводы.
Глава 3 Планирование параллельных заданий в гриде с неотчуждаемыми ресурсами.
3.1. Экономический подход к планированию в гриде.
3.2. Алгоритм планирования, учитывающий разделение и коаллокацию ресурсов.
3.2.1. Применение Backfill в гриде с неотчуждаемыми ресурсами.
3.2.2. Алгоритм планирования.
3.2.3. Обоснование корректности алгоритма.
3.2.4. Учёт различной производительности процессоров.
3.2.5. Экспериментальная оценка эффективности алгоритма.
3.2.6. Масштабируемость планировщика.
3.3. Выводы.;.
Глава 4 Реализация опережающего планирования для параллельных заданий.
4.1. Архитектура системы диспетчеризации.
4.2. Диспетчер.
4.2.1. Служба приёма команд.
4.2.2. Служба приёма информации о ресурсах.
4.2.3. База данных планирования.
4.2.4. Служба планирования.
4.2.5. Служба управления запуском.
4.3. Ресурсный агент.
4.3.1. Блок сбора информации о ресурсе.
4.3.2. Служба резервирования.
4.4. Пользовательский интерфейс.
4.5. Выводы.
Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Методология развития научного информационно-вычислительного комплекса в составе глобальной грид-инфраструктуры2012 год, доктор технических наук Кореньков, Владимир Васильевич
Разработка системы запуска ресурсоемких приложений в облачной гетерогенной среде2013 год, кандидат технических наук Е Мьинт Найнг
Модель и методы выбора неотчуждаемых ресурсов для планирования заданий в распределенных вычислительных средах2013 год, кандидат технических наук Емельянов, Дмитрий Михайлович
Интеллектуальная платформа управления композитными приложениями в распределённых вычислительных средах2010 год, кандидат технических наук Марьин, Сергей Владимирович
Алгоритмы организации функционирования мультикластерных вычислительных систем с иерархической структурой2013 год, кандидат технических наук Пазников, Алексей Александрович
Введение диссертации (часть автореферата) на тему «Управление параллельными заданиями в гриде с помощью опережающего планирования»
Актуальность темы
В последнее время активное развитие получила новая модель организации ресурсов под названием грид — пространственно распределённая среда, интегрирующая множество ресурсов разных типов (процессоры, долговременная и оперативная память, хранилища файлов, базы данных и сети), совокупность которых может быть использована для решения прикладных задач нового уровня сложности. Потенциал технологий грида уже сейчас оценивается очень высоко: он имеет стратегический характер, и в близкой перспективе грид должен стать инструментарием для развития высоких технологий в различных сферах человеческой деятельности.
Наиболее развит и востребован на практике рассматриваемый в работе вычислительный грид, оперирующий такими типами ресурсов, как процессоры, оперативная и дисковая память, которые применяются для обработки заданий и хранения файлов. К настоящему времени уже разработаны ключевые для этого типа грида протоколы дистанционного запуска заданий и управления файлами.
Эффективность функционирования грида как среды с коллективной формой обслуживания пользователей определяется в первую очередь согласованностью распределения имеющихся ресурсов, которое должно происходить автоматически, опираясь на планирование вычислительных процессов в гриде в целом. Поэтому одной из ключевых функций, требуемых от программного обеспечения грида, является функция диспетчеризации, с помощью которой обеспечивается распределение ресурсов из общего ресурсного пула между заданиями, доставка программ и данных. Задача диспетчеризации много раз успешно решалась для ближайшего аналога вычислительного грида — кластерных систем, однако в условиях грида она значительно усложняется, и для её решения требуются новые подходы.
В архитектуре грида функция диспетчеризации реализуется специальными программными службами, обеспечивающими такой уровень интеграции распределённых ресурсов, при котором грид представляется в виде единой операционной среды обработки запросов (заданий). Совокупность таких служб составляет систему диспетчеризации. Большинство существующих на сегодня систем диспетчеризации предназначено для обслуживания гридов, состоящих из кластеров, — традиционной формы организации распределённых ресурсов. Используемым на практике системам диспетчеризации присущи довольно жёсткие ограничения по применению, и они не способны исключить такие нежелательные эффекты, как непредсказуемость времени обработки заданий, задержка обработки в ситуациях, когда имеются простаивающие ресурсы. Существенным недостатком большинства систем является невозможность обработки параллельных заданий. Основная сложность в этом случае состоит в необходимости планирования, которое обеспечивает накопление и затем гарантированное синхронное выделение ресурсов в нескольких кластерах (коаллокация ресурсов): это предотвращает зависание заданий, которое является следствием фрагментации ресурсного пула. Некоторые системы способны решить эту задачу в специальных условиях применения, когда используемые ресурсы полностью отчуждаются в грид и централизованно управляются.
Диссертационная работа посвящена проблемам разработки методов управления параллельными заданиями и их алгоритмической поддержки для актуальной формы грида, когда ресурсы не отчуждаются от владельцев, а используются в гриде совместно с ними (неотчуждаемые ресурсы). Решение задачи в такой постановке открывает возможность создания высокопроизводительных вычислительных комплексов посредством интеграции пространственно распределённых, автономно управляемых, не выделенных специально в грид многопроцессорных и кластерных систем в единую операционную среду и применения в качестве средства межпроцессорного обмена данными глобальных телекоммуникаций.
Цель и задачи работы
Целью диссертационной работы является разработка нового метода управления параллельными заданиями в гриде. Достижение цели связывается с решением следующих задач.
Первая задача — это исследование существующих методов управления параллельными заданиями в кластерных системах и различных формах грида.
Вторая задача состоит в формализации планирования параллельных заданий для следующей формы грида:
• ресурсы используются совместно с владельцами (неотчуждаемые ресурсы);
• ресурсы организованы в кластеры (кластеризованные ресурсы);
• объекты планирования — многопроцессорные (параллельные) задания. Третья задача — разработка архитектуры системы диспетчеризации для этой формы грида.
Четвёртая задача — разработка алгоритма планирования, решающего задачу коаллокации в условиях разделения кластерных ресурсов с их владельцами.
Пятая задача заключается в программной реализации разработанного метода в системе диспетчеризации параллельных заданий и оценке характеристик масштабируемости системы и эффективности алгоритма планирования.
Практическая значимость
Полученные в диссертационной работе результаты могут быть использованы для построения гридов из существующих вычислительных центров путём объединения их ресурсов для решения важных прикладных задач науки и техники, выполняющихся на большом числе процессоров.
Разработанный диспетчер позволяет повысить эффективность функционирования распределённой вычислительной среды, а работу с ней сделать не сложнее, чем с более привычными компьютерными архитектурами: многопроцессорными и кластерными системами. С его помощью можно решать наиболее ресурсоёмкие параллельные задачи, для которых требуется привлечение компьютерного парка нескольких организаций.
Предполагается, что в дальнейшем результаты работы будут применены в программном обеспечении крупных инфраструктурных проектов.
Апробация работы
Основные результаты работы докладывались и обсуждались на следующих конференциях и семинарах:
1. 1-я международная конференция «Распределённые вычисления и грид-технологии в науке и образовании». Доклад «Использование алгоритма Backfill в гриде», Дубна, 29 июня-2 июля 2004 г.
2. Семинар МГУ им. М.В. Ломоносова «Проблемы современных информационно-вычислительных систем» под руководством д.ф.-м.н. В.А. Васенина. Доклад «Способы планирования в гриде и их реализация в грид-диспетчере», Москва, 12 апреля 2005 г.
3. Семинар группы разработчиков программного обеспечения для грид-инфраструктуры EGEE ARDA под руководством М. Lamanna. Доклад «К1АМ in GT4 Evaluation Activity and Grid Research», CERN, Женева, 12 октября 2005 г.
4. 13-я Всероссийская научно-методическая конференция «Телематика-2006». Доклад «Создание прототипа центра базовых грид-сервисов нового поколения для интенсивных операций с распределёнными данными в федеральном масштабе», Санкт-Петербург, 5-8 июня 2006 г.
5. 2-я международная конференция «Распределённые вычисления и грид-технологии в науке и образовании». Доклад «Управление параллельными заданиями в гриде с помощью метода опережающего планирования», Дубна, 26-30 июня 2006 г.
6. Научная конференция «Ломоносовские чтения», факультет ВМиК МГУ им. М.В. Ломоносова. Доклад «Коаллокация ресурсов грида для обслуживания параллельных заданий», Москва, 16-24 апреля 2008 г.
7. Научный семинар ИПМ им. М.В. Келдыша под руководством М.Р. Шура-Бура и Д.А Корягина. Доклад «Управление параллельными заданиями в гриде с помощью опережающего планирования», Москва, 6 ноября 2008 г.
По материалам диссертации опубликовано пять печатных работ [1, 2, 3, 4, 5], в том числе, одна [5] — в журнале, рекомендованном ВАК для публикации основных результатов докторских и кандидатских диссертаций по вычислительной технике и информатике.
Структура и объём работы
Работа состоит из введения, четырёх глав, заключения и списка литературы. Общий объём диссертации — 114 страниц (включая 10 страниц
Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Методы обработки запросов в системах управления базами данных для многопроцессорных систем с иерархической архитектурой2008 год, кандидат физико-математических наук Лепихов, Андрей Валерьевич
Система пакетной обработки заданий в гетерогенной вычислительной сети2004 год, кандидат технических наук Хачкинаев, Геннадий Месропович
Организация функционирования распределенных вычислительных систем в мультизадачных режимах2012 год, доктор технических наук Мамойленко, Сергей Николаевич
Графическая объектная модель параллельных процессов и ее применение в программных комплексах численного моделирования2007 год, доктор технических наук Востокин, Сергей Владимирович
Разработка и исследование алгоритмов управления очередями заданий при организации параллельных вычислений в кластерных вычислительных системах2011 год, кандидат технических наук Аль-хулайди Абдулмаджид Ахмед Галеб
Заключение диссертации по теме «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», Семячкин, Дмитрий Александрович
4.5. Выводы
В настоящей главе описана выполненная автором и под его руководством реализация программного прототипа системы диспетчеризации параллельных заданий в гриде с неотчуждаемыми ресурсами, основанного на разработанном в диссертационной работе методе и алгоритме. Особенностью системы является то, что для планирования диспетчер использует прогноз использования ресурсов на будущее, что позволяет эффективно распределять задания по ресурсам. Важные результаты получены в реализации ресурсного агента, занимающегося построением прогноза. Во-первых, предложен способ отслеживания изменения состояния кластера, основанный на «прослушивании» сообщений, которые локальный менеджер Torque посылает Maui. Таким образом, ресурсный агент узнаёт о событиях, происходящих в кластере, и управляет моделированием, в результате которого строится расписание. Во-вторых, разработан способ учёта резервирований с помощью введения фиктивных заданий и штатных средств Maui. В-третьих, предложен метод динамического управления шагом планирования, позволяющий существенно сократить время построения прогноза. Кроме этого, разработан и задействован в диспетчере механизм предварительного резервирования ресурсов, в реализации которого решена важная задача закрепления резервирования за конкретным глобальным заданием, выполнение которого запланировано на соответствующих ресурсах.
Заключение
Автор выражает благодарность заведующему сектором ИПМ им. М.В. Келдыша РАН, кандидату физико-математических наук Коваленко Виктору Николаевичу и заведующему отделом ИПМ им. М.В. Келдыша РАН, доктору физико-математических наук Горбунову-Посадову Михаилу Михайловичу за помощь в подготовке диссертации. Работа выполнена под руководством заместителя директора ИПМ им. М.В. Келдыша, доктора физико-математических наук, профессора кафедры Системного программирования факультета ВМиК МГУ им. М.В. Ломоносова Корягина Дмитрия Александровича, которому автор выражает искреннюю признательность.
В рамках диссертационной работы получены следующие результаты.
1. На основе анализа существующих методов управления параллельными заданиями в многопроцессорных и кластерных системах показано, что в условиях грида эти методы не применимы непосредственно, а требуется их модификация, учитывающая особенности пространственно распределённой среды.
2. Предложен новый метод диспетчеризации параллельных заданий, позволяющий использовать ресурсы входящих в грид кластеров как пользователям грида, так и организациям, являющимся владельцами кластеров. Обеспечивается управляемость процессом обработки заданий со стороны пользователей, и в то же время контролируемость использования ресурсов владельцами кластеров.
3. Разработана архитектура системы диспетчеризации, в которой наряду с традиционно используемыми механизмами: очередью заданий, приоритетным управлением, дистанционной доставкой файлов — применены новые: механизмы предсказания загрузки кластерных ресурсов и их предварительного резервирования.
4. В рамках предложенной архитектуры решён ключевой вопрос управления параллельными заданиями: разработан оригинальный алгоритм планирования, решающий задачу коаллокации ресурсов грида и способный подбирать ресурсы по критериям скорейшего старта или скорейшего завершения задания.
5. Реализована система диспетчеризации параллельных заданий. Система установлена на экспериментальном полигоне грида, что позволило провести оценку характеристик масштабируемости системы и эффективности алгоритма планирования. Реализация может быть использована в грид-инфраструктурах, создание которых в России ожидается в ближайшей перспективе.
Список литературы диссертационного исследования кандидат физико-математических наук Семячкин, Дмитрий Александрович, 2008 год
1. Коваленко В.Н., Коваленко Е.И., Корягин Д.А., Семячкин Д.А. Управление параллельными заданиями в гриде с неотчуждаемыми ресурсами. Препринт № 63, 2007. М.: ИПМ РАН. 28 с. http://www.gridclub.ru/library/publication.2007-12-07.4482411642
2. Коваленко В.Н., Семячкнн Д.А. Методы и алгоритмы управления параллельными заданиями в гриде с ресурсами в форме кластеров // Вестник Южного научного центра РАН. 2008. № 3(4). С. 23-34.
3. Message Passing Interface.http ://www-unix.mcs .anl .gov/mpi/
4. Parallel Virtual Machine. http://www.csm.ornl.gov/pvm/
5. Feitelson D.G. A Survey of Scheduling in Multiprogrammed Parallel Systems // Research Report RC 19790 (87657). IBM T. J. Watson Research Center, 1994. P. 171.http://www.cs.huji.ac.il/~feit/papers/SchedSurvey97TR.ps.gz
6. Maui scheduler. http://www.supercluster.org/maui
7. Streit A. On Job Scheduling for HPC-Clusters and the dynP Scheduler // In: HiPC. Berlin / Heidelberg, Springer-Verlag, 2001. Lect. Notes Comput. Sci. V. 2228. P. 58-67.http://www.fz-juelich.de/jsc/vsgc/pub/streit-2001 -OJS .pdf
8. Brando T. J. Comparing DCE and CORBA // Technical Report MP 95B-93, MITRE, 1995.http://www.mitre.org/research/domis/reports/DCEvCORBA.html
9. Milojicic D. S., Kalogeraki V., Lukose R., Nagaraja K., Pruyne J., Richard В., Rollins S., Xu Z. Peer-to-peer computing // Technical report, HP Laboratories Palo Alto, 2002.http://www.hpl.hp.com/techreports/2002/HPL-2002-57Rl.pdf
10. Baker M. Cluster computing white paper // Rapport Technique, IEEE Task Force on Cluster Computing, 2000. http://arxiv.org/pdf/cs.DC/0004014vl .pdf
11. Корягин Д.А., Коваленко B.H. Распределённый компьютинг и грид // Технологии грид. Том 1. 2006. М.: ИПМ им. М.В.Келдыша. С. 7-27. http://www.gridclub.ru/library/publication.2006-07-17.5298811749
12. Foster I., Jennings N. R., Kesselman C. Brain Meets Brawn: Why Grid and Agents Need Each Other // In: Proceedings of the 3rd International Joint
13. Conference on Autonomous Agents and Multiagent Systems. New York, 2004. IEEE Computer Society. V. 1. P. 8-15. http://www.semanticgrid.org/documents/003-fosterigrid.pdf http://www.gridclub.ru/library/publication.2006-02-28.0712570840 (русский перевод)
14. Kephart J.O., Chess D.M. The Vision of Autonomic Computing // IEEE Computer Society Press, 2003. Computer. V. 36(1). P. 41-50. http://www.research.ibm.com/autonomic/research/papers/ACVisionComp uterJan2003.pdf
15. Salvador Т., Barile S., Sherry J. Ubiquitous computing design principles: supporting human-human and human-computer transactions // In: Proceedings of the Conference on Human factors in computing systems. Vienna, Austria, 2004. ACM. P. 1497-1500.
16. Catlett C., Smarr L. Metacomputing // Communications of the ACM. 1992. V. 35(6), P. 44-52.
17. Kaufmann III W.J., Smarr L. Supercomputing and the transformation of science // Scientific American Library, a division of HPHLP, New York. 1993.
18. MPICH-G2. http://www3.niu.edu/mpi/33. GridMPI.http ://ww w. gridmpi. org/
19. Enabling Grids for E-SciencE (EGEE). http://www.eu-egee.org
20. Grid2003. www.ivdgl.org/grid2003
21. NorduGrid. www.nordugrid.org
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.