Разработка методов и алгоритмов повышения производительности многопроцессорных вычислительных комплексов при решении специальных задач тема диссертации и автореферата по ВАК РФ 05.13.15, кандидат наук Сачков Валерий Евгеньевич

  • Сачков Валерий Евгеньевич
  • кандидат науккандидат наук
  • 2020, ФГБОУ ВО «МИРЭА - Российский технологический университет»
  • Специальность ВАК РФ05.13.15
  • Количество страниц 191
Сачков Валерий Евгеньевич. Разработка методов и алгоритмов повышения производительности многопроцессорных вычислительных комплексов при решении специальных задач: дис. кандидат наук: 05.13.15 - Вычислительные машины и системы. ФГБОУ ВО «МИРЭА - Российский технологический университет». 2020. 191 с.

Оглавление диссертации кандидат наук Сачков Валерий Евгеньевич

ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ

ВВЕДЕНИЕ

Глава 1. Критический обзор современных аппаратных и программных средств повышения производительности многопроцессорных вычислительных комплексов для специальных вычислений

1.1 Технико-экономический анализ масштабирования распределённой системы многопроцессорного вычислительного комплекса

1.2 Обзор современных архитектур параллельных вычислительных комплексов

1.2.1 Системы с общей памятью

1.2.2 Системы с распределённой памятью

1.2.3 Гибридные системы

1.3 Обзор аппаратных средств повышения производительности

1.4 Обзор программных средств для распараллеливания программ

1.5 Программное обеспечение распределённых кластерных вычислительных комплексов

1.5.1 Apache Hadoop

1.5.2 Apache Mesos

1.6 Системы управления конфигурациями (Software Configuration Management)

1.7 Системы высокопроизводительных вычислений (High Throughput Computing)

1.8 Постановка задачи исследования

Глава 2. Разработка методов, алгоритмов и архитектуры программной системы распределённой обработки данных в многопроцессорных вычислительных комплексах

2.1 Методы повышения производительности распределенной системы

обработки данных

2

2.2 Синхронные и асинхронные процессы

2.3 Разработка модели асинхронных акторов

2.3.1 Модель акторов

2.3.2 Грамматика переходов в разные состояния конечного автомата

2.3.3 Модель конечного автомата асинхронных акторов

2.3.4 Формализация правил состояний модели асинхронных акторов

2.3.5 Основные компоненты разработанной асинхронной модели акторов

2.3.6 Обобщённый алгоритм работы асинхронной модели акторов для

вычислительных задач

2.3.7 Режимы работы разработанной модели асинхронных акторов

2.3.8 Роли разработанной модели асинхронных акторов

2.4 Разработка алгоритмов и методов модели асинхронных акторов

2.4.1 Общий алгоритм работы асинхронного актора

2.4.2 Входные параметры

2.4.3 Модуль балансировщика нагрузки

2.4.4 Модуль мониторинга

2.4.5 Адаптеры обработки сообщений

2.5 Главный цикл асинхроного актора

2.5.1 Выбор режима работы актора

2.5.2 Обработка сообщений

2.6 Разработка универсального ядра балансировщика нагрузки

2.6.1 Режим калибровки

2.6.2 Режим балансировки

2.7 Разработка архитектуры программной системы распределённого вычислительного кластера на базе асинхронных акторов

2.7.1 Разработка метода обмена сообщений между узлами кластера

2.7.2 Формат передачи данных по протоколу AMQP

2.7.3 Архитектура программной системы вычислительного кластера

2.8 Выводы

3

Глава 3. Разработка методов и алгоритмов распространения функционала модели асинхронных акторов через адаптеры

3.1 Постановка специальных вычислительных задач для апробации модели асинхронных акторов

3.2 Методы подключения внутренних и сторонних решений с помощью адаптеров асинхронных акторов

3.3 Неоптимизированная специальная вычислительная задача предобработки текста на естественном языке, реализованная в АСТП

3.4 Оптимизированная специальная вычислительная задача создания индексированной базы ассоциативных векторных пространств

3.5 Внутренняя вычислительная задача по управлению кластером средствами операционной системы

3.6 Выводы

Глава 4. Апробация разработанных методов и алгоритмов функционирования многопроцессорного вычислительного комплекса с использованием асинхронных акторов

4.1 Используемое программное обеспечение

4.1.1 Выбор языка программирования и платформы для реализации модели асинхронных акторов

4.1.2 Используемые специальные сторонние решения для реализации модели асинхронных акторов

4.1.3 Используемые специальные сторонние решения для реализации специальных вычислительных задач

4.2 Распределённая вычислительная система асинхронных акторов (РВСАА)

4.2.1 Описание РВСАА

4.2.2 Архитектура РВСАА

4.3 Апробация РВСАА

4.3.1 Проверка закона Амдала для разработанной модели асинхронных

акторов для неоптимизированной СВЗ

4.4 Измерение повышения производительности СВЗ в режиме алгоритма калибровки

4.4.1 Предобработка текста на естественном языке средствами специального стороннего готового решения АСТП

4.4.2 Создание индексированной базы АВП средствами специального стороннего готового решения АСТП

4.4.3 Управление кластером средствами операционной системы

4.5 Выводы по апробации РВСАА

4.6 Ассоциативно-семантический текстовый препроцессор (АСТП)

4.6.1 Описание программного комплекса АСТП

4.6.2 Функциональная схема АСТП

4.6.3 Апробация семантического поиска в ассоциативном векторном пространстве

4.7 Выводы

ЗАКЛЮЧЕНИЕ

Список используемых источников

ПРИЛОЖЕНИЕ А Свидетельство о государственной регистрации программы для ЭВМ «Распределённая вычислительная система асинхронных акторов (РВСАА)»

ПРИЛОЖЕНИЕ Б Свидетельство о государственной регистрации программы для ЭВМ «Ассоциативно-семантический текстовый препроцессор (АСТП-2017)»

ПРИЛОЖЕНИЕ В Акты внедрения

ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ

Сокращение Значение

АВП Ассоциативное векторное пространство

АСТП Ассоциативно-семантический текстовый препроцессор

БН Балансировщик нагрузки

ВК Вычислительный кластер

ЛП Легковесный процесс

МВК Многопроцессорный вычислительный комплекс

ОЗ Очередь задач

ОР Очередь решений

ОС Обработчик сообщений

ПЛИС Программируемая логическая интегральная схема

РВСАА Распределённая вычислительная система асинхронных акторов

СВЗ Специальная вычислительная задача

СОА Сервис-ориентированная архитектура

СПО Специальное программное обеспечение

MNB Мультиноминальный байесовский классификатор

NLP Обработка естественного языка (Natural Language Processing)

ВВЕДЕНИЕ

В современном мире больших данных («Big Data») актуальным является вопрос об обработке значительных массивов информации для извлечения ценных знаний. Понятие «большие данные» является не определением технологии, а концепцией, включающей следующие признаки:

1. Разнородность. Данные не структурированы и разрозненны, они разного типа и вида.

2. Объём. Для каждого типа информационной системы определяется свой объём данных, который считается «большим», например от нескольких сотен гигабайт до нескольких петабайт.

3. Скорость. Генерация цифровых данных происходит с очень высокой скоростью, например генерация пользователями нескольких миллионов сообщений в секунду.

Разработанные ранее методы, алгоритмы и архитектуры вычислительных комплексов и специального программного обеспечения (СПО) с появлением больших данных оказались не готовы к обработке экспоненциально растущего объёма неструктурированных цифровых данных.

Современные тенденции по специализированной обработке информации создали необходимость в разработке новых решений по обработке больших объёмов неструктурированной цифровой информации с использованием мощных многопроцессорных вычислительных комплексов.

Среди учёных и исследователей, которые занимались задачами

специальной обработки вычислительных задач на многопроцессорных

вычислительных комплексах, можно выделить следующих: С. А. Лебедев,

И. С. Брук, Б. И. Рамеев, И. Я. Акушский, В. М. Глушков, Н. Я. Матюхин,

М. А. Карцев, Г. П. Лопато, В. А. Мельников, Ю. Г. Косарев, Э. В. Евреинов,

В. П. Корячко, С. В. Скворцов, Н. Вирт (Niklaus Emil Wirth), Ч. Э. Р. Хоар

(Charles Antony Richard Hoare), Э. В. Дейкстра (Edsger Wybe Dijkstra),

К. А. Петри (Carl Adam Petri), М. Флинн (Michael J. Flynn), Д. Амдал (Gene

7

Amdahl), К. Хьюитт (Carl Eddie Hewitt), Э. С. Таненбаун (A. S. Tanenbaum) и др.

Рекомендованный список диссертаций по специальности «Вычислительные машины и системы», 05.13.15 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка методов и алгоритмов повышения производительности многопроцессорных вычислительных комплексов при решении специальных задач»

Актуальность работы

Под специальными вычислительными задачами (СВЗ) понимаются узкоспециализированные в определенной предметной области задачи, для которых разрабатываются сложные индивидуальные решения. Зачастую разработку таких решений бывает затруднительно или невозможно выполнить имеющимися собственными средствами.

Сложность решения СВЗ обусловливается их уникальностью. СВЗ не обладают унификацией, и единого стандарта не существует. Каждый тип задач является уникальным и требует разработки собственного решения, методов, алгоритмов и т.д. Сложность методов и алгоритмов для решения СВЗ вынуждает использовать помимо собственных разработок специальные сторонние готовые решения. Данный подход решения СВЗ обусловлен тем, что есть определённые трудности при реализации собственного решения, а именно:

1) невозможно воспроизвести или повторить сторонние решения собственными силами;

2) невозможно за приемлемое время разработать аналог стороннего решения;

3) экономически не выгодно разрабатывать аналог стороннего решения;

4) защита стороннего решения лицензией или авторским правом;

5) отсутствие специалистов с необходимыми компетенциями.

Использование специальных сторонних готовых решений для СВЗ

является стандартной практикой при современной разработке. Данная практика уменьшает необходимые ресурсы и время для поиска целевой функции, методов, алгоритмов, моделей и т.д., дающих нужный результат

при обработке СВЗ, но порождает проблемы, связанные с производительностью, оптимизацией и масштабированием:

1. Проприетарное программное обеспечение (ПО). Не позволяет модифицировать решение под нужды пользователя.

2. Решение не приспособлено для распределительных вычислительных кластеров. Современные приложения часто реализуют параллельную обработку данных, используя CPU и GPU процессоры, но крайне редко поддерживают распараллеливание задач по сети между разными физическими вычислительными комплексами.

3. Плохая оптимизация. Приложение не использует все доступные вычислительные ресурсы (например, только CPU, игнорируя наличие GPU процессоров), что значительно сказывается на производительности.

4. Сложность при вертикальном и горизонтальном масштабировании. Например, при добавлении нового вычислительного узла в кластер необходимы его настройка, конфигурация и подключение к менеджеру задач.

Из вышеперечисленных трудностей формируется актуальность исследования — это разработка новых методов и алгоритмов, способных: повысить производительность многопроцессорных вычислительных комплексов (МВК); ускорить работу специальных сторонних готовых решений (с модификацией и без); упростить разработку и эксплуатацию средств обработки больших массивов неструктурированных цифровых данных, отвечающих концепции «больших данных»; использовать, насколько это возможно, только открытые и свободные непроприетарные специальные сторонние готовые решения или собственные разработки.

В диссертационном исследовании разработаны методы и алгоритмы повышения производительности многопроцессорных вычислительных комплексов при решении специальных задач.

Объектом диссертационной работы является многопроцессорный вычислительный комплекс для решения специальных вычислительных задач.

Предмет исследования определён паспортом специальности 05.13.15: предметная область № 2 — теоретический анализ и экспериментальное исследование функционирования вычислительных машин, комплексов и компьютерных сетей с целью улучшения их технико-экономических и эксплуатационных характеристик; № 3 — разработка научных методов, алгоритмов организации специальной обработки данных, хранения и ввода-вывода информации; № 4 — разработка научных методов и алгоритмов организации параллельной и распределённой обработки информации, многопроцессорных, многомашинных и специальных вычислительных систем, а также перечнем задач, решаемых в диссертации.

Целью диссертационной работы является разработка методов и алгоритмов повышения производительности многопроцессорных вычислительных комплексов при решении специальных задач.

Для достижения поставленной цели в работе сформулированы следующие основные задачи:

1. Провести критический обзор современных аппаратных и программных средств повышения производительности многопроцессорных вычислительных комплексов для специальных вычислений.

2. Разработать методы, алгоритмы и архитектуру программной системы распределённой обработки данных в многопроцессорных вычислительных комплексах.

3. Разработать методы и алгоритмы распространения функционала модели асинхронных акторов через адаптеры.

4. Провести апробацию разработанных методов и алгоритмов функционирования многопроцессорного вычислительного комплекса с использованием асинхронных акторов.

5. Внедрить основные результаты и научные положения диссертации в практические разработки.

Методы исследования

Для решения поставленных задач в ходе диссертационного исследования использовались: методы и алгоритмы распределённой обработки данных; методы и алгоритмы параллельной обработки данных; методы построения топологий вычислительных сетей; методы межпроцессного взаимодействия; методы анализа неструктурированной информации; методы математического моделирования; технологии разработки алгоритмов и программного обеспечения объектно-ориентированного программирования.

Научная новизна работы заключается в следующем:

1. Разработана модель асинхронных акторов обладающая свойствами обмена сообщениями, самокопирования, изменения поведения и адаптированная под асинхронную работу в различных режимах на МВК.

2. Разработан алгоритм асинхронных акторов, позволяющий повысить производительность обработки специальных вычислительных задач с использованием вычислительных ресурсов МВК за счет работы в трех режимах: однопоточном, многопоточном, многопроцессном.

3. Разработаны методы и алгоритмы использования специализированных сторонних: модулей, библиотек, фреймворков, приложений через реализацию подключаемых адаптеров асинхронного актора.

Значение полученных результатов исследования для практики

подтверждается тем, что:

1. Разработан и внедрён в промышленную эксплуатацию пакет

специального программного обеспечения «Распределённая вычислительная

система асинхронных акторов (РВСАА)». Это специальное масштабируемое

программное обеспечение для многопроцессорных вычислительных

комплексов (МВК), предназначенное для распараллеливания и ускорения

обработки СВЗ между программными и аппаратными средствами МВК

11

путём максимального использования допустимой вычислительной мощности МВК.

2. Разработан и внедрён в промышленную эксплуатацию пакет программного обеспечения «Ассоциативно-семантический текстовый препроцессор (АСТП-2017)», предназначенный для предварительной нормализации текстов с целью преобразования в наборы ассоциативных семантических векторов с заданной смысловой аннотацией. Дополнительно поддерживаются функции обработки естественного языка в процессах взаимодействия естественного языка и языков компьютерных систем и роботизированных устройств (стеммизация и токенизация) для последующей обработки средствами обработки естественного языка (Natural Language Processing — NLP) корпуса документов для проверки гипотез, обучения и статистического лингвистического анализа.

3. Проведена апробация Распределённой вычислительной системы асинхронных акторов (РВСАА).

4. Проведена апробация Ассоциативно-семантического текстового препроцессора (АСТП-2017).

На защиту выносятся следующие основные результаты и научные положения:

1. Методы, алгоритмы и архитектура программной системы многопроцессорного вычислительного комплекса для повышения производительности при решении специальных задач на основе модели асинхронных акторов.

2. Модель асинхронных акторов для многопроцессорного вычислительного комплекса.

3. Методы и алгоритмы трёх основных режимов работы асинхронного актора и их переключения для обработки СВЗ.

4. Структура, методы и алгоритмы балансировщика нагрузки и его подключаемых сменных ядер для повышения производительности обработки СВЗ.

5. Структура, методы и алгоритмы подключаемых адаптеров специальных сторонних решений для обработки СВЗ.

Теоретическая значимость исследования обоснована тем, что:

- подтверждена возможность использовать модель асинхронных акторов для повышения производительности при обработке СВЗ на МВК в вычислительном кластере;

- предложен алгоритм повышения производительности работы специализированных собственных и сторонних готовых решений для обработки СВЗ;

- разработан алгоритм, позволяющий изменять логику работы балансировщика нагрузки для изменения распределения вычислительных ресурсов на МВК.

Личный вклад. Все результаты и научные положения, выносимые на защиту, получены автором лично. В частности автором: проведён критический обзор современных аппаратных и программных средств повышения производительности МВК для специальных вычислений; рассмотрены современные методы повышения производительности распределенной системы обработки данных для МВК; разработаны структуры, методы, алгоритмы и архитектура программной системы вычислительного кластера для повышения производительности и оптимального использования вычислительных ресурсов МВК; осуществлено личное участие во внедрении разработанного пакета прикладных программ в эксплуатацию, а также в непосредственной подготовке основных публикаций по выполненной работе.

Достоверность полученных результатов подтверждена:

- результатами проведённых экспериментов, полученными экспериментальными данными и применением предложенных алгоритмов, методов и архитектуры программной системы в разработанном вычислительном комплексе на базе Распределённой вычислительной системы асинхронных акторов (РВСАА);

- результатами проведённых экспериментов, полученными экспериментальными данными и применением предложенных алгоритмов и методов в разработанном прикладном программном обеспечении на базе препроцессора Ассоциативно-семантического текстового препроцессора (АСТП).

Апробация работы

Результаты работы регулярно представлялись на научно-технических семинарах кафедр Института комплексной безопасности и специального прибора строения РТУ — МИРЭА, а также на научно-технических семинарах других учебных заведений и организаций.

Получено свидетельство о государственной регистрации программы для ЭВМ № 2018663271 «Распределённая вычислительная система асинхронных акторов (РВСАА)» от 24.10.2018 г. (Приложение А).

Получено свидетельство о государственной регистрации программы для ЭВМ № 2017663559 «Ассоциативно-семантический текстовый препроцессор (АСТП-2017)» от 07.12.2017 г. (Приложение Б).

По материалам диссертационной работы опубликовано 15 научных работ, из них 7 — в научных рецензируемых изданиях, рекомендуемых ВАК, 2 — в журналах, включённых в базу данных Scopus, 3 — в трудах международных научно-практических конференций, входящих в РИНЦ, 3 — публикации, относящиеся к теме диссертации, не входящие в ранее перечисленные издания.

Структура диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы и двух приложений.

Основная часть диссертации содержит 186 страницы машинописного текста, включая 67 рисунков и 15 таблиц.

Основные результаты работы

В рамках проведенного диссертационного исследования получены следующие основные теоретические и практические результаты:

1. Проведен критический обзор современных аппаратных и программных средств повышения производительности МВК для специальных вычислений. Рассмотрены современные методы повышения производительности распределенной системы обработки данных для МВК. Проанализированы их преимущества и недостатки.

2. Разработаны методы, алгоритмы и архитектура программной системы МВК для повышения производительности специальных вычислительных задач на базе разработанной модели асинхронных акторов.

3. Разработано специальное программное обеспечение РВСАА.

4. Проведена апробация полученных результатов.

Список основных работ по теме диссертации

Публикации, индексируемые в базе данных Scopus:

1. Sachkov V. E., Zhukov D. O., Korablin Y. P., Raev V. K., Akimov D. A. Organization of Information System for Semantic Search Based on Associative Vector Space. In: Sukhomlin V., Zubareva E. (eds.). Convergent Cognitive Information Technologies. Convergent 2018. Communications in Computer and Information Science, Vol. 1140. P. 78-70. Springer, Cham; DOI: https://doi.org/10.1007/978-3-030-37436-5_6

2. Sachkov V. E., Akimov D. A., Pavelyev S. A. The Use of Psycholinguistic Patterns in Interactive Systems of Active Information Retrieval, International Journal of Engineering & Technology, 2018, Vol. 7, No. 4.38, P. 422-425; ISSN 2227-524X; DOI: 10.14419/ijet.v7i4.38.24595

Публикации в журналах, входящих в перечень ВАК:

1. Сачков, В. Е. Использование асинхронных акторов в вычислительных комплексах для специальных задач / В. Е. Сачков // Cloud of science. — 2020. — Т. 7. — № 3. — С. 644-655 // URL: https://elibrary.ru/item.asp?id=43023408

2. Сачков, В. Е. Применение ассоциативно-семантического препроцессора в интерактивных диалоговых системах на естественном языке / В. Е. Сачков // Труды Института системного программирования РАН.

— 2018. — Т. 30. — Вып. 4. — С. 195-208; DOI: 10.15514/ISPRAS-2018-30(4)-13

3. Сачков, В. Е. Использование ассоциативного векторного пространства в семантическом поиске / В. Е. Сачков // Современная наука: актуальные проблемы теории и практики. — Серия «Естественные и технические науки». — 2018. — № 5. — С. 132-135 // URL: https://elibrary.ru/item.asp?id=35417224

4. Сачков, В. Е. Обработка и компьютерный анализ текста на естественных языках / В. Е. Сачков, Е. Ф. Гильмутдинова, Е. Д. Матяш, Д. А. Акимов // Современная наука: актуальные проблемы теории и практики. — Серия «Естественные и технические науки». — 2016. — № 12.

— С. 57-64 // URL: https://elibrary.ru/item.asp?id=27354782

5. Акимов, Д. А. Обработка и компьютерный анализ информации об опубликованных уязвимостях нулевого дня на естественных языках / Д. А. Акимов, В. Е. Сачков, А. С. Алёшкин, В. И. Уманский // Проблемы информационной безопасности. Компьютерные системы. — 2017. — № 2. — C. 9-15 // URL: https://elibrary.ru/item.asp?id=29426687

6. Сачков, В. Е. Вычислительный комплекс специальной семантической обработки текста на естественном языке / В. Е. Сачков // Промышленные АСУ и контроллеры. — 2018. — № 8. — С. 54-59 // URL: https://elibrary.ru/item.asp?id=35490904

7. Акимов, Д. А. Организация целенаправленного активного поиска на основе оценки синтагматических и парадигматических ассоциаций текстовых сообщений / Д. А. Акимов, А. Ю. Дятченкова, В. Е. Сачков // Современная наука: актуальные проблемы теории и практики. — Серия «Естественные и технические науки». — 2018. — № 5. — С. 69-75 // URL: https://elibrary.ru/item.asp?id=35417213

Публикации, входящие в сборники международных научно-практических конференций, индексируемые в РИНЦ:

1. Карнаков, В. В. Обработка текста на естественных языках с использованием компьютерного анализа / В. В. Карканов, Д. А. Акимов,

B. Е. Сачков, Е. Ф. Гильмутдинова. — В кн.: Информационные технологии и математическое моделирование систем 2016: труды международной научно-технической конференции. — Одинцово, 2016. — С. 125-130 // URL: https://elibrary.ru/item.asp?id=27354782

2. Сачков, В. Е. Применение ассоциативных векторных пространств для создания интерактивно диалоговых систем / В. Е. Сачков // Актуальные вопросы науки: материалы 38-й межд. науч.-практ. конф. — Москва, 2018. —

C. 258-263 // URL: https://elibrary.ru/item.asp?id=35233014

3. Сачков, В. Е. Анализ проблемы частотного перекрытия слов при определении тематики текста в семантических вычислительных комплексах / В. Е. Сачков // Вестник современных исследований: материалы межд. науч.-практ. конф. — Омск, 2018. — С. 486-488 // URL: https://elibrary.ru/item.asp?id=35339603

Другие публикации по теме диссертационной работы, не входящие в вышеперечисленные издания:

1. Андрианова, Е. Г. Повышение производительности обработки специальных задач с использованием модели асинхронных акторов / Е. Г. Андрианова, В. Е. Сачков, Д. О. Жуков // Высокопроизводительные вычислительные системы и технологии. — 2020. — Т. 4. — № 1. — С. 2431 // URL: https://www.elibrary.ru/item.asp?id=43961238

2. Сачков, В. Е. Применение ассоциаций в семантическом поле текста на естественном языке / В. Е. Сачков; под общ. ред. Е. С. Чернова // Фундаментальные и прикладные исследования: гипотезы, проблемы и результаты: материалы 4-й межд. науч.-практ. конф. — Новосибирск, 2018. — С. 293-297 // URL: https://elibrary.ru/item.asp?id=32843066

3. Сачков, В. Е. Анализ задачи определения тематики текста в семантических вычислительных комплексах / В. Е. Сачков // EurasiaScience: материалы 15-й межд. науч.-практ. конф. — Москва, 2018. — С. 140-141 // URL: https://elibrary.ru/item.asp?id=35320428

Глава 1. Критический обзор современных аппаратных и программных средств повышения производительности многопроцессорных вычислительных комплексов для специальных вычислений

В современном мире больших данных («Big Data») [1] вопрос об обработке значительных массивов информации для извлечения ценных знаний является актуальным. Концепция больших данных включает следующие ключевые понятия [2]:

1. Разнородность. Данные не структурированы и разрозненны, они разных типов и видов.

2. Объём. Для каждого типа системы определяется свой объём данных, который считается «большим», например от нескольких сотен гигабайт до нескольких петабайт.

3. Скорость. Генерация цифровых данных происходит с очень высокой скоростью.

В связи с современными тенденциями по специализированной обработке информации возникает необходимость в разработке решений по обработке больших объёмов неструктурированной цифровой информации с использованием мощных вычислительных комплексов.

Вычислительные задачи не обладают унификацией, и единого стандарта не существует. Каждый тип задач является уникальным и требует разработки собственного решения, методов оптимизации, алгоритмов и т.д. Сложность методов и алгоритмов для решения вычислительных задач вынуждает использовать помимо собственных разработок специальные сторонние готовые решения. Но такой подход обладает рядом недостатков:

1. Проприетарное программное обеспечение (ПО) не позволяет модифицировать приложение под нужды пользователя.

2. Сложность воспроизведения. Стороннее ПО может разрабатываться большим сообществом или крупной организацией, что требует значительных ресурсов и компетенций для разработки аналога.

3. Решение не приспособлено для распределительных вычислительных кластеров. Современные приложения часто реализуют параллельную обработку данных, используя CPU и GPU процессоры, но крайне редко поддерживают распараллеливание задач по сети между разными физическими вычислительными комплексами.

4. Плохая оптимизация. Приложение не использует все доступные вычислительные ресурсы (например, только CPU, игнорируя наличие GPU процессоров), что значительно сказывается на производительности.

Для решения перечисленных трудностей необходимо разработать новые методы, алгоритмы и архитектуру, способную повысить производительность многопроцессорных вычислительных комплексов (МВК), которые способны упростить разработку и эксплуатацию средств обработки больших массивов неструктурированных цифровых данных, отвечающих концепции «Big Data».

На сегодняшний день существуют два основных подхода для реализации на практике высокопроизводительных вычислительных комплексов:

1. Горизонтальная и вертикальная масштабируемость аппаратной части вычислительного комплекса.

2. Прикладная — набор специализированного программного обеспечения вычислительного комплекса, в котором реализованы новые методы и алгоритмы, повышающие производительность обработки данных, определённой задачи [3].

Оба этих подхода подразумевают объединение нескольких

вычислительных комплексов, которые обычно состоят из нескольких

компьютеров или серверов, соединённых высокоскоростным каналом связи,

представляющихся для пользователя как единый кластер, т.е. единый

20

аппаратный ресурс [4, 5, 6]. Подобная организация вычислительных комплексов называется распределенной системой параллельной обработки данных.

Поэтому в данной главе кратко рассмотрены преимущества и недостатки некоторых популярных открытых (свободных) решений для создания или эксплуатации высокопроизводительных вычислительных комплексов для специальной обработки информации.

1.1 Технико-экономический анализ масштабирования распределённой системы многопроцессорного вычислительного комплекса

Экономическая составляющая использования МВК для СВЗ оценивается с помощью закона Гроша [7]. Основное утверждение таково: чтобы сделать вычисления СВЗ дешевле, необходимо их ускорить. Цена оборудования МВК должна коррелировать со скоростью обработки СВЗ и рассчитываться как квадрат производительности от стоимости.

Поэтому скорость обработки СВЗ на МВК является важным рассчитываемым параметром [8] при разработке методов, алгоритмов и архитектур, которые должны соблюдать определённые правила:

- МВК не должен стоять в простое при вычислениях;

- вычислительные ресурсы МВК должны эффективно использоваться;

- оперативный ввод и вывод новых узлов МВК при масштабировании или выходе из строя.

Рассмотрим основные технико-экономические характеристики распределённой системы МВК, определяющие их производительность, стоимость и ограничения.

Определение 1. Распределённая система — это набор независимых компьютеров, представляющийся их пользователям единой объединённой системой [9].

Одна из характеристик распределённых систем состоит в том, что от

пользователей скрыты различия между компьютерами и способы связи

21

между ними. То же самое относится и к внешней организации распределённых систем. Другой важной характеристикой распределённых систем является способ, при помощи которого пользователи и приложения единообразно работают в них, независимо от того, где и когда происходит их взаимодействие.

Распределённые системы должны относительно легко поддаваться расширению или масштабированию [9].

Определение 2. Масштабируемость — это способность системы, сети или процесса увеличивать свою производительность при добавлении ресурсов [10].

Эта характеристика является прямым следствием наличия независимых компьютеров, но в то же время не указывает, каким образом эти компьютеры на самом деле объединяются в единую систему. Масштабируемость системы может измеряться по трём различным показателям. Во-первых, система может быть масштабируемой по отношению к её размеру, что означает лёгкость подключения к ней дополнительных пользователей и ресурсов. Во-вторых, система может масштабироваться географически, т.е. пользователи и ресурсы могут быть разнесены в пространстве. В-третьих, система может быть масштабируемой в административном смысле, т.е. быть проста в управлении при работе во множестве административно независимых организаций. Однако система, обладающая масштабируемостью по одному или нескольким из этих параметров, при масштабировании часто даёт потерю производительности [11].

Закон Амдала [12, 13] показывает ограничения распараллеливания задачи в распределительной системе вычислительного кластера при горизонтальном и вертикальном масштабировании (рисунок 1.1).

Amdahl's Law

20 18 16 14 12 10 8 6 4 2 0

/ / Parallel portion

/ / / ......... 75%

/ / --95%

/ /

/ / —

—3 / Л x /

---

г fS

Number of processors

Рисунок 1.1 — Ускорение программы с помощью параллельных вычислений на

нескольких процессорах [14]

Согласно этому закону в определённый момент прирост производительности за счёт масштабирования теряет свой эффект. Установка дорогостоящего оборудования имеет крайне низкою отдачу, если программное обеспечение не способно к оптимальному распараллеливанию вычислительных задач. Данное утверждение подтверждено экспериментами, проведёнными на имеющемся вычислительном комплексе (Институт информационной безопасности и специального приборостроения) с CPU и GPU процессорами.

Для разработки архитектуры программной системы и проведения экспериментов вычислительного комплекса специальной обработки вычислительных задач использовался вычислительный кластер на базе CPU процессоров для вычислений, состоящий из восьми лезвий (серверов) со следующей конфигурацией каждого сервера:

- процессор Socket-2011 Intel Xeon E5-2690v2 3.0GHz;

- память DDR3 SERVER 16GB — 8 шт.;

- жёсткий диск HDD 2.5" SATA 2TB;

- Microsoft Windows 2012 Standard SvrStd 2012R2.

Вычислительная мощность измерялась с помощью разработанной нами специальной консольной утилиты, написанной на языке Java. В качестве единицы измерения была выбрана совокупность машинных операций, необходимая для одной бинарной операции с двойной точностью двух случайных чисел (рисунок 1.2).

ы Test Overload Theread = 10 - I п х I

Рисунок 1.2 — Измерение вычислительной мощности консольной утилитой

Измерение проводилось с распараллеливанием задачи на многопроцессорном вычислительном комплексе по параметрам, отображённым в таблице 1.1. Результаты испытания показаны на рисунке 1.3. На рисунке представлены измерения:

- KPD — количество выполненных вычислительных операций в секунду;

- xTh — количество потоков;

- SUM — общее количество выполненных вычислительных операций;

- MT — среднее время работы всех потоков;

- BT — лучшее время работы потока;

- FT — худшее время работы потока.

Таблица 1.1

Параметры испытаний вычислительного кластера

Количество потоков Количество операций для испытания № 1 Количество операций для испытания № 2

Похожие диссертационные работы по специальности «Вычислительные машины и системы», 05.13.15 шифр ВАК

Список литературы диссертационного исследования кандидат наук Сачков Валерий Евгеньевич, 2020 год

Список используемых источников

1. Lynch C. Big data: how do your data grow? // Nature, 2008. — Vol. 455, No. 7209. — P. 28-29. DOI: 10.1038/455028a

2. Laney D. 3D data management: controlling data volume, velocity, and variety // International Transaction of Electrical and Computer Engineers System, 2017.

— Vol. 4, No. 1. — P. 14-25. DOI: 10.12691/iteces-4-1-3

3. Wilkinson B. Allen M. Parallel Programming: Techniques and Applications Using Networked Workstations and Parallel Computers — 2nd edition. — New Jersey, Pearson, 2005. — P. 496.

4. Computer cluster [электронный ресурс] // URL: https://en.wikipedia.org/wiki/Computer_cluster (дата обращения: 23.02.2020).

5. Корячко, В. П. Методы и технологии автоматизации проектирования высокопроизводительных систем и компьютерных сетей / В. П. Корячко, С. В. Скворцов, А. П. Шибанов, Д. А. Перепелкин // Вестник рязанского государственного радиотехнического университета. — 2017. — № 60. — С. 94-104 // URL: https://elibrary.ru/item.asp?id=29369172; DOI: 10.21667/1995-4565-2017-60-2-94-104

6. Корячко, В. П. Математическая модель балансировки потоков данных в распределенных сетях центров обработки данных / В. П. Корячко, М. А. Иванчикова // Перспективные информационные технологии (ПИТ 2018): труды международной научно-технической конференции. — Самара, 2018. — С. 631-633 // URL: https://elibrary.ru/item.asp?id=36453913

7. Null L., Lobur J. The Essentials of Computer Organization and Architecture. — Jones & Bartlett Learning, 2006. — P. 766.

8. Хорошевский, В. Г. Архитектура вычислительных систем: Учеб. пособие.

— 2 изд., перераб. и доп. / В. Г. Хорошевский. — М.: Изд-во МГТУ им. Н. Э. Баумана, 2008. — 520 с.

9. Таненбаум, М. ван Стеен. Распределенные системы. Принципы и парадигмы / М. Ван Стеен Таненбаум; пер. с англ. В. Горбункова. — СПб.: Питер, 2003. — 877 с.

10.Neuman В. Scale in Distributed Systems / Casavant, T. and Singhal, M. (eds.). In: Readings in Distributed Computing Systems, 1994. — Los Alamitos, CA: IEEE Computer Society Press. — P. 463-489.

11.Таненбаум, М. ван Стеен. Распределенные системы. Принципы и парадигмы / М. Ван Стеен Таненбаум; пер. с англ. В. Горбункова. — СПб.: Питер, 2003. — 877 с. — С. 32.

12.Amdahl G. M. Validity of the single processor approach to achieving large scale computing capabilities. In: Proceedings of the April 18-20, 1967, spring joint computer conference (AFIPS '67 (Spring)), 1967. — NY: Association for Computing Machinery. — P. 483-485; DOI: https://doi.org/10.1145/1465482.1465560

13.Popov G., Mastorakis N., Mladenov V. Calculation of the acceleration of parallel programs as a function of the number of threads. In: ICC0MP'10: Proceedings of the 14th WSEAS international conference on Computers: part of the 14th WSEAS CSCC multiconference, 2010. — Vol. 2. — P. 411-414.

14.Закон Амдала [электронный ресурс] // URL:

https://ru.wikipedia.org/wiki/Закон_Амдала (дата обращения 20.02.2020).

15.Flynn M. J. Some computer organizations and their effectiveness // IEEE Transactions on Computers, 1972, 21 (9). — P. 948-960.

16.Таненбаум, Э. Архитектура компьютера. — 6-е изд. / Э. Таненбаум, Т. Остин — СПб.: Питер, 2020. — 816 с.

17.Symmetric multiprocessing [электронный ресурс] // URL: https://en.wikipedia.org/wiki/Symmetric_multiprocessing (дата обращения 20.02.2020).

18.Архитектуры и топологии многопроцессорных вычислительных систем / А. В. Богданов, В. В. Корхов, В. В. Мареев, Е. Н. Станкова. — М.: ИНТУИТ.РУ «Интернет-Университет Информационных Технологий», 2004. — 176 с.

19. Андреев, А. Обзор архитектуры многопроцессорных серверов HP 9000 V-

class [электронный ресурс] / А. Андреев // Лаборатория Параллельных

176

Информационных Технологий НИВЦ МГУ // URL: https://parallel.ru/computers/reviews/vclass_overview.html (дата обращения: 20.02.2020).

20. Процессоры Intel Xeon [электронный ресурс] // URL: https://www.intel.ru/content/www/ru/ru/products/processors/xeon.html (дата обращения 20.02.2020).

21. Opteron X and A-Series Processors [электронный ресурс] // URL: https://www.amd.com/ru/opteron (дата обращения: 20.02.2020).

22. Jeffers J., Reinders J. Intel Xeon Phi Coprocessor High Performance Programming. — Morgan Kaufmann Publishers, 2013. — P. 432; DOI: https://doi.org/10.1016/C2011 -0-06997-1

23.Byun C., Kepner J., Arcand W. et al. Optimizing Xeon Phi for Interactive Data Analysis [электронный ресурс] // URL: https://arxiv.org/abs/1907.03195 (дата обращения: 24.02.20 20). DOI: 10.1109/HPEC.2019.8916300

24. NVIDIA TESLA [электронный ресурс] Самые технически продвинутые в мире ускорители для дата-центров // URL: https://www.nvidia.com/ru-ru/data-center/tesla/ (дата обращения: 20.02.2020).

25.Скворцов, С.В. Ускорение процессов обработки данных большого объема средствами графических процессоров / С.В. Скворцов, Т.А. Фетисова, Т.С. Скворцова // Известия тульского государственного университета. Технические науки. — 2019. — № 2. — С. 312-319 // URL: https://elibrary.ru/item.asp?id=37140803&

26.Скворцов, С. В. Параллельные алгоритмы поиска данных и их реализация на платформе CUDA / С. В. Скворцов, Т. А. Фетисова, Д. В. Фетисов // Вестник рязанского государственного радиотехнического университета. — 2018. — № 65. — С. 55-62 // URL: https://elibrary. ru/item. asp?id=36815766

27.S. Skvortsov, T. Fetisova, D. Perepelkin and D. Fetisov, "Approach of Acceleration of Genetic Algorithm on CUDA platform," 2019 8th

Mediterranean Conference on Embedded Computing (MECO), Budva, Montenegro, 2019, pp. 1-5. DOI: 10.1109/МЕС0.2019.8760016

28.Zohouri H. R. High Performance Computing with FPGAs and OpenCL [электронный ресурс] PhD Thesis, 2018 // URL: https://arxiv.org/abs/1810.09773 (дата обращения: 24.02.2020).

29. Xilinx [электронный ресурс] // URL: https://www.xilinx.com (дата обращения: 20.02.2020).

30. Intel FPGAs and Programmable Devices [электронный ресурс] // https://www.intel.com/content/www/us/en/products/programmable.html (дата обращения: 20.02.2020).

31. Xilinx Alveo [электронный ресурс] // URL: https://www.xilinx.com/products/boards-and-kits/alveo.html (дата обращения: 20.02.2020).

32.Таненбаум, Э. Современные операционные системы. — 4-е изд. / Э. Таненбаум, Х. Бос. — СПб.: Питер, 2015. — 1120 с.

33. OpenMP [электронный ресурс] // URL: https://www.openmp.org (дата обращения: 20.02.2020).

34.Radenski A. Shared Memory, Message Passing, and Hybrid Merge Sorts for Standalone and Clustered SMPs. In: Proc PDPTA'11, the 2011 International Conference on Parallel and Distributed Processing Techniques and Applications (H. Arabnia, Ed.), CSREA Press, 2011. — P. 367-373.

35.Антонов, А. С. Технологии параллельного программирования MPI и OpenMP: Учеб. пособие / А. С. Антонов, предисл.: В. А. Садовничий. — М.: Издательство Московского университета, 2012. — 344 с.

36. Mohsan Tanveer, M. Aqeel Iqbal, Farooque Azam Using Symmetric Multiprocessor Architectures for High Performance Computing Environments // International Journal of Computer Applications, 2011. — Vol. 27. — No. 9. — Pp. 1-6. DOI: 10.5120/3332-4582

37. Open-MPI [электронный ресурс] Open Source High Performance

Computing // URL: https://www.open-mpi.org (дата обращения: 20.02.2020).

178

38. Антонов, А. С. Параллельное программирование с использованием технологии MPI: Учебное пособие / А. С. Антонов. — М.: Изд-во МГУ, 2004. — 71 с.

39.Zambre R., Chandramowlishwaran A., Balaji P. Scalable Communication Endpoints for MPI+Threads Applications. In: IEEE 24th International Conference on Parallel and Distributed Systems (ICPADS), 2018. — P. 803812. DOI: 10.1109/PADSW.2018.8645059

40.White T. Hadoop: The Definitive Guide, Fourth Edition. — Sebastopol: O'Reilly Media, 2015. — P. 756.

41.Lammel R. Google's Map Reduce Programming Model // Science of Computer Programming, 2008. — Vol. 70. — P. 1-30. DOI: https://doi.org/10.1016/j.scico.2007.07.001

42.Apache Hadoop [электронный ресурс] // URL: http://hadoop.apache.org (дата обращения: 20.02.2020).

43. Apache Flink — Stateful Computations over Data Streams [электронный ресурс] // URL: https://flink.apache.org (дата обращения: 20.02.2020).

44. Apache Spark — Lightning-fast unified analytics engine [электронный ресурс] // URL: https://spark.apache.org (дата обращения: 20.02.2020).

45.Apache Mesos [электронный ресурс] // URL: http://mesos.apache.org/ (дата обращения: 20.02.2020).

46.Saha P., Beltre A., Govindaraju M. Exploring the Fairness and Resource Distribution in an Apache Mesos Environment. In: 2018 IEEE 11th International Conference on Cloud Computing (CLOUD), San Francisco, 2018. — Pp. 434-441. DOI: 10.1109/CLOUD.2018.00061

47.Puppet [электронный ресурс] // URL: https://puppet.com (дата обращения: 23.02.2020).

48.Chef [электронный ресурс] // URL: https://www.chef.io (дата обращения: 23.02.2020).

49.Saltstack [электронный ресурс] // URL: https://www.saltstack.com (дата обращения: 23.02.2020).

50.Thain D., Tannenbaum T., Livny M. Distributed Computing in Practice: The Condor Experience // Concurrency and Computation: Practice and Experience

— Vol. 17. — No. 2-4. — Pp. 323-356, 2005. DOI: https://doi.org/10.1002/cpe.938

51.Аветисян, А. И. Системы управления кластерами / А. И. Аветисян, Д. А. Грушин, А. Г. Рыжов // Труды Института системного программирования РАН. — 2002. — Т. 3. — C. 39-62.

52.SERVICE-ORIENTED ARCHITECTURE ONTOLOGY, VERSION 2.0 [электронный ресурс] // URL:

https://publications.opengroup.org/standards/soa/c144 (дата обращения: 23.02.2020).

53.Stallings W. Operating Systems: Internals and Design Principles, 7th Edition.

— N.J.: Prentice Hall, 2012. — P. 723.

54.Bensalem S., Fernandez J., Havelund K., Mounier L. Confirmation of deadlock potentials detected by runtime analysis. In: Proceedings of the 4th Workshop on Parallel and Distributed Systems: Testing, Analysis, and Debugging, held in conjunction with the ACM SIGSOFT International Symposium on Software Testing and Analysis (ISSTA 2006), Portland, 2006. DOI: 10.1145/1147403.1147412

55.Gorla D. Synchrony vs Asynchrony in Communication Primitives // Electronic Notes in Theoretical Computer Science, 2007. — Vol. 175. — I. 3. — P. 87108. DOI: https://doi.org/10.1016/j.entcs.2006.10.054

56.Hewitt C., Bishop P., Steiger R. A universal modular ACTOR formalism for artificial intelligence. In: Proc. International Joint Conference on Artificial Intelligence, 1973. — Pp. 235-245.

57.Agha G. ACTORS: A Model of Concurrent Computation in Distributed Systems. — MIT Press, Cambridge, Mass., 1986. — P. 190.

58.Agha G., Thati P., Ziaei R. Actors: a model for reasoning about open distributed systems // Formal methods for distributed processing: a survey of

object-oriented approaches, 2001. — USA: Cambridge University Press — P. 155-176.

59.Juma I. The actor model in python with gevent [электронный ресурс] // URL: https://medium.com/@ianjuma/the-actor-model-in-python-with-gevent-b8375d0986fa (дата обращения: 23.02.2020).

60.Hewitt C. Viewing control structures as patterns of passing messages // Artificial Intelligence, 1977. — Vol. 8. — I. 3. — P. 323-364. DOI: https://doi.org/10.1016/0004-3702(77)90033-9

61.Вахалия, Ю. Нити и легковесные процессы / Ю. Вахалия; пер. с англ. Е. Васильев, Л. Серебрякова. — СПб.: Питер, 2003. — 844 с.

62.Гилл А. Введение в теорию конечных автоматов / под ред. П.П. Пархоменко. — М.: Наука, 1966. — 272 с.

63.Хопкрофт Д., Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений. 2-е изд. — М.: Издательский дом «Вильямс», 2008. 528 с.

64.Сачков, В. Е. Использование асинхронных акторов в вычислительных комплексах для специальных задач / В. Е. Сачков // Cloud of science. — 2020. — Т. 7. — № 3. — С. 644-655 // URL: https://elibrary.ru/item.asp?id=43023408

65.Андрианова, Е. Г. Повышение производительности обработки специальных задач с использованием модели асинхронных акторов / Е. Г. Андрианова, В. Е. Сачков, Д. О. Жуков // Высокопроизводительные вычислительные системы и технологии. — 2020. — Т. 4. — № 1. — С. 24 -31.

66.Ungerer T., Robic B., Silc J. A survey of processors with explicit multithreading // ACM Comput. Surv., 2003. — Vol. 35. — No. 1. — P. 2963. DOI: https://doi.org/10.1145/641865.641867

67.Liu D., Deters R. The Reverse C10K Problem for Server-Side Mashups. In: Service-Oriented Computing — ICSOC 2008 Workshops. ICSOC 2008, Berlin,

Heidelberg, 2008. — Vol. 5472. — Pp. 166-177. DOI: https://doi.org/10.1007/978-3-642-01247-1_16

68.Эрик Фримен, Элизабет Фримен. Паттерны проектирования = Head First Design Patterns / Э. Фримен, Э. Фримен. — СПб.: Питер, 2011. — 656 с.

69.Эшби, У. Р. Введение в кибернетику. (An Introduction to Cybernetics, 1956) / У. Р. Эшби; пер. с англ. Д. Г. Лахути, ред. В. А. Успенского. — Москва: Издательство иностранной литературы, 1959. — 432 с.

70.Richards M. Software Architecture Patterns. — Sebastopol: O'Reilly Media, 2015. — P. 55.

71.Шалев-Шварц, Ш. Идеи машинного обучения: от теории к алгоритмам / Ш. Шалев-Шварц, Ш. Бен-Давид; пер. с англ. А. А. Слинкина. — М.: ДМК Пресс, 2019. — 436 с.

72.Таненбаум, Э. Компьютерные сети. — 5-е изд. / Э. Таненбаум, Д. Уэзеролл. — СПб.: Питер, 2020. — 960 с.

73.Baker M. Cluster Computing White Paper [электронный ресурс] // URL: https://arxiv.org/abs/cs/0004014 (дата обращения: 23.02.2020).

74.Message Queue [электронный ресурс] // URL: https://en.wikipedia.org/wiki/Message_queue (дата обращения: 23.02.2020).

75.O'Hara J. Toward a Commodity Enterprise Middleware // Acmqueue, 2007. — Vol. 5. — No. 4. — P. 48-55. DOI: https://doi.org/10.1145/1255421.1255424.

76.Advanced Message Queuing Protocol [электронный ресурс] // URL: http://www.amqp.org (дата обращения: 23.02.2020).

77.Hohpe G., Woolf B. Enterprise Integration Patterns: Designing, Building, and Deploying Messaging Solutions. — Pearson Education, 2012. — P. 106. ISBN 9780133065107.

78.Дэвид А. Шаппелл ESB — Сервисная шина предприятия / Д. Шаппелл; пер. с англ. под ред. В. М. Беленковича. — Санкт-Петербург: БХВ-Петербург, 2008. — 345 с.

79.Сачков, В. Е. Обработка и компьютерный анализ текста на естественных

языках / В. Е. Сачков, Е. Ф. Гильмутдинова, Е. Д. Матяш, Д. А. Акимов //

182

Современная наука: актуальные проблемы теории и практики, серия Естественные и технические науки. — 2016. — № 12. — С. 57-64 // URL: https://eHbrary.ru/item.asp?id=27686798

80.Карнаков, В. В. Обработка текста на естественных языках с использованием компьютерного анализа / В. В. Карнаков, Д. А. Акимов, В. Е. Сачков, Е. Ф. Гильмутдинова // в кн.: Информационные технологии и математическое моделирование систем 2016: труды международной научно-технической конференции. — Одинцово, 2016. — С. 125-130 // URL : https://elibrary.ru/item. asp?id=27354782

81.Акимов, Д. А. Обработка и компьютерный анализ информации об опубликованных уязвимостях нулевого дня на естественных языках / Д. А. Акимов, В. Е. Сачков, А. С. Алёшкин, В. И. Уманский // Проблемы информационной безопасности. Компьютерные системы. — 2017. — № 2. — C. 9-15 // URL: https://elibrary.ru/item.asp?id=29426687

82.Гришин, А. А. Психолингвистический анализ социальных сетей / А. А. Гришин, В. Е. Сачков // Вестник МГТУ МИРЭА. — 2015. — Т. 1. -№ 4 (9). — С. 198-205 // URL: https://elibrary.ru/item.asp?id=25286474

83.D. A. Akimov, V. E, Sachkov, E. O. Guryanova and I. K. Shevtsov Automatic Extraction of Scientific Information from Open Access Publications, Journal of Advanced Research in Dynamical and Control Systems, Vol. 12, I. 03, P. 383391. DOI: 10.5373/JARDCS/V12SP3/20201273

84.Прикладная и компьютерная лингвистика / под ред. И. С. Николаева, О. В. Митриениной, Т. М. Ландо. — М.: ЛЕНАНД, 2016. — 320 с.

85.Грант С. Ингеролл, Томас С. Мортон, Эндрю Л. Фэррис. Обработка неструктурированных текстов. Поиск, организация и манипулирование / Грант С. Ингеролл, Томас С. Мортон, Эндрю Л. Фэррис; пер. с англ. А. А. Сликин. — М.: ДМК Пресс, 2015. — 414 с.

86.Сачков, В. Е. Применение ассоциаций в семантическом поле текста на

естественном языке / В. Е. Сачков; под общ. ред. Е. С. Чернова //

Фундаментальные и прикладные исследования: гипотезы, проблемы и

183

результаты: материалы 4-й межд. науч.-практ. конф. — Новосибирск, 2018. — С. 293-297 // URL: https://elibrary.ru/item.asp?id=32843066

87.Сачков, В. Е. Использование ассоциативного векторного пространства в семантическом поиске / В. Е. Сачков // Современная наука: актуальные проблемы теории и практики, серия «Естественные и технические науки».

— 2018. — № 5. — С. 132-135 // URL: https://elibrary.ru/item.asp?id=35417224

88.Сачков, В. Е. Применение ассоциативных векторных пространств для создания интерактивно диалоговых систем / В .Е. Сачков // Актуальные вопросы науки: материалы 38-й межд. науч.-практ. конф. — Москва, 2018.

— С. 258-263 // URL: https://elibrary.ru/item.asp?id=35233014

89.Сачков, В. Е. Анализ задачи определения тематики текста в семантических вычислительных комплексах / В. Е. Сачков // EurasiaScience: материалы 15-й межд. науч.-практ. конф. — Москва, 2018.

— С. 140-141 // URL: https://elibrary.ru/item.asp?id=35320428

90.Rennie J. D. M., Shih L., Teevan J., Karger D. R. Tackling the Poor Assumptions of Naive Bayes Text Classifiers. In: Proceedings of the Twentieth International Conference (ICML 2003), Washington, 2003. — P. 616-623.

91.Boese S., Reiners T., Wood L. C. Semantic Document Networks to Support Concept Retrieval // Encyclopedia of Business Analytics and Optimization, 2014. — P 2135-2146. DOI: 10.4018/978-1-4666-5202-6.ch192

92.Сачков, В. Е. Вычислительный комплекс специальной семантической обработки текста на естественном языке / В. Е. Сачков // Промышленные АСУ и контроллеры. — 2018. — № 8. — С. 54-59 // URL: https://elibrary.ru/item.asp?id=35490904

93.Маккинли, У. Python и анализ данных / У. Маккинли; пер. с англ. А. А. Слинкин. — М.: ДМК Пресс, 2015. — 482 с.

94.Nahum D., Ayanoglu E., Aytas Y. Mastering RabbitMQ. — Birmingham: Packt Publishing, 2015. — P. 286.

95.RabbitMQ [электронный ресурс] // URL: https://www.rabbitmq.com/ (дата обращения: 23.02.2020).

96.Aio-pika [электронный ресурс] // URL: https://aio-pika.readthedocs.io (дата обращения: 23.02.2020).

97.Jupyter [электронный ресурс] // URL: http://jupyter.org (дата обращения: 23.02.2020).

98.Idris I. NumPy: Beginner's Guide — Third Edition. — Birmingham: Packt Publishing, 2013. — P. 310.

99.Varoquaux G., Gouillart E, Vahtras O, Haenel V, Rougier N. P., et al. Scipy Lecture Notes: One document to learn numerics, science, and data with Python [электронный ресурс] // URL: https://scipy-lectures.org/_downloads/ScipyLectures-simple.pdf (дата обращения: 23.02.2020).

100. Heydt M. Learning pandas — Python Data Discovery and Analysis Made Easy. — Birmingham: Packt Publishing, 2015. — P. 506.

101. Deep learning with word2vec and gensim [электронный ресурс] // URL: https://rare-technologies.com/deep-learning-with-word2vec-and-gensim/ (дата обращения: 23.02.2020).

102. Bird S., Klein E., Loper E. Natural Language Processing with Python. — Sebastopol: O'Reilly Media, 2009. — P. 504.

103. V. E. Sachkov, D. A. Akimov, S. A. Pavelyev The Use of Psycholinguistic Patterns in Interactive Systems of Active Information Retrieval, International Journal of Engineering & Technology, 2018. — Vol. 7. — No. 4.38. — P. 422425; ISSN 2227-524X. DOI: 10.14419/ijet.v7i4.38.24595

104. Сачков, В. Е. Применение ассоциативно-семантического препроцессора в интерактивных диалоговых системах на естественном языке / В. Е. Сачков // Труды Института системного программирования РАН, 2018. — Т. 30. — Вып. 4. — С. 195-208. DOI: 10.15514/ISPRAS-2018-30(4)-13

105. Акимов, Д. А. Организация целенаправленного активного поиска на основе оценки синтагматических и парадигматических ассоциаций текстовых сообщений /Д. А. Акимов, А. Ю. Дятченкова, В. Е. Сачков // Современная наука: актуальные проблемы теории и практики, серия «Естественные и технические науки». — 2018. — № 5. — С. 69-75 // URL: https://eHbrary.ru/item.asp?id=35417213

106. V. E. Sachkov, D. O. Zhukov, Y. P. Korablin, V. K.Raev, D. A. Akimov Organization of Information System for Semantic Search Based on Associative Vector Space. In: Sukhomlin V., Zubareva E. (eds) Convergent Cognitive Information Technologies. Convergent 2018. Communications in Computer and Information Science. — Vol. 1140. — P. 78-70. — Springer, Cham. DOI: https://doi.org/10.1007/978-3-030-37436-5_6

107. Сачков, В. Е. Анализ проблемы частотного перекрытия слов при определении тематики текста в семантических вычислительных комплексах / В. Е. Сачков // Вестник современных исследований: материалы межд. науч.-практ. конф. — Омск, 2018. — С. 486-488 // URL: https://elibrary.ru/item.asp?id=35339603

108. Rubner Y., Tomasi C., Guibas L. J. A metric for distributions with applications to image databases // IEEE International Conference on Computer Vision, 1998. — P. 59-66. DOI: 10.1109/ICCV.1998.710701

109. Kusner M., Sun Y., Kolkin N., Weinberger K. From word embeddings to document distances // Proceedings of the 32nd International Conference on Machine Learning, 2015. — Vol. 37. — P. 957-966.

ПРИЛОЖЕНИЕ А Свидетельство о государственной регистрации программы для ЭВМ «Распределённая вычислительная система асинхронных

акторов (РВСАА)»

ПРИЛОЖЕНИЕ Б Свидетельство о государственной регистрации программы для ЭВМ «Ассоциативно-семантический текстовый препроцессор

(АСТП-2017)»

ПРИЛОЖЕНИЕ В Акты внедрения

ЖЛ-

чйпйг1

МИНОБРНАУКИ РОСТ И И

Федеральное государственное бюджетное образовательное учреждение

высшего образования «МИР )Л — Российский 1С\но.к>1 нческии универентт» РТУ МНРЭА

«УТВГ,Р*АдйО»

д~ < >* - »^/л'Д

{амеспиедь директора ннстигу га комплексной исюпасцости и

еншналынйо приборостроения

~ НнкоЯоо В.Ц.

Су' Жг.

V

Акт внедрении в учебный процесс материалов диссертационной работы «Ра >рабо| к а чего юн м а.и при I мои повышении нрон шодше.и.носш мно1 «процессорных вычисли кмьных комплексов нри решении специальных та.тач» Сачкова Ва.1срни К.ш еньевнча

Настоящим актом подтверждается, что основные положения и результаты лиссертационного исследования внедрены в учебный процесс кафедры К'Ь-4 «Интеллектуальные системы информационной безопасности».

Результаты исследовании, полу ченных Сачковым В. К. используются на практических и лабораторных занятиях по дисциплинам: «Технологии высокопроизводительных вычислений». «Методы параллельного программирования».

Заведующий кафедрой К1>-4 «Интеллектуальные системы информационной безопасности» Института комплексной безопасности и специального приборостроения

Магомедов 111.1"

©

МОСКОВСКИЕ

ЭНЕРГЕТИЧЕСКИЕ

СИСТЕМЫ

«УТВЕРЖДАЮ»

Генеральный директор ООО ГК «МОСКОВСКИЕ ЭНЕРГЕТИЧЕСКИЕ СИГТРММ»

'у\Трифонов E.H.

v

л *ж

ъщ

I«d 2« марта 2020 г.

АКТ

о внедрении результатов диссертационной работы

Комиссия в составе:

Председатель-. Трифонов E.H.- генеральный директор ООО ГК «МЭС» Члены комиссии: Шахмаев В.Р. - технический директор

ознакомились с результатами диссертационной работы Сачкова Валерия Евгеньевича «Разработка методов и алгоритмов повышения производительности многопроцессорных вычислительных комплексов при решении специальных задач». По итогам рассмотрения результатов работы, комиссией принято решение внедрить модель асинхронных акторов, разработанную в рамках данного диссертационного исследования, в процесс распределённой обработки данных на вычислительных кластерах, которая позволит ускорить задачи: анализа телеметрии датчиков на энергоустановках среднего и высокого напряжения; расчета распределения нагрузки в электрических сетях; расчета параметров при проектировании энергоустановок и систем электрообогрева трубопроводов; анализа данных собранных при авариях на энергоустановках; путем подключения через адаптеры асинхронных акторов специальных приложений выполняющих расчеты. Модель асинхронных акторов позволяет, для подключенных приложений организовать оркестровку распределения заданий между вычислительными узлами для разных типов специальных задач, повысить производительность вычислений приложений за счет запуска в одном

Трофимов Д.А.- главный инженер

из режимов параллелизма наиболее оптимально подходящий под тип системы н задачи.

! 1астоя|цнй акт не я&1яется основанием для взаимных финансовых расчетов.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.