Разработка и исследование аналитического метода оценки вычислительной способности компьютеров тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат наук Ракитский, Антон Андреевич
- Специальность ВАК РФ05.13.17
- Количество страниц 132
Оглавление диссертации кандидат наук Ракитский, Антон Андреевич
ОГЛАВЛЕНИЕ
Введение
ГЛАВА 1. ВЫЧИСЛИТЕЛЬНАЯ СПОСОБНОСТЬ
1.1 Вводная часть
1.2. Краткий обзор современных тенденций в области оценки производительности
1.3. Основные идеи и определения
1.4. Пример расчета вычислительной способности абстрактного компьютера
1.5. Программный комплекс для оценки вычислительной способности
процессоров и вычислительных систем
Выводы
ГЛАВА 2. ОЦЕНКА ВЫЧИСЛИТЕЛЬНОЙ СПОСОБНОСТИ ПРОЦЕССОРОВ INTEL И AMD
2.1. Оценка производительности ранних моделей процессоров Intel
2.1.1. Оценка производительности компьютера на базе процессора Intel 80286
2.1.2. Оценка производительности компьютера на базе процессора Intel 80486
2.1.3 Оценка производительности компьютера на базе процессора Intel Pentium(P5)
2.1.4 Оценка производительности компьютера на базе процессора Intel
Pentium ММХ
2.1.5. Анализ результатов для ранних моделей процессоров Intel
2.2. Оценка производительности современных моделей процессоров Intel и AMD
2.2.1. Особенности определения вычислительной способности процессоров семейства Intel Р6
2.2.2. Оценка вычислительной способности процессоров микроархитектуры NetBurst (Pentium 4, Pentium D)
2.2.3. Оценка вычислительной способности для процессоров с микроархитектурой РМ (Pentium М, Intel Core Solo)
2.2.4. Оценка вычислительной способности для процессоров Core
(Merom)
2.2.5. Оценка вычислительной способности процессоров AMD К10
Выводы
ГЛАВА 3. ВЫЧИСЛИТЕЛЬНАЯ СПОСОБНОСТЬ СУПЕРКОМПЬЮТЕРОВ
3.1. Основные определения и понятия
3.2. Обзор существующих методик оценки производительности суперкомпьютеров
3.3. Вычислительная способность суперкомпьютеров
3.3.1. Вычислительная способность сетевого процессора
3.3.2. Пример определения вычислительной способности сетевого процессора
3.4. Определение вычислительной способности суперкомпьютера на примере ASCI Red
3.5. Анализ полученных результатов
3.6. Применение метода в сфере облачных вычислений
Выводы
ОСНОВНЫЕ ЗАКЛЮЧЕНИЯ И ВЫВОДЫ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ
А. Программный комплекс для автоматизации оценки вычислительной
способности компьютеров и вычислительных систем
А.1. Программа нахождения вычислительной способности по
характеристическому уравнению
А.2. Программа для преобразования списка инструкций компьютера в
характеристическое уравнение (фрагмент)
А.З Программа для построения списка инструкций компьютера в
требуемом формате представления (фрагмент)
Б. Список инструкций некоторых процессоров в заданном формате
Б.1. Список инструкций для процессоров Intel Р5
Б.2. Список инструкций для процессоров AMD К10
Б.З. Список инструкций для процессоров Intel Core 2
Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК
Встречная оптимизация класса задач трёхмерного моделирования для архитектур многоядерных процессоров2018 год, кандидат наук Сударева Ольга Юрьевна
Построение и оптимизация распределенных виртуальных вычислительных систем2020 год, кандидат наук Пья Сон Ко Ко
Исследование и разработка методов эффективной реализации графовых алгоритмов для современных векторных архитектур2020 год, кандидат наук Афанасьев Илья Викторович
Математическое и программное обеспечение распределения данных в проблемно-ориентированных параллельных программах2014 год, кандидат наук Палагин, Владимир Владимирович
Разработка и исследование методов достижения высокой степени масштабируемости суперкомпьютерных приложений2013 год, кандидат физико-математических наук Корж, Антон Александрович
Введение диссертации (часть автореферата) на тему «Разработка и исследование аналитического метода оценки вычислительной способности компьютеров»
ВВЕДЕНИЕ
Актуальность исследования В последние десятилетия компьютерная техника проникла практически во все сферы деятельности человека, вычислительные модули устанавливаются в обычные бытовые устройства вроде чайника или стиральной машины. И с каждым годом требования к производительности компьютеров и устройств с вычислительными модулями только увеличиваются. Например, современные мобильные телефоны уже имеют более высокую производительность, чем была у самых мощных настольных компьютеров десять лет назад. Основными частями компьютера, определяющими его производительность, являются процессор и память различных типов. Количество владельцев компьютеров ежегодно растёт, и производители компьютеров под давлением высокого спроса постоянно наращивают объемы выпуска вычислительных модулей для электронных устройств, разрабатывают новые модели процессоров. И перед компаниями, занимающимися производством вычислительных модулей и перед рядовыми пользователями остро стоит вопрос объективной оценки и сравнения производительности различных компьютеров. Для пользователей важной задачей является сравнение компьютеров, и выбор наиболее экономичного варианта, который при этом способен решать стоящие перед пользователем задачи. Производителям же требуется сравнивать производительность новых разрабатываемых компьютеров с уже существующими моделями, в том числе с моделями конкурентов. С похожей задачей сталкиваются и клиенты на облачных сервисах, на которых арендуют вычислительные мощности. Они сами определяют архитектуру и устройство облачной вычислительной системы: количество вычислительных узлов, их состав, объёмы памяти различных видов. Клиенты облачных сервисов рассматривают различные конфигурации системы и определяют, какая из них будет более подходящей, для чего необходимо оценивать и сравнивать их производительность.
Оценка производительности компьютеров в настоящее время производится при помощи так называемых бенчмарков. Бенчмарк - это
4
набор контрольных задач, который запускается и выполняется на компьютере для определения его сравнительных характеристик. Бенчмарки имеют ряд существенных недостатков, позволяющих говорить как об их необъективности, так и о больших неудобствах в их применении. Во-первых, бенчмарк - это ограниченный набор задач, а, следовательно, он позволяет оценить производительность компьютера именно для решения этих задач, что говорит о неполноте оценки. Во-вторых, для применения бенчмарка требуется наличие рабочей модели компьютера, а это, в свою очередь, требует существенных затрат. Более эффективным может быть метод, позволяющий оценить производительность аналитически, имея в наличии лишь описание основных характеристик архитектуры компьютера.
По темам, связанным с исследованием методов оценки производительности компьютеров, проводятся многочисленные международные конференции, а также существует ряд международных научных журналов, занимающихся этим вопросом. В этой области работает ряд научных центров, принадлежащих производителям компьютеров, кроме того, создано множество независимых некоммерческих организаций. Самой крупной и известной из таких организаций является SPEC (Standart Performance Evaluation Corporation), членами которой являются многие разработчики и производители электронных устройств, например, ACER, AMD, Apple, Dell, Fujitsu, Hitachi, HP, IBM, Intel, Samsung. Эта организация существует с 1988 года и основной своей целью ставит разработку стандартизированного, максимально объективного бенчмарка. Несмотря на большое количество исследователей производительности компьютеров, аналитических методов оценки их производительности до недавнего времени не было.
Впервые метод теоретической оценки производительности компьютеров на основе определения их вычислительной способности был
опубликован Б .Я. Рябко в 2012 году1. Данный метод базируется на идеях теории информации и для его применения требуется только информация об архитектуре исследуемого компьютера (список инструкций процессора, время их выполнения, объемы всех видов памяти). Автором диссертации было проведено исследование предложенного метода на предмет применимости к современным компьютерам, которые имеют более сложную структуру, чем описанные в работе Рябко Б.Я., в современных компьютерах могут использоваться одновременно несколько конвейеров, кэш-память нескольких уровней и многие другие механизмы. На основе исследования был предложен метод для оценки вычислительной способности современных компьютеров. Были исследованы основные процессоры Intel и AMD, определена их вычислительная способность при помощи предложенного метода, а также проведено исследование и сравнение производительности суперкомпьютеров, построенных на основе этих процессоров. Кроме того, из полученных результатов видно, что аналогичный подход может быть применён для оценки и сравнения мобильных телефонов и многих других телекоммуникационных устройств. Полученные в ходе работы результаты сравниваются с результатами общепризнанных бенчмарков, исходя из чего, делаются выводы о высокой точности и применимости метода.
Цель работы - разработка и экспериментальное исследование аналитического метода оценки вычислительной способности современных компьютеров, применение этого метода для оценки вычислительной способности реальных компьютеров на базе процессоров Intel и AMD и анализ полученных результатов. Кроме того, целью работы является разработка метода оценки суперкомпьютеров на базе метода, предложенного Рябко Б.Я., и его экспериментальное применение для оценки вычислительной способности существующих суперкомпьютеров, а так же анализ полученных результатов.
1 Ryabko В. An information-theoretic approach to estimate the capacity of processing units. Performance Evaluation. 2012. V. 69, P. 267-273.
Объектом исследований в данной работе является
производительность компьютеров и других вычислительных систем, в том числе и суперкомпьютеров, методы её оценки, а так же архитектура и устройство реальных компьютеров на базе процессоров Intel и AMD.
Состояние проблемы Компании, занимающиеся разработкой и производством процессоров, при проектировании новых процессоров сталкиваются с множеством проблем. Одна из проблем заключается в том, что на этапе разработки требуется рассматривать множество вариантов конфигураций процессора и выбирать из них оптимальный. Варьироваться может размер кэш-памяти, количество уровней памяти, состав списка инструкций и т.д. Чтобы выбрать оптимальную конфигурацию, необходимо оценить производительность всех вариантов. В настоящее время для оценки производительности используются бенчмарки, но их применение требует построения рабочей модели процессора или написания его эмулятора, что является дорогостоящим и трудоёмким процессом.
Не менее важной проблемой является оценка производительности кластеров и суперкомпьютеров. В настоящее время существуют несколько центров, ведущих рейтинг самых производительных суперкомпьютеров, но общепринятая формула теоретической оценки производительности суперкомпьютеров является сильно приближённой и часто не соответствует действительности. Эта формула опирается на необъективные данные, предоставляемые разработчиками процессоров. В качестве характеристики, предоставляемой производителем, используется среднее количество инструкций, выполняемое процессором за один такт. Этот показатель не может объективно характеризовать производительность процессора, что видно при сравнении теоретической оценки производительности суперкомпьютеров с результатами бенчмарков.
о
Задачи исследования Для достижения указанных целей с учетом изложенного состояния проблемы в рамках диссертационной работы решаются следующие задачи:
1. Разработка и исследование метода аналитической оценки производительности компьютеров и вычислительных систем.
2. Применение метода для определения вычислительной способности реально существующих компьютеров на базе процессоров Intel и AMD, кластеров и суперкомпьютеров из списков ТОР500 и НРСС.
3. Оценка точности метода путём сравнения полученных результатов с результатами общепризнанных бенчмарков.
Методы исследования В процессе проведения исследований были использованы основные положения и методы теории информации, вычислительные методы.
Результаты, выносимые на защиту
1. Метод теоретической оценки вычислительной способности для современных компьютеров, включающих в себя многоконвейерные процессоры и различные типы кэш-памяти.
2. Вычислительная способность реально существующих компьютеров, кластеров и суперкомпьютеров, определённая при помощи предложенного метода.
3. Высокая точность предлагаемого метода, показанная путём сравнения с общепризнанными бенчмарками.
Научная новизна результатов работы
1. Метод определения вычислительной способности современных компьютеров, предложенный в диссертации, не имеет аналогов и позволяет находить достаточно объективную оценку
производительности современных компьютеров и других вычислительных систем.
2. При помощи предложенного метода впервые была теоретически оценена вычислительная способность современных компьютеров на базе процессоров Intel и AMD, а полученные результаты сравнены с результатами бенчмарков. При этом сравнение показало, что метод может применяться наравне с бенчмарками, однако имеет гораздо меньшую трудоёмкость.
3. Метод теоретической оценки вычислительной способности суперкомпьютеров, предложенный в диссертации, был применён для оценки и сравнения производительности современных реально существующих суперкомпьютеров. Результаты применения метода показали, что он может выступать в качестве альтернативы или дополнения для оценки теоретического максимума производительности, используемой в настоящее время.
Практическая ценность полученных результатов
1. Разработана система для быстрого и удобного определения вычислительной способности компьютеров и им подобных устройств.
2. Для современных процессоров Intel и AMD с помощью разработанного метода была произведена теоретическая оценка их производительности.
3. Для ряда суперкомпьютеров из списков ТОР-500 и НРСС была произведена теоретическая оценка их производительности.
Реализация и внедрение результатов работы Основные результаты использованы при выполнении следующих проектов и государственных программ:
• Проект Федеральной целевой программы «Разработка теоретико-информационных методов оценки и повышения производительности компьютерных систем и сетей передачи данных» гос. контракта № 8229 от 6 августа 2012 года.
• Проект Федеральной целевой программы «Эффективные методы построения защищенных высокоскоростных каналов передачи цифровых данных для предоставления доступа к широкополосным мультимедийным услугам» гос. контракта № 8329 от 17 августа 2012 года.
• Гранты для выполнения научных исследований аспирантами, магистрантами и молодыми преподавателями ФГОБУ ВПО «СибГУТИ», 2013 г.
Результаты работы внедрены:
• В учебный процесс на кафедре ПМиК в программу курса «Криптографические методы защиты информации» (специалист) по направлению 10.05.02 «Информационная безопасность телекоммуникационных систем»;
• Технология оценки вычислительной способности была внедрена в научно-образовательный центр по разработке и внедрению информационных технологий СибГУТИ для наукоемких и промышленных предприятий города Новосибирска, созданный в соответствии с соглашением о предоставлении в 2013 году субсидии из областного бюджета Новосибирской области. Технология используется в центре для разработки практических методов оценки производительности реальных процессоров.
• Методы оценивания вычислительной способности, предложенные в диссертационной работе, использованы при построении вычислительного комплекса и системы обработки данных ИВТ СО РАН с целью оптимизации его структуры
Апробация работы
Основные результаты данной работы докладывались и обсуждались на следующих российских и международных конференциях и семинарах:
• 2012 XIII International Symposium on Problems of Redundancy (St.-Petersburg, 5-10 Sept., 2012).
• XIV Российская конференция с участием иностранных ученых «Распределительные информационные и вычислительные ресурсы» (DICR'2012). (Россия, Новосибирск, 26-30 ноября 2012 г.).
• Всероссийская конференция Индустриальные информационные системы - 2013 (Россия, Новосибирск, 24-28 сентября 2013 г).
• Научный семинар СибГУТИ (Россия, Новосибирск, 17 сентября 2013 г).
• Научный семинар ИМ СО РАН «Теория кодирования» (Россия, Новосибирск, 9 декабря 2014 г).
Публикации По теме диссертации опубликовано 11 работ, в числе которых 8 статей в журналах и сборниках, из которых 4 входят в список ВАК.
Личный вклад В работах, выполненных в соавторстве, вклад автора состоит в построении и реализации предлагаемых схем и алгоритмов, а также в проведении необходимых экспериментальных исследований и анализе полученных результатов.
Структура и объем работы Диссертация содержит 132 страницы текста и состоит из введения, трёх глав, заключения, списка литературы и приложений. Работа содержит 17 таблиц и 18 рисунков. Список литературы включает в себя 50 источников.
и
ГЛАВА 1. ВЫЧИСЛИТЕЛЬНАЯ СПОСОБНОСТЬ
1.1 Вводная часть
Одной из важнейших задач в сфере информационных технологий является сравнение компьютеров и вычислительных систем. Компьютеры сравниваются по техническим характеристикам, по дизайну, по удобству работы, но основным и самым важным показателем является производительность.
Производительностью компьютера будем называть количественную характеристику скорости выполнения операций на нём. Довольно часто производительность измеряют в так называемых флопсах (FLOPS - floating point operations per second), это количество операций с плавающей точкой в секунду, которое может выполнить компьютер. В настоящее время по этой характеристике дифференцируют суперкомпьютеры от обычных вычислительных систем. К суперкомпьютерам в последние годы принято относить вычислительные системы с производительностью свыше 10 Терафлопс (среднестатистический современный настольный компьютер имеет производительность 0.1 Терафлопс). Естественно эти критерии непостоянны и увеличиваются с общим ростом производительности систем.
При оценке производительности процессоров и суперкомпьютеров возникает множество проблем. Первая заключается в том, что производительность системы может сильно зависеть от выполняемой задачи. Например, некоторые процессоры больше приспособлены для работы с матрицами и векторами чем другие, и при выполнении задач, связанных с подобными операциями, у них будет неоспоримое преимущество. В настоящее время производительность компьютеров и суперкомпьютеров оценивается с помощью так называемых бенчмарков, специальных наборов задач, которым обязательно требуется наличие рабочей модели компьютера и время для подготовки и проведения оценки.
Бенчмарк - это набор контрольных задач, необходимых для определения сравнительных характеристик производительности вычислительной системы. Бенчмарками также называют программы, с помощью которых тестируют время автономной работы ноутбуков, карманных компьютеров и смартфонов, радиус действия беспроводной сети и т.д., однако в данной работе под бенчмарками подразумеваются наборы задач именно для оценки производительности, поэтому в дальнейшем данный термин будет применяться именно в этом смысле.
1.2. Краткий обзор современных тенденций в области оценки производительности
Бенчмарки используются для сравнения производительности компьютеров и в настоящее время являются важным критерием при выборе тех или иных компонентов компьютера для большинства потребителей. В первую очередь бенчмарки используются при выборе процессора, т.к. он является «сердцем» системы и, по сути, определяет её общую производительность. Количество бенчмарков с каждым днём растёт, постоянно разрабатываются новые бенчмарки, оценивающие способность вычислительных систем решать задачи определённых типов. Тем не менее, самые распространённые бенчмарки, признанные мировой общественностью, стремятся к универсальности и объективности. Новые версии бенчмарков дорабатываются для оценки производительности компьютера для большинства распространённых задач.
Список наиболее часто используемых и распространённых бенчмарков:
• LavaLys Everest — комплекс программ для тестирования подсистем ALU и FPU процессора, кэш-памяти, пропускной способности памяти, скорости работы жёсткого диска;
3DMark — тест, используемый для определения производительности компьютера в игровой трёхмерной графике (это довольно универсальный тест, т.к. при работе с 3D графикой решаются самые разные задачи); PCMark — тест всех подсистем компьютера;
Java Micro Benchmark — тест на Java, используемый для определения производительности компьютера; Unigine Heaven 2 — тест, используемый для определения производительности компьютера в игровой 3D графике в режимах DirectX 9, 10, 10.1, 11 и OpenGL;
3D Ore FPS — программный комплекс, используемый для определения производительности компьютера в игровой 3D графике (ХР, Windows 7, Windows 8);
Aquamark — тест, используемый для определения производительности компьютера в игровой трёхмерной графике; ВАРСО— тесты производительности компьютера при работе с офисными приложениями (SysMark), при создании сетевого контента (WebMark) и тест времени автономной работы портативных ПК (MobileMark);
Right Mark Memory Analyzer— тест подсистем кэш-памяти и оперативной памяти;
Right Mark Audio Analyzer — программы для тестирования качества аналоговых и цифровых трактов аудио-аппаратуры; CineBench — тестирование производительности компьютера при создании трёхмерной графики;
ScienceMark— тест подсистем ALU и FPU процессора, кэшпамяти и пропускной способности оперативной памяти; SiSoft Sandra— комплекс программ, который содержит модули тестирования большинства подсистем компьютера;
• SuperPI — тест, вычисляющий число Пи с определённым количеством знаков после запятой;
• Business Winstone —тест производительности компьютера при работе с офисными приложениями.
Многие компьютерные игры, благодаря их требовательности к аппаратному обеспечению и зависимости скорости работы игры от производительности компьютеров, также успешно используются в качестве бенчмарков. Обычно тестирование производительности компьютера в игре выглядит следующим образом: игра запускается в заранее записанном тестовом режиме, и измеряется количество кадров в секунду (FPS), которое способна вывести тестируемая система. Результаты тестирования при различных разрешениях и с различными настройками качества графики заносятся в итоговую таблицу.
Для оценки производительности компьютеров также могут использоваться и различные повседневные задачи, выполняемые большинством пользователей, например:
• применение фильтров в графических редакторах;
• сжатие и распаковка файлов с использованием архиваторов;
• конвертирование аудио и видео;
• визуализация сцен в ЗБ-редакторах;
• воспроизведение медиафайлов выского качества (фильмы BLU-RAY, аудиофайлы в формате LOSSLESS).
Измеряя время выполнения одной и той же операции при одинаковых исходных данных, но на разных компьютерах, можно получить сравнительную характеристику производительности.
Кроме того, существуют крупные сообщества производителей различных компонент компьютеров, которые объединяются и занимаются разработкой относительно объективных наборов тестовых задач. Самый яркий пример - SPEC (Standard Performance Evaluation Corporation). SPEC -
это Американская некоммерческая организация, ставящая основной целью «разработать, произвести, поддерживать и утвердить стандартизированный набор» бенчмарков для оценки производительности компьютеров. SPEC был основан в 1988 году. Бенчмарки SPEC широко используются для оценки производительности вычислительных систем, а результаты тестов публикуются на официальном вебсайте компании. Компания состоит из нескольких подразделений: Graphics and Workstation Performance Group (GWPG), the High Performance Group (HPG), the Open Systems Group (OSG) и the Research Group (RG). Наиболее интересен состав членов этой организации, в который входят практически все разработчики вычислительных модулей, периферийных устройств, компонент компьютеров, смартфонов и высокопроизводительных вычислительных систем. Например, членами организации являются такие компании как ACER, AMD, Apple, Dell, Fujitsu, Hitachi, HP, IBM, Intel, Samsung и многие другие.
Отдельно следует рассмотреть бенчмарки, которые используются для оценки и сравнения производительности в данной работе. Первый бенчмарк, который был использован - это ICOMP. ICOMP (Intel Comparative Microprocessor Performance) - индекс, который был разработан компанией Intel для оценки и относительного сравнения своих микропроцессоров. В первой части работы мы рассматриваем одни из первых процессоров Intel, поэтому результаты применения характеристики вычислительная способность сравнивались именно с этим индексом. Индекс применялся для сравнения процессоров, начиная с Intel386 до Intel Pentium III. Существует три версии этого индекса, которые выпускались по мере выхода новых процессоров. Так как процессоры, оцениваемые этим индексом, сильно пересекаются друг с другом, то можно легко с их помощью сравнивать любые процессоры из представленного выше диапазона. Как показано дальше, предложенная в диссертации характеристика показала схожие с бенчмарком результаты.
В качестве второго бенчмарка был использован уже описанный выше SPECint и SPECfp. Первый бенчмарк оценивает процессоры по качеству решения задач, основанных на задачах с целыми типами данных, второй - по решению задач с плавающей точкой. Такое разделение является обоснованным, так как у абсолютного большинства процессоров для решения этих задач применяются различные блоки выполнения инструкций. Кроме того, большинство задач чаще всего сводится к работе с целочисленными типами данных, и оценка SPECint таким образом является достаточно объективной и показательной. Оценка при помощи бенчмарка SPECfp также необходима, т.к. блок для работы с плавающей точкой является неотъемлемой частью процессора. Конечно, оценка с помощью только этих бенчмарков не будет в должной степени объективной, поэтому сравним результаты применения предложенной характеристики не только с ними, но и с другими бенчмарками. Кроме того, эти бенчмарки постоянно дорабатываются и выпускаются новые версии, которые становятся все более и более объективными за счет включения в себя все большего количества разноплановых задач. Чтобы не нарушать объективность оценки мы рассматривали в течении сравнения результаты только одной версии. В случае ранних процессоров это была версия SPEC95, для следующей группы процессоров мы использовали SPEC2000 и т.д.
Третьим основным бенчмарком, с помощью которого мы оцениваем и сравниваем процессоры, является PassMark. PassMark - это один из крупнейших на данный момент проектов, который позволяет оценивать и сравнивать процессоры, разработанные в течение большого интервала времени. Этот бенчмарк является одним из самых популярных среди обычных пользователей и позволяет оценивать процессоры начиная с Pentium III вплоть до самых современных процессоров, выпущенных в последние годы. База результатов применения этого бенчмарка огромна и включает в себя практически все массово выпускаемые современные
процессоры. Тестирование производится на ряде базовых задач, в которые входят:
• Математические целочисленные операции (это базовые операции, которые используются во всех программах). В данном тесте операции сложения, вычитания, умножения и деления применяются к большому набору случайных 32 и 64 разрядных чисел.
• Сжатие данных без потерь (используется метод адаптивного кодирования, который был описан в работе «Arithmetic Coding for Data Compression» под авторством Ian H. Witten, Radfort M. Neal, John G. Cleary).
• Задача нахождения простых чисел. Этот тест основан на алгоритме нахождения всех простых чисел вплоть до некоторого заданного «схема Эйткена».
• Шифрование данных (используется несколько базовых, наиболее часто используемых шифров). В этом тесте применяются криптографические методы TwoFish, AES, Salsa20 и SHA256.
• Математические операции с плавающей точкой. Этот тест очень похож на описанный в первом пункте с одним важным отличием, что все операции применяются к типам данных с плавающей точкой.
• Мультимедийный тест (тест для оценки качества работы блока SSE). SSE - это набор инструкций, который позволяет обрабатывать большие блоки данных на большой скорости. Частью этого теста, например, является задача умножения матрицы размером 4x4 на вектор из 4 элементов. Вектор представлен в виде 128-разрядного числа с плавающей точкой (4 32-разрядных дробных числа), а матрица представлена в виде 4 аналогичных 128-разрядных чисел (4x4x32).
• Стандартная сортировка строк (используется алгоритм яЗоЛ). Это одна из самых распространённых задач в многочисленных приложениях.
• Физические задачи (оценивается, насколько быстро процессор может решать задачи физического взаимодействия нескольких сотен различных объектов).
• Линейные задачи с использованием только одного ядра (многие программы до сих пор не адаптированы для использования нескольких ядер и поэтому такой тест является достаточно актуальным).
Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК
Высокопроизводительные сопроцессоры для параллельной обработки данных в формате с плавающей точкой в системах цифровой обработки сигналов2013 год, кандидат технических наук Пантелеев, Алексей Юрьевич
Методы и средства создания параллельно-конвейерных программ для решения графовых NP-полных задач на реконфигурируемых вычислительных системах2021 год, кандидат наук Касаркин Алексей Викторович
Параллельные алгоритмы матричного умножения и матричной экспоненты, основанные на асинхронных обменах данными между несколькими графическими ускорителями, и их применение для решения нестационарного уравнения Шредингера2024 год, кандидат наук Чой Е Рем
Исследование и оптимизация современных систем моделирования, применяемых для разработки программного обеспечения вычислительных машин2019 год, кандидат наук Юлюгин Евгений Андреевич
Параллельные технологии математического моделирования турбулентных течений на современных суперкомпьютерах2015 год, доктор наук Горобец Андрей Владимирович
Список литературы диссертационного исследования кандидат наук Ракитский, Антон Андреевич, 2014 год
СПИСОК ЛИТЕРАТУРЫ
1. Altix ICE 8200 [Электронный ресурс]. URL: http://icl.cs.utk.edu/hpcc/hpcc_record.cgi7idK257 (дата обращения: 10.06.2013)
2. ASCI Red [Электронный ресурс]. URL: http://www.top500.org/system/168753 (дата обращения: 10.06.2013)
3. Christon М., Crawford D., Hertel E., Peery J., Robinson A. ASCI Red -Experiences and Lessons Learned with a Massively Parallel TeraFLOP Supercomputer // Proceedings of the Supercomputer, 1997.
4. Cover T.M., Thomas J. A. Elements of Information Theory. Wiley, 2006.
5. Cray Inc. ХТЗ [Электронный ресурс]. URL: http://icl.cs.utk.edu/hpcc/hpcc_record.cgi?id=135 (дата обращения: 10.06.2013)
6. Dell PE850 [Электронный ресурс]. URL: http://icl.cs.utk.edu/hpcc/hpcc_record. cgi?id=146 (дата обращения: 10.06.2013)
7. Endeavor Intel Cluster, Xeon 3GHz [Электронный ресурс]. URL: http://top500.org/system/175068 (дата обращения: 10.06.2013)
8. Endeavor Intel Cluster, Xeon E54xx 2.8 GHz [Электронный ресурс]. URL: http://top500.org/system/175633 (дата обращения: 10.06.2013)
9. Fionov A., Polyakov Yu., and Ryabko В., "Application of computer capacity to evalution of Intel x86 processors," 2nd International Congress on Computer Applications and Computational Science, November 15-17, 2011, Bali, Indonesia, (Springer, Advances in Intelligent and Soft Computing, Vol. 145, 2012, pp. 99-104).
10. Firefly - PowerEdge SC1435 Dual core Opteron [Электронный ресурс]. URL: http://top500.org/system/175188 (дата обращения: 10.06.2013)
11. Fog A. Lists of instruction latencies, throughputs and microoperation
breakdowns for Intel, AMD and VIA CPUs. Copenhagen University College of Engineering. 2012. URL: http://www.agner.org/optimize/ (Дата обращения: 04.12.2012).
12. Fog A. The microarchitecture of Intel, AMD and VIA CPUs An optimization guide for assembly programmers and compiler makers. Copenhagen University College of Engineering. 2012-02-29. URL: http://www.agner.org/optimize/ (Дата обращения: 04.12.2012).
13. Hamacher V.C., Vranesic Z.G., Zaky S.G. Computer Organization. McGraw-Hill, 2002.
14. Intel 64 and IA-32 Architectures Software Developers Manual Volume 1: Basic Architecture. Intel Corp. URL:
http://www.intel.ru/content/www/ru/ru/architecture-and-technology/64-ia-32-architectures-sofitware-developer-vol-1 -manual.html (Дата обращения: 04.12.2012).
15. Intel 64 and IA-32 Architectures Software Developers Manual Volume 2. Intel Corp. URL: http://www.intel.ru/content/www/us/en/architecture-and-technology/64-ia-32-architectures-software-developer-vol-2a-2b-instruction-set-a-z-manual.html
(Дата обращения: 15.03.2012).
16. Intel Discovery Cluster [Электронный ресурс]. URL: http://icl.cs.utk.edu/hpcc/hpcc_record.cgi?id=238 (дата обращения: 10.06.2013)
17. Intel Endeavor Cluster [Электронный ресурс]. URL: http://icl.cs.utk.edu/hpcc/hpcc_record.cgi?id=245 (дата обращения: 10.06.2013)
18. Intel x86 Quick Reference Instruction Manual -8086/80186/80286/80386/80486. URL: http://www.intel-assembler.it/portale/5/x86-instruction-reference-manual/x86-instruction-reference-manual .asp
(Дата обращения: 04.12.2012).
19. Knuth D.E.. The Art of Computer Programming, Volume 1, Fascicle 1, MMIX: A RISC Computer for the New Millennium, 2005.
20. Kozyrakis C.E., Patterson D.A., A new direction for computer architecture research. Computer, V.31, n.ll, pp.24-32, 1998.
21. Krichevsky R., Universal Compression and Retrival. Kluver Academic Publishers, 1993.
22. Marr D. Т., Binns F., Hill D. L., Hinton G., Koufaty D. A., Miller J. A. and Upton M. Hyper-threading technology architecture and microarchitecture // Intel Technology Journal. 2001. V. 06, Issue 01.
23. Netfinity Cluster [Электронный ресурс]. URL: http://www.top500.org/system/167471 (дата обращения: 10.06.2013)
24. NOW Cluster, Intel Xeon 53xx [Электронный ресурс]. URL: http://top500.Org/svstem/l 75588
(дата обращения: 10.06.2013)
25. Patterson D. A., Hennessy J.L.. Computer Organization and Design: The Hardware / Software Interface. Morgan Kauffman, 2004.
26. Patterson D.A., Hennessy J.L. Computer Architecture: A Quantitative Approach. Morgan Kaufmann Publishers, 2008.
27. Petitet A., Whaley R. C., Dongarra J., Cleary A. HPL - A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers [Электронный ресурс]. URL: http://www.netlib.org/benchmark/hpl/index.html
(дата обращения: 10.06.2013).
28. Ryabko В. An information-theoretic approach to estimate the capacity of processing units // Performance Evaluation. 2012. V. 69, P. 267-273.
29. Ryabko В., "Applications of Information Theory to analysis of efficiency and capacity of computers and similar devices," Proc. IEEE Region 8 SIBRCON-2010, Irkutsk Listvyanka, Russia, July 11-15, 2010, pp.11-14
30. Ryabko В., "Using Information Theory to study efficiency and capacity of computers and similar devices," Information, No. 1, 2010, pp. 3—12.
31. Sequin C.H. and Patterson D.A. Design and implementation of RISC I. University of California, Berkeley, 1982.
32. Shannon С. E. A mathematical theory of communication // Bell Sys. Tech. J. 1948. V. 27, P. 379-423, P. 623-656.
33. SKIF Ural T16 Cluster [Электронный ресурс]. URL: http://t0p5QQ.0rg/svstem/l 75584
(дата обращения: 10.06.2013)
34. Stallings W. Computer Organization and Architecture: Designing for Performance. Prentice-Hall, 2009.
35. Tanenbaum A.S. Structured computer organization. Prentice Hall PTR, 2001. 514 p.
36. The Linpack Benchmark [Электронный ресурс]. URL: http://www.top500.org/project/linpack/
(дата обращения: 10.06.2013).
37. Н.Бахвалов, Н.Жидков, Г.Кобельков. Численные методы. //Москва, БИОНОМ. Лаборатория знаний, 2003.
38. Т.Корман, ЧЛейзерсон, Р.Ривест. Алгоритмы: Построение и анализ. / Пер. с англ. под ред. А. Шеня. - М.:МЦНМО: БИНОМ. Лаборатория знаний, 2004.
39. Ракитский А.А. Программа для определения вычислительной способности и уравнения всех исследованных на данный момент процессоров [Электронный ресурс]. URL:
https.7/drive.google.com/folderview?id=0B023P6Ajk7nJckhpRmdGSlVtZlk (дата обращения: 10.09.2014)
Работы автора, в которых изложены основные результаты диссертации
Статьи и доклады на конференциях
40. Ракитский A.A. Практическое применение методов теоретической оценки вычислительной способности для процессоров Intel серии Р5 // Вестник «СибГУТИ». 2012. №4, с. 50-61.
41. Ракитский A.A. Теоретическая оценка вычислительной способности процессоров Intel // Вестник СибГУТИ. 2013.3 с. 29-45.
42. Ракитский A.A. Использование вычислительной способности как характеристики для оценки и сравнения суперкомпьютеров // Вестник СибГУТИ. 2013.4 с. 67-84.
43. Ракитский A.A., Рябко Б.Я., Фионов А.Н. Аналитический метод сравнения и оценки производительности компьютеров и вычислительных систем // Вычислительные технологии, 2014, Том 19, № 4, с. 84-98.
44. Rakitskiy A., Ryabko В., Fionov A. Evaluation of computer capacity for P5 intel processors // Problems of Redundancy in Information and Control Systems (RED), 2012 XIII International Symposium. St. Petersburg, 5-10 Sept. 2012. P. 70-73.
45. Ракитский A.A., Рябко Б.Я., Фионов А.Н. Определение вычислительной способности процессоров Intel семейств Р5 и Р6 и сравнение с данными бенчмарков // XIV Российская конференция с участием иностранных ученых «Распределительные информационные и вычислительные ресурсы» (DICR'2012). Россия, Новосибирск, 26-30 ноября 2012 г.
46. Ракитский A.A., Рябко Б.Я., Фионов А.Н. Программный комплекс для теоретической оценки и анализа производительности
вычислительных систем // Индустриальные информационные системы 2013. Россия, Новосибирск, 24-28 сентября 2013 г.
47. Ракитский A.A., Рябко Б.Я. Практическое применение теоретико-информационного подхода к оценке производительности компьютеров и вычислительных систем // XV Российская конференция с участием иностранных ученых «Распределительные информационно-вычислительные ресурсы» (DICR'2014). Россия, Новосибирск, 2-5 декабря 2014г.
48. Ракитский A.A., Рябко Б.Я., Фионов А.Н. Программа нахождения вычислительной способности по характеристическому уравнению. № гос. регистрации 2013619017.
49. Ракитский A.A. Программа для преобразования списка инструкций компьютера в характеристическое уравнение. № гос. регистрации 2013619015.
50. Ракитский A.A. Программа для построения списка инструкций компьютера в требуемом формате представления. № гос. регистрации 2013619014.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.