Исследование и разработка методов повышения производительности интегральных схем реконфигурируемых вычислительных систем тема диссертации и автореферата по ВАК РФ 05.27.01, кандидат технических наук Артамонов, Дмитрий Сергеевич
- Специальность ВАК РФ05.27.01
- Количество страниц 211
Оглавление диссертации кандидат технических наук Артамонов, Дмитрий Сергеевич
Определения, обозначения и сокращения.
Введение.
Глава 1. Анализ принципов построения ИС РВС и выявление причин, ограничивающих их производительность.
1.1 Проблемы многоядерных процессоров.
1.2 Реконфигурируемые вычислительные системы.
1.3 Сравнение архитектур БРвА (ПЛИС) и ИС РВС.
1.4 Обзор существующих архитектур ИС РВС.
1.5 О перспективах развития однородных вычислительных сред.
1.6 Анализ факторов, ограничивающих производительность ИС РВС.
1.6.1 Архитектура процессорного элемента и его функциональность.
1.6.2 Оптимизация затрат аппаратных ресурсов матрицы вычислительной системы.
1.6.3 Топология межпроцессорных связей и коммутационная логика.
1.6.4 Организация процесса загрузки конфигурационных данных в ПЭ ИС РВС.
1.7 Выводы.
Глава 2. Методика анализа ИС РВС. Решение проблемы ограниченного функционального спектра ПЭ ИС РВС.
2.1 Программное средство, обеспечивающее анализ моделей ИС РВС.
2.2 Функциональная модель ИС РВС.
2.2.1 Основные элементы для создания высокоуровневой модели ИС РВС.
2.2.2 Создание модели ПЭ.
2.2.3 Создание схемы-шаблона.
2.2.4 Разработка схемы-макроса.
2.3 Методика комплексного анализа ИС РВС.
2.4 Разработка структурной схемы ПЭ ИС РВС.
2.4.1 Требования к ПЭ ИС РВС.
2.4.2 Выбор модели аппаратной реализации операционного блока ПЭ ИС РВС
2.4.3. Разработка структурной схемы многофункционального мультипликативного устройства.
2.4.4 Структурная схема ПЭ.
2.5 Выводы.
Глава 3. Метод обеспечения аппаратной поддержки альтернативных вычислений наИС РВС.
3.1 Проблема низкой эффективности использования аппаратных ресурсов ИС РВС в случае реализации на них вычислительных структур с ветвлением.
3.2 Схемотехническая реализация альтернативных вычислений на ПЭ ИС РВС.
3.3 Сравнение производительности базовой и модифицированной ИС РВС.
3.4 Выводы.
Глава 4. Решение проблемы простоя системы, связанного с транзитом данных через неактивные ПЭ ИС РВС. Оптимизированная топология межпроцессорных связей
ИС РВС.:.
4.1 Исследование зависимости времени простоя ИС РВС от количества активных задач и типа их размещения.
4.2 Выбор оптимального типа топологии системы межсоединений ПЭ ИС РВС.
4.2.1 Основные характеристики топологии системы связей ПЭ ИС РВС.
4.2.2 Модель, используемая для оценки характеристик топологии сети межсоединений ИС РВС.
4.2.3 Методика выбора оптимальной топологии накристальной системы межпроцессорных связей ИС РВС.
4.2.4 Сравнения характеристик различных вариантов топологий системы межсоединений ПЭ ИС РВС.
4.2.5 Оптимизация топологии сети межпроцессорных соединений ИС РВС на уровне регулярных связей в рамках статической конфигурации.
4.2.5 Оптимизация топологии сети межпроцессорных соединений ИС РВС на уровне нерегулярных глобальных коммутационных ресурсов.
4.3 Выводы.168,
Глава 5. Метод обеспечения динамической частичной реконфигурируемости аппаратуры ИС РВС.
5.1 Конфигурация процессорного элемента.
5.2 Статический режим загрузки конфигурационных настроек в аппаратуру ИС РВС.
5.3 Динамическая частичная реконфигурируемость аппаратуры ИС РВС.
5.4 Обеспечение динамической коммутации схем-макросов прикладных задач
5.5 Выводы.
Глава 6. Апробация результатов исследований в составе прототипа ИС РВС, реализованного в ПЛИС Xilinx.
6.1 Архитектура прототипа ИС РВС.
6.1.1 Режимы работы прототипа ИС РВС.
6.1.2 Реализация прототипа ИС РВС.
6.2 Плата прототипа ИС РВС.
6.3 Архитектура экспериментального стенда.
6.4 Комплексная программно-аппаратная верификация ИС РВС.
6.5 Оценка характеристик ИС РВС.
6.6 Выводы.
Рекомендованный список диссертаций по специальности «Твердотельная электроника, радиоэлектронные компоненты, микро- и нано- электроника на квантовых эффектах», 05.27.01 шифр ВАК
Исследование и разработка методов увеличения производительности интегральных схем многоядерных микропроцессоров на основе повышения эффективности коммутационной логики2009 год, кандидат технических наук Путря, Федор Михайлович
Средства и методы повышения производительности и снижения энергопотребления систем на кристалле, реализуемых на базе программируемых логических интегральных схем2009 год, кандидат технических наук Шалтырев, Владимир Алексеевич
Методы и средства автоматизированного сопряжения функциональных узлов и блоков в приложениях для реконфигурируемых вычислителей2010 год, кандидат технических наук Раскладкин, Максим Константинович
Методы и средства программирования софт-архитектур для реконфигурируемых вычислительных систем2012 год, кандидат технических наук Коваленко, Василий Борисович
Синтезатор структурных параллельных прикладных программ для многокристальных реконфигурируемых вычислителей2011 год, кандидат технических наук Гуленок, Андрей Александрович
Введение диссертации (часть автореферата) на тему «Исследование и разработка методов повышения производительности интегральных схем реконфигурируемых вычислительных систем»
Актуальность. Развитие технологий создания микроэлектронных продуктов с одной стороны, и развитие электроники и вычислительной техники - с другой, предопределили появление технологий создания сложных устройств типа «система-на-кристалле» (СнК), объединяющих в одном микрочипе различные функциональные устройства - микропроцессор, специализированные 1Р-блоки, аналоговые и радиочастотные модули, модули памяти, периферийные устройства и т.д. Развитие технологий производства интегральных схем, степень интеграции которых может достигать сотен миллионов вентилей на кристалле, а минимальные топологические размеры - 45-32 нм, потенциально обеспечивает возможность создания СнК новых поколений, обладающих значительно лучшими технико-эксплуатационными характеристиками.
Использование в ядре СнК реконфигурируемых вычислительных систем (РВС),,т.е. систем, аппаратура которых может реконфигурироваться, менять свои функции, в зависимости от решаемых вычислительной системой5 задач' позволяет эффективно адаптировать архитектуру под структуру решаемой, задачи и тем самым обеспечить максимальный уровень производительности СнК. Архитектура, интегральных схем (ИС) РВС в общем случае представляет собой однородный массив вычислительных ячеек структуры^- процессорных элементов (ПЭ), каждый из которых может выполнять как минимум одну специфическую функцию из определенного набора возможных функций, в зависимости от конфигурации, в которой он находится. При этом ПЭ массива могут находиться в различных конфигурациях, конфигурации можно изменять в процессе эксплуатации реализованного микрочипа такого массива, обеспечивая тем самым реализацию различных функций и вычислительных алгоритмов.
Такая архитектура в силу своей внутренней регулярности очень технологична и при логическом, и при физическом проектировании, и существующие системы САПР могут эффективно использоваться для проектирования таких устройств. Более того, такая* архитектура может и эффективно использовать современные технологии, поскольку производительность ИС такой архитектуры, в силу ее естественного параллелизма, может увеличиваться практически, пропорционально с ростом числа ПЭ в одном кристалле.
Благодаря своим уникальным свойствам, это направление выходит в настоящее время на передний план развития мировой электроники. Этот процесс обусловлен двумя основными причинами - насыщением вычислительных возможностей, заложенных в традиционной модели компьютерных вычислений, и постоянно развивающимся уровнем технологии- полупроводникового производства,- открывающим новые, глобальные перспективы для реализации сложных электронных систем на одном кристалле.
Однако существуют факторы, сдерживающие развитие этого перспективного направления. Основными среди них являются отсутствие многообразия эффективных и прошедших практическую апробацию • интегральных схем, вычислительных архитектур указанного класса, отсутствие автоматизированных средств' проектирования- системного уровня и систем программирования реконфигурируемых архитектур.
Существующие интегральные схемы (ИС) РВС на фоне- гибкости и технологичности архитектуры не обеспечивают требуемых- уровней-производительности. Наличие данной; проблемы является следствием недостаточного количества проведенных исследований в области оптимизации ИС РВС. В свою* очередь, недостаточное количество- проведенных исследований в области построения эффективных ИС РВС определяется низкой эффективностью широко применяемой методики анализа- интегральных схем на основе моделирования предварительно разрабатываемого- ЮХ-описания, что является трудоемким и долговременным процессом.
Таким образом, актуальной является задача выявления причин, ограничивающих вычислительные мощности ИС РВС, разработки- эффективной комплексной, методики анализа ИС РВС и проведения исследований и разработки методов повышения производительности ИС РВС с использованием разработанной методики:
Цель работы
Цель работы заключается в разработке и схемотехнической реализации методов увеличения производительности ИС РВС.
Для достижения цели работы было необходимо решить следующие задачи:
• Провести анализ факторов, ограничивающих вычислительную мощность ИС РВС и исследование существующих подходов и решений в области повышения производительности ИС вычислительных систем данного класса.
• Разработать модель ИС РВС и комплексную методику анализа на системном, функциональном и схемотехническом уровнях.
• Определить и сформулировать требований к процессорному элементу (ПЭ) ИС РВС, выполнение которых обеспечит наилучший показатель производительности ИС вычислительных систем данного класса.
• Оптимизировать операционные блоки ПЭ в соответствии с разработанными требованиями и разработать структурную схему ПЭ на основе данных блоков.
• Разработать и реализовать метод схемотехнической оптимизации вычислений на ИС РВС, основанный на введении поддержки альтернативных вычислений в ПЭ ИС РВС.
• Исследовать зависимость времени простоя ИС РВС от количества активных задач и алгоритма их размещения на аппаратуре ИС РВС для различных типов топологии межпроцессорных связей и разработать аппаратные средства обмена данными между процессорными элементами ИС РВС, обеспечивающие снижение времени простоя ИС РВС, связанного с транзитом данных через ПЭ.
• Разработать эффективные средства обеспечения динамической частичной реконфигурируемости ИС РВС.
• Разработать прототип ИС РВС на основе предлагаемых методов повышения производительности и провести экспериментальную апробация результатов исследований.
Научная новизна работы
1. Установлены основные причины, ограничивающие производительность ИС РВС: ограниченная функциональность процессорных элементов (ПЭ), не позволяющая покрыть широкий спектр типовых алгоритмов высокопараллельной потоковой обработки данных, низкая эффективность использования аппаратных ресурсов ИС РВС в случае реализации на ней вычислительных алгоритмов с ветвлениями, простой ИС РВС, обусловленный транзитом данных через неактивные ПЭ к активному ПЭ, длительное время переконфигурирования ИС РВС, невозможность динамической реконфигурации части матрицы процессорных элементов ИС РВС, совмещенной с вычислениями.
2. Предложена методика комплексной оценки эффективности схемотехнической реализации функциональных элементов ИС РВС, основанная на сравнительном анализе показателя удельной производительности (производительности на единицу площади) ИС РВС, построенных на базе данных элементов.
3. Проведен анализ зависимости эффективности ИС РВС от параметрических характеристик ПЭ, определены и сформулированы требования к ПЭ ИС РВС, выполнение которых обеспечивает максимальную производительность ИС РВС относительно обработки заданного диапазона прикладных задач потоковой обработки данных.
4. Выявлены механизмы влияния типов функциональных операторов и вычислительных структур прикладных задач, выполняемых на ПЭ на производительность ИС РВС, и предложен способ ее повышения, основанный на обеспечении аппаратной поддержки альтернативных вычислений в процессорном элементе системы.
5. Предложен способ обеспечения динамической коммутации ПЭ ИС РВС на уровне глобального коммутационного ресурса, основанный на интеграции в коммутационную систему глобальных вертикальных и горизонтальных шин и системы реконфигурируемых повторителей, и обоснование возможности его практической реализации.
Практическая значимость работы
1. Разработанный комплекс схемотехнических решений, позволяющих увеличить производительность ИС РВС, применен в системе на кристалле «РРХ4096», разработанной в ООО ИДМ, что в совокупности обеспечило увеличение производительности реконфигурируемого ядра, входящего в состав СнК «РРХ4096», более чем в 4 раза для прикладных задач цифровой обработки сигналов.
2. Разработанная библиотека конфигурационных настроек ПЭ ИС РВС для наборов прикладных задач, обеспечивающая повторное использование программно-аппаратных блоков интеллектуальной собственности, внедрена в ООО ИДМ, что позволило оптимизировать, используемую на предприятии методологию совместного проектирования и верифицирования СБИС класса "система-на-кристалле" на базе реконфигурируемых вычислительных систем и программных средств-для реализации прикладных алгоритмов на основе данных систем.
3. Разработанная методика- комплексной оценки эффективности функциональных блоков ИС РВС использована при разработке и модернизации лекционных курсов и лабораторных практикумов, входящих в учебные планы ФЭКТ МИЭТ.
На защиту выносятся положения'
1. Структурно-функциональная модель >ИС РВС, обеспечивающая возможность комплексного анализа ИС РВС, и, построенная на базе данной модели, методика оценки эффективности функциональных элементов ИС РВС.
2'. Структурная' схема ПЭ с расширенным функциональным спектром, обеспечивающая одновременную обработку как простых арифметических и логических, так и комплексных мультипликативных функциональных операторов.
3. Схемотехническая4 реализация альтернативных вычислений на ПЭ ИС РВС, представляющая обеспечение возможности условного выбора того или иного функционального оператора на ПЭ ИС РВС, и определяющая повышение её удельной производительности.
4. Оптимизированная топология межсоединений ПЭ ИС РВС, основанная на интеграции в двумерную решетку взаимосвязанных иерархических двумерных тор-соединений, обеспечивающих гибкость коммутационной системы на уровне регулярных ближних взаимосвязей ПЭ, а также глобальных горизонтальных и вертикальных шин, обеспечивающих эффективность обмена данными между ПЭ на глобальном уровне, и определяющая снижение времени простоя, обусловленного транзитом данных в активные ПЭ ИС РВС.
5. Принцип организации процесса загрузки конфигурационных данных, основанный на обеспечении индивидуального доступа к конфигурационному регистру ПЭ ИС РВС в режиме вычислений, обеспечивающий динамическую частичную реконфигурируемость ИС РВС.
Личный вклад. Все основные научные результаты, приведенные в диссертации и сформулированные в положениях, выносимых на защиту, получены соискателем лично.
Апробация работы. Основные результаты работы были представлены на следующих научно-технических конференциях:
Всероссийский молодежный научно-инновационный конкурс-конференция «Электроника - 2006», МГИЭТ 2006; Всероссийский молодежный научно-инновационный конкурс-конференция «Электроника - 2007», МГИЭТ 2007; 52-ая научная конференция «Современные проблемы фундаментальных и прикладных наук» МФТИ 2009; Всероссийская молодежная выставка-конкурс прикладных исследований, изобретений и инноваций, Саратов 2009; Всероссийская межвузовская научно-техническая конференция «Микроэлектроника и Информатика 2009», МГИЭТ 2009; Всероссийская межвузовская научно-техническая конференция «Микроэлектроника и
Информатика 2010», МГИЭТ 2010; Международная научно-техническая конференция с элементами научной школы для молодежи «Проектирование систем на кристалле: тенденции развития и проблемы», МГИЭТ 2010.
Публикации. По теме диссертационной работы опубликовано 10 научных работ, в том числе 3 статьи опубликованы в журналах, входящих в перечень ВАК, 7 тезисов докладов, 1 научно-технический отчет по НИР, 1 научно-технический отчет по НИОКР.
Структура и объем работы. Диссертационная работа состоит из введения, 6 глав, заключения и списка литературы из 88 наименований. Общий объём диссертации составляет 207 страниц, в том числе 7 таблиц и 76 рисунков.
Похожие диссертационные работы по специальности «Твердотельная электроника, радиоэлектронные компоненты, микро- и нано- электроника на квантовых эффектах», 05.27.01 шифр ВАК
Методы и программно-аппаратные средства параллельных структурно-процедурных вычислений2004 год, доктор технических наук Левин, Илья Израилевич
Проектирование структуры межсоединений программируемых логических интегральных схем2012 год, кандидат технических наук Быстрицкий, Алексей Викторович
Автономные системы управления на базе динамически реконфигурируемых процессоров для промышленных роботов2013 год, кандидат технических наук Павельев, Сергей Александрович
Метод, алгоритмы и аппаратные средства планирования топологии программируемых логических интегральных схем2012 год, кандидат технических наук Минайлов, Виктор Викторович
Проектирование высокоинтегрированных программируемых логических интегральных схем по субмикронным проектным нормам2010 год, кандидат технических наук Цыбин, Сергей Александрович
Заключение диссертации по теме «Твердотельная электроника, радиоэлектронные компоненты, микро- и нано- электроника на квантовых эффектах», Артамонов, Дмитрий Сергеевич
6.6 Выводы
• Разработана архитектура ИС РВС, включающая аппаратную реализацию предложенных методов повышения производительности ИС РВС.
• Разработан прототип ИС РВС с использованием ПЛИС Xilinx, предназначенный для верификации ИС РВС и схем-макросов прикладных алгоритмов, реализованных на ИС РВС.
• Разработан экспериментальный стенд обеспечивающий процесс создания и отладки программных средств для реализации прикладных алгоритмов, отладки и верификация аппаратуры ИС РВС и в дальнейшем - обеспечения разработки и верификации схем-макросов прикладных вычислительных алгоритмов для формирования библиотеки алгоритмов ИС РВС.
• Разработана методика комплексной верификации ИС РВС и схем-макросов прикладных алгоритмов, реализованных на ИС РВС. Разработка и анализ ИС РВС на системном уровне обеспечивает основу для реализации аппаратной модели, а процесс синтеза и последующей загрузки конфигурационных настроек ПЭ вычислительной матрицы в аппаратуру, обеспечивает быструю верификацию и простое наращивание базы данных библиотек алгоритмов для их последующей аппаратной реализации как отдельно, так и в составе сложных прикладных задач.
• Разработанная на основе предлагаемых аппаратных методов обеспечения высоких уровней производительности, архитектура ИС РВС верифицирована на аппаратном уровне. Реализован набор прикладных задач. Апробация результатов в составе экспериментального стенда подтвердила реализуемость и эффективность предлагаемых методов повышения производительности ИС РВС.
• Проведена оценка технических характеристик разрабатываемой ИС РВС для различных уровней технологии и различных размеров кристалла. Реализованный комплекс схемотехнических методов повышения эффективности ИС РВС позволил повысить производительность более чем в 6 раз относительно базовой исходной архитектуры. Оцененная пиковая производительность ИС РВС л площадью 400 мм с количеством ПЭ, равным 10520, функционирующей на частоте 300 МГц составляет 197, 4 GOPS (Giga operations per second, миллиардов операций в секунду). Потребляемая мощность ИС 22,1 Вт.
Заключение
1). Проведенный в работе анализ позволил выявить основные причины насыщения производительности ИС РВС, среди которых наиболее важными являются: ограниченная функциональность процессорных элементов, не позволяющая покрыть широкий спектр типовых алгоритмов высокопараллельной обработки данных; низкая эффективность использования аппаратных ресурсов ИС РВС в случае реализации на ней вычислительных алгоритмов с ветвлением; простой ИС РВС, связанный с увеличением значения времени задержки, обусловленного транзитом данных к активному ПЭ; длительное время переконфигурирования ИС РВС; невозможность динамической реконфигурации части матрицы ПЭ ИС РВС, совмещенной с вычислениями.
2). Разработана и верифицирована функциональная модель ИС РВС обеспечивающая возможность комплексного анализа на различных уровнях абстракции (на уровне простейших функциональных блоков, на уровне ПЭ, на системном уровне), а также обеспечивающая возможность оценки производительности ИС РВС для различных конфигураций функциональных элементов ИС РВС.
3). Предложена методика комплексной оценки эффективности функциональных элементов ИС РВС, основанная на сравнительном анализе показателя удельной производительности (производительности на единицу площади) ИС РВС, построенных на базе данных элементов.
4). На базе предложенной функциональной модели разработана структурная схема ПЭ ИС РВС, обеспечивающая поддержку обработки установленного набора функциональных операторов, а также параллельную одновременную обработку двух операций, как простых арифметико-логических функциональных операторов, так и мультипликативных, что повышает производительность ИС РВС.
5). Разработан способ схемотехнической оптимизации вычислений на ИС РВС, основанный на введении поддержки альтернативных вычислений в ПЭ ИС
196
РВС и обеспечивающий эффективную поддержку на ИС РВС обработки алгоритмов с ветвлениями.
6). Разработана и оптимизирована топология системы межсоединений ПЭ ИС РВС как на уровне регулярных ближних связей (на базе связанных двумерных тор-соединений размерностью 8*8), так и на уровне глобальных связей в рамках взаимодействия схем-макросов (система глобальных вертикальных и горизонтальных шин). Данное решение ИС РВС обеспечивает уменьшение значения времени простоя ИС РВС, возникающее, с одной стороны, в процессе пересылки данных между активными ПЭ в рамках статической конфигурации одной схемы-макроса, а с другой, - в процессе пересылки данных между активными ПЭ разных схем-макросов в рамках динамической конфигурации произвольно размещаемых на аппаратуре ИС РВС прикладных задач.
7). Предложен новый принцип организации процесса загрузки конфигурационных данных, основанный на обеспечении индивидуального доступа к конфигурационному регистру ПЭ ИС РВС в режиме вычислений, обеспечивающий динамическую частичную реконфигурируемость ИС РВС.
8). Предложен принцип обеспечения динамической коммутации ПЭ на уровне глобальных связей, основанный на выделении в отдельный режим процесса загрузки конфигурации коммутационных настроек ПЭ, интеграции в ПЭ реконфигурируемых повторителей, управление которыми обеспечивает динамическую сегментацию глобальных шин, что определяет эффективность и гибкость коммутационной системы и, как следствие, повышение производительности ИС РВС.
9). Разработан прототип ИС РВС с использованием ПЛИС ХШпх, предназначенный для верификации ИС РВС и реализованных схем-макросов прикладных алгоритмов.
10). Разработана методика комплексной верификации ИС РВС и реализованных схем-макросов прикладных алгоритмов. Разработка и анализ ИС РВС на системном уровне обеспечивает основу для реализации аппаратной модели, а процесс синтеза и последующей загрузки конфигурационных настроек ПЭ вычислительной матрицы в аппаратуру, обеспечивает быструю верификацию и
197 простое наращивание базы данных библиотек алгоритмов для их последующей аппаратной реализации как отдельно, так и в составе сложных прикладных задач.
11). Результаты исследований апробированы в составе экспериментального стенда, включающего прототип ИС РВС в ПЛИС. Апробация результатов исследований в составе экспериментального стенда подтвердила реализуемость и эффективность предлагаемых методов повышения производительности ИС РВС.
12). Проведена оценка технических характеристик разрабатываемой ИС РВС для различных уровней технологии и различных размеров кристалла. В процессе масштабирования не требуется перепроектирование ИС РВС, их производительность растет с увеличением числа ПЭ в системе. Оцененная пиковая производительность ИС РВС площадью 400 мм2 с количеством ПЭ, равным 10520, функционирующей на частоте 300 МГц составляет 197, 4 GOPS (Giga operations per second, миллиардов операций в секунду). Потребляемая мощность ИС 22,1 Вт.
Таким образом, в результате выполнения работы решена задача повышения производительности интегральных схем реконфигурируемых вычислительных систем класса однородных вычислительных сред. Реализованный комплекс схемотехнических методов повышения гибкости ИС РВС относительно дифференцируемого диапазона приложений, повышения эффективности ИС РВС относительно обработки прикладных алгоритмов, в которых широко используется вычислительная структура с ветвлением по условию - структура типа "выбор" и "повторение", повышения эффективности коммутационной системы ИС РВС, обеспечения эффективных механизмов динамической реконфигурации аппаратуры ИС РВС, позволил повысить производительность системы более чем в 6 раз относительно базовой исходной архитектуры.
Список литературы диссертационного исследования кандидат технических наук Артамонов, Дмитрий Сергеевич, 2010 год
1. Аладышев ОС, Дикарев НИ., Овсянников А.П. и др., СуперЭВМ: области применения и требования к производительности // Известия ВУЗов. Электроника, 2004, №1. С. 13-17.
2. Варшавский В.И., Мораховский В.Б. и др. Однородные структуры. // М.: Энергия, 1973.- 150 с.
3. Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. // С.-Петербург: «БХВ-Петербург», 2002. 599 с.
4. Димитриев Ю.К., Хорошевский В.Г. Вычислительные системы из мини-ЭВМ. // М.: Радио и связь, 1982. 304 с.
5. КорнеевВ.В. Архитектура вычислительных систем с программируемой архитектурой // Новосибирск: Наука, 1983.-С. 116.
6. Распараллеливание обработки информации / Под ред. Грицика. Львов, 1985. - Т.2.
7. Kuch D.J. ILLIACIV Software and Application Programming // IEEE Jrans. Comput, 1968, v. 6-17, N 8. P. 758-770.
8. Каляев И.А., Левин И.И., Семерников Е.А., Шмойлов В.И. Реконфигурируемые мультиконвейерные вычислительные системы. // Ростов-на-Дону, ЮНЦ РАН, 2008. С. 393 .
9. Векторизация программ: теория, методы, реализация / Сборник переводов статей.// М.: Мир, 1991. С. 246-267.
10. Blum Т., Paar С. Montgomery Modular Multiplication on Reconfigurable Hardware // 14th IEEE Symposium on Computer Arithmetic (ARITH-14), April 14-16, 1999, Adelaide, Australia.
11. Gross Т., O'Hallaron D. R. iWARP. Anatomy of a Parallel Computing System. // MIT Press, March 1998, pp. 530.
12. Gross Т., O'Hallaron D. R, and Subhlok J. Task parallelism in a High Performance Fortran framework // IEEE Parallel & Distributed Technology, Vol 2, Num 3, 1994, pp. 16-26.
13. Fujita Y. Nobuyuki Y. Okazaki S. IMAP VISION: An SIMD Processor with HighSpeed On-chip Memory and Large Capacity External Memory // MVA '96 IAPR Workshop on Machine Vision Applications, November. 12-14. 1996. Tokyo, Japan, pp. 170-173.
14. Jones G. PulseDSP: A Signal Processing Oriented Programmable Architecture // Field Programmable Logic and Applications Lecture Notes in Computer Science, 2004, Volume 1673/2004, pp. 282-290.
15. Multicore DSP architecture // http://www.picochip.com/page/42/multi-core-dsp-architecture
16. PACT XPP Technologies // http://www.pactxpp.com/main/index.php
17. Каляев A.B. Теория цифровых интегрирующих машин и структур. // М.: Сов. Радио, 1970.
18. Евреинов Э.В., Косарев Ю.Г. Однородные универсальные вычислительные системы высокой производительности. //Новосибирск: Наука, 1966. С. 308.
19. Прангишвши И.В., Абрамова Н.А., Бабичева Б.В., Игнатущенко В.В. Микроэлектроника и однородные структуры для построения логических и вычислительных устройств. // М.: Наука, 1967. С. 228.
20. Евреинов Э.В., Прангишвши И.В. Цифровые автоматы с настраиваемой структурой.//М.: Энергия, 1974. С. 240.
21. Прангишвши КВ., ТодуаД.А., Абрамова Н.А. и др. ЭВМ ПС-300. // Приборы и системы управления, 1978, №10.
22. Русин Б.П., Кузьо М.Н., Шмойлов В.И. Пульсирующие информационные решётки новое поколение однородных вычислительных сред // Автоматика и вычислительная техника. - Рига, 2002, №1. - С. 60-71.
23. Седое B.C., Соболев В.Н., Самчинский A.A. и др. Элементная база ОВС. -Львов: ИППММАНУССР, 1989. С. 38.
24. Шмойлов В.И. Организация вычислительного процесса в мультиконвейерной вычислительной структуре. Львов: НТЦ «Интеграл», 1991. - С. 93.
25. Шмойлов В.И, Русын Б.П., Кузьо М.Н. Однородные вычислительные среды и пульсиры. Львов: Меркатор, 2001. - С. 62.
26. Кун С. Матричные процессоры на СБИС / Пер. с англ. // М.: Мир, 1991. С. 672.
27. Kung Н.Т. and Leiserson С.Е. Systolic arrays (for VLSI). // In Sparse Matriz Symposium, SIAM, 1978, pp. 256-282.
28. Бачериков Г.И., Богачёв М.П., Шмойлов В.И и др. Мультиконвейерные вычислительные структуры на однородных средах. // Львов: ФМИ АН УССР, 1985. С. 70.
29. Камша U.C., Камша В.П., Шмойлов В.И. и др. Суперкристалл ОВС с анализом команд. // Львов: НТЦ "Интеграл", 1990. С. 63.
30. Кузьо М.М., Русин Б.П., Шмойлов В.И. Однорщш середовища елементна база високопродуктивних обчислювальних систем. // Управляющие системы и машины.-Киев, 2000, №4. - С. 52-62.
31. Кузьо М.М., Русын Б.П., Шмойлов В.И. Однородные вычислительные среды // Оптико-електронш шформацшно-енергетичш технологи. Вшниця, 2001, №2. - С.19-37.
32. РусынБ.П., КузьоМ.Н., Шмойлов В.И. Реконфигурируемые высокопроизводительные системы на однородных средах // Автоматика и вычислительная техника. Рига, 2000, №3. С. 72-81.
33. Елейко В.И., Елейко Я.И., Шмойлов В.И. и др. ОВС безрезервных процессорных элементов. // Львов: НТЦ "Интеграл", 1991. С. 34.
34. Елейко Я.И. Самчинский A.A., Шмойлов В.И. Построение отказоустойчивой однородной вычислительной среды. // Львов: НТЦ "Интеграл", 1991. С. 67.
35. Подрубный О.В., Самчинский A.A., Шмойлов В.И. Построение отказоустойчивой элементной базы ОВС. // Львов: НТЦ "Интеграл", 1990. -С. 36.
36. Шмойлов В.И. Архитектура однородных вычислительных сред. // Львов: НТЦ "Интеграл", 1993. С. 289.
37. Самчинский A.A., Седов B.C., Шмойлов В.И. Архитектура однородной вычислительной среды. // Львов: НТЦ "Интеграл", 1991. С. 228.
38. Камша В.П., Кузъо М.Н., Шмойлов В.И. и др. ОВС на пластине. // Львов: НТЦ "Интеграл", 1990. С.63.
39. Кокурин СЛ., Кузъо М.Н., Шмойлов В.И. Разработка однородной вычислительной среды на пластине. // Львов: НТЦ "Интеграл", 1991. С. 26.
40. Кузъо М.М., Русын Б.П., Шмойлов В.И. Пульсирующие информационные решётки. // Оптико-електронш шформацшно-енергетичш технологи. -Вшниця, 2001, №1. С. 51-78.
41. Шмойлов В.И, Русин Б.П., Кузъо М.Н., Каший О.В. Проектирование пульсирующих информационных решёток. // Львов: Меркатор, 2000. С. 101.
42. Шмойлов В.И., Русин Б.П., Кузъо М.Н. Ячейка пульсирующих информационных решёток. // Львов: Меркатор, 2001. С. 34.
43. Шмойлов В.И, Русын Б.П., Кузъо М.Н. Однородные вычислительные среды и пульсиры. // Львов: Меркатор, 2001. С. 62.
44. Edsger W. Dijkstra. Notes on structured programming // Eds. Ole-Johan Dahl, Edsger W. Dijkstra, C. A. R. Hoare. Structured Programming. Academic Press, 1972.-88 p.
45. Шмойлов В.И., Адамацкий A.M., Кузьо M.H. Русин Б.П., Тимченко А.В. Пульсирующие информационные решетки. Львов: Меркатор, 2004. 302 с.
46. Шмойлов В.И., Русин Б.П., Кузьо М.Н. Пульсирующие информационные решетки новое поколение однородных вычислительных сред // Управляющие системы и машины.-Киев, 2004, №2. - С. 23-38.
47. Шмойлов В.И. Пульсирующие информационные решетки и суперкомпьютеры класса А. Львов: Меркатор, 2005. - С. 902.
48. Барский А.Б. Архитектура параллельных вычислительных систем http://www.intuit.rU/department/hardware/paralltech/9/l.html
49. Р. К. Chan, М. D. F. Schlag, С. D. Thomborson, and V. G. Oklobdzija, Delay Optimization of Carry-Skip Adders and Block Carry-Lookahead Adders // 10th IEEE Proceedings on Computer Arithmetic, June 26-28, 1991, pp.154-164.
50. K-H. Cheng; ¡V-S. Lee and Y-C. Huang, A 1.2V 500 MHz 32-bit Carry-Lookahead Adder. // 8th IEEE International Conference on Electronics, Circuits and Systems, Vol. 2, September 2-5, 2001, pp. 765-768.
51. P. Corsonello, S. Perri and G. Cocorullo, Hybrid carry select statistical carry lookahead adder. // Electronics Letters, Vol. 35, Issue 7 April 1, 1999, pp. 549551.
52. C-J. Fang, C-H. Huang, J-S. Wang and C-W. Yeh Fast and compact dynamic ripple carry adder design. // IEEE Asia- Pacific Conference on ASIC, Aug. 6-8, 2002, pp. 25-28.
53. Артамонов Д.С. Процессорный элемент для реконфигурируемых вычислительных систем. // Электроника 2006, Всероссийский молодежный научно-инновационный конкурс-конференция, Тезисы докладов, МИЭТ, 2006.-С.103.
54. Артамонов Д.С. Разработка процессорного элемента для реконфигурируемых вычислительных систем потоковой обработки данных. // Электроника 2007, Всероссийский молодежный научно-инновационный конкурс-конференция, Тезисы докладов, МИЭТ, 2007. - С.87.
55. Артамонов ДС., Вихров O.A. Повышение производительности реконфигурируемых однородных вычислительных сред методом поддержки альтернативных вычислений. // Известия высших учебных заведений, Электроника 5(79) 2009. С.50-56
56. Артамонов Д.С., Путря М.Г. Метод оптимизации вычислительного процесса на реконфигурируемых однородных вычислительных средах. // Информационные технологии и вычислительные системы, 3/2010. С. 19-26
57. Цилькер Б. Я., Орлов С. А. Организация ЭВМ и систем // Учебник для вузов. СПб., 2004. - 667 с.
58. Cordan В. An Efficient Bus Architecture for System-on-a-Chip Design // Proceedings of IEEE Custom Integrated Circuits Conference. 1999. May. pp. 623626.
59. Winegarden S. Bus Architecture of a System on a Chip with User Configurable System Logic // IEEE Journal of Solid State Circuits. 2000. Vol. 35, No. 3. pp. 425-433.
60. Артамонов Г. Т., Тюрин В.Д. Топология сетей ЭВМ и многопроцессорных систем. М.: Радио и связь, 1991. 248 с.
61. Open Core Protocol Reference Document Revision 002 // OCP-IP Association. 2001.202 p.
62. Корнеев В.В. Параллельные вычислительные системы. // М.: Нолидж, 1999. -320 с.
63. Суворова Е. А. Параллельные устройства вычислительной техники класса "системы-на-кристалле" // Дис. . канд. техн. наук : 05.13.05, СПб., 2004. -203 с.
64. Thompson С. D. Area-Time complexity for VLSI // Proc. ACM, Symp. Theory of Computing. 1979, pp. 81-88
65. Chi-Hsiang Yen, E. A. Varvarigos, B. Parhami The recursive grid layout sceme for VLSI layout of hierarchical networks / // Proc. Merged Int'l Parallel Processig Symp. & Symp. Parallel and Distributed Processing. 1999. Apr. pp.48-55.
66. С. H. Yeh, E.A. Varvarigos, B. Parhami Efficient VLSI layouts of hypercubic networks / // Proc. Symp. Fron-tiers of Massively Parallel Computation. 1999. Feb. pp. 98-105.
67. С. H. Yeh, B. Parhami, E.A. Varvarigos, H. Lee VLSI layout and packaging of butterfly networks / // Proc. ACM Symp. Parallel Algorithms and Architectures. 2000. pp.196-205.
68. C. H. Yeh, B. Parhami, E.A. Varvarigos The recursive grid layout scheme for VLSI layout of hierarchical networks / // Proc. Merged Int'l Parallel Processing Symp. & Symp. Parallel and Distributed Processing. 1999. Apr. pp. 441-445.
69. S. Even, S. Muthukrishnan, M.S. Paterson, S. Cenk Sahinalp Layout of the Batcher bitonic sorter. // Proc. ACM Symp. Parallel Algorithms and Architectures. 1998. pp. 172-181.
70. Chen G., Lau F. Layout of the Cube-connected Cycles without Long Wires // The Computer Journal. 2001. Vol. 44. pp. 374-383.
71. Kruskal C. P., Snir M. A unified theory of interconnection network structure // Theoretical Computer Science. 1986. Vol. 48. pp. 75-94.
72. The International Technology Roadmap for Semiconductors (ITRS), 1999.
73. K. C. Saraswat and F. Mohammadi, "Effect of interconnection scaling on time delay of VLSI circuits," IEEE Trans. Electron Devices, vol. ED-29, 1982, pp. 645650.
74. M. T. Bohr, "Interconnect scaling-the real limiter to high performance ULSI," IEDM Tech. Dig., 1995, pp. 241-244.
75. J. D. Meindl, "Low power microelectronics: retrospect and prospect," Proc. of the IEEE, vol. 83, no. 4, pp. 619-635, 1995.
76. S-Y Oh and K-J Chang, "2001 needs for multi-level interconnect technology," Circuits and Devices, pp. 16-21, 1995.
77. M. T. Bohr and Y. A. El-Mansy, "Technology for advanced high-performance microprocessors," IEEE Trans. Electron Devices, vol 45, no. 3, pp. 620-625, 1998.
78. H. B. Bakoglu, Circuits, Interconnections and Packaging for VLSI. // Reading, MA: Addision-Wesley, 1990
79. K. Banerjee, S. J. Souri, and K. C. Saraswat, "3-D ICs: A Novel Chip Design for Improving Deep Submicron Interconnect Performance and Systems-on-Chip Integration," Proc. IEEE, May 2001
80. Лап Liu, Meigen Shen, Li-Rong Zheng, et al., System level interconnect design for network-on-chip using interconnect IPs, Proceedings of the 2003 international workshop on System-level interconnect prediction (SLIP 03).
81. C. Grecu et al., "A Scalable Communication-Centric SoC Interconnect Architecture," Proc. Fifth Int'l Symp. Quality Electronic Design (ISQED '04), pp. 343-348, 2004
82. Артамонов Д.С. Метод обеспечения динамической частичной реконфигурируемости аппаратуры высокопроизводительного систолического процессора.// Известия высших учебных заведений, Электроника 5 2010. С.68-70.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.