Высокопроизводительные графические ускорители для систем индустриального назначения тема диссертации и автореферата по ВАК РФ 05.13.05, кандидат технических наук Корниленко, Александр Владимирович
- Специальность ВАК РФ05.13.05
- Количество страниц 149
Оглавление диссертации кандидат технических наук Корниленко, Александр Владимирович
Введение.
Методы исследования.
Результаты диссертации, выносимые на защиту.
Апробация диссертации.
Публикации.
Структура и объем диссертации.
Глава 1. Направления развития современных микросхем, содержащих 2Р-ускорители.
1.1 Основные варианты реализации графических ускорителей и современная технология их изготовления.
1.2 Особенности архитектуры микросхемы Chips 69000.
1.3 Особенности архитектуры микросхемы Fujitsu Semiconductor MB87J2120.
1.4 Особенности архитектуры Silicon Motion SM712.
1.5 Сравнительная характеристика и особенности развития.
Выводы и постановка задачи.
Глава 2. Выбор состава аппаратных средств графического ускорителя.
2.1 Определение состава графических операций, реализуемых ускорителем.
2.1.1 Обзор существующих графических функций X Window.
2.1.2 Критерии выбора реализуемых аппаратно функций X Window.
2.2 Выбор локальной шины.
2.3.1 Выбор типа видеопамяти.
2.3.3 Реализация арбитра видеопамяти.
Выводы.
Глава 3. Реализация блоков графического ускорителя.
3.1 Методика проектирования графического укорителя.
3.2 Реализация блока рисования отрезка.
3.2.1 Реализация алгоритма рисования отрезка по двум координатам.
3.2.2 Реализация параметрического блока рисования отрезка.
3.2.3 Метод повышения быстродействия алгоритма рисования отрезка с помощью введения буфера данных.
3.3 Реализация блока рисования эллипса.
3.4 Реализация блока рисования прямоугольной области.
3.4.1 Реализация блока заливки прямоугольной области одним цветом.
3.4.2 Реализация блока заливки прямоугольной области по маскам.
3.4.3 Реализация блока заливки прямоугольной области узором 8x8.
3.4.4 Оценка повышения быстродействия алгоритма заливки прямоугольной области с при увеличении разрядности шины данных.
3.5 Реализация блока копирования прямоугольной области.
3.5.1 Алгоритм и особенности работы блока копирования прямоугольной области
3.5.2 Повышение быстродействия блока копирования прямоугольной области с помощью буфера данных.
3.6 Сокращение используемых микросхемой ресурсов с помощью использования блоками общих субблоков.
3.7 Реализация блока очереди команд.
3.8 Реализация блока порта данных.
3.9 Реализация блока вывода текстовой информации.
3.10 Реализация интерфейса локальной шины.
3.10.1 Реализация работы локальной шины в режиме Target.
3.10.2 Рекомендации по выбору режима работы с локальной шиной.
3.11 Практические результаты, полученные по применению методик проектирования графических ускорителей.
Таблица 3.7.
Выводы.
Рекомендованный список диссертаций по специальности «Элементы и устройства вычислительной техники и систем управления», 05.13.05 шифр ВАК
Вычислительные устройства с параллельной и изменяемой архитектурой для задач обработки изображения2002 год, кандидат технических наук Аряшев, Сергей Иванович
Устройство контроля обращений и процедур доступа к секторам жесткого магнитного диска2007 год, кандидат технических наук Таныгин, Максим Олегович
Исследование и разработка высокопроизводительных устройств коммуникационной среды для создания параллельных ЭВМ индустриального применения2003 год, кандидат технических наук Сидоров, Евгений Александрович
Разработка элементов АРМ проектирования изделий электронной и вычислительной техники1998 год, кандидат технических наук Соловей, Денис Евгеньевич
Исследование и разработка методов увеличения производительности интегральных схем многоядерных микропроцессоров на основе повышения эффективности коммутационной логики2009 год, кандидат технических наук Путря, Федор Михайлович
Введение диссертации (часть автореферата) на тему «Высокопроизводительные графические ускорители для систем индустриального назначения»
Развитие индустриальных компьютерных систем [1,2] требует отображения графической информации на экран для оперативной оценки хода технологического процесса и принятия решений. Требования, выдвигаемые к индустриальным системам — сохранять функционирование в заданных техническим заданием параметрах при работе в условиях повышенных или пониженных температур (от -85 °С до +125 °С), электромагнитных помех и изменения напряжения питания в диапазоне ±10%. Эти требования приводят к задачам построения высокопроизводительных графических подсистем[3], способных функционировать в данных условиях. При этом современные условия требуют вывода информации с высокими разрешениями экрана до 1600 на 1200 точек и отображения до 16 млн. цветов.
Графические контроллеры являются неотъемлемой частью современных ЭВМ, обеспечивая взаимодействие оператора и вычислительной системы. На дисплее отображается не только текстовая, но и графическая информация, делая ЭВМ мощным средством управления и контроля. По сложности некоторые современные графические контроллеры уже превосходят центральный процессор. Первые ЭВМ, использующие в качестве устройства ввода-вывода терминал, отображали только текстовую информацию, при этом вывод па экран информации осуществлял центральный процессор. Появление графического интерфейса способствовало как популяризации первых персональных ЭВМ, так и развитию различных САПР, позволяющих увидеть на экране результат, максимально приближенный к конечному разрабатываемому с помощью САПР продукту. Для обеспечения разгрузки центрального процессора от рутинных задач работы с графическими примитивами в современные микросхемы графических контроллеров встраивают графические ускорители.
Многие зарубежные фирмы [4, 5] выпускают микросхемы именно для применения в индустриальных компьютерных системах. При этом, как правило, характеристики таких видеоконтроллеров отличаются от характеристик микросхем, используемых в персональных ЭВМ, например, отсутствием ускорителя трёхмерной графики, но при этом наличием функции вывода на ЭЛТ-дисплей, ЖК-дисплей и ТВ [6, 7, 8]. Следует отметить, что универсальность ЗБ-адапте-ров и сложность выполняемых ими задач приводят к тому, что для их нормального функционирования требуется мощная система охлаждения, в ряде современных моделей даже используется водяное охлаждение. В индустриальных видеоадаптерах охлаждение должно обеспечиваться пассивными радиаторами. Выпускаемые микросхемы графических контроллеров для персональных ЭВМ, обеспечивающие поддержку эффектов трёхмерной графики, не удовлетворяют требованиям функционирования в жестких индустриальных условиях.
Для большинства индустриальных применений достаточно реализовать быстродействующую видеосистему с выводом информации на различные типы мониторов. Весьма важной для этих видеосистем является реализация аппаратной поддержки выполнения системы графических команд X Window [9]. Эта система команд является общепринятой для вывода графической информации в операционных Unix-системах, таких, как Linux, Solaris, HPUX. При этом именно Unix-системы в большинстве своём применяются для управления и контроля технологических процессов, а также в бортовых ЭВМ. Таким образом, создание графического ускорителя, ориентированного на графическую систему команд X Window, позволит впоследствии применять его в широком спектре индустриальных систем управления и контроля.
В СССР и России работы по созданию графических ускорителей велись в конце 80х - начале 90х годов, когда ещё не существовало единых стандартов графических контроллеров, например, была создана БИС графического сопроцессора К1809ВГ4. В настоящее время эти разработки морально устарели, а новые не ведутся [10]. Для создания отечественных встроенных систем разработчики вынуждены закупать зарубежные графические микросхемы (Cirrus Logic, Chips, Fujitsu), ассортимент которых довольно велик. Однако эти микросхемы не удовлетворяют требованиям специального и индустриального применения по диапазону температур, влагостойкости, не поддерживают систему команд X Window. Кроме того, применение в отечественной аппаратуре зарубежных микросхем может вызвать значительные трудности при дальнейшем производстве этой аппаратуры в случае прекращения выпуска используемых импортных комплектующих, что уже неоднократно имело место.
Целью данной работы является разработка методов и средств проектирования графических ускорителей индустриального применения, специализированных для выполнения основных графических операций X Window. Для достижения этой цели в диссертации решались задачи анализа и выделения основных операций X Window, создана методика построения графических ускорителей, наиболее полно реализующих эти операции, разработаны алгоритмы работы блоков графического ускорителя и реализации на их основе устройств отображения графической информации, специализированных на выполнение выбранных операций X Window.
Представленная работа связана с научными планами отделения разработки высокопроизводительных систем НИИ Системных Исследований РАН по созданию современных высокопроизводительных ЭВМ специального назначения. Результаты данной работы предназначены для применения при проектировании систем контроля на базе индустриальных компьютеров, при построении средств сбора и отображения информации, при разработке аппаратуры управления сложными объектами.
Цель диссертации заключается в создании и развитии алгоритмов работы с графическими примитивами, разработке на основе полученных алгоритмов методик проектирования, структурных и схемотехнических решений для реализации высокопроизводительных 2D графических ускорителей, ориентированных на использование в системах индустриального и специального применения.
Для достижения данной цели необходимо выполнение следующих исследований и разработок:
1. рассмотреть операции X Window, графические стандарты и методы их реализации;
2. провести анализ требований к графическим ускорителям, обусловленных индустриальной областью их применения;
3. провести анализ команд X Window для определения набора команд, эффективного для аппаратной реализации;
4. на основе анализа команд и требований к области применения определить общие подходы и методики построения аппаратных средств графического ускорителя, рассмотреть возможные схемотехнические решения для отдельных блоков;
5. предложить методы увеличения быстродействия аппаратной реализации графических операций, если прямая реализация алгоритма имеет недостаточное быстродействие.
В соответствии с этим были определены следующие основные задачи диссертации:
1. Определить набор графических команд X Window, аппаратная реализация которых позволит существенно ускорить их выполнение.
2. Предложить методику оценки эффективности аппаратной реализации графических команд.
3. Разработать алгоритмы или структурные решения для аппаратной реализации выбранного набора графических команд.
4. Предложить возможные методы дальнейшего увеличения быстродействия блоков, реализованных на основании разработанных алгоритмов и структурных решений.
5. Предложить схемотехнические методы организации арбитрирования доступа к видеопамяти для оптимального распределения времени доступа к ней.
6. С применением разработанных средств и методов разработать и реализовать высокопроизводительный графический ускоритель для графических контроллеров, предназначенных для использования в системах индустриального и специального назначения.
Методы исследования
Для описания предлагаемых алгоритмов реализации основных графических процедур используется язык псевдокода. При описании предложенных структурных решений использованы графы состояний управляющих конечных автоматов для каждого из разработанных функциональных блоков. Программные модели алгоритмов разрабатывались на языках высокого уровня C/C++ и на поведенческом уровне языка Verilog HDL. После объединения получавшиеся архитектуры разрабатывались и тестировались на языке описания аппаратуры Verilog. Для программного моделирования архитектуры устройств использовалась система Verilog-XL фирмы Cadence.
Для создания макетных образцов с реальными задержками и аппаратного моделирования использовались программируемые логические микросхемы типа
FPGA фирмы Altera и системы автоматизированного проектирования Max+PlusII и QuartusII фирмы Altera. Эти пакеты имеют возможность получения на выходе величин реальных временных задержек в микросхеме, что позволяет промоделировать приближенное к реальности поведение разработанного средствами САПР и сконфигурированного в ПЛИС устройства, а также удешевить и ускорить процесс проектирования в целом.
Научная новизна диссертации
1. Обоснованы принципы выбора наиболее часто употребляемых графических операций графических систем X Window для аппаратной их реализации. Основными критериями выбора таких операций являются частота вызова операции и степень получаемого аппаратного ускорения. Ограничивающим критерием являлась сложность аппаратной реализации данной функции. На основе этих припципов предложена общая методика проектирования графических ускорителей.
2. Предложены алгоритмы для аппаратной реализации выбранного набора графических операций X Window. Данные алгоритмы представляют собой описания работы на псевдокоде блока аппаратного ускорения той или иной функции и обеспечили при практическом применении значительное ускорение аппаратного выполнения основных графических процедур до 37,6 раз при допустимых затратах ресурсов на их реализацию (увеличении площади кристалла за счёт ускорителя на 54 % , повышении потребления мощности на 41 %).
3. На базе предложенных алгоритмов разработаны структурные решения и получены графы машин состояний для реализации основных блоков графических ускорителей. Полученные структурные решения и графы состояний позволяют выполнить дальнейшую схемотехническую и топологическую разработку графических ускорителей средствами САПР.
Предложены методы повышения производительности алгоритмов работы блоков аппаратного выполнения графических операций по сравнению с их прямой реализацией: а) ускорение рисования отрезка линии по алгоритму Брезенхема методом введения промежуточных буферов данных (достигается увеличение быстродействия в 2,1 раза по сравнению с прямой реализацией), б) ускорение заливки прямоугольной области с помощью увеличения разрядности шины данных (увеличение быстродействия работы блока до 16 раз), в) ускорение копирования прямоугольной области методом введения буферов данных на чтение и запись (увеличение быстродействия работы блока до 5 раз).
К другим существенным результатам диссертации, имеющим практическое значение, могут быть отнесены следующие:
1. Предложена реализация канала очереди графических команд, позволившая снизить затраты времени на опрос окончания аппаратного выполнения графической операции. При этом минимальный выигрыш по времени за счёт отсутствия по локальной шине PCI циклов ожидания окончания операции составит при глубине очереди графических команд М = 8 до 168 тактов частоты шины PCI. Выигрыш времени зависит от суммарного времени выполнения графических операций, помещенных в очередь команд.
2. Предложена принципиальная схема арбитра доступа к видеопамяти с переключаемыми приоритетами для оптимизации времени работы с видеопамятью блока интерфейса локальной шины и графического ускорителя. Схема обеспечивает предоставление доступа к видеопамяти со стороны графического ускорителя и блока интерфейса локальной шины PCI таким образом, чтобы процесс ожидания данных при совместном обращении PCI и графического ускорителя к видеопамяти со стороны ускорителя как более быстродействующего устройства имел минимальную длительность. При этом выигрыш во времени работы составляет до 16 периодов тактовой частоты памяти за счёт минимизации ожидания подготовки процессором данных.
3. Предложена методика оптимизации схемотехнической реализации графических ускорителей по количеству транзисторов путем выделения функционально идентичных блоков и их использования для выполнения различных функций. Для разделения доступа к этим общим блокам разработан алгоритм ар-битрирования запросов. Для созданного графического ускорителя данная методика обеспечила снижение количества требуемых логических элементов на 7,5%, и, соответственно, уменьшение на такую же величину потребляемой графическим ускорителем мощности.
Результаты диссертации, выносимые на защиту
1. Методика выделения графических функций X Window, предназначенных для аппаратной реализации.
2. Методика построения аппаратных средств графического ускорителя, предназначенного для отображения графической информации в индустриальных ЭВМ. Методика позволяет реализовать аппаратное выполнение основных графических операций X Window, ускоряя функцию рисования отрезка линии в 4 раза по сравнению с программным выполнением, и до 30 раз для копирования в 8-разрядном режиме, наращивать функциональные возможности таких микросхем, например, добавляя ещё одну очередь команд вывода на экран. Предложены методы и способы повышения быстродействия прямой реализации алгоритмов аппаратного выполнения графических операций.
3. Структура блоков графического ускорителя, реализующего аппаратное выполнение основных графических операций X Window, в составе графического контроллера, предназначенного для вывода графической информации на экран в системах на базе высокопроизводительных индустриальных ЭВМ. Диаграммы работы машин состояний блоков аппаратного ускорения графических операций.
Практическая ценность
Разработанные в диссертации методики проектирования графических ускорителей и алгоритмы реализации графических операций, предложенные структурные и схемотехнические решения для реализации основных блоков и субблоков были использованы при разработке двух типов отечественных микросхем графических контроллеров индустриального назначения 1890ВГ10Т и 1890ВГ14Т, выпускаемых серийно.
Графические контроллеры 1890ВГ10Т и 1890ВГ14Т позволяют выводить на экран изображение с высоким разрешением и кадровой частотой с глубиной цвета 8, 16 и 32 разряда на точку; при этом находящийся в их составе графический ускоритель способен осуществлять следующие графические операции:
• копирование прямоугольных областей в видеопамяти;
• копирование прямоугольных областей в видеопамяти с графической операцией;
• заливка прямоугольной области в видеопамяти фиксированным цветом;
• заливка прямоугольной области в видеопамяти фиксированным цветом с графической операцией;
• постановка точек по координатам;
• заливка прямоугольной области по маске, расположенной в памяти (копирование с расширением цвета);
• заливка прямоугольной области с отсечением по маске расположенной в памяти (копирование с расширением цвета с отсечением);
• заливка произвольной прямоугольной области с использованием расположенного в регистре шаблона 8x8 (как двухцветной, так и с отсечением);
• рисование линии нулевой толщины с использованием графической операции по начальной и конечной точкам (в том числе и пунктирной линии) с поддержкой отрицательных экранных координат;
• рисование линии нулевой толщины (в том числе и пунктирной) с использованием графической операции по начальной точке, длине и характеризующей наклон величине ошибки;
• обработка очереди графических команд.
Проведенные экспериментальные исследования и испытания микросхем 1890ВГ10Т и 1890ВГ14Т позволили оценить эффективность введения разработанного графического ускорителя для повышения производительности систем при выполнении графических процедур. Возможности функционирования в расширенном диапазоне температур обеспечиваются особенностями технологического процесса и применением металлокерамического или стеклокерамическо-го корпуса, обладающих способностью повышенного отвода тепла от кристалла.
Данные микросхемы используются в ряде ОКР по созданию автоматизированных систем управления индустриального и специального применения. С использованием данных микросхем создано новое поколение компьютеров серии «Багет», что подтверждается приложенными актами о внедрении.
Апробация диссертации
Основные положения диссертации докладывались и обсуждались на научно-технических конференциях и семинарах:
• Научно-техническая конференция «Электроника, микро- и наноэлектроника», 2001 г. (г. Пушкинские горы), 2002 г. (г. Пушкин), 2003 г. г. Кострома).
• Научные сессии МИФИ-2001 и МИФИ-2002.
• На семинарах НИИСИ РАН, межведомственных совещаниях и семинарах.
Публикации
По теме диссертации опубликовано 10 работ.
Структура и объем диссертации
Диссертация состоит из введения, трех глав, заключения и списка литературы. Диссертация содержит 145 страниц, 43 рисунка, 16 таблиц. Список литературы насчитывает 91 наименование.
Похожие диссертационные работы по специальности «Элементы и устройства вычислительной техники и систем управления», 05.13.05 шифр ВАК
Маломощные цифровые сложнофункциональные блоки КМОП СБИС2010 год, кандидат технических наук Гармаш, Александр Александрович
Аппаратная реализация кодеков Рида-Соломона на плис на основе высокоуровневых параметризованных описаний функциональных узлов2012 год, кандидат технических наук Тайлеб ур. Мазуз Незхат
Высокопроизводительные сопроцессоры для параллельной обработки данных в формате с плавающей точкой в системах цифровой обработки сигналов2013 год, кандидат технических наук Пантелеев, Алексей Юрьевич
Универсальный нейросетевой ускоритель для решения задач искусственного интеллекта1999 год, кандидат технических наук Борисов, Виктор Леонидович
Исследование методов реализации алгоритмов обработки больших потоков данных за счет конвейерного распараллеливания2009 год, кандидат технических наук Лысаков, Константин Федорович
Заключение диссертации по теме «Элементы и устройства вычислительной техники и систем управления», Корниленко, Александр Владимирович
Выводы
Изложенная в данной главе общая методика проектирования графических ускорителей позволяет провести оценку эффективности ускорения отдельных графических операций и определить набор операций, аппаратная реализация которых обеспечивает наибольшее повышение быстродействия при допустимых затратах ресурсов (количества дополнительных элементов, площади кристалла, потребляемой мощности).
Предложены алгоритмы аппаратной реализации основных графических операций Х-Windows:
• копирование прямоугольной области;
• заливка прямоугольной области;
• заливка прямоугольной области по одноцветной и двуцветной маскам;
• заливка прямоугольной области по одноцветной и двуцветной маскам узором 8x8 точек;
• формирование отрезка прямой линии по двум точкам либо по двум точкам и наклону;
• формирование отрезка прямой линии по двум точкам либо по двум точкам и наклону с поддержкой пунктира.
Данные алгоритмы позволяют произвести на их основе разработку структуры и схемотехнической реализации основных блоков графического ускорителя. На базе данных алгоритмов разработаны структурные решения для следующих блоков ускорителя:
1. Блок рисования отрезка прямой линии (раздел 3.2.1, 3.2.2). Блок реализует целочисленный алгоритм Брезенхема, при котором итеративно ставятся точки, принадлежащие рисуемой линии. Для ускорения работы в структуру блока введены буферы данных (раздел 3.2.3). В результате работы блока достигается ускорение выполнения этой графической операции в 2,5 раза по сравнению с программной реализацией.
2. Блок заливки прямоугольной области одним цветом (раздел 3.4.1). Блок работает с шиной данных шириной 128 разрядов, позволяющей за один цикл работы блока рисовать до 16 точек (раздел 3.4.4). В результате работы блока обеспечивается аппаратное выполнение данной операции, которое в 22,8 раз быстрее, чем программное.
3. Блок заливки прямоугольной области по маске (раздел 3.4.2). Данный блок также работает с шиной данных шириной в 128 разрядов, которая позволяет за один цикл ставить до 16 точек. Достигается ускорение операции при аппаратном выполнении в 22,8 раз по сравнению с программным выполнением.
4. Блок заливки прямоугольной области по маске узором 8x8 точек (раздел 3.4.3). Блок также работает с шириной шины данных 128 разрядов, но считывает маску из регистров, не обращаясь к памяти. Его быстродействие равно быстродействию блока заливки прямоугольной области одним цветом.
5. Блок копирования прямоугольной области (раздел 3.5.1). Блок работает с шиной данных шириной в 128 бит, что позволяет копировать до 16 точек за цикл работы блока. Для ускорения работы блока в его структуру введены буферы чтения данных (раздел 3.5.2). Ускорение аппаратного выполнения по сравнению с программным составило 37,6 раз.
Получены временные диаграммы работы машин состояния, управляющих функционированием данных блоков. Полученные структурные схемы и временные диаграммы позволяют произвести автоматизированный схемотехнический синтез и разработку топологии блоков ускорителя стандартными средствами САПР.
Предложена реализация очереди графических команд (раздел 3.7), позволяющая разгрузить центральный процессор и локальную шину, исключив N-1 циклов ожидания выполнения операции, где N-глубина очереди команд. Проведенная оценка показывает, что для реализации выбранного набора операций X-Windows целесообразно использовать глубину очереди М = 8, при этом достигается сокращение времени выполнения графических операций на величину от 168 тактов по шине PCI.
При разработке графических ускорителей проведена оптимизация схемы по количеству транзисторов путем выделения функционально идентичных блоков, используемых для выполнения различных задач. Разделение доступа к этим блокам производится с помощью предложенного алгоритма арбитража. Данный способ оптимизации позволил сократить на 7,5 % количество логических элементов, требуемых для реализации графического ускорителя, и, соответственно, уменьшить на такую же величину потребляемую графическим ускорителем мощность.
С использованием разработанных методик проектирования графических ускорителей и алгоритмов реализации графических операций, предложенных структурных и схемотехнических решений проведена разработка графических ускорителей для двух типов микросхем графических контроллеров 1890ВГ10Т, 1890ВГ14Т, выпускаемых серийно. На базе этих микросхем разработаны и изготовлены индустриальные графические модули в формате PCI Mezzanine Card [25]. Было произведено тестирование данных модулей и их сравнение с графическим ускорителем S3 Virge МХ+, установленным в персональном компьютере, по скорости выполнения типовых графических процедур. Полученные результаты показывают, что использование разработанных ускорителей обеспечивает ускорение выполнения типовых графических процедур до 37,6 раз. При выполнении большинства процедур (8 тестовых процедур из 10) графический ускоритель, реализованный в составе микросхемы 1890ВГ14Т, обеспечивает на отдельных задачах в 2,5 раза более высокое быстродействие, чем лучшие зарубежные образцы графических 2D ускорителей.
Заключение
Основным научным результатом диссертации является развитие методов проектирования высокопроизводительных графических контроллеров для систем индустриального назначения.
Основные теоретические результаты данной диссертации заключаются в следующем:
1. Обоснованы принципы выбора наиболее часто употребляемых графических операций графических систем X Window для их аппаратной реализации. На основе этих принципов предложена общая методика проектирования графических ускорителей.
2. Предложены алгоритмы для аппаратной реализации выбранного набора графических операций X Window. Данные алгоритмы обеспечивают значительное ускорение аппаратного выполнения основных графических процедур (до 37,6 раз) при допустимых затратах ресурсов на их реализацию (увеличении площади кристалла за счёт ускорителя на 54 % (из табл.3.5), повышении потребления мощности па 41% (из табл.3.6)).
3. На базе предложенных алгоритмов разработаны структурные решения и получены графы машин состояний для реализации основных блоков графических ускорителей. Полученные структурные решения и графы состояний позволяют выполнить дальнейшую схемотехническую и топологическую разработку графических ускорителей средствами САПР.
4. Предложены методы повышения производительности алгоритмов работы блоков аппаратного выполнения графических операций по сравнению с их прямой реализацией: а) ускорение рисования отрезка линии по алгоритму Брезенхема методом введения промежуточных буферов данных (достигается увеличение быстродействия в 2,1 раза по сравнению с прямой реализацией), б) ускорение заливки прямоугольной области с помощью увеличения разрядности шины данных (увеличение быстродействия работы блока до 16 раз), в) ускорение копирования прямоугольной области методом введения буферов данных на чтение и запись (увеличение быстродействия работы блока до 5 раз).
Основные практические результаты диссертации следующие:
1. Предложены и реализованы в микросхеме алгоритмы очереди графических команд, позволившие снизить затраты времени на опрос окончания аппаратного выполнения графической операции. При этом минимальный выигрыш по времени за счёт отсутствия по локальной шине PCI циклов ожидания окончания операции составит при глубине очереди графических команд М = 8 до 168 тактов частоты шины PCI. Выигрыш во времени зависит от суммарного времени выполнения графических операций, помещенных в очередь команд.
2. Предложена и реализована в микросхеме принципиальная схема арбитра доступа к видеопамяти с переключаемыми приоритетами для оптимизации времени работы с видеопамятью блока интерфейса локальной шины и графического ускорителя. Схема обеспечивает предоставление доступа к видеопамяти со стороны графического ускорителя и блока интерфейса локальной шины PCI таким образом, чтобы процесс ожидания данных при совместном обращении PCI и графического ускорителя к видеопамяти со стороны ускорителя как более быстродействующего устройства имел минимальную длительность. При этом выигрыш во времени работы составляет до 16 периодов тактовой частоты памяти за счёт минимизации ожидания подготовки процессором данных.
3. Предложена методика оптимизации схемотехнической реализации графических ускорителей по количеству транзисторов путем выделения функционально идентичных блоков и их использования для выполнения различных функций. Для разделения доступа к этим общим блокам разработан алгоритм ар-битрирования запросов. Для созданного графического ускорителя 1890ВГ10Т данная методика обеспечила снижение количества требуемых логических элементов на 7,5 %, и, соответственно, уменьшение на такую же величину потребляемой графическим ускорителем мощности.
Разработанные в диссертации методики проектирования графических ускорителей и алгоритмы реализации графических операций, предложенные структурные и схемотехнические решения для реализации основных блоков и субблоков были использованы при разработке двух типов отечественных микросхем графических контроллеров индустриального назначения 1890ВГ10Т и 1890ВГ14Т, выпускаемых серийно.
Проведенные экспериментальные исследования и испытания микросхем 1890ВГ10Т и 1890ВГ14Т позволили оценить эффективность введения разработанного графического ускорителя для повышения производительности систем при выполнении графических процедур. Возможности функционирования в расширенном диапазоне температур обеспечиваются особенностями технологического процесса и применением металлокерамического или стеклокерамическо-го корпуса, обладающих способностью повышенного отвода тепла от кристалла.
Сравнение результатов тестирования графических модулей, реализованных на базе разработанных микросхем графических контроллеров 1890ВГ10Т, 1890ВГ14Т и зарубежных образцов, показывает, что предложенные в диссертационной работе методы проектирования и структурно-схемотехнические решения ускорителей плоской графики обеспечивают существенное повышение производительности при выполнении основных графических операций до 32 раз по сравнению с программным выполнением.
Данные микросхемы используются в ряде ОКР по созданию автоматизированных систем управления индустриального и специального применения. С использованием данных микросхем создано новое поколение компьютеров серии «Багет», что подтверждается приложенными актами о внедрении.
Список литературы диссертационного исследования кандидат технических наук Корниленко, Александр Владимирович, 2008 год
1. Рэй Алдерман. Путешествие по рыночной матрице, часть 3. Сегмент военных, научных и телекоммуникационных приложений. // V1.A Journal - December 1995
2. Вольфганг Эйзенбарт. Автоматизация опасных промышленных объектов. // "Средства и системы компьютерной автоматизации". http://www.asutp.ru/? р=600605
3. Николаев A. GUI во встраиваемых системах. // PCWeek/RE 2006, № 19.
4. Крылов Е. И . Графические контроллеры для гибких мультимедийных решений фирмы Fujitsu // http://www.cec-mc.ru/read/art20.shtml
5. В.Беляев. Мировой рынок средств отображения информации. В цифрах и таблицах. // Электроника: наука, технология, бизнес. 2005, №8.6. 69000 HiQVideo Accelerator with Integrated Memory. Data Sheet Revision13. // Chips and Technologies, Inc. August 1998
6. MB87J2120 & MB87P2020 -A. Lavender & Jasmine, Colour LCD/CRT/TV Controller Specification. // Fujitsu Microelectronics Europe GmbH.
7. Mobile Computer Display Controller, Preliminary Version 1.3. // Silicon Motion , Inc.
8. Scheifler R.W., Gettys J. X Window System: the complete reference to Xlib, X Protocol ICCCM, XLFD.// 3-rd edition.
9. Ю.Шишарин С. Российские производители микросхем. Пути выхода из кризиса // PCWeek/RE. 2003, № 111.. Кузнецов С.Н. Встраиваемые системы для военных и космических применений.// PCWeek/RE. 2000, №18.
10. Krinitsin V. Pentium 4 and Athlon XP: Thermal Conditions//http://www.digit-life.com13. http://ebusiness.artisan.com/index.html
11. QUALIFIED MANUFACTURERS LIST OF PRODUCTS QUALIFIED UNDER PERFORMANCE SPECIFICATION MIL-PRF-38535 INTEGRATED CIRCUITS (MICROCIRCUITS) MANUFACTURING
12. GENERAL REQUIREMENTS FOR. // QML-38535-20. 2-Feb-2007
13. Glasow A., Fischer A.H. A comparison of reliability aspects of a 0.35jam and 0.18|дт process copper metallization // Invited Paper Advanced Metallization Conference-2000. http://www.copper-reliability.com/own-paper/AMC-2000.pdf
14. Black J.R. Electromigration — A brief survey and some recent result// IEEE Trans. On electron devices.- ED-16-1969.- C.338-347
15. A Scaling Scheme for Interconnect in Deep-Submicron Processes/ Rahmat K., Nakagawa O.S., Oh S-Y., Moll J., Lynch W.T.// http://www.hpl.hp.com/techreports/95/HPL-95-123.pdf
16. Cadence CRITICAL NANOMETER DESIGN ISSUES// http://nanometer.cadence.com/criticalissues.html
17. Glasow A.von, Fischer A.H. Electromigration and Stressmigration Failure Mechanism Studies in Copper Interconnects// ПТС 2002 http://www.copper-reliability.com/Myresults.htm
18. Linux Xfree86 // http://emanual.ru/download/www.eManual.ru2979.html
19. Что такое DirectX? // http://emanual.ru/download/wvvw.eManual.ru40.html
20. ГукМ. Аппаратные интерфейсы ПК. // СПб.: Питер, 2003. 528 стр, илл.
21. Andy Cockburn, Bruce McKenzie. Evaluating the Effectiveness of Spatial Memory in 2D and 3D Physical and Virtual Environments. // http://citeseer.ist.psu.edu/479772.html
22. A. H. Рыбаков, Т. И. Зеленова. Локальная шина PCI: обзор. // "Средства и системы компьютерной автоматизации" http://www.asutp.ru/?p=600186
23. Рой Вебстер. РМС-мезонины выходят в лидеры коммуникационной отрасли.// "Средства и системы компьютерной автоматизации" -http://www.asutp.ru/?p=600020
24. А.Лапин. Средства отображения информации. // Электроника: наука, технология, бизнес 2005, №8.
25. Средства отображения информации. Каталог НПО "Интеграл". // Минск. -2005.
26. В.Майская. Возможны перемены. ДОЗУ идут на смену СОЗУ. // Электроника: наука, технология, бизнес. 2003, №8.
27. А.Веселов. Микросхемы памяти фирмы Samsung Electronics. Обзор продукции. // Электроника: наука, технология, бизнес. 2002, №1.
28. М.Валентинова. Экзотическая память. Гонки продолжаются. // Электроника: наука, технология, бизнес. 2001, №6.
29. Пол Марш. Будущее плоскопанельных дисплеев. // CIE 1999, №5.
30. Ю.Адамов, Я.Губин, А.Сибагатуллин. Интегральные схемы для видеоинтерфейса жидкокристаллических панелей. // Электроника: наука, технология, бизнес. 2005, №8.
31. Altera, Processor & Peripheral Megafunction, AMPP, // http://www.altera.com/.
32. В.Майская. ПЛИСы всякие нужны, ПЛИСы всякие важны. // Электроника: наука, технология, бизнес. 2005, №3.
33. А.Лохов, А.Рабоволюк. Средства проектирования FPGA компании MENTOR GRAPHICS. // Электроника: наука, технология, бизнес. 2004, №4.
34. А.Погорилый, А.Соколов. Отладка устройств, реализованных на ПЛИС. Логический анализатор, размещенный внутри ПЛИС. // Электроника: наука, технология, бизнес. 2004, №4.
35. В.Майская. Программируемые логические микросхемы. // Электроника: наука. технология, бизнес. 2004, №4.
36. Эгрон Ж. Синтез изображений. Базовые алгоритмы: Пер. с франц. // М.: Радио и связь. 1993. - 216 е.: ил.
37. Е. Угрюмов Цифровая схемотехника. // СПб.: Санкт-Петербург, 2001. 528 с.
38. Савельев А. Я. Арифметический и логические основы цифровых автоматов: Учебник. // М.: Высшая школа, 1980. 255 е., ил.
39. Баранов В.П. Синтез микропрограммных автоматов. // М.: Нолидж. 1997. -376 с.
40. Е. А. Никулин. Компьютерная геометрия и алгоритмы машинной графики. // СПб: "БХВ-Петербург" 2003 г - 560 стр.43. 20-графика / Многоугольники, отрезки Сборник программ // http://blitzetc.boolean.name/codelib/2d-polygons.htm
41. М.Петров, С.Заболотский. Оптимизированная структура FPGA для продукции массового спроса. Микросхемы Lattice ЕСР/ЕС // Электроника: наука, технология, бизнес. 2005, №3.
42. А.Филатов. Становление нового сегмента рынка FPGA. Экономичные системные решения на FPGA. // Электроника: наука, технология, бизнес. 2005, №3.
43. Вирт Н. Алгоритмы и структуры данных. Пер. с англ. // М.: Мир, 1989.- 360 с.
44. Бобровский С. Алгоритмы, применяемые в играх. // http://maker.dn.farlep.net/? article=4&b=l
45. В.Беляев. Средства отображения информации на старте тысячелетия. // Электроника: наука, технология, бизнес. 2001, №6.
46. Баранов И. Применение графических дисплеев взамен символьных моделей. // Новости электроники. 2006, №2.
47. Graphics Performance Accelerators (GPA) //http://www.intel.com/support/motherboards/desktop/d815eea2/sb/cs-013029.htm
48. Акритас А. Основы компьютерной алгебры с приложениями. Перевод с английского Панкратьева Е.В. // М.:"Мир",1994
49. А.Н. Рыбаков. Военный аспект. // Средства и системы компьютерной автоматизации. http://www.asutp.ru/?p=600206)
50. Ким Рубин. Десять заповедей проектирования устройств ввода/вывода. // Средства и системы компьютерной автоматизации. http://www.asutp.ru/?p= 600238
51. Жданов А.А. Операционные системы реального времени // PCWeek/RE -1999, №8.
52. Жданов А, Латыев А. Замечания о выборе операционных систем при построении систем реального времени. // PCWeek/RE. 2001, № 1.
53. Джон Фогелин, Хан Квинг. Реализация высокой готовности во встраиваемых системах.// Средства и системы компьютерной автоматизации. -http://www.asutp.ru/?p=600410
54. Бевз А, Хохловский В. Компания ШНЕИДЕР: Системы верхнего уровня для отображения технологической информации и управления // http://www.asutp.ru/? р=600380
55. Рыбак О. С. Графический инструментарий в SCADA-системе Citect. // http://www.rtsoft.ru/ru/
56. Jerry Fiddler. Linux In Embedded System: Where Are The Benefits? // http://www.windriver.com/
57. OpenGL ES* 1.0 Framework Software Developer's Guide, White Paper // http://www.intel.com/design/pca/companion/whitepapers/30327202.pdf
58. Разевиг В. ГИС и САПР: что нового. // PCWeek/RE. 2000, № 2
59. Rob Pike, Bart Locanthi, John Reiser. Hardware/Software Tradeoffs for Bitmap Graphics on the Blit //http://citeseer.ist.psu.edU/cache/papers/cs/15744/http:zSzzSzcm.bell-labs.comzSzcmzSzcszSzdoczSz87zSzarchtr.pdf/pike85hardwaresoftware.pdf
60. Jian Huang, Roni Yagel, Vassily Filippov, and Yair Kurzion. An Accurate Method To Voxelize Polygonal Meshes //http://citeseer.ist.psu.edU/cache/papers/cs/12886/http:zSzzSzreality.sgi.comzSzyairen grzSzpaperszSzpolygon.pdfZhuang98accurate.pdf
61. Selection of commonly used terms in embedded graphics. // http://www.fujitsu.com/emea/services/microelectronics/displaycontrollers/glossary/
62. Rob Pike. The Blit: A Multiplexed Graphics Terminal // http://citeseer.ist.psu.edu/ pike84blit.html
63. Rob Pike. Graphics in Overlapping Bitmap Layers // http://citeseer.ist.psu.edu/pike83graphics.html
64. Rob Pike. 8,5, the Plan 9 Window System. // http://citeseer.ist.psu.edu/10933.html
65. NS32FX161-15NS32FX161-20NS32FX164-20
66. NS32FX164-25NS32FV16-20NS32FV16-25 Advanced Imaging Communication Signal Processors //http://citeseer.ist.psu.edu/494819.html
67. Steven Roth. Interactive Graphic Design Using Automatic Presentation Knowledge (1994). // http://citeseer.ist.psu.edu/roth94interactive.html
68. Marc A. Najork, Marc H. Brown. A Library for Visualizing Combinatorial Structures (1994) //http://citeseer.ist.psu.edu/najork941ibrary.html
69. D. Michelucci. Arithmetic Issues in Geometric Computations. // http://citeseer.ist.psu.edu/michelucci96arithmetic.html ,
70. D. F. Wiley, H. R. Childs, B. F. Gregorski, B. Hamann, К. I. Joy. Contouring Curved Quadratic Elements (2003) // http://citeseer.ist.psu.edu/wiley03contouring.html
71. Dieter W. Fellner, Martin Fischer. A 2D Graphics Interface Based on CGI. -http://citeseer.ist.psu.edu/fellner93graphics.html
72. Robert W. Lindeman, John L. Sibert, James K. Hahn. Hand-Held Windows: Towards Effective 2D Interaction in Immersive Virtual Environments -http://citeseer.ist.psu.edu/lindeman99handheld.html
73. Gareth Smith. Cooperative Virtual Environments: lessons from 2D multi user interfaces. http://citeseer.ist.psu.edu/smith96coopcrative.html
74. Ю.Борисов. Отечественная электронная промышленность и компонентная база. Перспективы развития // Электроника: наука, технология, бизнес. 2006, №2.
75. А.Садчихин, С.Созинов, А.Морозов. Программно-аппаратные комплексы на основе отечественных составных экранов // Электроника: наука, технология, бизнес 2005, №8.
76. В.Телец, С.Цыбин, А.Быстрицкий, С.Подъяпольский. ПЛИС для космических применений. Архитектурные и схемотехнические особенности. // Электропика: наука, технология, бизнес. 2005, №6.
77. В.Майская. LVDS-устройства. Гигабиты за милливатты. // Электроника: наука. технология, бизнес. 2005, №7.
78. В.Ломакин. Высокопроизводительные микропроцессоры/микроконтроллеры класса "система на кристалле". // Электроника: наука, технология, бизнес. 2005, №7.
79. Е.Дмитриев. Разработка элементной базы фотоприемных устройств отображения видеоинформации. // Электроника: наука, технология, бизнес. 2005, №2.
80. А.Бухтеев, В.Немудров. Системы на кристалле. Новые тенденции. // Электроника: наука, технология, бизнес. 2004, №3.83. http://www.altera.com/products/devices/dev-index.jsp
81. Бриндли К., Карр Дж. Карманный справочник инженера электронной техни-ки./Пер. с англ. // М.: Издательский дом «Додека XXI», 2002. - 480 стр., ил.85. http://wvvw.s3graphics.com/
82. И. Каршенбойм. Микросхемы FPGA фирмы Actel //Компоненты и технологии 2002, №3
83. Ракович Н.Н. TFT-дисплеи — информативно, функционально, просто // Компоненты и технологии. 2002, №4
84. Александр Самарин. Обзор современных цифровых дисплейных интерфейсов для плоских экранов // Компоненты и технологии. 2006, №1
85. Ракович Н.Н. Одноплатные компьютеры VersaLogic: ни мороз им не страшен, ни жара // Компоненты и технологии. 2004, №9
86. Интервью с начальником 22 ЦНИИС МО РФ контр-адмиралом Ю. И. Степановым «Об особенностях применения импортных компонентов в военной и специальной технике» // Компоненты и технологии. 2007, №1
87. Грег Роуз. Вопросы успешного применения ОС Linux во встраиваемых системах // Мир компьютерной автоматизации. 2002, № 3
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.