Технология когнитивной интерпретации гетерогенных данных средствами визуализации тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат наук Шкляр Алексей Викторович
- Специальность ВАК РФ05.13.17
- Количество страниц 175
Оглавление диссертации кандидат наук Шкляр Алексей Викторович
Введение
Глава 1. Визуализация данных и ее проблемы
1.1 Группа обоснования
1.1.1 Таксономия
1.1.2 Негативные факторы
1.1.3 Предварительная информированность
1.1.4 Эстетика восприятия
1.2 Группа оценки
1.2.1 Инсайт
1.2.2 Адекватность
1.2.3 Масштабируемость
1.2.4 Требовательность
1.2.5 Ресурсоемкость визуализации
1.3 Целесообразность использования визуализации
1.4 Модель данных
1.4.1 Гетерогенные данные
1.4.2 Визуальная модель данных
1.4.3 Методика и технология интерпретации данных
1.5 Сравнение способов интерпретации данных
1.5.1 Преимущества компьютерных вычислений
1.5.2 Преимущества человеческого мышления
1.5.3 Семантическое взаимодействие
1.6 Визуализация и информационные процессы
1.6.1 Основания аналогии
1.6.2 Источники гетерогенных данных
1.6.3 Информационная избыточность
1.7 Принципы восприятия
1.7.1 Константность
1.7.2 Целостность восприятия
1.7.3 Обобщенность
1.7.4 Предметность восприятия
1.7.5 Движение
1.7.6 Восприятие цвета
1.8 Схемы процессов визуализации
1.8.1 Схема Ван Вийка (Van Wijk)
1.8.2 Схема взаимодействия М. Спайви (M. Spivey)
1.8.3 Схема Д. Рассела (D. Russell )
1.8.4 Схема П. Пиролли (P. Pirelli)
1.9 Критерии выбора визуального представления
1.9.1 Неопределенность
1.9.2 Содержательность
1.9.3 Новизна
1.9.4 Матрица характеристик
1.10 Актуальные задачи в развитии визуализации информации
Выводы по главе
Глава 2. Результативность визуального исследования
2.1 Определения основных понятий
2.1.1 Процессы когнитивной интерпретации
2.1.2 Количественная характеристика визуальной модели
2.2 Структурная единица визуального анализа
2.2.1 Прямые процессы (Ер)
2.2.2 Обратные процессы (Ев)
2.2.3 Визуальное взаимодействие (Еу)
2.2.4 Цикличное использование структурной единицы
2.3 Формальное описание процесса визуализации
2.4 Составляющие комплексного подхода
2.4.1 Семиотическая составляющая
2.4.2 Субъективная составляющая
2.4.3 Функциональная составляющая
2.5 Структурная схема визуализации
2.6 Классификация задач анализа
2.6.1 Иконическая модель
2.6.2 Задача визуального информирования
2.6.3 Задача визуального обучения
2.6.4 Задача использования экспертного мнения
2.6.5 Аналитические визуальные модели
2.7 Технология когнитивной интерпретации гетерогенных данных
2.7.1 Управление результативностью
2.7.2 Обоснование предлагаемой технологии
2.7.3 Когнитивная результативность Жсот(Т)
2.7.4 Конструктивная результативность Жсгесае(Т)
2.7.5 Интерактивная результативность Жтапаёе(Т)
2.7.6 Декомпозиционная оценка функции визуального представления
2.7.7 Разработанный алгоритм построения средств визуализации
2.7.8 Методика проведения визуального исследования
2.7.9 Этапы технологии когнитивной интерпретации
Выводы по главе
Глава 3. Использование технологии когнитивной интерпретации гетерогенных данных
3.1 Динамические визуальные модели
3.1.1 Использование восприятия движения
3.1.2 Информативность динамических знаков
3.1.3 Возможности динамических знаков
3.1.4 Интерактивность
3.2 Задача оценки изученности
3.2.1 Постановка задачи
3.2.2 Реализация технологии когнитивной интерпретации
3.2.3 Резюме решения задачи
3.3 Задача определения критериев схожести
3.3.1 Постановка задачи
3.3.2 Применение технологии когнитивной интерпретации
3.3.3 Резюме решения задачи
3.4 Задача аналитического исследования медико-биологических данных
3.4.1 Постановка задачи
3.4.2 Применение технологии когнитивной интерпретации
3.4.3 Резюме решения задачи
3.5 Комплексная характеристика визуальной модели
3.6 Программное обеспечение «Аналитический визуализатор данных»
3.7 Выводы по главе
Глава 4. Результативность использования средств визуализации
4.1 Программное обеспечение
4.2 Оценка ресурсоемкости построения модели данных
4.2.1 Повторяемость
4.2.2 Объем исходных данных
4.2.3 Размерность данных
4.2.4 Результативность использования классификации задач
4.3 Оценка результативности интерпретации
4.3.1 Обучение, сомнение, рефлексия
4.3.2 Информативность воспринимаемых факторов
4.3.3 Оценка общей результативности
4.4 Разные данные и разные задачи
4.5 Вычислительная результативность
4.6 Комплексная характеристика средства визуализации
4.7 Оценка результативности решений практических задач
4.7.1 Исследование медико-биологических данных
4.7.2 Анализ многомерных экспериментальных и литературных данных о металломатричных композитах
Выводы по главе
Заключение
Список литературы
Приложение
Приложение
Приложение
Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК
Математическое обеспечение и информационная технология поддержки нечетких когнитивных моделей управления слабоструктурированными социально-экономическими системами2021 год, кандидат наук Исаев Руслан Александрович
Метод оценки динамической воздушной обстановки на конфликтность посредством полихромного отображения объектов в информационном обеспечении диспетчера управления воздушным движением2023 год, кандидат наук Пономарев Кирилл Юрьевич
Алгоритмическое и программное обеспечение человеко-машинных интерфейсов с когнитивно-графическим отображением информации для систем космического назначения2020 год, кандидат наук Емельянова Юлия Геннадиевна
Многовариантное моделирование и алгоритмизация принятия решений на основе классификации и визуальной трансформации медицинской информации1998 год, доктор технических наук Попова, Ольга Борисовна
Развитие технологии цифровой постобработки видеоматериала на основе средств поверхностного моделирования и методов цветокоррекции2019 год, кандидат наук Янчус Виктор Эдмундасович
Введение диссертации (часть автореферата) на тему «Технология когнитивной интерпретации гетерогенных данных средствами визуализации»
Введение
Актуальность исследования. Развитие сфер деятельности человека, основанных на применении цифровых технологий, делает актуальным создание средств обработки, передачи и хранения больших объемов данных. Существующие подходы к исследованию эмпирических данных обладают рядом недостатков, к которым следует отнести их значительную ресурсоемкость и высокие требования к подготовке специалистов, участвующих в исследовании [109]. Потенциальные возможности визуализации сформировали условия для ее привлечения к решению актуальных задач во многих сферах человеческой деятельности: медицина, техника, экономика, юриспруденция и т.д. Одним из прикладных направлений в развитии визуализации, обладающим возрастающей актуальностью, становится разработка технологии когнитивной интерпретации, применимой для исследования больших объемов гетерогенных данных.
Вопросам, связанными с интерпретацией визуальных образов и развитием семиотического подхода посвящены работы исследователей: I. Biederman, J.J. Gibson, B. Shneiderman, E.R. Tufte, Д.А. Поспелов, А.А. Зенкин, в последние годы - C. Chen, N. Elmqvist, L. Itti, R. Mazza, P. Pirolli, W. Ribarsky, D. Sacha, B. Tversky, C.Ware, J.J. van Wijk, В. Л. Авербух, А.Е. Бондарев, В.А. Галактионов, А.А. Кули-нич, Л.В. Массель, Г.С. Осипов, А. Соломоник и др. Вопросы, относящиеся к исследованиям, смежным с рассматриваемым направлением, освещаются в работах по компьютерному моделированию, психологии восприятия, системному анализу и в ряде других. В работе проведен анализ и обобщение существующих теоретических подходов к визуализации, в том числе, схемы взаимодействия М.Спайви (2007г.), Д. Рассела (1993г.), Ж. Ван Вийка (2005 г.), П. Пиролли (2005 г.).
Сложность извлечения новых знаний в результате интерпретации гетерогенных данных с применением средств визуализации связана с недостаточной обоснованностью существующих подходов к визуализации, необходимостью междисциплинарных исследований и отсутствием формализованного подхода к решению задач визуального исследования таких данных [18]. С другой стороны,
растущая потребность в развитии средств визуализации делает актуальным рациональное использование потенциала современных компьютерных технологий и любых иных привлекаемых ресурсов.
Данная работа направлена на обоснование привлечения когнитивного потенциала визуализации к получению новых знаний при обработке больших объемов гетерогенных данных. Существующие примеры использования средств визуализации позволяют предположить, что их результативность может быть существенно улучшена благодаря активному использования собственного потенциала исследователя, в том числе. информативного, когнитивного, эмоционального. Кроме того, систематизация усилий, прилагаемых к разработке и применению средств визуализации, является необходимым условием для достижения высокой интерпретируемости исследуемых данных, обеспечивая получение новых знаний. Создание средств визуального исследования, обладающих предсказуемой и управляемой результативностью позволит расширить их практическое применение в качестве прикладного инструмента в научных исследованиях.
В настоящее время, привлечение и активное использования когнитивного потенциала исследователя являются пассивными резервами существующих средств исследований. Целенаправленное использование этих резервов при разработке средств визуализации способно увеличить их практическую значимость в качестве инструмента для исследования больших объемов гетерогенных данных.
Цель диссертационной работы — разработка технологии когнитивной интерпретации гетерогенных данных, использующей возможности и средства визуализации для получения новых знаний.
Для достижения поставленной цели в работе были решены следующие задачи:
1. Создание системы понятий и их определений, структурирующей описание процессов визуализации.
2. Разработка алгоритма построения средств визуализации, обеспечивающего увеличение общей результативности исследования.
3. Разработка методики проведения исследования гетерогенных данных с использованием средств визуализации, направленной на привлечение когнитивной интерпретации визуализации для достижения цели исследования.
4. Создание технологии результативного обнаружения новых знаний, основанной на методичном использовании средств визуализации.
5. Апробация разработанных средств визуализации при решении практических задач исследования данных.
Объект исследований — технологии обнаружения новых знаний, обеспечивающие интерпретацию больших объемов гетерогенных данных.
Предмет исследований — средства визуализации и их применение в качестве инструментов интерпретации гетерогенных данных, позволяющие результативно использовать доступные ресурсы для получения новых знаний.
Методы исследования. Основой исследований являются теоретические схемы визуализации отечественных и зарубежных исследователей в области компьютерной визуализации, современные подходы к вопросам семиотики, анализа данных, оценки зрительного восприятия. Использован понятийный аппарат системного анализа, лингвистики, психологии восприятия, математический аппарат теории множеств.
Научная новизна диссертационной работы. К научной новизне следует отнести следующие результаты диссертационной работы:
1. Предложен новый комплексный подход к визуализации гетерогенных данных, позволивший ввести определение общей результативности визуального исследования и классификацию задач визуализации. (Пункт 2 области исследований паспорта специальности 05.13.17)
2. Разработан оригинальный алгоритм построения средств визуализации, отличающийся адаптацией создаваемых инструментов к условиям задачи исследования гетерогенных данных и когнитивным возможностям пользователя. (Пункты 4, 8 области исследований паспорта специальности 05.13.17)
3. Впервые предложена методика проведения визуального исследования гетерогенных данных с использованием созданных средств визуализации, обеспечивающая совместное использование вычислительных и когнитивных ресурсов. (Пункт 13 области исследований паспорта специальности 05.13.17)
4. Разработана технология когнитивной интерпретации гетерогенных данных, позволяющая увеличить результативность получения новых знаний в результате выполнения обоснованных этапов создания и использования средств визуализации. (Пункты 5, 7 области исследований паспорта специальности 05.13.17)
Теоретическая значимость.
1. Разработана новая общая схема визуализации, систематизирующая создание и применение средств визуализации.
2. Предложена технология когнитивной интерпретации, объединяющая когнитивные и вычислительные ресурсы при исследовании гетерогенных данных.
3. Обосновано использование средств визуализации в качестве аналитического инструмента, предназначенного для получения новых знаний.
4. Решена проблема количественной оценки потенциала средств визуализации, обеспечивающая увеличение результативности новых аналитических инструментов.
5. Предложена система понятий и определений визуализации, необходимая для решения задачи междисциплинарного взаимодействия при исследовании гетерогенных данных.
Практическая значимость работы. Практическая значимость диссертационной работы заключается в создании средств визуализации, направленных на изучение гетерогенных данных и применимых в ряде практических исследований. К таким исследованиям относятся: определение степени изученности предметных областей, поддержка экспертных заключений в нефтегазовой отрасли, получение предварительных данных для проведения аналитического медико-биологических исследований.
Результаты исследований использовались в следующих научно-исследовательских проектах:
1. Ряд НИР по проектированию разработки месторождений нефти и газа Томской области (дог. №15.12-445/2017у от 14.08.2017 г., №15.12-444/2017у от 14.08.2017 г., №15.12-210/2017у от 13.06.2017 г., №4-693/17 от 13.02.17 г.).
2. Грант Российского научного фонда, проект №2 18-11-00215 «Построение и визуальный анализ многомерных данных».
3. Грант Российского фонда фундаментальных исследований №19-07-00844 А по теме «Новые методы формирования и применения многомерных визуальных моделей для представления, обработки, анализа, интерпретации и использования больших мультисенсорных данных».
4. НИР «Исследование эмпирических данных о современном состоянии изученности процессов, связанных с получением карбида кремния электродуговым методом» (дог. пожертвования денежных средств между компанией BP и ТПУ 9936 от 30.05.2017. Проект «Получение порошковых материалов на основе карбида кремния»)
При выполнении диссертационной работы получено 2 свидетельства о государственной регистрации программы для ЭВМ.
Практическая значимость работы подтверждена актами внедрения результатов диссертационного исследования в ООО «Западно-Сибирская компания», использования в учебном процессе в Томском политехническом университете (дисциплины «Компьютерное моделирование», «Информационные технологии в промышленном дизайне», «Компьютерная графика в промышленном дизайне»).
Положения, выносимые на защиту. 1. Предложенный комплексный подход и разработанная на его основе классификация задач визуализации увеличивают результативность когнитивной интерпретации в результате обоснования свойств и требований, предъявляемых к средствам визуализации (сокращение времени построения средства визуализации на 25%).
2. Разработанный алгоритм формализует процесс построения средств визуализации, предназначенных для интерпретации гетерогенных данных, и увеличивает общую результативности получения знаний (на 5-11%).
3. Предложенная методика проведения визуального исследования увеличивает результативность средств визуализации в результате совместного использования вычислительных и когнитивных ресурсов (сокращение времени формирования гипотезы на 40%).
4. Технология когнитивной интерпретации позволяет разрабатывать и применять средства визуализации для получения новых знаний при решении практических задач интерпретации гетерогенных данных (всех типов). Апробация работы. Основные положения и выводы диссертационного исследования обсуждались на 9 научных и научно-практических конференциях: ГрафиКон-2015, 25-я Международная конференция по компьютерной графике и зрению (Протвино, 22-25 сентября 2015 г.); ГрафиКон-2016, 26-я Международная конференция и школа-семинар по компьютерной графике и зрению (Нижний Новгород, 19-23 сентября 2016 г.); ГрафиКон-2017, 27-я Международная конференция по компьютерной графике и машинному зрению (Пермь, 24-28 сентября 2017 г.); ГрафиКон-2018, 28-я Международная конференция по компьютерной графике и машинному зрению (Томск, 23-27 сентября 2018 г.); ВМСППС'2017, 20-я Юбилейная Международная конференция по Вычислительной механике и современным прикладным программным системам (Алушта, 24-31 мая 2017 г.); CIT&DS 2017, Creativity in intelligent technologies & Data science (12-14 September, 2017, Volgograd, Russia); СПММОИиПВ-2017, Международная научная конференция «Современные проблемы математического моделирования, обработки изображений и параллельных вычислений 2017» (пос. Дивноморское, г. Геленджик, Краснодарский край, 4 - 11 сентября 2017 г.); XXIII Байкальская Всероссийская конференция с международным участием «Информационные и математические технологии в науке и управлении» (Иркутск, 29 июня - 8 июля 2018г.); Международная научно-практическая конференция «Молекулы и системы для диагностики и адресной терапии» (Томск, Россия, 1-3 ноября 2017 г.).
Публикации по теме работы. Основные результаты диссертационной работы изложены в 23 печатных работах, в том числе 9 опубликованы в рецензируемых изданиях, рекомендованных ВАК РФ, 3 - в изданиях, индексируемых в международных базах Scopus, Web of Science, 11 - опубликованы в периодических изданиях, входящих в список РИНЦ. Получены 2 свидетельства о регистрации программы для ЭВМ.
Личный вклад автора. Основные научные результаты, изложенные в диссертационной работе, получены автором: обоснован и сформулирован комплексный подход к визуализации данных, разработан и апробирован алгоритм построения средств визуализации, предложена методика проведения визуального исследования, разработана и применена в решении ряда практических задач технология когнитивной интерпретации, разработано и зарегистрировано необходимое программное обеспечение. Постановка задач и формулировка положений научной новизны, дизайн эксперимента, обсуждение и корректировка материалов велись совместно с научным руководителем.
Апробация результатов исследований при решении практических задач выполнена совместно с Паком А.Я., Петровым В.А., Завьяловым Д.А., Вехтер Е.В.
Структура и объем диссертационной работы. Объем диссертационной работы составляют: основной текст - 153 страницы (введение, 4 главы, заключение, список источников - 122 наименования), 3 приложения, таблиц - 18, рисунков - 65.
Глава 1. Визуализация данных и ее проблемы
На современном этапе развития средств информационной коммуникации визуализация рассматривается как доминирующая форма информационного взаимодействия [6]. Однако, к настоящему моменту не сформирован единый подход к изучению и использованию возможностей визуализации в качестве инструмента научного исследования. Одним из затруднений в этом направлении является необходимость проведения объемных междисциплинарных исследований, для которых характерными препятствиями являются формирование общего определения объекта исследований и применимость специализированных методов, соответствующих узким предметным областям [53].
Естественным следствием становится существование двух подходов к созданию средств визуализации, отличающихся способами представления и интерпретации данных:
• Создание универсальных систем, ориентированных на широкое практическое применение. Универсальные системы визуализации характеризуются наличием типового набора информационных объектов и соответствующих ему способов визуального представления [39, 49, 65, 82, 118]. Задачей разработчика средств визуализации является создание алгоритма перевода исследуемых данных в представление, опирающееся на библиотеку типичных объектов.
• Разработка узкоспециализированных систем, ориентированных на использование в ограниченной предметной области [36, 43, 81, 87]. Для специализированных систем визуализации характерно создание и развитие способов визуализации, учитывающих особенности ограниченной предметной области, традиционные способы представления информации и существующие методы исследований. Естественным недостатком специализированных систем является недостаточная применимость для решения задач, имеющих междисциплинарный характер или связанных с исследованием объектов, не имеющих определенного типа.
Неизбежным эффектом использования визуализации, согласно [1], является влияние на сознание наблюдателя через формирование новой информационной реальности, связанное с иллюзией объективности визуализации в процессе ее интерпретации. Для существующих систем визуализации использование указанного эффекта является резервом, привлечение которого затруднено отсутствием систематизированного подхода к использованию когнитивных аспектов визуализации. Таким образом, одним из актуальных вопросов следует считать исследование соотношения в интерпретации информативного образа объективной и субъективной составляющих. В данном случае, указано на необходимость учета как свойств интерпретируемого образа, так и условий его создания, специфики восприятия, культурной традиции и иных аспектов [121]. Следовательно, в научной визуализации возникает необходимость в согласованном использовании методов семиотики, риторики, поэтики, лингвистики, психоанализа, феноменологии, герменевтики и т.д. [119]
Вывод 1.1 Для преодоления ограничений, существующих в каждом из указанных подходов, необходимо создание гибкого универсального подхода, реализующего потенциал визуализации как инструмента передачи, интерпретации и хранения данных при решении широкого круга практических задач.
Известен ряд вопросов, которые препятствуют реализации потенциала визуализации в качестве инструмента для исследования данных различного типа [29, 90]. В исследованиях [30] сформулированы положения, указывающие на необходимость учета при анализе визуальных образов нескольких уровней дополнительной информации: технологического, лингвистического, жанрового, эстетического, идеологического. Анализ примеров фактического применения визуализации, в том числе для проведении научных исследований [45, 58, 83], позволил выделить наиболее актуальные вопросы, ответы на которые дают основания для обоснованного практического использования визуализации. В результате систематизации усилий, направленных на разработку средств визуального исследования данных [55, 79, 88], выделенные вопросы могут быть разделены на две группы:
• группа обоснования — вопросы, связанные с ошибками в понимании внутренних закономерностей визуализации;
• группа оценки — вопросы, связанные с получением количественных характеристик для сравнения между собой различных средств визуализации [2]. Для привлечения визуализации к исследованию гетерогенных данных в диссертационном исследовании изучены обе группы вопросов. Полученные результаты являются обоснованием технологии когнитивной интерпретации.
1.1 Группа обоснования
В результате обобщения опыта практического использования средств визуализации для решения практических задач обработки данных [35, 62, 64], к группе обоснования отнесены следующие вопросы:
1.1.1 Таксономия
Определение единой таксономии визуализации, включающей определения основных понятий и их отношения между собой. Создание системы понятий, описывающих объекты и процессы визуализации (Рис. 1), необходимо для развития и практического использования визуализации, т.к. обеспечивает совместную деятельность исследователей, обладающих разным научным мировоззрением, опытом и подходами к использованию визуализации.
ИСХОДНЫЕ ДАННЫЕ
Аналитические Эмпирические Базы данных
ПОДГОТОВКА
Фильтрация данных
Препроцессинговая обработка
ВИЗУАЛЬНАЯ МОДЕЛЬ
Цифровая модель Методы визуализации Образ данных
Рис. 1 Процесс визуального исследования
1.1.2 Негативные факторы
Выделение факторов, препятствующих достижению пользователем необходимого понимания. Некоторые из них обозначены в [37, 101] и отнесены к проблемам информационной визуализации, однако, могут быть отнесены к визуализации в целом.
1.1.3 Предварительная информированность
Использование предварительной информированности пользователя в процессе интерпретации зрительного образа данных [73]. Под предварительной информированностью понимаются все накопленные наблюдателем знания и опыт, так как предполагается, что они в значительной мере определяют его мышление и, следовательно, становятся основанием для интерпретации визуализированной информации. Предварительная информированность включена в группу обоснования для возможности учета квалификации потенциального исследователя при разработке средств визуализации.
1.1.4 Эстетика восприятия
Использование влияния визуализации на зрителя [78]. Примером является несомненное влияние эстетики восприятия на понимание. При выборе правила сопоставления между данными и образом, эстетика восприятия может выступать в качестве субъективной, но быстрой меры оценки результатов визуализации. Вывод 1.2 Группа обоснования сформирована для определения необходимых составляющих технологии когнитивной интерпретации: единая таксономия, предварительное исследование, создание визуального образа данных, интерпретация образа данных. Разработка указанных составляющих должна решить задачу использования визуализации в качестве самодостаточного инструмента для исследования данных.
1.2 Группа оценки
В группу оценки, по результатам обобщения современных подходов к использованию и пониманию визуализации [29, 31, 50, 72, 106], отнесены вопросы определения сравнительных характеристик средств визуализации.
1.2.1 Инсайт
Термин «понимание» в значительной мере совпадает с понятием «инсайт» (insight) [96], для которого определены свойства, на основании которых возможен переход к количественным характеристикам понимания. Глубина инсайта отражает объем новых знаний, полученных исследователем при осмыслении вопроса или интерпретации визуально воспринимаемого объекта, а также комплексность -число связей с другими понятиями или областями знания.
Целью визуализации является достижение инсайта необходимой глубины [63]. Достигнутая глубина инсайта определяет число и разнообразие вопросов, ответы на которые могут быть получены на основании новых знаний. Указанная цель визуализации и понятие глубины инсайта могут быть использованы для определения ценности полученных знаний — оцениваемой характеристики итогов визуального исследования [21].
1.2.2 Адекватность
При исследовании значительных объемов данных и создании их визуального представления возникают затруднения, влияющие на общий результат:
1 Трудоемкость получения визуального образа данных.
2 Сложность интерпретации насыщенного визуального образа.
3 Определение свойств данных, которые являются значимыми факторами для решаемой задачи. Решение о способе использования или управления этими свойствами принимается исследователем.
4 Выделение и управление обстоятельствами, которые относятся к особенностям визуализации, не связаны с визуализируемыми данными, но влияют на результат интерпретации.
Способность разработанного способа визуализации данных к преодолению названных затруднений определена как адекватность визуализации — характеристика, принадлежащая группе оценки.
Определение 1.1 Адекватность визуализации — наличие в визуальном образе элементов, способных сообщить наблюдателю значения всех существенных, в контексте решаемой задачи, данных [10].
1.2.3 Масштабируемость
Современные средства получения цифровых данных расширяют задачу обработки больших объемов данных, дополняя ее необходимостью исследования изменяющихся данных. Широкое прикладное значение имеют решения задач, связанных с обработкой данных и принятием управляющих решений в режиме реального времени [116]. Использование визуализации для изучения гетерогенных данных, выдвигает требование масштабируемости для визуального представления данных [33, 59]. Масштабируемость визуализации существенна в случае переформулирования задачи исследования гетерогенных данных в частный вариант изучения лишь части данных или в вариант задачи с накоплением данных.
1.2.4 Требовательность
Широкое распространение технологий компьютерной визуализации и их непрерывное усложнение создает трудности при взаимодействии пользователя и средств визуализации [75]. Существует необходимость постоянного обучения пользователей средств визуализации навыками визуальной коммуникации. Это обстоятельство становится критически важным в ситуации, когда средства визуализации обеспечивают совместное участие в работе группы исследователей или являются способом обмена информацией между специалистами с различным уровнем подготовки или областью специализации.
1.2.5 Ресурсоемкость визуализации
Анализ существующих подходов к измерению сложности производимых исследователем вычислений или трудоемкости совершаемых операций [47] показывает отсутствие аналогичных терминов, применимых к визуализации и ее
практическому использованию. Выделим свойства визуализации, аналогичные определению сложности алгоритмов [27]:
• Ресурсоемкость визуализации — величина, определяемая ресурсами, привлеченными к достижению цели исследования с применением средств визуализации.
• Значимость ресурсов — формальный параметр, характеризующий необходимость использования различных видов ресурсов при проведении исследования данных, а также их взаимозаменяемость.
1.3 Целесообразность использования визуализации
Замена традиционных средств исследования гетерогенных данных или их использование совместно с визуализацией требует обоснования при решении практических задач [44, 104]. С целью обоснования выбора средств визуального исследования, определен ряд преимуществ визуализации:
1. В качестве аналитического инструмента, визуализация, в отличие от машинных методов, обладает «прозрачностью» решения. Под «прозрачностью» понимается доступность промежуточных стадий решения для их оценки исследователем. Возможность контроля и коррекции решения для большинства реальных задач позволяет сократить время получения финального решения.
2. Визуальное восприятие способствует формированию у наблюдателя ментальной модели исследуемого явления [61]. Быстрое построение ментальных моделей обеспечивает когнитивную значимость визуального подхода к исследованию гетерогенных данных.
3. Совместное использование визуализации и методов машинного обучения в задачах исследования гетерогенных позволит сделать доступным для решения с помощью методов машинного обучения множества слабо формализованных задач [95].
Вывод 1.3 Создаваемые средства визуализации должны учитывать особенности визуального восприятия зрительных образов с изменяющейся детализацией.
Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК
Разработка интерактивных методик принятия решений в динамических социо-экономических системах2019 год, кандидат наук Феррейра Опасо Елена Владимировна
Формирование культуры визуализации учебной информации школьника2023 год, доктор наук Аранова Светлана Владимировна
Исследование и разработка информационно-поисковых интерфейсов на основе типологии поведения пользователей2004 год, кандидат технических наук Коробкина, Наталья Николаевна
Технология построения прогностических комплексов в экономике2008 год, кандидат экономических наук Зотов, Владислав Александрович
Построение моделей геометрических объектов, их обработка и передача в транспортных информационных сетях2005 год, доктор технических наук Коптева, Лариса Георгиевна
Список литературы диссертационного исследования кандидат наук Шкляр Алексей Викторович, 2019 год
Список литературы
1. Барт Р. Риторика образа // Избранные работы. Семиотика. Поэтика. / Р. Барт, М. :, 1989. 616 с.
2. Д. Манаков, Авербух В. Верификация визуализации // Научная визуализация. 2016. № 1 (8). C. 58-94.
3. Лотман Ю.М. Семиотика кино и проблемы киноэстетики / Ю.М. Лотман, Таллин: Ээсти Раамат, 1973.
4. Маклаков А.Г. Мышление. Общая психология / А.Г. Маклаков, Санкт-Петербург: Питер, 2001. 592 с.
5. Пирс Ч.С. Логические основания теории знаков / Ч.С. Пирс, СПб.: Лаборатория метафизических исследований философского в-та СПбГУ; Алетея, 2000. 352 с.
6. Розин В.М. Визуальная культура и восприятие. Как человек видит и понимает мир / В.М. Розин, 6-е изд., URSS, 2015. 272 с.
7. Соломоник А. Очерк общей семиотики / А. Соломоник, Минск: МЕТ, 2009. 191 с.
8. Шкляр А. [и др.]. Визуальное моделирование многомерных данных // Динамика систем, механизмов и машин. 2017. № 1 (5). C. 125-128.
9. Шкляр А., Захарова А. Визуальные модели // Проблемы информатики. 2011. (4). C. 41-47.
10. Шкляр А., Захарова А. Использование систем частиц для реконструкции трехмерных моделей объектов в условиях недостаточности исходных данных // Проблемы информатики. 2012. № 17 (5). C. 63-68.
11. Шкляр А., Захарова А. Построение многокомпонентных визуальных 3d-моде-лей с использованием разнородных источников информации, на примере создания геологических моделей // Известия томского политехнического университета. 2012. № 5 (320). C. 73-80.
12. Шкляр А., Захарова А. Метафоры визуализации // Научная визуализация. 2013. № 2 (5). C. 16-24.
13. Шкляр А., Захарова А. Организация информационного обмена объекта исследования с визуальными моделями данных // Информационное общество. 2014. (3). C. 46-52.
14. Шкляр А., Захарова А. Основные принципы построения визуальных моделей данных на примере интерактивных систем трехмерной визуализации // Научная визуализация. 2014. № 2 (6). C. 62-73.
15. Шкляр А., Захарова А. Информативные признаки задач визуализации // Научная визуализация. 2015. № 2 (7). С. 73-80.
16. Шкляр А., Захарова А. Значение особенностей зрительного восприятия для интерпретации визуальных моделей произвольных данных Протвино: Издательство: Автономная некоммерческая организация «Институт физико-технической информатики», 2015. С. 214-221.
17. Шкляр А., Захарова А. Динамические знаковые структуры в информативных визуальных высказываниях Протвино: Издательство: Автономная некоммерческая организация «Институт физико-технической информатики», 2016. 131-136 с.
18. Шкляр А., Захарова А. Структурный подход к визуализации данных Издательство МАИ-Принт (Москва), 2017. С. 609-611.
19. Шкляр А., Захарова А., Ризен Ю. Измеряемые характеристики задач визуализации // Научная визуализация. 2016. № 1 (8). С. 95-107.
20. Шкляр А.В. [и др.]. Применение комплексного подхода при моделировании (на примере полигона утилизации жидких нефтяных отходов) // Программные системы и вычислительные методы. 2017. № 1 (1). С. 22-30.
21. Шкляр А.В. Результативность визуального анализа в задачах принятия решений // Информационные И Математические Технологии В Науке И Управлении. 2018. № 3 (11). С. 147-155.
22. Шкляр А.В. Оценка Практической Применимости Средств Визуального Исследования // Вестник Брянского Государственного Технического Университета. 2019. № 1 (74). С. 69-76.
23. Шкляр А.В., Захарова А.А., Вехтер Е.В. Методика Решения Задач Анализа Данных При Использовании Аналитических Визуальных Моделей // Научная Визуализация. 2017. № 4 (9). С. 78-88.
24. Шкляр А.В., Захарова А.А., Вехтер Е.В. Комплексный Критерий Применимости Средств Визуальной Аналитики В Экспертных Системах // Информационные И Математические Технологии В Науке И Управлении. 2018. № 3 (11). С. 37-44.
25. Шкляр А.В., Захарова А.А., Петров В.А. Повышение результативности анализа данных при помощи визуальной интерактивности на примере исследований омикс-ных данных // Современные проблемы математического моделирования, обработки изображений и параллельных вычислений 2017 (СПММОИИПВ-2017) Труды Международной научной конференции. 2017 Издательство: Общество с ограниченной ответственностью «ДГТУ-ПРИНТ» (Ростов-на-Дону). 2017. С. 95104.
26. Anderson J.R. (Carnegie M.U. Cognitive Psychology and its Implications / J.R. (Carnegie M.U. Anderson, 2013. p.1689-1699.
27. Arora S., Barak B. Computational complexity: a modern approach // Complexity. 2007. № January. p. 489.
28. Barrett H. [h gp.]. Perceptual Measures For Effective Visualizations // Proceedings. Visualization '97 (Cat. No. 97CB36155). 1997. p. 515-517.
29. Batch A., Elmqvist N. The Interactive Visualization Gap in Initial Exploratory Data Analysis. // IEEE transactions on visualization and computer graphics. 2018. № 1 (24). p. 278-287.
30. Berger A.A. Seeing is believing: an introduction to visual communication / A.A. Berger, McGraw-Hill Education, 2011. 267 p.
31. Bertini E., Tatu A., Keim D. Quality Metrics in High-Dimensional Data Visualization: An Overview and Systematization // IEEE Transactions on Visualization and Computer Graphics. 2011. № 12 (17). p. 2203-2212.
32. Biederman I. Recognition-by-Components: A Theory of Human Image Understanding // Psychological Review. 1987. № 2 (94). p. 115-147.
33. Blascheck T. [h gp.]. VA2: A Visual Analytics Approach for // Evaluating Visual Analytics Applications // IEEE Transactions on Visualization and Computer Graphics. 2016. № 1 (22). p. 61-70.
34. Branchini E., Savardi U., Bianchi I. Productive thinking: Tlie role of perception and perceiving opposition. // Gestalt Theory. 2015. № 1 (37). p. 7-24.
35. Cano S. [h gp.]. A Visualization and Human-Computer Interaction Proposal in the Context of Pronunciation Information // IEEE Revista Iberoamericana de Tecnologias del Aprendizaje. 2016. № 1 (11). p. 12-17.
36. Carpendale S. [h gp.]. Ontologies in Biological Data Visualization // IEEE Computer Graphics and Applications. 2014. № 2 (34). p. 8-15.
37. Chen C. Top 10 unsolved information visualization problems // IEEE Computer Graphics and Applications. 2005. № 4 (25). p. 12-16.
38. Chen C.C.C. An Information-Theoretic View of Visual Analytics // IEEE Computer Graphics and Applications. 2008. № February (28). p. 18-23.
39. Chen H. [h gp.]. Uncertainty-Aware Multidimensional Ensemble Data Visualization and Exploration // IEEE Transactions on Visualization and Computer Graphics. 2015. № 9 (21). p. 1072-1086.
40. Chen M. [h gp.]. Data, Information, and Knowledge in Visualization // Computer Graphics and Applications, IEEE. 2009. № 1 (29). p. 12-19.
41. Chen M., Golan A. What May Visualization Processes Optimize? // IEEE Transactions on Visualization and Computer Graphics. 2016. № 12 (22). p. 2619-2632.
42. Chen M., Jânicke H. An information-theoretic framework for visualization // IEEE Transactions on Visualization and Computer Graphics. 2010. № 6 (16). p. 1206-1215.
43. Chen W., Guo F., Wang F.-Y. A Survey of Traffic Data Visualization // IEEE Transactions on Intelligent Transportation Systems. 2015. № 6 (16). p. 2970-2984.
44. Claessen J.H.T., Wijk J.J. van Flexible Linked Axes for Multivariate Data Visualization // IEEE Transactions on Visualization and Computer Graphics. 2011. № 12 (17). p. 2310-2316.
45. Cook K. [h gp.]. Mixed-initiative visual analytics using task-driven recommendations IEEE, 2015. p. 9-16.
46. Cover T.M., Thomas J. A. Elements of Information Theory / T.M. Cover, J. A. Thomas, 2005. 748 p.
47. Crouser R.J., Hescott B. Toward Complexity Measures for Systems Involving Human Computation // Human Computation. 2014. (1). p. 569-592.
48. Cui Q. [h gp.]. Measuring data abstraction quality in multiresolution visualizations 2006. p.709-716.
49. Dang N. [h gp.]. WebScope: A new tool for fusion data analysis and visualization IEEE, 2009. p. 141-143.
50. Dasgupta A. [h gp.]. Familiarity Vs Trust: A Comparative Study of Domain Scientists' Trust in Visual Analytics and Conventional Analysis Methods. // IEEE transactions on visualization and computer graphics. 2017. № 1 (23). p. 271-280.
51. Date C.J. An Introduction to Database Systems // An Introduction to Database Systems. 1995. № c (1). 839p.
52. Dykes J., MacEachren A.M., Kraak M.J. Advancing Geovisualization 2005. p.691-703.
53. Elkins J. Interpreting Non-art Images 2001.
54. Elmqvist N. [h gp.]. Fluid interaction for information visualization // Information Visualization. 2011. № 4 (10). p. 327-340.
55. Elmqvist N., Yi J.S. Patterns for visualization evaluation // Information Visualization. 2015. № 3 (14). p. 250-269.
56. Endert A. [h gp.]. Toward Usable Interactive Analytics: Coupling Cognition and Computation 2014.
57. Gibson J.J. The Ecological Approach to Visual Perception 1986. 352 p.
58. Globus A., Raible E. Fourteen Ways to Say Nothing with Scientific Visualization // Computer. 1994. T. 27. № 7. p. 86-88.
59. Green T.M., Ribarsky W., Fisher B. Visual analytics for complex concepts using a human cognition model 2008. p. 91-98.
60. Green T.M., Ribarsky W., Fisher B. Building and applying a human cognition model for visual analytics // Information Visualization. 2009. № 1 (8). p. 1-13.
61. Groesser S.N., Schaffernicht M. Mental models of dynamic systems: Taking stock and looking ahead // System Dynamics Review. 2012. № 1 (28). p. 46-68.
62. Grudin J. Three Faces of Human-Computer Interaction // IEEE Annals of the History of Computing. 2005. № 4 (27). p. 46-62.
63. Guo H. [h gp.]. A Case Study Using Visualization Interaction Logs and Insight Metrics to Understand How Analysts Arrive at Insights. // IEEE transactions on visualization and computer graphics. 2016. № 1 (22). p. 51-60.
64. Heer J., Bostock M. Crowdsourcing graphical perception New York, New York, USA: ACM Press, 2010. 203 p.
65. Isenberg P. [h gp.]. Data Visualization on Interactive Surfaces: A Research Agenda // IEEE Computer Graphics and Applications. 2013. № 2 (33). p. 16-24.
66. Itti L., Baldi P. A principled approach to detecting surprising events in video 2005. 631-637 p.
67. Itti L., Koch C., Niebur E. A model of saliency-based visual attention for rapid scene analysis // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1998. № 11 (20). p. 1254-1259.
68. Keim D. [h gp.]. Visual analytics: Definition, process, and challenges 2008. 154-175 p.
69. Klein G. a. [h gp.]. A Data-Frame Theory of Sensemaking // Expertise out of context. 2007. p. 113-155.
70. Klein G., Moon B. Making sense of sensemaking 1: Alternative perspectives // IEEE Intelligent Systems. 2006. T. 21. № 4. p. 70-73.
71. Klein G., Moon B. Making sense of sensemaking 2: A macrocognitive model // IEEE Intelligent Systems. 2006. T. 21. № 5. p. 88-92.
72. Lam H., Munzner T., Kincaid R. Overview Use in Multiple Visual Information Resolution Interfaces // IEEE Transactions on Visualization and Computer Graphics. 2007. № 6 (13). p. 1278-1285.
73. Lee S. [h gp.]. How do People Make Sense of Unfamiliar Visualizations?: A Grounded Model of Novice's Information Visualization Sensemaking. // IEEE transactions on visualization and computer graphics. 2016. № 1 (22). p. 499-508.
74. Long T. Van A new metric on parallel coordinates and its application for high-dimensional data visualization IEEE, 2015. p.297-301.
75. Mahyar N., Tory M. Supporting Communication and Coordination in Collaborative Sensemaking. // IEEE transactions on visualization and computer graphics. 2014. № 12 (20). p. 1633-42.
76. Matsushita M., Kato T. Interactive visualization method for exploratory data analysis IEEE Comput. Soc, p. 671-676.
77. Miller G.A. The magic number seven, plus or minus two: some limits on our capacity for processing information. // Psychological Review. 1994. № 2 (101). p. 343-352.
78. Nguyen P.H. [h gp.]. SensePath: Understanding the Sensemaking Process Through Analytic Provenance. // IEEE transactions on visualization and computer graphics. 2016. № 1 (22). p. 41-50.
79. North C. Toward measuring visualization insight // IEEE Computer Graphics and Applications. 2006. № 3 (26). p. 6-9.
80. North C., SHNEIDERMAN B. Snap-together visualization: can users construct and operate coordinated visualizations? // International Journal of Human-Computer Studies. 2000. № 5 (53). p. 715-739.
81. Palmas G. [h gp.]. MovExp: A Versatile Visualization Tool for Human-Computer Interaction Studies with 3D Performance and Biomechanical Data // IEEE Transactions on Visualization and Computer Graphics. 2014. № 12 (20). p. 2359-2368.
82. Paneels S., Roberts J.C. Review of Designs for Haptic Data Visualization // IEEE Transactions on Haptics. 2010. № 2 (3). p. 119-137.
83. Pienta R. [h gp.]. VIGOR: Interactive Visual Exploration of Graph Query Results. // IEEE transactions on visualization and computer graphics. 2018. № 1 (24). C. 215-225.
84. Pirolli P. Information Foraging Theory: Adaptive Interaction with Information // Information Foraging Theory. 2007. p. 1-28.
85. Pirolli P., Card S. The sensemaking process and leverage points for analyst technology as identified through cognitive task analysis // Proceedings of International Conference on Intelligence Analysis. 2005. (2005). p. 2-4.
86. Pirolli P., Card S. The sensemaking process and leverage points for analyst technology as identified through cognitive task analysis // Proceedings of International Conference on Intelligence Analysis. 2005. (2005). p. 2-4.
87. Pizzi N.J., Demko A., Vivanco R. Discrimination of software quality in a biomedical data analysis system IEEE, p. 1702-1707.
88. Pontis S., Blandford A. Understanding "influence": An empirical test of the DataFrame Theory of Sensemaking // Journal of the Association for Information Science and Technology. 2016. № 4 (67). p. 841-858.
89. Purchase H.C. [и др.]. Theoretical foundations of information visualization // Information Visualization. 2008. № 4950 (4950). p. 46-64.
90. Ragan E.D. [и др.]. Characterizing Provenance in Visualization and Data Analysis: An Organizational Framework of Provenance Types and Purposes // IEEE Transactions on Visualization and Computer Graphics. 2016. № 1 (22). p. 31-40.
91. Rodrigues Jr. J.F. [и др.]. Combining Visual Analytics and Content Based Data Retrieval Technology for Efficient Data Analysis IEEE, 2010. p. 61-67.
92. Rogowitz B.E., Treinish L.A. How not to lie with visualization // Computers in physics. 1996. № 3 (10). p. 268-273.
93. Russell D.M. [и др.]. The cost structure of sensemaking 1993. p. 269-276.
94. Sacha D. [и др.]. Knowledge Generation Model for Visual Analytics // Visualization and Computer Graphics, IEEE Transactions on. 2014. № 99 (PP). p. 1.
95. Sacha D. [и др.]. Human-centered machine learning through interactive visualization // 24th European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning. 2016. № April. p. 27-29.
96. Saraiya P., North C., Duca K. An insight-based methodology for evaluating bioinfor-matics visualizations 2005. p.443-456.
97. Shannon C.E. A Mathematical Theory of Communication // Bell System Technical Journal. 1948. № 3 (27). p. 379-423.
98. Shklyar A. [и др.]. Visual detection of internal patterns in the empirical data Springer Verlag, 2017. p. 215-230.
99. Shklyar A. [и др.]. Visual modeling in an analysis of multidimensional data // Journal of Physics: Conference Series. 2018. № 1 (5). p. 125-128.
100. Shklyar A., Zakharova A. Facilities of visual analysis while searching for regularities in dissimilar experimental data Омский государственный технический университет (Омск), 2017. p. 61-67.
101. Shklyar A.V., Zakharova A.A., Vekhter E.V. The Applicability of Visualization Tools in the Meta-Design of an Educational Environment // European Journal of Contemporary Education. 2019. № 1 (8).
102. Sieck W.R. [h gp.]. Technical Report 1200 FOCUS : A Model of Sensemaking FOR THE BEHAVIORAL AND SOCIAL SCIENCES // Social Sciences. 2007. № May. p. 151.
103. Spivey M. The Continuity of Mind / M. Spivey, 2007. 443 p.
104. Tam G.K.L., Kothari V., Chen M. An Analysis of Machine- and Human-Analytics in Classification // IEEE Transactions on Visualization and Computer Graphics. 2017. №2 1 (23). p. 71-80.
105. Tan D.S., Robertson G.G., Czerwinski M. Exploring 3D navigation 2001. p.418-425.
106. Tory M., Moller T. Evaluating Visualizations: Do Expert Reviews Work? // IEEE Computer Graphics and Applications. 2005. № 5 (25). p. 8-11.
107. Tufte E.R. The visual display of quantitative Information // The Visual Display of Quantitative Information. 2008. p. 1-19.
108. Tversky B., Morrison J.B., Betrancourt M. Animation: Can it facilitate? // International Journal of Human Computer Studies. 2002. № 4 (57). p. 247-262.
109. Vieira C., Parsons P., Byrd V. Visual learning analytics of educational data: A systematic literature review and research agenda // Computers and Education. 2018.
110. Ward M.O., Theroux K.J. Perceptual Benchmarking for Multivariate Data Visualization 1997. p. 314-321.
111. Ware C. Information Visualization: Perception for Design: Second Edition / C. Ware, 2004. 486 p.
112. Ware C. Foundation for a Science of Data Visualization / C. Ware, 2012. 27 p.
113. Weick K.E., Sutcliffe K.M., Obstfeld D. Organizing and the Process of Sensemaking // Organization Science. 2005. № 4 (16). p. 409-421.
114. Wijk J.J. Van The value of visualization 2005. 11 p.
115. Wilson D., Sperber D. Linguistic form and relevance 2012. p. 149-168.
116. Wong P.C. [h gp.]. Dynamic Visualization of Transient Data Streams. // Infovis. 2003. (2003). p. 97-104.
117. Yang-Pelaez J., Flowers W.C. Information content measures of visual displays // IEEE Symposium on Information Visualization 2000. INFOVIS 2000. 2000. p.99-103.
118. Yen G.G., Zheng Wu Ranked Centroid Projection: A Data Visualization Approach With Self-Organizing Maps // IEEE Transactions on Neural Networks. 2008. № 2 (19). p. 245-259.
119. Zakharova A. A., Shklyar A. V. Visual presentation of different types of data by dynamic sign structures 2016. № 4 (8). p. 28-37.
120. Zakharova A.A., Vekhter E. V., Shklyar A. V. Methods of solving problems of data analysis using analytical visual models 2017. № 4 (9). p. 78-88.
121. Ziemkiewicz C., Kosara R. The Shaping of Information by Visual Metaphors // IEEE Transactions on Visualization and Computer Graphics. 2008. № 6 (14). p. 1269-1276.
122. ГОСТ Р 52292-2004 Информационная технология. Электронный обмен информацией. Термины и определения ИПК «Издательство стандартов», 2005.
Приложение 1
Пример применения методики визуального исследования при решении задачи аналитического типа.
1.1 Условие задачи
Пусть существует множество объектов O=(Oi..O„j. Каждый элемент множества O определяется конечным множеством значений Oi = (Pi1.. Pik}. Если элементы множества O являются описаниями объектов промышленного дизайна, то актуальной задачей является определение соответствия между характеристиками PiJ-элемента Oi и востребованностью объекта у потенциальных потребителей. Т.к. характеристики Pii являются заданными величинами, то решением задачи является определение параметров ожидания у целевой аудитории, обеспечивающих преимущество выделенного объекта перед остальными элементами множества O. В другой формулировке, целью решения является определение параметров A=(Ai..Ak} целевой аудитории, для которой выбор заданного объекта Oi окажется наиболее предпочтительным.
1.2 Подход к решению
Для получения необходимого решения необходима формальная иерархия ожиданий целевой аудитории, позволяющая определить значимость каждого из признаков Pij, а точнее, значимость близости свойства PiJ- и ожидания аудитории Aj. Определение целевой функции может быть осложнено следующими факторами:
• Параметры Pij могут иметь любой тип, в т.ч. не числовой.
• Иерархия ожиданий является неизвестной величиной, которая может быть изменена в ходе решения.
• Размерность k множества A может быть высокой (>3), что осложняет прямое сравнение объектов Oi.
• Ожидание Ai целевой аудитории допускает неопределенность, т.е. Ai — Ai ± AAi
Применение средств визуализации предложено в качестве способа оперативной оценки позиционирования одного из элементов Oi по отношению к остальным элементам, без использования многофакторного анализа и предварительной обработки исходных данных. Полученная информация может быть использована для
определения оптимальных (например, экономически) способов формирования ожиданий целевой аудитории. 1.3 Исходные данные
Таблица 19 Образец исследуемых данных.
Param 00 Name_001 Name_002 Name_003 Name_004 Name_005 Name_006 Name_007 Name_008
Param 01 0,03 0,01 0,06 0,13 0,12 2,01 0,65 0,47
Param 02 4,30 3,10 0,70 5,70 2,20 4,16 5,70 3,70
Param 03 40,14 20,52 10,66 10,28 48,14 44,33 32,66 18,78
Param 04 112,50 175,00 129,10 154,10 132,50 154,00 141,10 134,60
Param 05 Form factor_001 Form factor_002 Form factor_003 Form factor_004 Form factor_002 Form factor_001 Form factor_002 Form factor_004
1.4 Стандартная визуализация (Microsoft Exel)
Проведен поиск способов визуального представления исходных данных с применением наиболее распространенных программных средств.
Param05 Param04 Param03
80,00 100,00 120,00 140,00 160,00 180,00 200,00 ■ Name 005 BName 004 ■ Name 003 BName 002 BName 001
Param02 Param01
0,00 20,00 40,00 60,00 I Name 008 BName 007 ■ Name 006
Рис. 41 Пример линейчатой диаграммы
200,00 180,00 160,00 140,00 120,00 100,00 80,00 60,00 40,00 20,00 0,00 -20,00 0
Рис. 42 Пример точечной диаграммы с гладкими кривыми
■ Ыате 001 ■ №те 002 ■ №те 003 ■ №те 004 ■ №те 005 ■ №те 006 ■ №те 007 ■ №те 008
Рис. 43 Пример кольцевой диаграммы
■ 0,00-50,00 ■ 50,00-100,00 «100,00-150,00 «150,00-200,00
200,00 150,00 100,00 50,00 0,00
Рис. 44 Пример поверхностной диаграммы
Param05
Param04
Param03
Param02
Param01
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% I Name 001 ■ Name 002 ■ Name 003 ■ Name 004 ■ Name 005 ■ Name 006 ■ Name 007 ■ Name 008
Рис. 45 Пример нормированной линейчатой диаграммы
■ Рагат01 • Рагат02 • РагатОЗ • Рагат04 • Рагат05
Ыате_001 200,00
Name_008 150,00
Name 002
Name 007
Name 006
Name 003
Name 004
Name 005
Рис. 46 Пример лепестковой диаграммы
Использование распространенных способов визуализации обладает следующими недостатками:
• Визуальные образы выполняют иллюстративную функцию, т.е. представляют визуальное подтверждение уже сформулированному решению.
• Применение известных визуальных приемов сравнения информационных объектов (пузырьковые диаграммы) мало информативно при интерпретации гетерогенных данных.
Рис. 47 Пространство визуальной модели
• Статичная визуализация не позволяет осуществлять проверку формируемых гипотез. Каждая новая гипотеза приводит к действиям, выходящим за рамки взаимодействия с визуальным образом, или, возможно, верифицируется при построении нового изображения.
1.5 Новое решение
В качестве средства визуализации, предназначенного для решения поставленной задачи, предложена трехмерная визуальная модель, использующая интерактивное управление свойствами визуального образа для сокращения времени формирования гипотезы решения. Пространство визуальной модели разделено на N горизонтальных плоскостей, где N — число информативных объектов в исходных данных. Представление каждого объекта — набор к элементов круговых диаграмм, где к — число свойств в описании каждого объекта.
Т.к. целью решения является согласование реальных свойств и ожиданий потребителей, то предложен переход от абсолютных значений Ру к нормированным. Кроме того, вводится представление о существующем ожидании, которое определяется набором значений А = {А}. Следовательно, каждый реальный объект может быть представлен как отклонение от заданного ожидания целевой аудитории. Рис. 49 Визуальное представление
информативного объекта
Рис. 48 Визуализация отклонений
Элементы интерактивного управления состоянием средства визуализации позволяют задать значения ожидания А для каждого свойства (положение элемента на шкале) и степень их неопределенности ЛА, (ширина каждого элемента). Одновременное представление в пространстве визуальной модели позволяет сформировать у наблюдателя представление о сравнительных преимуществах информационных объектов по отношению к установленному ожиданию. Взаимодействие с трехмерным представлением используется для адаптации восприятия конкретного пользователя, направленной на быструю интерпретация исходных данных.
Рис. 50 Элементы управления
Рис. 51 Одновременное представление объектов
Рис. 52 Сравнение объектов
Использование элементов интерактивного управления позволяет достичь минимального отклонения свойств Ру любого (3) выделенного объекта от ожиданий А = {А} целевой аудитории. В соответствии с условиями задачи, множество значений А характеризует целевую аудиторию, для которой выбор объекта Р[ является предпочтительным. Однако, в соответствии с используемой функцией визуального представления, для остальных объектов наблюдается отклонение от ожиданий как в положительную (вправо), так и в отрицательную (влево) сторону. Если параметр Рц (сиреневый) является убывающей функцией ожидания (т.е. чем меньше, тем лучше), то объекты (4) и (2) являются более предпочтительным выбором. Это следует из отрицательного отклонения от ожидания наиболее значимого (внешнего) параметра (Рис. 53). Изменение значения ожидания и его неопределенности (А] ± АА]) приводит к более выгодному позиционированию выделенного (3) объекта (Рис. 54).
Рис. 55
Другим способом изменения позиционирования выделенного объекта является уменьшение значимости выбранного параметра. Представлено (Рис. 55) состояние той же модели в случае минимальной значимости параметра Рц (сиреневый). Параметры ожидания, обеспечивающие преимущество выделенного объекта, для этой ситуации выглядят совершенно по-другому (Рис. 56) и определяются при использовании интерактивного управления средством визуализации. 1.6 Резюме визуального решения
• Предложенное средство визуализации позволяет решать задачи аналитического типа, т.е. проводить последовательные операции получения, интерпретации информации, формирования гипотез, принятия решения об изменении цели или условий решения.
• Методика применения средства визуализации позволяет достигать цели исследования без интерпретации численных значений. Т.о. предложен подход к решению задач указанного типа, опирающийся исключительно на средства визуализации.
• Использована функция визуального представления, ориентированная на распространенные способы визуализации численных данных (круговые и лепестковые диаграммы). Это обеспечивает снижение ресурсоемкости этапа обучения пользователя.
• Средство визуализации имеет низкую зависимость от специфики предметной области задачи. Т.о. опыт использования предложенного средства интерпретации может быть привлечен к решению других задач.
• Низкие требования к предварительной подготовленности пользователей обеспечивают возможность использования средства визуализации при отсутствии специальной подготовки при решении задач интерпретации данных, имеющих междисциплинарный характер.
Рис. 56
1.7 Детализация методики визуального исследования.
1. Получение неадаптированного средства визуализации данных.
Построение средства визуализации в результате выполнения автоматизированной процедуры. Процедура соответствует этапам алгоритма построения средства визуализации (Рис. 57).
2. Адаптация функции визуального представления к восприятию пользователя.
Выбор способа цветового кодирования, позволяющего пользователю адекватно формировать понимание исходных данных, без выделенных предпочтений или потери внимания к деталям
Рис. 57
Рис. 58
из-за их недостаточной выразительности (Рис. 58).
Система цветов определяется на основании одной из известных цветовых палитр в соответствии с индивидуальными предпочтениями пользователя. Цветовая и световая составляющая определяются как параметры, влияющие на работоспособность пользователя.
3. Общее представление о данных и условиях задачи исследования. Анализ образа данных, полученного в состоянии элементов интерактивного управления, предложенных пользователю после выполнения алгоритма построения средства визуализации. Сравнение образов информативных объектов. Сопоставление образов и состояния параметров системы управления, отражающего значения параметров ожидания целевой аудитории (Рис. 59). Определение объекта, имеющего преимущество, в соответствии с собственными параметрами, значениями ожиданий и метафорой визуального представления.
Рис. 59
Рис. 60
4. Декомпозиция визуальной модели (при необходимости). Разделение процесса исследования на два этапа. На первом этапе определяются параметры управления средством визуализации, минимизирующие отклонение характеристик выбранного объекта от параметров ожидания (Рис. 60).
5. Выделение простейших зависимостей.
Определение диапазона параметров ожидания (значение и неопределенность), в котором выделенный объект сохраняет свое позиционирование среди всех остальных объектов (смягчение требований к ожиданиям).
6. Выбор функции визуального представления зависимостей.
На основании представления о возможном смягчении требований к ожиданиям, выбор параметров ожидания, который обеспечивает наилучшее представление выделенного объекта по сравнению со всеми остальными.
Рис. 61
Рис. 62
Рис. 63
Рис. 64
сом, начинающимся после завершения визуального исследования.
Рис. 65
Приложение 2
РОССИЙСКАЯ ФЕДЕРАЦИЯ
ки 2018664833
-V-
ФЕДЕРАЛЬНАЯ СЛУЖБА ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ
ГОСУДАРСТВЕННАЯ РЕГИСТРАЦИЯ ПРОГРАММЫ ДЛЯ ЭВМ
Номер регистрации (свидетельства): 2018664833
Автор(ы):
Шкляр Алексей Викторович (ГШ), Захарова Алена Александровна (1Ш)
Дата регистрации: 22.11.2018
Дата публикации и номер бюллетеня:
Номер и дата поступления" заявки:
22.11.2018 Бюл. № 12
2018661741 25.10.2018
Правообладателе и):
федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский Томский политехнический университет» (1Ш)
Контактные реквизиты: 634050, г. Томск, пр. Ленина, 30, ФГАОУ ВО «Национальный исследовательский Томский политехнический университет», отдел правовой охраны результатов интеллектуальной деятельности, abataba@tpu.ru, +7 (3822) 606-494
Название программы для ЭВМ: Анализатор визуального представления данных
Реферат:
Программа предназначена для измерения продолжительности процедур построения и интерпретации визуальных моделей гетерогенных данных с целью определения применимости различных способов визуального представления данных и может применяться в научных исследованиях и образовании для разработки средств визуальной аналитики. Программа обеспечивает выполнение следующих функций: определение длительности интервалов построения визуальной модели данных; определение продолжительности интервалов интерпретации визуальной модели и построения достоверного решения; проведение серий измерений продолжительности указанных интервалов с автоматическим изменением контролируемых параметров; сохранение результатов измерений в текстовом формате; получение комплексной характеристики визуального представления, включающей усредненные значения продолжительности интервалов построения, обучения и интерпретации.
Язык программирования: Мах8спр(
Объем программы для ЭВМ: 34 Кб
Стр 1
УТВЕРЖДАЮ:
Генеральный директор
:но-(^йбирская Компания»
Крылов
2017 г.
АКТ ВНЕД1
г. Томск
13.02.2017 г.
Я, нижеподписавшийся, Гавр и лов Сергей Николаевич, главный геолог ООО «ЗападноСибирская Компания», подтверждаю, что алгоритмическое и программное обеспечение системы «Аналитический визуалпзатор данных» и техническая документация в электронном виде внедрены в ООО «Западно-Сибирская Компания».
Программное обеспечение «Аналитический визуаяшатор данных» использовалось в ООО «Западно-Сибирская Компания» для проведения аналитических исследований больших объемов данных с целью выявления фактических зависимостей в разнородных характеристиках исследуемых объектов при выполнении проектов по подсчету запасов, проектированию разработки, техн и ко-эконом и чес кому обоснованию инвестиций и коэффициентов извлечения углеводородов нефтегазовых месторождений в 2016-2017 гг.:
• дог. №4-693/17 от 13,02.2017 г.;
• дог, №4-664/16 от 18.07.2016 г.;
• дог. № 4-659/16 от 01.04.2016 г.;
• дог. № 4-677/16 от 17.10,2016 г.
Внедренный программный продукт позволил проводить решение задач оперативного исследования многомерных данных, получать визуально-аналитическое представление об особенностях исследуемой информации, а также достигать положительных результатов в задачах принятия решений в условиях ограниченного времени анализа. Таким образом, время анализа исходных данных для проектирования разработки месторождений при использовании указанного программного обеспечения удалось сократить на 15-20%,
Научный руководитель проекта: д.т.н. Захарова A.A.
Исполнители проекта: Шкляр A.B.. Завьялов Д.А.
Главный геолог
ООО «Западно-Сибирская Компания»
TOMSK POLYTECHNIC UNIVERSITY
томскии
политехнический университет
1.1
Ministry of Education and it' . - of the Russian Federation Federal State Autonomous educational Institution of Higher Education "National Research Tomsk Polytechnic University11 {TPU>
Fax +7-3822-563365, e-mail: tpu®(pu.rj, tpu.ru OKPO (National Classification of enterprises and Organizations):
02069303,
VAT / KPP (Cade of Reason for Registration)
30, Lenin aVE., Tomsk, 634ÜS0, Russia Tel. >7-3822-606333, +7-3822-701779,
Company Number: L 027000890168,
Министерство образовании и науки Российской Федерации
федеральное государственное автономное образовательное
учреждение высшего обраэозэния_
^Национальный исследовательский
Томский политехнический университет* (ТПУ)
Ленина, пр., д. 30, г. Томен, 634050, Россия
тел.: +7-3322-606333, +7-3822-701779,
факс +7-3 022-563 В65, e-mail: tpu@tpu.ru, tpu.ru
ОКПО 02С6Э303. ОГРН 1027D0089D168,
ИНН/КПП 7018С07264/701701001, БИК 046902001
7018007264/701701001, BIC 046902001
СПРАВКА
о внедрении результатов научно-исследовательской работы в практику
На основе полученных результатов научно-исследовательской работы «Технология когнитивной интерпретации гетерогенных данных средствами визуализации» соискателя Шкляра A.B. разработан модуль учебной дисциплины «Инженерная технология в промышленном дизайне» для студентов направления подготовки 54.04.01 «Дизайн» изучаемой в отделении автоматики и робототехники ИШИТР ТПУ.
Руководитель ООП «Дизайн»
Доцент Отделения Автоматики и робототехники,
ИШИТР ТПУ, кл.н.
Руководитель
Отделения Автоматики и робототехники ИШИТР ТПУ, К.Т.Н.
С.В. Леонов
Начальник
организационного отдела
ИШИТР ТПУ, К.Т.Н.
А.Я. Пак
Приложение 3
Выполнение алгоритма построения средства визуализации для сравнения гетерогенных данных.
В качестве тестовой задачи, позволяющей оценить перспективность использования визуальных методов анализа данных, была выбрана проблема реконструкции недостающих данных в описании объектов нефтедобывающей отрасли. Гипотезой решения этой задачи является предположение о возможности заимствования недостающих данных у объектов, имеющих близкие показатели в других характеристиках. Таким образом, целью визуального анализа становится быстрый поиск объектов, имеющих близкие свойства, при условии допустимости субъективного решения о принципах оценки подобной близости.
В результате выполнения шагов 1-3 разработанного алгоритма (3.3.2) определены свойства функции визуального представления рассматриваемой задачи: целостность, обобщенность, предметность, цвет.
• Принцип целостности (1.7.2) восприятия необходим для упрощения восприятия пользователем гетерогенных данных, входящих в описание каждого информационного объекта.
• Принцип обобщенности (1.7.3) является основанием для оперативного сопоставления визуальных образов, в том числе с представлением объектов, полученных пользователем ранее.
• Предметность восприятия (1.7.4) предложена в качестве способа формирования у пользователя понимания причин отличий информационных объектов.
• Введение в функцию визуального представления цвета предложено для упрощения наблюдения в пространстве визуальной модели за разными информационными объектами или их группами.
Шаг 4: Выбор функции представления при заданных параметрах. Предложено использование визуальной метафоры безразмерного пространства, связанной с визуализацией в нормированном пространстве без использования шкал, соответствующих исходным значениям.
Модель является множеством горизонтальных плоскостей, каждая из которых содержит образ данных, принадлежащих отдельному свойству исследуемых объектов. Плоскость определяется двумя ортогональными шкалами. Основная шкала соответствует выбранному свойству и масштабируется в пространстве модели с целью наиболее полного представления информации пользователю. Дополнительная шкала использована для отображения параметра сравнения, выбранного в качестве основания метафоры исследования.
Порядок расположения образов свойств относительно друг друга использован как самостоятельная шкала, отображающая степени связанности между одним, предварительно выделенным свойством, и всеми остальными данными. Точки разных плоскостей, отображающие свойства одного объекта объединяются в единый образ этого объекта, создавая уникальный зрительный образ, который подготовлен к сравнительному анализу.
Шаг 5: Ограничение управляемости функции визуального представления на основании требований типа задачи и характеристики состояния пользователя модели
Интерфейс модели предназначен для выполнения пользователем следующих действий:
► выбор источника данных (текстовый файл, Unicode, строка содержит описание одного объекта, параметры в строке разделены табулятором)
► определение набора свойств, представленных в модели (операции добавления и удаления образов)
► изменение представления (определение свойств отображения)
► использование операций манипулирования пространством модели для поиска интерпретируемого состояния. Шаг 6. Определение операций изменения функции представления.
Предложен способ сравнения объектов, основанный на визуализации суммарного отклонения каждого представленного объекта от выделенного набора значений или характеристик указанного объекта.
К операциям изменения представления относятся :
• изменение цвета объекта или группы;
• исключение объекта или группы из визуального пространства;
• визуальное объединение, замена группы объектов на объединяющий образ (поверхность);
• независимое изменение масштаба визуального представления любого свойства (управление значимостью отдельных свойств).
Для визуального представления данных о достоверности исходных данных предложен прием, согласно которому исходным данным сопоставляется не точка в визуальном пространстве, а область соответствующего размера.
Использование комбинаций предложенных способов визуализации позволило выделять группы информационных объектов, имеющих явно выраженное «альтернативное поведение». Это является одним из оснований для формирования гипотез ответа на вопрос исследования
Шаги 7, 8 Определение дополнительных функций чтения R*, записи R—
Для сохранения результатов визуального исследования предусмотрена возможность вывода растровых изображений в высоком разрешении, а также сохранение визуальной модели в формате .3ds (Autodesk 3ds Max).
Для дополнения модели новыми данными необходимые изменения вносятся в текстовый файл, считываемый при построении визуального образа.
Шаг 9 Для сохранения непрерывности интерпретации используются непрерывные диапазоны управляющих воздействий.
Возможность выбор произвольного информационного объекта в качестве «объекта сравнения» позволяет формировать множество промежуточных гипотез решения и оперативно сопоставлять результаты интерпретации визуализации.
В случае необходимости, одним из которых является изменение характеристик пользователя средства визуализации, функция визуального представления может быть изменена. Частным случаем, возникающем на этапе обмена данными между участниками исследования, может быть увеличение информационной насыщенности полученного визуального образа.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.