Разработка и исследование моделей для оптимизации информационного потока при интерактивном анализе больших данных в геоинформационных системах тема диссертации и автореферата по ВАК РФ 05.25.05, кандидат наук Глушков Андрей Александрович

  • Глушков Андрей Александрович
  • кандидат науккандидат наук
  • 2021, ФГАОУ ВО «Южный федеральный университет»
  • Специальность ВАК РФ05.25.05
  • Количество страниц 176
Глушков Андрей Александрович. Разработка и исследование моделей для оптимизации информационного потока при интерактивном анализе больших данных в геоинформационных системах: дис. кандидат наук: 05.25.05 - Информационные системы и процессы, правовые аспекты информатики. ФГАОУ ВО «Южный федеральный университет». 2021. 176 с.

Оглавление диссертации кандидат наук Глушков Андрей Александрович

Введение

Глава 1. Анализ особенностей информационного процесса при интерактивном анализе геопространственных больших данных

1.1 Модели представления данных рабочих областей при интерактивном анализе в геоинформационных системах

1.2 Свойства геопространственных больших данных, влияющие на

их качество при интерактивном анализе

1.2.1 Показатели ценности больших данных

1.2.2 Особенности информационных процессов при анализе больших геоданных

1.3 Основные проблемы использования больших геоданных в системах информационной поддержки принятия решений

1.4 Адаптация информационного потока к изменению структуры информационной базы ГИС

1.5 Постановка задачи исследования

Глава 2. Исследование и разработка информационных моделей рабочих областей при интерактивном анализе больших данных в ГИС

2.1 Особенности рабочих областей больших данных

2.2 Особенности диалога пользователя с ГИС в процессе решения сложных задач

2.3 Модель рабочей области и оптимизация информационного

потока

2.4 Влияние модели рабочей области на решение задачи оптимизации информационного потока

2.5 Исследование функции полезности рабочей области

2.6 Реализация оператора отображения состояния рабочей области

и вывод новой информационной модели

Стр.

2.7 Информационная модель рабочей области с элементами,

содержащими неопределенность

Глава 3. Адаптация информационного потока к изменению

структуры информационной базы при интерактивном

анализе

3.1 Анализ динамики структурных изменений базы данных ГИС

3.2 Анализ влияния изменения структуры базы данных на инфомационный поток

3.3 Методика адаптации информационного потока геоинформационного сервиса

3.4 Представление правил базы знаний и их проверка

3.4.1 Виды правил

3.4.2 Подтверждение правил

3.5 Процедура генерации правил

3.6 Методика оценки качества адаптации

Глава 4. Разработка и экспериментальное исследование интеллектуальной геоинформационной системы адаптирующейся к информационному потоку при

интерактивном анализе

4.1 Сервис адаптации в общей архитектуре геосервиса

4.1.1 Высокоуровневая архитектура геосервиса с системой интеллектуальной поддержки

4.1.2 Диаграмма использования геосервиса с системой адаптации

4.1.3 Диаграмма деятельности геосервиса с системой адаптации

4.2 Схема и методика взаимодействия сервисов

4.3 Сервис системы адаптации

4.3.1 Диаграмма классов сервиса адаптации и описание методов

4.3.2 Модуль классификации пользователя и его обучение

4.4 Сервис сбора данных

4.4.1 Организация работы с большими данными в рамках геосервиса

4.4.2 База данных сервиса

Стр.

4.4.3 Диаграмма классов и описание методов

4.5 Интеграция сервисов в существующую программно-аппаратную среду

4.5.1 Определение общей концепции интеграции сервиса

4.5.2 Выбор технологии контейнеризации

4.5.3 Схема и процедура интеграции сервиса

4.6 Оценка работы системы после внедрения сервиса адаптации

Заключение

Список литературы

Список рисунков

Список таблиц

Приложение А. Листинги открытой части (Open Source) Place

Context Provider Tizen SDK

Приложение Б. Листинги открытой части (Open Source)

Statistics Context Service Tizen SDK

Приложение В. Листинги прототипа аналитического гео модуля

Приложение Г. Патенты на основе результатов

диссертационного исследования

Приложение Д. Акты о внедрении результатов

диссертационного исследования

Рекомендованный список диссертаций по специальности «Информационные системы и процессы, правовые аспекты информатики», 05.25.05 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка и исследование моделей для оптимизации информационного потока при интерактивном анализе больших данных в геоинформационных системах»

Введение

Большое число областей применения геоинформационных систем (ГИС) предполагает непрерывное накопление данных. Необходимость фиксировать состояние наблюдаемого объекта или явления порождает интенсивный поток разнородных по природе данных на продолжительных интервалах времени. Срок хранения полученных сведений во многих случаях не ограничен и сдерживается исключительно техническими возможностями архивирования информации. Базы данных ГИС по этой причине соответствуют современным представлениям о больших данных (big data), поскольку имеют значительный объем, который непрерывно растет, разнородны по форматам представления и обладают ценностью, определяющейся достоверным отображением объектов, явлений и событий реального мира.

Анализ больших данных в ГИС проводится с целью принятия решений. Для этого пользователь-аналитик создает рабочую область общей карты, которая далее им визуально исследуется и модифицируется, порождая ментальный образ прикладной задачи. В процессе интерактивного анализа аналитик генерирует альтернативы, сопоставляет их между собой и выбирает лучшее решение. Современные ГИС оснащены разнообразными программными инструментами статистического, пространственного, топологического, морфологического, кар-тометрического и других видов анализа, которые дают возможность строить новые картографические объекты, помещая их на исходную картографическую основу. Пользователь-аналитик, таким образом, самостоятельно формирует дополнительный поток данных, способный улучшать качество принимаемых решений. Однако, на практике повышение качества происходит не всегда. Причина в том, что по мере увеличения общего объема данных ГИС растет трудоемкость отбора и компоновки картографических объектов в рабочую область. Картографические изображения усложняются, возрастает объем визуальной информации, а перенасыщение информационными потоками пользователя-аналитика со стороны ГИС снижает качество восприятия и, как следствие, ухудшает ценность решений прикладных задач. Следовательно, должны приниматься особые меры для адаптации ГИС к поведению пользователя-аналитика для снижения сложности изучаемой рабочей области и обеспечения ее целостности. Перспективным путем решения данной проблемы представляется

разработка новых моделей при интерактивном анализе, основанных на знаниях. Как показало изучение научных публикаций, данный вопрос остается недостаточно исследованным.

Значимость исследований в области обработки больших данных подтверждается государственными программами проведения исследований в области науки и технологий. Данное направление актуально в научном и практическом отношении, о чем говорит заметное число отечественных и зарубежных научных публикаций. В основе исследований лежат работы таких ученых, как В.Г.Бондур, В.П.Савиных, В.Я.Цветков, И.Н.Розенберг, P.A.Longley, M.F.Goodchild, D.J.Maguiгe, Р.А.Кет, Е.Тау1ог, а также многих других. Исследования охватывают как механизмы сбора, хранения и обработки больших объемов геопространственных данных, так и способы организации ГИС для реализации аналитических процедур над большими данными, методы диалогового взаимодействия пользователей-аналитиков с ГИС, методологию принятия решений.

Цель диссертационной работы заключается в разработке и исследовании информационных моделей для оптимизации информационного процесса при интерактивном анализе больших данных геопространственного характера. На основе разработанных моделей рабочей области анализа должны быть построены процедуры повышения качества информационной поддержки принятия решений на основе пространственных данных.

Для достижения поставленной цели решаются следующие задачи:

1. Анализ современных средств хранения и обработки данных большого объема, моделей организации диалога в геоинформационных системах, использующих большие данные;

2. Разработка и исследование новой концепции представления рабочей области при интерактивном анализе, явно использующую функцию полезности, зависящую от избыточности;

3. Разработка модели представления рабочей области, содержащей неопределенные объекты, параметры которых имеют неопределенное, неоднозначное или неточное значение;

4. Исследование подходов к повышению качества информационного процесса поддержки принятия решений за счет применения адаптивных процедур интерактивного взаимодействия;

5. Разработка и исследование модели адаптации интерактивного диалога, основанной на знаниях, возникающих в процессе коллективной работы пользователей с ГИС;

6. Разработка методики оценки качества адаптации по показателю времени и погрешности адаптации, использующую вероятностную модель распространения полезных данных от одного пользователя к другому в сетевой ГИС;

7. Экспериментальное исследование предложенных моделей для оптимизации информационного потока при интерактивном анализе больших геопространственных данных.

Научная новизна:

1. Предложена новая модель представления рабочей области анализа двумя информационными компонентами - скелетоном и окружением. Скелетон формируется детерминированными запросами к базе данных ГИС, окружение строится интеллектуальными процедурами как оболочка скелетона. Отличием предложенной концепции является использование функции полезности, параметрами которой являются сложность скелетона и окружения. Применение предложенной концепции позволяет оптимизировать качество принятия решений посредством максимизации функции полезности рабочей области (соответствует п.1 паспорта специальности 05.25.05).

2. Предложена информационная модель рабочей области анализа с неопределенными объектами, состоящая в добавлении объектов с дефектами визуального отображения. Отличием модели является выделение в структуре рабочей области трех компонентов: скелетона, окружения и неопределенных объектов. Использование модели дает возможность формировать новые представления изображения, стимулируя появление у пользователя-аналитика при визуальном анализе дополнительных альтернатив решений (соответствует п.1 паспорта специальности 05.25.05).

3. Разработана методика адаптации информационного потока при интерактивном анализе к изменению структуры информационной базы больших данных ГИС. Методика основана на извлечении знаний о полезных для визуального анализа объектах путем генерации правил. Правила рассматриваются как гипотезы, которые могут быть подтвер-

ждены или опровергнуты в течение заданного времени членами профессиональной группы аналитиков-пользователей ГИС. Отличительной особенностью методики является добавление в процесс интерактивного анализа подпроцесса извлечения и накопления знаний о полезных объектах и отношениях. Применение предложенной модели позволит за счет повторного использования знаний сократить избыточность рабочей области анализа и повысить ее целостность (соответствует п.1 паспорта специальности 05.25.05).

4. Разработана методика оценки качества адаптации по показателю времени и погрешности адаптации. Отличием методики является использование вероятностной модели распространения полезных данных от одного пользователя к другому в сетевой ГИС. Это позволило получить аналитические соотношения для оценки вероятности распространения полезных данных и при заданной вероятности рассчитать необходимое время или число сеансов для подтверждения. Предложены соотношения для расчета вероятностей ошибок адаптации, вызванных отбрасыванием полезных правил и принятием бесполезных. Использование методики дает возможность повысить полезность использования информационных ресурсов ГИС при интерактивном анализе локальных рабочих областей данных. (Соответствует п.1 паспорта специальности 05.25.05).

Практическая значимость заключается в разработке метода, на основе которого могут быть построены ГИС, включенные в контур принятия решений. Методы и алгоритмы данной работы имеют прикладной характер. Разработанная система интеллектуальной помощи с функцией автоматической адаптации может быть реализована для повышения полезности данных в процессе выборки за счет извлечения и использования исторических знаний. Это ведет к повышению эффективности работы оператора сервиса путем сокращения времени поиска информации путем минимизации избыточности данных в автоматическом или полуавтоматическом режиме и минимизация нагрузки на ресурсы сервиса путем оптимизации работы с большими данными системы путем фильтрации избыточных данных в полностью автоматическом режиме.

Ыетодология и методы исследования. В работе использовались методы построения информационных адаптивных и интеллектуальных систем, методы теории принятия решений, теория графов, теории нечетких множеств

и нечеткой логики, прецедентного картографического и пространственного анализа.

Основные положения, выносимые на защиту:

1. Информационная модель представления рабочей области скелетоном и окружением с использованием функции полезности.

2. Информационная модель представления рабочей области, включающей в себя неопределенные объекты.

3. Методика адаптации информационного потока в интерактивном диалоге к изменению структуры информационной базы ГИС.

4. Методика оценки качества адаптации информационного потока по показателям времени и точности адаптации.

Достоверность подтверждается корректным применением математического аппарата и результатами экспериментального анализа программной реализации предложенной модели.

Результаты исследований использованы при выполнении Государственного задания «Методы и средства принятия решений на основе динамических геоинформационных моделей» (тема №2.918.2017/ПЧ) в НТЦ «Интех» Южного федерального университета, а также при выполнении гранта РФФИ №15-01-00149 «Методы интеллектуальной визуализации пространственно-временных объектов и отношений для принятия решений на основе опыта». Методика геолокационного распознавания контекста использована в ОС Tizen 2.4, разрабатываемая транснациональной компанией Samsung Electronics. Предложенные алгоритмы внедрены в интеллектуальное программное обеспечение, разрабатываемое ООО «Дистиллери».

Материалы исследований используются в учебных дисциплинах магистерской программы «Информационно-аналитические системы и технологии "больших данных"», реализуемой кафедрой информационно-аналитических систем безопасности Института компьютерных технологий и информационной безопасности ЮФУ.

Документы, подтверждающие внедрение, приведены в приложении.

Апробация работы. Основные теоретические и практические результаты работы докладывались и обсуждались на международных научно-практических конференциях: «2nd International Conference on Information Science and Security ICISS 2015» (Сеул, Южная Корея, 2015), « 11th International Conference Application of information and communication technologies AICT 2017» (Москва,

Россия, 2017), «3rd Russian-Pacific Conference on Computer Technology and Applications RPC 2018» (Владивосток, Россия, 2018), «9th Computer Science Online Conference CSOC 2019», «10th Computer Science On-line Conference CSOC 2020».

Публикации. Основные результаты по теме диссертации изложены в 10 печатных изданиях, 3 из которых изданы в журналах, рекомендованных ВАК, 6 — в материалах международных конференций, индексируемых в библиографических базах данных Scopus и Web of Science. А также 1 монографии, изданной ВИНИТИ РАН. Имеется 1 свидетельство о регистрации программ для ЭВМ, зарегистрированы 2 заявки на полезную модель

Объем и структура работы. Диссертация состоит из введения, четырёх глав, заключения и приложений. Полный объём диссертации составляет 176 страниц, включая 37 рисунков и 10 таблиц. Список литературы содержит 118 наименований.

Глава 1. Анализ особенностей информационного процесса при интерактивном анализе геопространственных больших данных

1.1 Модели представления данных рабочих областей при интерактивном анализе в геоинформационных системах

Современные подходы к интерактивный анализ различаются соответственно сложности решаемых прикладных задач. Под сложности задачи чаще всего понимается объем и качество информации, которой располагает аналитик при решении поставленной задачи. Простыми в данной работе мы считаем задачи описание которых не вызывает неоднозначности, неточности, неполноты и неопределённости в постановке задачи. Для решения подобных задач создаются программное процедуры с полностью определенным детерминированным алгоритмом. Для сложной задачи полностью определить алгоритм невозможно. Применительно к интерактивному анализу сложность задачи проявляется в том что процедура построение картографических изображений порождает не соответствующие смыслу задачи экземпляры изображений.

Следует отметить, что уровень простоты реализации зависит не только от количества картографических объектов но и от того, насколько у аналитика является определенным представление о структуре отображаемой информации и ценности элементов для принятия решений. Основное с нашей точки зрения причина проблемы интерактивного анализа в ГИС - это избыточность. Информационная база реальных систем содержит гораздо больше информации чем это требуется для решения поставленной прикладной задачи. Отображение всех имеющихся данных в заданной области пространства бессмысленна, поскольку восприятие человеком потока отображаемой информации имеет естественный предел. Из-за этого аналитик не получает нужных сведений и вынужден предпринимать меры для снижения избыточности.

Чаще всего процесс сокращения избыточности носит эвристические характер. Если аналитик не обладает достаточным опытом и квалификацией, им используется метод проб и ошибок. Это отрицательно сказывается на основном в процессе генерации решений задач. Исходя из сказанного, проанализируем достоинства и недостатки существующих методов представления данных.

Традиционный метод отображения геопространственных данных [1]. Предполагает построение изображений карт, схем и планов для дальнейшей полиграфической обработки либо как универсальных растровых изображений. После формирования таких карт в ГИС они не подлежат изменению. Все возможности по смысловому наполнению реализуются во время подготовки карты картографом.

Формальная модель рассматриваемого вида отображения следующая:

С =< Б,Т,С >, V = ^ (С), IV| < V*,

где С - трехкомпонентная модель информационной базы ГИС, включающая в себя множество картографических (С), темпоральных (Т) и семантических объектов (С). Оператор отображения (^()) формирует изображение (V) ограниченной сложности (V*). Как следует из данной модели, отбор необходимых данных из С не входит в функцию ГИС, т.е. реализуется пользователем вручную.

Достоинство данного подхода в том, что аналитики используют готовые карты, не затрачивая усилий на их компоновку, интерактивный анализ осуществляется с максимальной скоростью.

Недостаток - смысловое содержание карты может не соответствовать решаемой задаче. Как вариант, картографы готовят атласы (библиотеки карт). Это увеличивает возможность найти нужное, но повышает затраты на поиск. Кроме того, если полезными оказываются несколько карт, возникает проблема переключения с одной на другую во время анализа - это рассеивает внимание аналитика, провоцирует появление ошибок.

Статический метод отображения геопространственных данных, использующий картографическую основу ГИС. Заключается в том, что результаты некоторого сложного анализа данных представляются картографическим изображением, скомпонованным с элементами отображения других типов [2]. Диаграммы, таблицы, зависимости объединяются с фрагментами карт с целью представления аналитического результата, создания некоторого целостного образа решения, полученного в результате анализа. В отличие от предыдущего способа, данный способ использует готовые карты, программы отображения данных [3]

Модель данного способа отображения:

V = FÍ(<S,T >) и ) IV| < V*,Я(У) < я*.

В отличие от предыдущей модели, здесь используются два независимых оператора отображения для пространственно-временных и семантических данных Fl и F2. Множество различным образом отображаемых объектов образуют картографическое изображение. Достоверность изображения ) в рассматриваемом случае играет важную роль, поскольку всякий проект картографической области анализа строится, исходя из необходимости достоверно представить картину реального мира. Все манипуляции с объектами информационной базы выполняются пользователем вручную.

Достоинство: образное представление результата, гораздо лучше воспринимаемое, чем тексты и массивы чисел. Недостаток: отображает одну "точку зрения" на анализируемые данные, невозможно что-то преобразовать в иной контекст.

Геоинформационное картографирование [4; 5]. Заключается в том, что рабочий вариант карты создается из слоев (по сути, других готовых карт), классов объектов и внешних ссылок. Это начальный этап картографического анализа. Построенная карта описывается в виде проекта - информационной структуры, отражающей элементы и связи карты. Проекты тематических (специализированных) карт могут применяться повторно. Имеется возможность в диалоге изменять структуру проекта.

Формальная модель данного процесса отображения представляется как

$ = Lsi, т = и = Lcг,

г г г

!д =< Бд, ¿д, Сд >, Бд С ¿д С Т, Сд С С,

V = F(Ф(< $,Т,С >)) IVI < V) < я*.

Здесь Ф - оператор отбора объектов, соответствующих задаче, F - оператор отображения объектов. Оператор Ф по сути интерпретирует описание картографического проекта, т.е. реализует часть функций отбора полезных данных.

Достоинством данного подхода к отображению является перераспределение части функций по управлению изображением от пользователя к ГИС. Благодаря этому аналитик освобождается от значительной части рутинной работы. Эффективность интерактивного анализа значительно повышается.

Недостаток: проект имеет сложную информационную структуру, которая чаще всего не документирована. Новый пользователь не ознакомлен с деталями отбора информации и возникает возможность ошибки из-за неверного толкования данных проекта.

Интерактивная отображение картографических данных в ГИС. Отличительная особенность - совместное с ГИС конструирование рабочей области карты и интенсивный интерактивный анализ. Для этого в ГИС вводится система картографических образов 2 = , каждый из которых является описанием семейства картографических изображений для решения некоторого класса прикладных задач. Формальная модель отображения для этого случая выглядит следующим образом:

5 = и ^^ Т = и = и ^^

г г г

!Д =< 5д, ¿д, Сд >, йд ✓ ¿д ✓ Т, Сд ✓ С,

2 = ,

V = ^(Ф(< 5,Т,С >, ))

IVI < V) < я*.

I) —> шаж.

Здесь I(У,2й) является функцией полезности последовательности картографических изображений, формируемых для решения прикладной задачи.

Достоинство: возможность динамично манипулировать данными в определенной смысловой области, стимулируя образное мышление. Потенциально в диалоге реализуется опыт аналитика, скрытые знания о проблеме, которые приводят к более достоверным (соответствующим реальности) решениям.

Недостаток: отсутствие формальных моделей управления диалогом направленных на максимизацию информационного наполнения представления карт. Необходимы дальнейшие исследования в этом направлении.

Изучение подходов к отображению геопространственных данных позволил сделать следующие выводы:

1. рост сложности решаемых задач повышает роль опыта, приобретённого экспертами. Опыт относится к процессу последовательного анализа картографических изображений. В зависимости от содержания изображений, последовательности изучение рабочей области анализа генерируется решения различного качества;

2. увеличение объема хранимых данных в ГИС не ведет к снижению неопределённости применительно к принятию решений. Причина в неочевидности тех закономерностей которые скрыты в больших объемах данных. Сформулировать альтернативу решение невозможно без того, чтобы осознать скрытое в данных содержание. Манипулирование изображением является, по сути, процессом добычи данных (data mining). Получив явно или интуитивно скрытые в данных зависимости, аналитик способен сформировать решение высокого уровня достоверности. Подобный результат является следствием отображения информационного потока анализируемых геопространственных данных высокого качества;

3. геоинформационная система и эксперт образуют систему гибридного интеллекта. Обе стороны участвуют в реализации единой цели. Эта цель есть генерация достоверных решений. Разумность поведения обеих сторон оказывает решающее влияние на результат. Роль ГИС в том, чтобы создавать полезный для генерации решений поток картографических данных. Интеллектуальность решение этой задачи проявляется в отборе наиболее необходимых в смысловом отношении данных. Эксперт рассматривается как система "естественного" интеллекта, воздействующая на поток картографических данных. Разумность этого воздействия заключается в формировании рациональной последовательности запросов на получение картографических данных.

1.2 Свойства геопространственных больших данных, влияющие на их качество при интерактивном анализе

1.2.1 Показатели ценности больших данных

Термин "большие данные"все еще не является четко определенным термином [6]. В общем случае это есть множество данных, которое представляется некоторым структурированным и неструктурированным набором элементов данных, которые ввиду их большого объема достаточно проблематично собрать, сохранить, обработать, проанализировать, а затем управлять их представлять с помощью традиционных аппаратных средств, программного обеспечения и технологий баз данных. Наряду с многочисленными определениями большие данные часто могут быть описаны своими уникальными характеристиками. При определении архитектуры приложений в условиях увеличения объема обрабатываемых данных в работе [7], было предложено три характеристики, которые отражают проблемы и возможности обработки больших объемов данных: объем (Volume), скорость (Velocity) и разнообразие (Variety). Сокращенно 3Vs. В то время как 3Vs достаточно долго используются для описания больших данных, были выявлен дополнительный параметр достоверность (Veracity) для описания целостности и качества данных. Также были предложены дополнительные Vs, такие как изменчивость (variability), валидность (validity), волатильность (volatility), видимость (visibility), ценность (value) или отображение (visualization). Тем не менее, они были встречены критически, поскольку они не обязательно отражают качественные характеристики. Вышеперечисленные дополнительные Vs напрямую не способствуют пониманию того, что слово «большой» в термине «большие данные» не обязательно может указывать на данные большого объема. Они затрагивают важные концепции, связанные со всей процедурой сбора больших данных, обработки и их представления. Заметим, что в работе [8] утверждалось, что 3Vs не могут быть применимы для выявления и классификации больших данных на ранних этапах и было предложен термин «3Cs»: мощность (cardinality), непрерывность (continuity) и сложность (complexity). Очевидно, что поиск определения больших данных и их характеристик является непрерывным процессом, но тем не менее это не

должно оказать негативного влияния на процесс обработки и анализа больших данных.

Используя высказывание «80% всех данных является геоданными» (см обсуждения в работе [9]), большая часть данных в мире имеет географическую привязку, что указывает на важность обработки больших данных геопространственного характера. Геопространственные данные описывают объекты и явления с координатами местоположения в пространственной системе координат. Геопространственные данные традиционно собираются с использованием наземной съемки, фотограмметрии и дистанционного зондирования, а в последнее время - лазерным сканированием, мобильным картографированием, геолокационными датчиками, веб-содержимым с геометкой, географической информацией от волонтеров (УС1), отслеживанием глобальной навигационной спутниковой системы (С^Б).

Анализ показывает, что геопространственные большие данные могут быть охарактеризованы следующими параметрами:

— объем: хранилища, измеряемые петабайтами для данных дистанционного зондирования, постоянно увеличивающиеся объемы наблюдений в режиме реального времени и данные социальных сетей на основе местоположения, огромное количество данных УС1 и т.д., Также постоянное увеличение объема данных такого рода поднимают не только проблемы

с хранением но и анализ большого объема информации [10

— разнообразие: картографические данные, данные изображений, пространственно привязанные текстовые, структурированные и неструктурированные, растровые и векторные данные, все эти разные типы данных, многие со сложными структурами, требуют более эффективных моделей, структурирования, индексирования, технологий управления данными, например, использование NoSQL. На практике такие решения используются все чаще, а преимущества и недостатки

активно обсуждаются в сообществе [11-13

— скорость: данные изображений, обновление которых может иметь большие перерывы при высоком разрешении, непрерывная потоковая передача наблюдений от различных сенсоров, устройства интернета вещей (Internet of Things), трассировка системы навигации в реальном времени и данные социальных сетей требуют согласования скорости ге-

Похожие диссертационные работы по специальности «Информационные системы и процессы, правовые аспекты информатики», 05.25.05 шифр ВАК

Список литературы диссертационного исследования кандидат наук Глушков Андрей Александрович, 2021 год

Список литературы

1. Clarke Keith C. Advances in Geographic Information Systems // Computers, Environment and Urban Systems. — 1986. — Т. 10, № 3. — С. 175 - 184.

2. Салищев К.А. Проектирование и составление карт. — Москва: МГУ, 1987.

— С. 60.

3. Берлянт А.М. Картографический метод иследования. — Москва: МГУ, 1978. — С. 60, 114-118, 120-122.

4. Ebert David S., Favre Jean M, Peikert Ronald. Data visualization // Computers & Graphics. — 2002. — С. 207 - 208.

5. Tory Melanie, Möller Torsten. Human factors in visualization research // IEEE Transactions on Visualization and Computer Graphics. — 2004. — С. 72

- 84.

6. Acar Umut A., Chen Yan. Streaming big data with self-adjusting computation // Proceedings of the 2013 workshop on Data driven functional programming - DDFP '13. — 2013.

7. Laney Doug. 3D Data Management: Controlling Data Volume,Velocity, and Variety // Application Delivery Strategies. — 2001.

8. Suthaharan Shan. Big Data Classification : Problems and Challenges in Network Intrusion Prediction with Machine Learning // Performance Evaluation Review. — 2014. — С. 70-73.

9. Morais C. D. Where is the Phrase "80% of Data is Geographic". — URL:

(дата обращения:

10. Dasgupta Arup. Big data: The future is in analytics // Geospatial World. — 2013. — C. 30 - 31.

11. Geo-spatial Big Data Storage Based on NoSQL Database / S. Li, H. Yang, Y. Huang, Q. Zhou // Wuhan Daxue Xuebao (Xinxi Kexue Ban)/Geomatics and Information Science of Wuhan University. — 2017. — C. 163 - 169.

http://www.gislounge.com/80-percent-data-is-geographic/ 28.02.2017).

12. Big geo data management: An exploration with social media and telecommunications open data / Arias C. Munoz, M. A. Brovelli, S. Corti, G. Zamboni // International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences - ISPRS Archives. — 2016. — C. 595 - 601.

13. Matuszka Tamás, Kiss Attila. Experimental evaluation of some geodata management systems // Proceedings of 2014 9th IEEE International Conference on Computer Engineering and Systems, ICCES 2014. — 2014.

— C. 92-97.

14. Dasgupta Arup. Big data: The future is in analytics // Geospatial World. — 2013. — C. 31 - 34.

15. ShekharS. Evans M.R. Gunturi V. Yang K. Cugler D.C. Benchmarking spatial big data // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). — 2014.

— C. 81-86.

16. Gomes Lee. Machine-Learning Maestro Michael Jordan on the Delusions of Big Data and Other Huge Engineering Efforts // IEEE Spectrum.

— 2014. — URL: https://spectrum.ieee.org/robotics/artificial-intelligence

machinelearning-maestro-michael-jordan-on-the-delusions-of-big-data-and-other-h'

(дата обращения: 21.10.2018).

17. Viktor Mayer-Schonberger Kenneth Cukier. Big Data: A Revolution That Will Transform How We Live, Work, and Think. - 2013. - С. 21-23.

18. Lee Jae-Gil, Kang Minseo. Geospatial Big Data: Challenges and Opportunities // Big Data Research. — 2015. — С. 74 - 81.

19. Wang Shuliang, Yuan Hanning. Spatial Data Mining in the Context of Big Data // 2013 International Conference on Parallel and Distributed Systems.

2013. — С. 486-491.

20. Wang Shuliang, Yuan Hanning. Spatial Data Mining: A Perspective of Big Data // International Journal of Data Warehousing and Mining. — 2014. — C. 50-87.

21. Tan Haoyu, Luo Wuman, Ni Lionel M. CloST: a hadoop-based storage system for big spatio-temporal data analytics // Proceedings of the 21st ACM international conference on Information and knowledge management - CIKM '12. - 2012. - C. 2139-2143.

22. Wang Yonggang, Wang Sheng. Research and implementation on spatial data storage and operation based on Hadoop platform // 2010 2nd IITA International Conference on Geoscience and Remote Sensing, IITA-GRS 2010.

- 2010. - C. 275 - 278.

23. Hadoop-GIS: A High Performance Spatial Data Warehousing System over MapReduce. / Ablimit Aji, Fusheng Wang, Hoang Vo h gp. // Proceedings of the VLDB Endowment International Conference on Very Large Data Bases.

- 2013. - C. 1009 - 1020.

24. Cheng Tao, Haworth James, Manley Ed. Advances in geocomputation (1996-2011) // Computers, Environment and Urban Systems. - 2012. - C. 481

- 487.

25. Guan Qingfeng, Clarke Keith C. A general-purpose parallel raster processing programming library test application using a geographic cellular automata model // International Journal of Geographical Information Science. - 2010.

- C. 695-722.

26. Guan Qingfeng, Kyriakidis Phaedon C., Goodchild Michael F. A parallel computing approach to fast geostatistical areal interpolation // International Journal of Geographical Information Science. - 2011. - C. 1241-1267.

27. Grid-enabling geographically weighted regression: A case study of participation in higher education in England / Richard Harris, Alex Singleton, Daniel Grose et al. // Transactions in GIS. - 2010.

28. Longley Paul A., Adnan Muhammad, Lansley Guy. The geotemporal demographics of twitter usage // Environment and Planning A. - 2015. -C. 465-484.

29. Bolbol Adel, Cheng Tao, Tsapakis Ioannis. Inferring hybrid transportation modes from sparse GPS data using a moving window SVM classification // Computers, Environment and Urban Systems. - 2012. - C. 354-361.

30. Jiang Bin, Miao Yufan. The Evolution of Natural Cities from the Perspective of Location-Based Social Media // Professional Geographer. — 2015. — С. 295

- 306.

31. Jiang Bin. Geospatial analysis requires a different way of thinking: the problem of spatial heterogeneity // GeoJournal. — 2014. — С. 1-13.

32. Ломов Б. Ф. Основы инженерной психологии. Учебник. — Москва: Высшая школа, 1986. — С. 448.

33. Л. С. Берштейн С.Л. Беляков. Геоинформационные справочные системы. Научное издание. — Таганрог: ТРТУ, 2001. — С. 160.

34. Gibson James J. The Ecological Approach to the Visual Perception of Pictures // Leonardo. — 1978. — С. 198-210.

35. Butler John C. An introduction to geoscience education resources on the Internet // Computers and Geosciences. — 1995. — С. 817-824.

36. Paul A. Longley Michael F. Goodchild David J. Maguire David W. Rhind. Geographical Information Systems and Science. — 2011. — С. 34-38.

37. Encyclopedia of GIS / Под ред. Shashi Shekhar, Hui Xiong. — Springer, 2008.

— С. 122.

38. Shekar S., Chawla S. Spatial Databases: A Tour. — 2003. — С. 21.

39. World Geospatial. Mansour Raad Discusses Geospatial Big Data: The Next

Big Trend in Analytics. — URL: https://www.geospatialworld.net/article/

mansour-raad-discusses-geospatial-bigdata-the-next-big-trend-in-analytics/

?utm_content=buffer3709f&amp;utm_medium=social&amp;utm_source=

linkedin.com&amp;utm_campaign=buffer (дата обращения: 28.02.2018).

40. Codd Edgar Frank. A Relational Model of Data for Large Shared Data Banks // Communications of the ACM. - 1970. - C. 377-387.

41. Brin S, Page L. The anatomy of a large scale hypertextual Web search engine // Computer Networks and ISDN Systems. — 1998. — C. 107-117.

42. Fayyad Usama, Piatetsky-Shapiro Gregory, Smyth Padhraic. From Data Mining to Knowledge Discovery in Databases // AI Magazine. — 1996. — C. 27-54.

43. Frankel Felice, Reid Rosalind. Big data: Distilling meaning from data. — 2008.

44. Pangbourne Kate, Alvanides Seraphim. Towards intelligent transport geography // Journal of Transport Geography. — 2014. — C. 231 - 232.

45. Autodesk. AUTOCAD MAP 3D TOOLSET. - URL: https://www.autodesk.

eu/products/autocad/included-toolsets/autocad-map-3d (дата обращения:

25.02.2018).

46. Malikova Evgeniya, Pilyugin Victor, Adzhiev Valery. Scientific visualization extended with sonification for data analysis // Proceedings of the International Conferences on Interfaces and Human Computer Interaction 2014, Game and Entertainment Technologies 2014 and Computer Graphics, Visualization, Computer Vision and Image Processing 2014 - Part of the Multi Conference on Comp. - 2014. - C. 348-352.

47. Burigat Stefano, Chittaro Luca. Interactive visual analysis of geographic data on mobile devices based on dynamic queries // Journal of Visual Languages & Computing. - 2008. - C. 99 - 122.

48. A dynamic data model for mobile GIS / Wenzhong Shi, Kawai Kwan, Geoffrey Shea, Jiannong Cao // Computers & Geosciences. - 2009. - C. 2210 - 2221.

49. Ang Li-Minn, Seng Kah Phooi. Big Sensor Data Applications in Urban Environments // Big Data Research. - 2016. - C. 1-12.

50. ELAN: An Efficient Location-Aware Analytics System / Yaxiao Liu, Henan Wang, Guoliang Li et al. // Big Data Research. - 2016.

51. Turner Andrew J. Introduction to Neogeography. - 2006. - C. 76-78.

52. Taylor D R Fraser, Lauriault Tracey P. Chapter 22 - Conclusion and the Future of Cybercartography // Developments in the Theory and Practice of CybercartographyApplications and Indigenous Mapping. - 2014. - C. 343 -350.

53. Lindholm Mikko, Sarjakoski Tapani. Designing a Visualization User Interface // Modern Cartography Series. — 1994. — С. 167 - 184.

54. Cranley Nicola, Perry Philip, Murphy Liam. Dynamic content-based adaptation of streamed multimedia // Journal of Network and Computer Applications. — 2007. — С. 983 - 1006.

55. Assessing the effectiveness of different visualizations for judgments of positional uncertainty / Grant McKenzie, Mary Hegarty, Trevor Barrett, Michael Goodchild // International Journal of Geographical Information Science. — 2016. — С. 221 - 239.

56. POI Pulse: A Multi-granular, Semantic Signature-Based Information Observatory for the Interactive Visualization of Big Geosocial Data / Grant McKenzie, Krzysztof Janowicz, Song Gao и др. // Cartographica. — 2015. — С. 71 - 85.

57. Creative problem solving in digital space using visual analytics / Jacob L. Cybulski, Susan Keller, Lemai Nguyen, Dilal Saundage // Computers in Human Behavior. — 2015. — С. 20 - 35.

58. S.L. Belyakov A.V. Bozhenyuk M.L. Belykova, Rozenberg I.N. Model Of Intellectual Visualization Of Geoinformation Service // Proceedings of 28th European Conference on Modelling and Simulation ECMS. — 2014. — С. 326 - 333.

59. Sors L.A.S., Santalo L.A., Kac M. Integral Geometry and Geometric Probability. Cambridge Mathematical Library. — Beijing World Publishing Corporation (BJWPC), 2004. — С. 47.

60. И.Н. Розенберг. Спутниковые и геоинформационные технологии в интеллектуальных системах управления // Железнодорожный транспорт. — 2013. — № 3. — С. 28 - 32.

61. Беляков С. Л. Белякова М.Л. Самойлов Д. С. Геоинформационный сервис ситуационного центра // Информационные технологии. — 2011. — № 8. — С. 29 - 32.

62. Keller G. Randy, Baru Chaitanya. Geoinformatics: Cyberinfrastructure for the solid earth sciences. — 2011. — С. 33, 42.

63. Geoinformatics: Transforming data to knowledge for geosciences / A. Krishna Sinha, Zaki Malik, Abdelmounaam Rezgui и др. // GSA Today. — 2010. — С. 4 - 10.

64. ОСТ 68-3.4.1-03, ОСТ 68-3.4.2-03 «Карты цифровые. Методы оценки качества данных. Общие положения». — Роскартография РФ. — 2003. — 6.

65. Куртеев В. В. Проблемы качества картографической продукции на рынке геоинформатики. — URL: http://www.gisa.ru/38246.html (дата обращения:

22.02.2018).

66. Rice Matthew T., Jacobson R. Daniel, Caldwell Douglas R. u др. Crowdsourcing techniques for augmenting traditional accessibility maps with transitory obstacle information // Cartography and Geographic Information Science. - 2013. - C. 210 - 219.

67. Sui Daniel, Elwood Sarah, Goodchild Michael. Crowdsourcing geographic Knowledge: Volunteered geographic information (VGI) in theory and practice.

2013. - C. 191-213.

68. See Linda, Mooney Peter, Foody Giles и др. Crowdsourcing, Citizen Science or Volunteered Geographic Information? The Current State of Crowdsourced Geographic Information // ISPRS International Journal of Geo-Information. — 2016. - С. 50-72.

69. Fritz Steffen, McCallum Ian, Schill Christian и др. Geo-wiki.org: The use of crowdsourcing to improve global land cover. — 2009.

70. Беляков С. Л. Розенберг И.Н. Программные интеллектуальные оболочки геоинформационных систем. — Москва: Научный мир, 2010. — С. 5,13,36.

71. Беляков СЛ. Диденко Д.А. Самойлов Д. С. Адаптивная процедура управления представлением рабочей области электронной карты // Известия ЮФУ. Технические науки. — 2011. — № 1-114. — С. 125 - 130.

72. Belyakov S. Belyakova M. Glushkov A. Visualization of Spatial Data Adaptive to Changes in the Database Structure // Proc. 2nd International Conference on Information Science and Security (ICISS). — 2015. — С. 185-188.

73. Angelov Plamen, Filev Dimitar, Kasabov Nikola. Evolving intelligent systems : methodology and applications. — 2010. — С. 112.

74. Angelov P. Autonomous Learning Systems: From Data Streams to Knowledge in Real-time. — 2012. — С. 43.

75. Вагин В.Н. Головина Е.Ю. Загорянская А.А. Фомина М.В. Достоверный и правдоподобный вывод в интеллектуальных системах. — Москва: ФИЗ-МАТЛИТ, 2008. — С. 588.

76. Weng Lilian, Menczer Filippo, Ahn Yong-Yeol. Virality Prediction and Community Structure in Social Networks // Scientific Reports. — 2013. — С. 1-18.

77. Chung Kon Shing Kenneth, Piraveenan Mahendra, Levula Andrew Vakarau и др. Assessing online community-building through assortativity, density and centralization in social networks // Proceedings of the Annual Hawaii International Conference on System Sciences. — 2013. — С. 1-13.

78. Waller Matthew A., Fawcett Stanley E. Click here for a data scientist: Big data, predictive analytics, and theory development in the era of a maker movement supply chain // Journal of Business Logistics. — 2013. — С. 249-252.

79. Сантало Л.А., Максимов В.М., Амбартзумиан Р.В. Интегральная геометрия и геометрические вероятности. — Наука, 1983. — С. 214.

80. Коваленко И.Н., Филиппова А.А. Теория вероятностей и математическая статистика. Высшее образование. — Высшая школа, 1982. — С. 78-80.

81. Banerjee Joydipto. Moving to the cloud: Workload migration techniques and approaches // 2012 19th International Conference on High Performance Computing, HiPC 2012. — 2012. — С. 1-10.

82. Varia Jinesh. Architecting for the Cloud : Best Practices // Amazon Web Service. — 2010. — С. 1 - 23.

83. Liu Anna, Cai Rainbow. Architecting Cloud Computing Applications and Systems // 2011 Ninth Working IEEE/IFIP Conference on Software Architecture. — 2011. — С. 310 - 311.

84. Vandikas Konstantinos, Tsiatsis Vlasios. Microservices in IoT clouds // 2016 Cloudification of the Internet of Things, CloT 2016. — 2017. — С. 1-13.

85. High-performance docker integration scheme based on OpenStack / Sijie Yang, Xiaofeng Wang, Xiaoxue Wang et al. // World Wide Web. — 2020.

86. Balalaie Armin, Heydarnoori Abbas, Jamshidi Pooyan. Microservices Architecture Enables DevOps: Migration to a Cloud-Native Architecture // IEEE Software. — 2016. — С. 42 - 52.

87. Di Francesco Paolo, Malavolta Ivano, Lago Patricia. Research on Architecting Microservices: Trends, Focus, and Potential for Industrial Adoption // Proceedings - 2017 IEEE International Conference on Software Architecture, ICSA 2017. — 2017. — С. 21 - 30.

88. Performance evaluation of microservices architectures using containers / Marcelo Amaral, Jorda Polo, David Carrera и др. // Proceedings - 2015 IEEE 14th International Symposium on Network Computing and Applications, NCA 2015. — 2016. — С. 121 - 144.

89. Casalicchio Emiliano, Iannucci Stefano. The state-of-the-art in container technologies: Application, orchestration and security // Concurrency Computation. — 2020.

90. Rodriguez Maria, Buyya Rajkumar. Container Orchestration With Cost-Efficient Autoscaling in Cloud Computing Environments. — 2020.

91. Pilone By Dan, Pitman Neil. UML 2.0 in a Nutshell. — 2005. — С. 114-129.

92. Д. Арлоу А. Нейштадт. UML 2 и Унифицированный процесс: практический объектно-ориентированный анализ и проектирование. — СПб.: Символ, 2008. — С. 23-51.

93. Wormhole: Reliable Pub-Sub to Support Geo-replicated Internet Services / Yogeshwer Sharma, Philippe Ajoux, Petchean Ang и др. // Proceedings of the 12th USENIX Symposium on Networked Systems Design and Implementation (NSDI). — 2015. — С. 351 - 366.

94. Design Patterns: Elements of Reusable Object-Oriented Software / E. Gamma, R. Helm, R. Johnson, J. Vlissides. Addison-Wesley Professional Computing Series. - Pearson Education, 1994. - C. 97-132.

95. Redis Documentation. — 2020. — URL: https://redis.io/documentation (дата обращения: 02.08.2020).

96. Flask Documentation. — 2020. — URL: http://flask.pocoo.org/docs/ (дата обращения: 08.05.2020).

97. Werkzeug Documentation. — 2020. — URL: https://palletsprojects.com/p/

werkzeug/ (дата обращения: 09.07.2020).

98. Jinja2 Documentation. — 2020. — URL: http://jinja.pocoo.org/docs (дата обращения: 11.08.2020).

99. Pavan Kumar Potti, Sanjay Ahuja, Zornitza Prodanoff. Comparing Performance of Web Service Interaction Styles : SOAP vs . REST // Proceedings of the Conference on Information Systems Applied Research. — 2012. — С. 1 - 24.

100. Performance comparison of CRUD methods using NET Object relational mappers: A case study / Doina Zmaranda, Lucian Laurentiu Pop-Fele, Cornelia Gyorodi et al. // International Journal of Advanced Computer Science and Applications. — 2020.

101. Colley Derek, Stanier Clare, Asaduzzaman Md. The Impact of Object-Relational Mapping Frameworks on Relational Query Performance. — 2018. — 10.

102. Data mining in the life science swith random forest: A walk in the park or lost in the jungle? / Wouter G. Touw, Jumamurat R. Bayjanov, Lex Overmars и др. // Briefings in Bioinformatics. — 2013. — С. 315 - 326.

103. Gromping Ulrike. Variable importance assessment in regression: Linear regression versus random forest // American Statistician. — 2009. — С. 309 -319.

104. Dietterich Thomas G. Ensemble Methods in Machine Learning // Multiple Classifier Systems. - 2000. - C. 1 - 15.

105. Dong Xibin, Yu Zhiwen, Cao Wenming et al. A survey on ensemble learning. - 2020.

106. Scikit-learn Documentation. — 2020. — URL: http://scikit-learn.org/stable

documentation.html (дата обращения: 04.02.2020).

107. The Art of Data Science: A Guide for Anyone Who Works with Data / Roger D Peng, Elizabeth Matsui, Roger D. Peng & Elizabeth Matsui h gp. // Journal of Chemical Information and Modeling. — 2015. — C. 14-25.

108. Data mining with big data / Xindong Wu, Xingquan Zhu, Gong Qing Wu, Wei Ding // IEEE Transactions on Knowledge and Data Engineering. — 2014. — C. 231-269.

109. Peng Roger D. R Programming for Data Science // Aging. — 2015. — C. 15-38.

110. Rathee Amandeep. Comparing Random Forest, XGBoost and Deep

Neural Network. — 2020. — URL: https://www.kaggle.com/arathee2/

random-forest-vs-xgboost-vs-deep-neural-network (дата обращения:

23.01.2020).

111. Bühlmann Peter, Yu Bin. Analyzing bagging // Annals of Statistics. — 2002.

- C. 927 - 961.

112. Pokorny Jaroslav. NoSQL databases: A step to database scalability in web environment // International Journal of Web Information Systems. — 2013.

— C. 69 - 82.

113. Nayak Ameya, Poriya Anil, Poojary Dikshay. Type of NOSQL Databases and its Comparison with Relational Databases // International Journal of Applied Information Systems. — 2013. — C. 16 - 19.

114. Wendl Chris. Introduction: Motivation // Lectures on Contact 3-Manifolds, Holomorphic Curves and Intersection Theory. — 2020.

115. Morabito Roberto, Kjallman Jimmy, Komu Miika. Hypervisors vs. lightweight virtualization: A performance comparison // Proceedings - 2015 IEEE International Conference on Cloud Engineering, IC2E 2015. — Institute of Electrical and Electronics Engineers Inc., 2015. — C. 386-393.

116. Containers and Virtual Machines at Scale / Prateek Sharma, Lucas Chaufournier, Prashant Shenoy, Y. C. Tay // Proceedings of the 17th International Middleware Conference on - Middleware '16. — ACM Press. — С. 1-13.

117. Подорожный И. В. Светличный А. Н. Подлеснов А. В. Введение в контейнеры, виртуальные машины и docker // Молодой ученый. — 2016. — С. 49 - 53.

118. Carter Eric. 2018 Docker usage report. — 2018. — URL: https://sysdig.com/ blog/2018-docker-usage-report/ (дата обращения: 06.09.2019).

Список рисунков

1.1 Пример компонентов архитектуры ГИС для анализа больших геопространственных данных.......................119

1.2 Пример маршрута, полученного с помощью Yandex Map................124

1.3 Пример маршрута с дополнительными слоями............................124

1.4 Фрагмент карты, выбранный для принятия решения о наилучшем маршруте......................................................................25

2.1 Информационная модель ГИС с рабочей областью...........129

2.2 Рабочая область в начале анализа..........................................32

2.3 Фрагмент рабочей области..................................................32

2.4 Диаграмма действий при поиске решения................135

2.5 Карта с маршрутом........................................................148

2.6 Карта с зонами блокировки парковок....................................148

2.7 Информационная модель ГИС, использующая новую модель РО. . . 51

3.1 Пример рабочей области анализа..........................................158

3.2 Пример рабочей области анализа..........................................158

3.3 Примеры ошибок на картах................................................160

3.4 Схема адаптации............................................................165

3.5 Область для передачи полезных данных..................................174

4.1 Высокоуровневая архитектура программного комплекса................82

4.2 UML-диаграмма прецедентов для геосервиса с системой интеллектуальной поддержки..............................................184

4.3 Общая UML диаграмма активности (Activity Diagram)..................186

4.4 Общая схема взаимодействия сервисов....................................188

4.5 UML-диаграмма последовательности (Sequence diagram) взаимодействия сервисов с точки зрения шины данных..................189

4.6 UML-диаграмма классов сервиса адаптации..............................192

4.7 Принцип работы алгоритма случайный лес (random forest)......196

4.8 Алгоритм разметки данных для сервиса адаптации с прикладной точки зрения..................................................................197

4.9 Сравнение ошибок дерева решений с деревом решений с бэггингом. . 100

4.10 График зависимости ошибки от количества деревьев в процессе обучения модели...............................101

4.11 Диаграмма движения информационных потоков внутри сервиса. . . 102

4.12 иМЬ диаграмма классов сервиса сбора данных.............105

4.13 Концептуальная схема сочетания компонентов контейнеризации. . . 108

4.14 Схема расположения сервисов в ^екег-контейнерах..........111

Г.1 Свидетельство о государственной регистрации программы для ЭВМ 1169 Г.2 Уведомление о принятии заявки на патент в Европейское

Патентное Бюро..............................170

Г.3 Уведомление о принятии заявки на патент в Европейское

Патентное Бюро .............................. 171

Д.1 Акт о внедрении результатов в Samsung Electornics Corp........173

Д.2 Акт о внедрении результатов в Samsung Electronics Corp........1174

Д.3 Акт о внедрении результатов в ООО «Дистиллери»...........175

Д.4 Акт о внедрении результатов в НТЦ "Интех"ЮФУ...........1176

Список таблиц

1 Представления рабочих областей с и-о^е^Б............................155

2 Состояния системы и их интерпретация ..................................66

3 Наименования контекстов и средние значения оценок.........113

4 Коэффициенты избыточности и оценки полезности для контекста «Администратор».............................115

5 Коэффициенты избыточности и оценки полезности для контекста «Отдел безопасности»...........................115

6 Коэффициенты избыточности и оценки полезности для контекста «Отдел энергоснабжения» ..................................................116

7 Коэффициенты избыточности и оценки полезности для контекста «Отдел инженерных коммуникаций» ..................1116

8 Коэффициенты избыточности и оценки полезности для контекста «Отдел логистики» ........................................................117

9 Наименования контекстов и средние значения оценок.........117

10 Изменения параметров до и после внедрения системы интеллектуальной помощи геосервиса в процентах...........118

Приложение А

Листинги открытой части (Open Source) Place Context Provider

Tizen SDK 2.4

Работа с контекстными геоданными. Полный исходный код данного приложения доступен по ссылке: https://review.tizen.org/git/?p=framework/

context/place-context-provider.git;a=tree;hb=refs/heads/accepted/

tizen_2.4_mobile

Все проекты доступны по ссылке: |https://review.tizen.org/git/?a=

project_list;pf=framework/context

5

Листинг А.1 Исходный код C++файла src_geofence_myplace_handle.cpp /*

* Copyright (c) 2015 Samsung Electronics Co., Ltd.

*

* Licensed under the Apache License, Version 2.0 (the "License

* you may not use this file except in compliance with the License.

* You may obtain a copy of the License at

*

* http ://www. apache. org/ licenses/LICENSE-2.0

*

* Unless required by applicable law or agreed to in writing, software

* distributed under the License is distributed on an "AS IS" BASIS,

* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

* See the License for the specific language governing permissions and

* limitations under the License. */

10

15

#include <types_internal.h> #include <json.h> #include <context_mgr.h> #include "place_geofence_types.h' #include "myplace_handle.h"

ctx::myplace_handle::myplace_handle() : _place_id(-1) 25 , prev_state(GEOFENCE_STATE_UNCERTAIN) , geo_handle(NULL)

{ }

30 ctx::myplace_handle::~myplace_handle() {

stop_monitor();

}

35 bool ctx::myplace_handle::start_monitor(int place_id) {

_D("Starts to monitor Place -7,d" , place_id) ;

IF_FAIL_RETURN(place_id >= 0, false); 40 IF_FAIL_RETURN_TAG(geo_handle == NULL, false, _E, "Re-starting MyPlace monitor");

geofence_manager_create(&geo_handle); IF_FAIL_RETURN_TAG(geo_handle, false, _E, "Geofence initialization failed");

45

50

int ret ;

ret = geofence_manager_set_geofence_state_changed_cb( geo_handle, fence_state_cb, this);

IF_FAIL_CATCH_TAG(ret == GEOFENCE_MANAGER_ERROR_NONE , _E , " Setting state callback failed");

ret = geofence_manager_set_geofence_event_cb(geo_handle, fence_event_cb , this);

IF_FAIL_CATCH_TAG(ret == GEOFENCE_MANAGER_ERROR_NONE , _E , " Setting event callback failed");

ret = geofence_manager_foreach_place_geofence_list(geo_handle place_id, fence_list_cb, this);

IF_FAIL_CATCH_TAG(ret == GEOFENCE_MANAGER_ERROR_NONE, _E, " Getting fence list failed");

_place_id = place_id;

65

70

75

80

85

90

return true;

CATCH :

stop_monitor () ; return false;

}

int ctx::myplace_handle::get_place_id() {

return _place_id;

}

void ctx::myplace_handle::stop_monitor() {

_D("Stops monitoring Place-%d", _place_id);

//TODO: Do we need to stop all geofences explicitly ? if (geo_handle) {

geofence_manager_destroy(geo_handle); geo_handle = NULL;

}

geo_state_map.clear () ; _place_id = -1;

prev_state = GEOFENCE_STATE_UNCERTAIN;

}

bool ctx::myplace_handle::start_fence(int fence_id) {

int ret;

ret = geofence_manager_start(geo_handle, fence_id); IF_FAIL_RETURN_TAG(ret == GEOFENCE_MANAGER_ERROR_NONE , true _W, "Starting failed");

geofence_status_h status;

ret = geofence_status_create(fence_id, &status); IF_FAIL_RETURN_TAG(ret == GEOFENCE_MANAGER_ERROR_NONE, true _W, "Getting status failed");

geofence_state_e state = GEOFENCE_STATE_UNCERTAIN; geofence_status_get_state(status , & state) ; geofence_status_destroy(status);

105

110

115

120

125

130

geo_state_map[fence_id] = state; return true;

}

void ctx::myplace_handle::remove_fence(int fence_id)

{

geofence_manager_stop(geo_handle, fence_id); geo_state_map.erase(fence_id);

}

void ctx::myplace_handle::update_fence(int fence_id, geofence_manage_e manage)

{

switch (manage) {

case GEOFENCE_MANAGE_PLACE_REMOVED: _W("[Place-%d] Removed", _place_id); stop_monitor(); break;

case GEOFENCE_MANAGE_FENCE_ADDED:

_I(" [Place %d] Fence-%d added", _place_id , fence_id); start_fence(fence_id); emit_state_change(); break;

case GEOFENCE_MANAGE_FENCE_REMOVED:

_I("[Place-%d] Fence-%d removed", _place_id, fence_id); remove_fence(fence_id); emit_state_change(); break;

case GEOFENCE_MANAGE_FENCE_STARTED:

_D("[Place-%d] Fence-%d started", _place_id , fence_id); break;

case GEOFENCE_MANAGE_FENCE_STOPPED:

_D("[Place-%d] Fence-%d stopped", _place_id, fence_id);

//TODO: Do we need to restart this?

break;

default:

_D("[Place-%d] Ignoring the manage event %d", _place_id, manage); break;

}

145

150

155

160

165

170

void ctx::myplace_handle::update_state(int fence_id, geofence_state_e state)

{

geo_state_map[fence_id] = state;

}

static const char* get_state_string(geofence_state_e state) {

switch (state) {

case GEOFENCE_STATE_IN:

return MYPLACE_EVENT_IN; case GEOFENCE_STATE_OUT:

return MYPLACE_EVENT_OUT; case GEOFENCE_STATE_UNCERTAIN:

return MYPLACE_EVENT_UNCERTAIN; default:

return MYPLACE_EVENT_UNCERTAIN;

}

}

void ctx::myplace_handle::emit_state_change() {

geofence_state_e current_state = GEOFENCE_STATE_UNCERTAIN; int out_count = 0;

for (geo_state_map_t::iterator it = geo_state_map.begin(); it != geo_state_map.end () ; ++it) { if (it-> second == GEOFENCE_STATE_IN) { current_state = GEOFENCE_STATE_IN; break;

} else if (it->second == GEOFENCE_STATE_OUT) { ++ out_count;

}

}

if (current_state != GEOFENCE_STATE_IN && out_count > 0) { current_state = GEOFENCE_STATE_OUT;

}

if (current_state == prev_state) { return;

}

185

190

195

200

205

210

prev_state = current_state; json option;

option.set(NULL, PLACE_STATUS_DATA_MYPLACE_ID, _place_id); json data;

data.set(NULL, PLACE_STATUS_DATA_MYPLACE_ID, _place_id); data.set(NULL, PLACE_STATUS_DATA_MYPLACE_EVENT, get_state_string(current_state));

context_manager::publish(PLACE_SUBJ_GEOFENCE, option, ERR_NONE , data);

}

bool ctx::myplace_handle::fence_list_cb(int geofence_id, geofence_h fence, int fence_index, int fence_cnt, void* user_data)

{

_D("FenceID: %d, Index: %d, Count: %d", geofence_id, fence_index , fence_cnt);

IF_FAIL_RETURN(fence_cnt > 0, false);

myplace_handle *handle = reinterpret_cast<myplace_handle*>( user_data);

return handle->start_fence(geofence_id);

}

void ctx::myplace_handle::fence_event_cb(int place_id, int geofence_id, geofence_manager_error_e error, geofence_manage_e manage, void* user_data)

{

IF_FAIL_VOID_TAG(error == GEOFENCE_MANAGER_ERROR_NONE, _W , Geofence error: %d" , error);

myplace_handle *handle = reinterpret_cast<myplace_handle*>( user_data);

IF_FAIL_VOID_TAG(place_id == handle->get_place_id(), _W, " Mismatched Place ID");

handle->update_fence(geofence_id, manage);

5

void ctx::myplace_handle::fence_state_cb(int geofence_id, geofence_state_e state, void* user_data)

{

myplace_handle *handle = reinterpret_cast<myplace_handle*>( user_data); handle->update_state(geofence_id, state); handle->emit_state_change();

}

Листинг А.2 Исходный код C++файла src_geofence_place_geofence.cpp /*

* Copyright (c) 2015 Samsung Electronics Co., Ltd.

*

* Licensed under the Apache License , Version 2.0 (the "License

* you may not use this file except in compliance with the License.

* You may obtain a copy of the License at

*

* http ://www.apache.org/ licenses/LICENSE-2.0

*

* Unless required by applicable law or agreed to in writing, software

* distributed under the License is distributed on an "AS IS" BASIS,

* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

* See the License for the specific language governing permissions and

* limitations under the License. */

#include <geofence_manager.h>

#include <types_internal.h> #include <json.h> #include <context_mgr.h> #include "place_geofence.h"

ctx: :place_geofence_provider *ctx : :place_geofence_provider: : __instance = NULL;

10

15

20

35

40

45

50

55

ctx: :place_geofence_provider: :place_geofence_provider() {

}

ctx: :place_geofence_provider: :~place_geofence_provider() {

for (handle_map_t::iterator it = __handle_map.begin(); it != __handle_map.end(); ++it) { delete it->second;

}

__handle_map.clear();

}

ctx: :context_provider_iface * ctx : :place_geofence_provider: : create(void *data)

{

IF_FAIL_RETURN(!__instance, __instance);

__instance = new(std::nothrow) place_geofence_provider(); IF_FAIL_RETURN_TAG(__instance, NULL, _E, "Memory allocation failed");

_I(BLUE("Created")); return __instance;

}

void ctx::place_geofence_provider::destroy(void *data) {

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.