Модели и алгоритмы оценки и прогнозирования показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Морозова Валерия Олеговна
- Специальность ВАК РФ00.00.00
- Количество страниц 194
Оглавление диссертации кандидат наук Морозова Валерия Олеговна
Введение
1. Современное состояние моделирования процессов решения задач аналитической работы в правоохранительных органах
1.1. Описание существующих типов задач аналитической работы в правоохранительных органах, включающих решение расчетных задач
1.2. Существующие подходы к исследованию статистических моделей с использованием математических методов
1.3. Общая схема проведения исследования
1.4. Выводы по разделу
2. Изучение массивов правовой статистики в интересах решения задач аналитической работы сотрудников правоохранительных органов
2.1. Метод построения функциональной схемы использования данных правовой статистики в задачах нахождения показателей для осуществления аналитической работы сотрудниками правоохранительных органов
2.2. Нахождение масштабированной начальной выборки для решения расчётных задач
2.3. Анализ типов аномальных значений в массивах данных правовой статистики
2.4. Выводы по разделу
3. Численные методы и алгоритмы решения расчётных задач для осуществления аналитической работы сотрудниками правоохранительных органов
3.1. Численный метод и алгоритм определения состава расчётных показателей и данных для решения расчётных задач
3.2. Численные методы решения расчётных задач на основе нахождения актуальной выборки временных данных правовой статистики
3.3. Численные методы решения расчётных задач на основе нахождения актуальной выборки пространственно-временных данных правовой статистики
3.4. Численные методы решения расчётных задач на основе нахождения актуальной выборки пространственных данных правовой статистики
3.5. Выводы по разделу
4. Комплекс программ для оценки и прогнозирования показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов
4.1. Обоснование состава и описание процесса функционирования комплекса программ
4.2. Описание программ комплекса для работы с данными правовой статистики
4.3. Описание программ комплекса для решения расчётных задач
4.4. Результаты моделирования с использованием комплекса программ
Заключение
Список использованной литературы
Приложение № 1. Свидетельства о государственной регистрации программ для
ЭВМ
Приложение № 2. Акты внедрения
Приложение № 3. Результаты использования комплекса программ для
выявления аномальных значений показателя «Преступления террористической
направленности» с 2011 по 2022 г
Приложение № 4. Результаты использования комплекса программ для оценки и прогнозирования уровня криминогенной обстановки в федеральных округах
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Модели и алгоритмы выбора мер пожарной безопасности на основе исследования массивов пожарной статистики2015 год, кандидат наук Меньших, Анастасия Валерьевна
Модели и алгоритмы оценки живучести эргатических систем управления органов внутренних дел в условиях структурных преобразований2022 год, кандидат наук Зверев Георгий Игоревич
Методы и алгоритмы поддержки принятия решений центрами оперативно-разыскной информации2015 год, кандидат наук Новикова, Онега Юрьевна
Модели и алгоритмы аналитической деятельности ситуационных центров органов внутренних дел2022 год, кандидат наук Терентьев Александр Андреевич
Методология обеспечения аналитической разведки криминальных процессов и явлений2007 год, доктор технических наук Белоглазов, Евгений Григорьевич
Введение диссертации (часть автореферата) на тему «Модели и алгоритмы оценки и прогнозирования показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов»
ВВЕДЕНИЕ
Актуальность темы исследования. В современных условиях повышение эффективности принятия управленческих решений в правоохранительных органах осуществляется за счет совершенствования аналитической работы, базирующейся на результатах вычисления значений различных показателей, необходимых для принятия этих решений. Следовательно, чем выше точность рассчитанных показателей, тем выше обоснованность результатов аналитической работы и эффективность принимаемых управленческих решений.
Принятие управленческих решений осуществляется на основе аналитической работы и в значительной степени определяется результатами оценки текущих и прогнозирования будущих значений показателей. Прогнозирование возможно осуществить только на основе ретроспективного анализа данных, используемых сотрудниками правоохранительных органов, которые принято называть данными правовой статистики.
Особенность решения этой задачи заключается в ограниченности объема предоставляемых данных, что не позволяет использовать технологии Bigdata.
Кроме того, вычисления, производимые в интересах решения задач аналитической работы, часто носят уникальный характер и должны быть получены за ограниченное время. Это сужает возможность использования искусственных нейронных сетей, так как время их настройки и обучения, как правило, значительно превышает время оперативной ценности получаемой с их использованием информации.
В связи с этим для получения результатов могут быть использованы статистические методы. Однако их использование затрудняется следующими обстоятельствами:
1) из криминологических исследований бывают известны определённые свойства данных правовой статистики, например наличие тенденции, сезонности,
которые, как правило, в значительной степени искажены наличием социально-экономических и/или внешне- и внутриполитических событий, приводящих к появлению аномальных значений;
2) в официальной статистике данные содержатся только в виде количественных значений, а сотрудники правоохранительных органов часто оперируют вербально заданными качественными оценками показателей.
В настоящее время единого формального подхода к решению этих задач не существует, а математический аппарат разработан в не достаточной мере, что существенно сказывается на эффективности работы сотрудников.
Степень разработанности темы. Многообразие математических моделей объясняется большим спектром задач, основанных на использовании различных математических методов [1, 2, 15, 16, 27], которые решают сотрудники правоохранительных органов, занимающиеся аналитической работой с применением математических методов.
Различные аспекты аналитической деятельности, в том числе в правоохранительной сфере, с применением математических методов и моделей исследованы в работах В. А. Минаева, С. В. Бухарина, В. В. Меньших, О. В. Пьянкова, А. В. Мельникова, В. А. Родина, С. Н. Тростянского,
A. В. Бецкова, И. В. Горошко, Е. А. Пастушковой, А. И. Орлова, А. Н. Борисова,
B. И. Новосельцева, А. В. Алексеева, О. А. Крумберга, Л. В. Россихиной.
Однако, несмотря на большое количество работ, посвященных проблемам решения задач аналитической работы, решение расчётных задач оценки и прогнозирования показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов, рассмотрено не было.
В связи с этим актуальным является решение научной задачи математического моделирования процессов нахождения значений расчётных показателей, используемых при осуществлении аналитической работы, на основе данных правовой статистики.
Объект исследования: показатели, используемые при осуществлении аналитической работы сотрудниками правоохранительных органов.
Предмет исследования: математические методы, алгоритмы и компьютерные программы оценки и прогнозирования качественных и количественных показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов.
Цели и задачи исследования. Целью диссертационного исследования является разработка математических методов, алгоритмов и комплекса программ оценки и прогнозирования качественных и количественных показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов.
Для достижения поставленной цели требуется решить следующие частные научные задачи:
1) разработка метода построения функциональной схемы и алгоритма использования данных правовой статистики для осуществления аналитической работы сотрудниками правоохранительных органов;
2) разработка численных методов и алгоритмов нахождения актуальных выборок данных правовой статистики в интересах оценки показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов;
3) разработка численных методов и алгоритмов нахождения расчетных показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов;
4) разработка комплекса программ для оценки и прогнозирования показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов.
Методология и методы исследования. Для решения поставленных задач используются методы теории графов, теории нечетких множеств, регрессионный анализ, методы математической статистики.
Научная новизна. В ходе проведения исследования получены следующие результаты, характеризующиеся научной новизной:
1) разработанные метод построения функциональной схемы и алгоритм использования данных правовой статистики для осуществления аналитической работы сотрудниками правоохранительных органов отличаются от существующих детализацией описания состава и последовательности действий для нахождения показателей, используемых при осуществлении аналитической работы, и связей между ними;
2) разработанные численные методы и алгоритмы нахождения актуальных выборок данных правовой статистики в интересах оценки показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов, отличаются от существующих выявлением аномальных значений данных правовой статистики;
3) разработанные численные методы и алгоритмы нахождения расчетных показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов, отличаются от существующих корректировкой и учетом аномальных значений данных правовой статистики и использованием вербально заданных оценок показателей.
Теоретическая значимость работы заключается в том, что предложенный подход к моделированию процесса оценки и прогнозирования качественных и количественных показателей может быть использован для оказания помощи сотрудникам, решающим задачи аналитической работы, а также в принятии управленческих решений и исследовательских целях в правоохранительных органах.
Практическая значимость работы заключается в разработке комплекса программ, позволяющего определить состав количественных и качественных показателей и данных, используемых при осуществлении аналитической работы, представить используемые показатели в требуемом масштабе, выявить аномальные значения показателей и сделать прогноз их изменения в числовом или вербальном виде с учетом выявленных аномалий.
Достоверность результатов подтверждается использованием при разработке моделей известных математических методов и результатами
вычислительных экспериментов.
Положения, выносимые на защиту:
1) функциональная схема и алгоритм использования данных правовой статистики для осуществления аналитической работы сотрудниками правоохранительных органов позволяют обосновать состав и структуру комплекса моделей и численных методов нахождения показателей, используемых при осуществлении аналитической работы и последовательность их выполнения;
2) численные методы и алгоритмы нахождения актуальных выборок данных правовой статистики в интересах оценки показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов, позволяют учитывать влияние социально-экономических и/или внутри- и внешнеполитических событий на динамику данных правовой статистики;
3) численные методы и алгоритмы нахождения расчетных показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов, позволяют повысить точность прогнозируемых значений показателей и представить их в случае необходимости в виде вербально описанных оценок;
4) комплекс программ для оценки и прогнозирования показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов может быть использован как при осуществлении аналитической работы сотрудников правоохранительных органов, так и в исследовательских целях.
Реализация и внедрение результатов работы. Результаты диссертационного исследования внедрены в практическую деятельность информационного центра Главного управления МВД России по Воронежской области, образовательный процесс Центрального филиала федерального государственного бюджетного образовательного учреждения высшего образования «Российский государственный университет правосудия» и федерального государственного казенного образовательного учреждения высшего образования «Воронежский институт Министерства внутренних дел Российской Федерации».
Апробация работы. Основные результаты диссертации докладывались и обсуждались на следующих конференциях и семинарах: Международная конференция «3rd International Conference on Control Systems, Mathematical Modeling, Automation and Energy Efficiency» (SUMMA 2021) (Липецк, 2021 г.); Международная научно-практическая конференция «Охрана, безопасность, связь» (Воронеж, 2020 г., 2021 г., 2022 г.); Международная научная конференция «Дифференциальные уравнения, математическое моделирование и вычислительные алгоритмы» (Белгород, 2021 г.); Международная научно-практическая конференция «Информатика: проблемы, методология, технологии» (Воронеж, 2021 г.); Международная научно-техническая конференция «Актуальные проблемы прикладной математики, информатики и механики» (Воронеж, 2022 г.); Международная научная конференция «Partial Differential Equations and Related Topics» (PDERT'22) (Белгород, 2022 г.); Всероссийская научно-практическая конференция «Актуальные проблемы деятельности подразделений уголовно-исполнительной системы», посвященная 20-летию Воронежского института ФСИН России (Воронеж, 2021 г., 2022 г.); Всероссийская научно-практическая конференция «Южно-Уральская молодежная школа по математическому моделированию» (Челябинск, 2021 г.); Всероссийская конференция «Актуальные вопросы эксплуатации систем охранного мониторинга и защищенных телекоммуникационных систем» (Воронеж, 2021 г., 2022 г.); Всероссийский семинар «Математическое моделирование автоматизированных систем специального назначения» (Воронеж, 2020 г.); Всероссийский семинар «Математическое моделирование и численные методы исследования и оптимизации систем критического применения» (Воронеж, 2021 г.); Всероссийский семинар «Математическое моделирование информационных систем органов внутренних дел» (Воронеж, 2021 г.).
Соответствие паспорту специальности. Содержание диссертации соответствует паспорту специальности 1.2.2. Математическое моделирование, численные методы и комплексы программ.
Публикации. По материалам диссертации опубликованы 23 печатные работы (1 статья в издании, индексируемом в Scopus [111]; 7 статей в других изданиях, рекомендованных ВАК при Минобрнауки России [40, 43, 44, 47, 56, 64,
65]; 13 материалов научных конференций и статей в научных журналах [37, 39, 41, 42, 54, 55, 57, 58, 59, 60, 61, 62, 63], 1 заключительный отчет о научно-исследовательской работе [89], 1 методические рекомендации [46]), в том числе 6 работ опубликовано без соавторов. Разработано 7 программ для ЭВМ, зарегистрированных в Федеральной службе по интеллектуальной собственности [80, 81, 82, 83, 84, 85, 86]. В работах, выполненных в соавторстве, автором лично выполнены: в [39, 40, 41, 62, 63, 111] - разработан численный метод представления количественных значений в вербально заданном виде, описаны лингвистические значения качественных показателей, используемых сотрудниками правоохранительных органов; в [54, 64] - произведен анализ задач, решаемых в ходе осуществления аналитической работы сотрудниками правоохранительных органов, а также анализ состава начальной и масштабируемой выборок; в [56] - разработан численной метод и алгоритм выявления аномальных значений в статистических панелях; в [43, 44] -произведена программная реализация разработанных алгоритмов; в [47] -разработана функциональная модель использования данных правовой статистики, классификация расчётных задач, используемых при осуществлении аналитической работы; в [42] - описан метод оценки взаимосвязи показателей правовой статистики, разработан численный пример; в [37, 55, 57, 58, 59] - описан метод выявления аномалий в динамических рядах на основе исследования тренда; в [60] - произведена классификация способов анализа информации при осуществлении аналитической работы; в [61] - описана модель изучения взаимосвязи динамических рядов; в [65] - разработан численный метод нахождения состава расчётных показателей и данных для решения задач аналитической работы.
Структура работы: Диссертация состоит из введения, четырех разделов, заключения, списка литературы из 117 наименований и 4 приложений. Работа изложена на 194 страницах машинописного текста (основной текст занимает 148 страниц, содержит 61 рисунок и 4 таблицы).
Первый раздел диссертационного исследования посвящен анализу
возможных вариантов нахождения расчётных показателей для решения задач аналитической работы в правоохранительных органах, базирующихся на данных правовой статистики. Рассмотрены основные типы расчётных задач, решаемых сотрудниками правоохранительных органов, и используемые ими типы данных правовой статистики. Проведен анализ существующих математических моделей и методов исследования статистических массивов. Сделан вывод о необходимости разработки новых численных методов и алгоритмов, позволяющих осуществлять оценку и прогнозирование показателей, с учетом выявленных особенностей, а именно наличием критических отклонений (аномалий), возникающих в связи с социально-экономическими и/или внутри- и внешнеполитическими событиями, а также необходимости использования вербальных оценок статистических показателей.
Во втором разделе на основе проведенного в предыдущем разделе анализа нахождения расчётных показателей в интересах решения задач аналитической работы разработана функциональная схема и алгоритм использования данных правовой статистики. Рассмотрены процедуры решения расчётных задач аналитической работы сотрудников правоохранительных органов.
Третий раздел посвящен разработке численных методов и алгоритмов решения расчётных задач на основе обработки статистических массивов. На основе функциональной схемы разработан численный метод нахождения расчётных показателей и начальной выборки, а также численные методы и алгоритмы актуальной выборки для различного типа расчетных задач.
Четвертый раздел посвящен описанию комплекса программ, построенного на основе разработанных в разделе 3 численных методов и алгоритмов для оценки и прогнозирования качественных и количественных показателей, используемых при осуществлении аналитической работы сотрудниками правоохранительных органов, с учетом выявленных особенностей.
В заключении приведены основные результаты, полученные в ходе диссертационного исследования.
Благодарности. Хочу выразить искреннюю благодарность своему
научному руководителю, заслуженному деятелю науки Российской Федерации, доктору физико-математических наук, профессору Меньших Валерию Владимировичу за оказанную помощь при проведении данного диссертационного исследования. Также хотела бы выразить благодарность за помощь в сборе и обработке материала на различных этапах проведения исследования, в том числе за консультации и обсуждение полученных результатов, сотрудникам и работникам кафедры математики и моделирования систем, и кафедрам юридического факультета Воронежского института МВД России.
1. СОВРЕМЕННОЕ СОСТОЯНИЕ МОДЕЛИРОВАНИЯ ПРОЦЕССОВ РЕШЕНИЯ ЗАДАЧ АНАЛИТИЧЕСКОЙ РАБОТЫ В ПРАВООХРАНИТЕЛЬНЫХ ОРГАНАХ
1.1. Описание существующих типов задач аналитической работы в правоохранительных органах, включающих решение расчетных задач
В современных условиях повышение эффективности принятия управленческих решений в правоохранительных органах осуществляется за счет усложнения процессов функционирования их систем управления, что обеспечивается, в частности, совершенствованием аналитической работы, базирующейся на анализе большого объёма информации, осуществляемого с использованием средств вычислительной техники, позволяющих оперативно получать различные расчётные показатели, необходимые для принятия этих решений [9, 30, 31].
Аналитическая работа в правоохранительных органах представляет собой особый вид творческой познавательной деятельности научно-исследовательского характера, заключающийся в определении состояния, структуры и динамики тех или иных параметров (характеристик) оперативной обстановки, выявлении негативных отклонений в ней, установлении причинно-следственных зависимостей между различными факторами, обусловившими данные отклонения, а также прогнозировании тенденций ее изменений с целью осуществления управляющих воздействий на подчиненные органы внутренних дел при решении задач правоохранительной деятельности [49, 51, 52].
Аналитическая работа является одним из основных видов деятельности всех правоохранительных органов и, в частности, ведущим направлением работы их штабных подразделений, в которых решаются определённые задачи
аналитической работы, направленные на обоснование и принятие управленческих решений [31, 49, 51, 52]. Благодаря решению задач аналитической работы происходит своевременное обнаружение возникающих проблем (противоречий, несоответствий), выбор оптимальных или рациональных путей и средств их решения, обоснованная оценка криминогенной ситуации на обслуживаемой территории [21, 22, 53].
Таким образом, согласно определению, в нормативных документах и приведённому выше описанию аналитическая работа в правоохранительных органах:
- не включает решение повседневных задач распределения сил и средств правоохранительных органов (решению этих задач посвящено достаточно много исследований, например [20, 22, 33, 48, 68, 71, 76, 91, 96]);
- предполагает, как правило, осуществление ретроспективного анализа данных, используемых правоохранительными органами, которые принято называть данными правовой статистики [16, 35, 36, 93, 94].
Согласно нормативным-правовым актам [49, 51, 52] аналитическая работа в правоохранительных органах выступает:
- в качестве функции управления органом;
- как один из компонентов руководства отраслевым подразделением;
- в качестве функциональных обязанностей отдельных сотрудников служб и подразделений.
В современных условиях решение задач аналитической работы в значительной степени базируется на результатах вычисления значений различных расчётных показателей. Следовательно, чем выше точность указанных показателей, тем выше обоснованность результатов решения этих задач и эффективность принимаемых управленческих решений.
Таким образом, в правоохранительных органах лица, занимающиеся аналитической работой, должны стремиться к использованию как можно более точных значений расчётных показателей.
Организация аналитической работы осуществляется во всех территориальных органах внутренних дел, начиная с органов районного уровня, являющегося базовым звеном системы Министерства внутренних дел Российской Федерации, потому что именно на этом уровне происходят основные процессы и события, требующие непрерывного слежения за их состоянием, учета, анализа, выработки мер немедленного реагирования со стороны правоохранительных органов [49, 51, 52], которые зависят:
- от качества, достоверности, полноты и масштаба исходной информации, которая используется для решения задач аналитической работы, т. е. данных правовой статистики;
- от точности математических методов и моделей, используемых для решения задач нахождения значений расчётных показателей.
В качестве основных задач аналитической работы выделяют [49, 51, 52]:
- выявление и систематизация данных о преступлениях и правонарушениях на обслуживаемой территории правоохранительных органов, проведение сравнительного анализа с аналогичными данными других регионов;
- установление значимых социальных характеристик преступлений и правонарушений, детерминирующих особенности их проявления в данном регионе;
- выявление криминологических и организационно-управленческих значимых характеристик отдельных видов и групп преступлений, которые могут быть положены в основу принятия решений, направленных на повышение эффективности планирования и осуществления мер борьбы с этими преступлениями;
- выявление проблемных ситуаций во внутриорганизационной деятельности правоохранительных органов, связанных с их функционированием как социальных коллективов (управленческое обследование);
- информационно-аналитическое обслуживание начальников и руководителей органов внутренних дел.
В интересах решения перечисленных задач аналитической работы, согласно [49, 51, 52], сотрудниками правоохранительных органов используются результаты определённых вычислений, которые получены в ходе решения определённых расчётных задач, обеспечивающих процессы анализа и прогнозирования показателей и характеризующих:
- состояние показателей криминогенной обстановки. Основное назначение изучения криминогенной обстановки заключается в обосновании и объяснении состояния преступности, выявлении причин и условий совершения преступных деяний для выработки управленческих решений в сфере правоохранительной деятельности. Оценка состояния криминогенной ситуации, как правило, выражается в виде вербально заданных качественных характеристик, поскольку количественные значения не в полной мере отражают качественные характеристики [95];
- структуру и динамику криминогенной обстановки. Структуру и динамику тех или иных характеристик криминогенной обстановки, как правило, можно проследить, изучив данные, относящиеся к последовательным моментам или промежуткам времени, которые называют динамическими (или временными) рядами [8, 16];
- тенденцию развития криминогенной обстановки. Выявление тенденции, как правило, связано с получением некой теоретической модели реальной действительности и анализом данных, применением общих и частных методов аналитической работы;
- выявление негативных и критических отклонений в тенденции криминогенной обстановки вследствие влияния социально-экономических внешне- и/или внутриполитических факторов, которые приводят к уменьшению точности прогнозирования [12, 55, 57, 58, 59];
- вероятное определение дальнейшего развития событий (прогноз будущих значений) или принятия решения [6, 46, 41, 35, 92]. В связи с этим цель аналитической работы состоит в прогнозировании возможных изменений тех или иных показателей криминогенной обстановки для выработки стратегии и тактики
управления, разработки и реализации своевременных, обоснованных и рациональных управленческих решений руководителя органа или подразделения.
Решение расчётных задач базируется на анализе разнообразных показателей, характеризующих различные категории населения, состояние преступности и результаты деятельности правоохранительных органов в определенный момент или промежуток времени на одном или нескольких территориальных образованиях или объекте, а также динамику изменения указанных показателей [10, 95]. Указанную информацию принято называть данными правовой статистики.
Как следует из анализа источников [30, 31, 49, 51, 52,], в интересах решения сотрудниками правоохранительных органов задач аналитической работы используются, как правило, результаты решения перечисленных ниже типов расчётных задач:
Ь - оценка текущего состояния преступности на основе задаваемых сотрудниками правоохранительных органов, осуществляющими решение задач аналитической работы, новых показателей, не содержащихся в данных официальной статистики и определяемых на основе известных показателей правовой статистики;
Р1 - прогноз значения показателя, характеризующего состояние преступности для заданного территориального образования;
Р2 - прогноз значения показателя, характеризующего состояние преступности для заданного множества территориальных образований;
Р3 - прогноз множества значений показателей, характеризующих состояние преступности для заданного территориального образования;
РЬ - оценка состояния преступности на основе прогнозируемых значений показателей правовой статистики для заданного территориального образования.
Решение этих типов расчётных задач базируется на следующих вспомогательных задачах:
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Уголовно-процессуальные проблемы противодействия преступлениям, совершаемым преступными группами в ходе рейдерских захватов имущества2024 год, кандидат наук Бурынин Сергей Сергеевич
Модели и численные методы оценки эффективности функционирования систем безопасности объектов органов внутренних дел2022 год, кандидат наук Жилин Роман Андреевич
Формирование политического сознания сотрудников органов внутренних дел как фактор становления правового государства в России2006 год, кандидат политических наук Папура, Татьяна Алексеевна
Уголовная ответственность за посягательство на жизнь сотрудника правоохранительного органа2002 год, кандидат юридических наук Полухин, Владимир Васильевич
Уголовно-правовая охрана личности сотрудников правоохранительных органов, обеспечивающих общественный порядок и общественную безопасность1998 год, кандидат юридических наук Ткаченко, Валерий Степанович
Список литературы диссертационного исследования кандидат наук Морозова Валерия Олеговна, 2023 год
Г (В /
В11,..., В1
>
р
не будет выполнено для матрицы В /
В11,..., В19
Данное обстоятельство свидетельствует о том, что показатели, соответствующие строкам В11,..., В19 в столбце В1, т. е. в момент или промежуток времени , имеют аномальные значения.
Алгоритм выявления аномальных значений в статистических панелях приведен на рисунке 3.7.
Рисунок 3.7 - Алгоритм выявления аномальных значений в статистических
панелях
Таким образом, для нахождения актуальной выборки данных X для пространственно-временных данных для решения расчётных задач типа Р2, Р3, РЬ необходимо решение следующих вспомогательных задач:
— выявление аномальных значений в выборке X" данных правовой статистики с помощью вспомогательной задачи Q7;
- нахождение актуальной выборки данных 1с1',в которой исключены аномальные данные с помощью вспомогательных задач Q4, Q5, Q6.
Однако в зависимости от поставленой задачи сотруднику, занимающемуся аналитической работой, решения только задач Р2, Р3 недостаточно, т. к. есть необходимость представить имеющиеся показатели в качественном для решения задач РЬ, т. е. вербально описываемом, виде или сделать прогноз будущих значений. В связи с этим обратимся к вопросу преобразования количественных данных правовой статистики к качественному виду и использования этих оценок при решении расчётных задач типов Ь, РЬ с помощью вспомогательных задач
Q 2, Q3.
3.4. Численные методы решения расчётных задач на основе нахождения актуальной выборки пространственных данных правовой статистики
Обратимся к решению расчетных задач типов Ь, РЬ для пространственных и пространственно-временных данных правовой статистики.
Как было сказано ранее, основной сложностью регрессионных моделей является необходимость использования вербальных данных, содержащих качественные оценки значений показателей правовой статистики.
Для описания вербально заданных качественных характеристик используются лингвистические переменные, описывающие взаимосвязь значений качественных показателей с некоторыми нечеткими множествами, которые несут в себе не количественную, а качественную смысловую нагрузку, отражающую неоднозначное восприятие ситуации. Эта неоднозначность формально выражается функцией принадлежности. Обратимся к рассмотрению вопроса
нахождения функций принадлежности указанных нечётких множеств применительно к решаемой задаче. Заменим функцию принадлежности этого нечёткого множества одним или несколькими числовыми значениями.
Выделим два случая.
Пусть 2Х, ^ ,•••, 2 - возможные лингвистические значения показателя 2 е{7,X,Х2,...,Хт}. В первом случае для уменьшения сложности вычислений
или в связи со сложностью вида функции принадлежности, как это предложено создателем теории нечётких множеств L. Zadeh [116, 117], в качестве единственного соотносимого с ней числового значения ,I = 1,2,...,^ может выступать медианное значение функции принадлежности , которое находится в результате решения следующего уравнения [16]:
В этом случае следует использовать в статистической модели вместо лингвистических значений показателей их медианные значения , найденные по
формуле (3.38), а во втором случае - совокупность моделей, построенных для каждого из выбранных числовых значений.
Наиболее распространённой среди статистических моделей, используемых для решения задач аналитической работы в правоохранительных органах, является модель множественной регрессии, которая в общем виде представляет собой определение определённых функциональных зависимостей статистических показателей по наборам данных, удовлетворяющим требованиям теоремы Гаусса-Маркова [8, 16]:
(3.38)
7 = / (Х1, Х2,..., Хт ) + е,
(3.39)
где 7 - значение нового показателя;
X, Х2,..., Хт - значение известного показателя правовой статистики; б - случайная величина.
Данные зависимости позволяют по значениям нескольких известных показателей Xx,X2,...,Xm, выраженным как в количественном виде, так и виде лингвистических оценок, определять значение нового показателя Y с помощью вспомогательной задачи Q3. Количественной оценкой качества уравнения
регрессии является индекс детерминации r2, который указывает на взаимосвязь показателей.
Заметим, что если значение нового показателя Y первоначально описывалось лингвистически, то после использования регрессионной модели его значение будет описываться количественно, и поэтому необходимо осуществить обратный переход от количественного представления к лингвистическому. Рассмотрим решение этой задачи для каждого из описанных выше случаев.
В первом случае найденное с помощью регрессионного уравнения (3.39) значение d для показателя Z следует принять за оценку медианного значения функции принадлежности нечёткого множества, соответствующего искомому лингвистическому значению нового показателя Z .
Найденная описанным выше способом функция принадлежности имеет достаточно простой кусочно-линейный вид, что позволяет использовать вместо медианного значения вектор наиболее характерных её числовых значений, определённых в точках h,h,...,h [40, 111, 46, 89], что графически представлено на рисунке 3.8.
Рисунок 3.8 - Функция принадлежности нечеткого множества, соответствующего отдельному значению лингвистического показателя
Это приводит к необходимости решения совокупности регрессионных уравнений
\= к ( Х ,Х2 ,...,Хm ) + gl,
\ = fh2 ( Х1,Х2,...,Хm ) + £2, ^ ^
Y = f (Х,,Х2,...,Хm ) + 6.
Методы регрессионного анализа достаточно хорошо разработаны и изучены, однако только для отбора существенных для прогнозирования показателей, выбора вида модели регрессии, т. е. функциональной зависимости Y и оценки значимости результатов моделирования с помощью модели (3.39) .
Во втором случае используем значения dx, d2,..., d, полученные в результате решения совокупности регрессионных уравнений вида (3.40) для каждого численного значения \,h,...,h, выбранного для функции принадлежности j(x). Функция принадлежности в этом случае может быть аппроксимирована кусочно-линейной функцией j( x), такой, что
j(x) = f+1 ~ d (x - h) + dt (3.41)
hi+i - hi
на отрезках \hi, hi+1 ], i = 1,..., I -1.
Рассмотрим возможность использования описанного выше подхода на
примере данной модели. Медианное значение функции j(x) также обозначим d .
Пусть d ( Zj), d ( z2 ),..., d ( zs) - медианные значения функций
принадлежности соответствующих им нечётких множеств j (x)(x),..., j (x).
В таком случае в качестве лингвистической оценки показателя Z следует принять значение
= Arg min(d. - d(z.)), (3.42)
i=1,2 ,...,s
которое наиболее близко отстоит от полученного в результате регрессионного анализа значения Z. Решение задачи количественного описания лингвистических значений показателей сводится к нахождению медианных оценок функций принадлежности нечётких множеств, описывающих вербально заданные оценки нового показателя.
Алгоритм решения задачи количественного описания лингвистических
значений показателей представлен на рисунке 3.9.
Рисунок 3.9
- Алгоритм решения задачи количественного описания лингвистических значений показателей
Далее обратимся к решению одной из важных задач, прогнозированию значений показателей.
Для решения задачи прогнозирования качественных значений показателя У осуществляется подстановка предполагаемых значений показателей Хх, Х2,..., Хт в совокупность регрессионных уравнений (3.40) и нахождение с использованием формулы (3.41) кусочно-линейной аппроксимации нового вида соответствующей функции принадлежности.
В результате этого может оказаться, что полученная нечёткая оценка качественного показателя У будет в разной степени соответствовать его возможным лингвистическим значениям 21,2г,...,2т. Данное обстоятельство обуславливается тем, что интервалы количественных значений, условно соответствующих качественным, зацеплены друг за друга. Это отражает как субъективность лингвистических оценок, так и тот факт, что нет резкого разделения между соседними лингвистическими оценками.
Для решения задачи нахождения степени соответствия прогнозируемого
качественного значения показателя У различным значениями лингвистической шкалы обозначим:
Ь0 - нечеткое множество, соответствующее новому качественному
значению У •
?
Ь(),1 = 1,2,...,я - нечеткое множество, соответствующее значению zi лингвистической шкалы показателя У .
Оценка соответствия нового лингвистического значения показателя У лингвистическому значению находится следующим образом:
¿0 пЬ( )( Х ) ^
е( Г,.) = -,1 = 1,2,...,5. (3.43)
X Ь Ь пЦ ,)( Х ) ^
.=1 о
Использование данного метода позволяет значительно уменьшить вычислительную сложность задачи прогнозирования, что важно при использовании большого объёма исходных данных.
Таким образом, для решения задачи количественного описания лингвистических значений показателей, которые используют в аналитической деятельности, выделяют два случая:
- в первом случае в качестве единственного соотносимого с функцией принадлежности ¡л( х) числового значения может выступать медианное значение
функции принадлежности, которое находится в результате решения уравнения (3.38);
- во втором случае используется совокупность моделей (3.40), построенных для каждого из выбранных числовых значений.
3.5. Выводы по разделу 3
1. В подразделе 3.1 разработан численный метод и алгоритм, который может быть использован для автоматизации решения расчетных задач типов Ь, Р1, Р2, Р3, РЬ в интересах осуществления аналитической работы,
предполагающих использование результатов решения расчётных задач на основе обработки статистических массивов.
2. В подразделе 3.2 разработан численный метод нахождения актуальной выборки X для динамических рядов. Нахождение актуальной выборки X для
динамических рядов заключается в выявлении структурных и параметрических аномальных значений уровней ряда, которые возникают вследствие влияния социально-экономических, внешне- и/или внутриполитических факторов. Применение разработанного математического метода позволяет определить актуальную выборку X данных правовой статистики для динамических рядов как с наличием сезонной компоненты c, так и при отсутствии c, даже в том случае, если классическими методами данная выборка не выявляется в связи с малой длиной отрезков динамических рядов между аномальными значениями, а также уменьшить значение относительной погрешности прогнозируемых значений динамических рядов.
3. В подразделе 3.3 разработаны численный метод и алгоритм нахождения актуальной выборки X для панельных данных. Выявление аномальных значений показателей правовой статистики в панельных данных осуществляется в два этапа. Первый этап подразумевает выявление момента или интервала времени, в котором присутствуют аномальные значения элементов выборки, а второй - выявление конкретных элементов, имеющих аномальные значения в данном моменте или интервале времени.
4. В подразделе 3.4 разработан численный метод нахождения актуальной выборки X для пространственных данных. Рассмотрена регрессионная модель, на основе которой была решена задача количественного описания лингвистических значений показателей, которые используют при решении расчётных задач в интересах решения задач аналитической работы. Были рассмотрены два случая, в которых в качестве единственного соотносимого с функцией принадлежности x) числового значения может выступать медианное значение d функции принадлежности и совокупность моделей, построенных для каждого из выбранных числовых значений.
4. КОМПЛЕКС ПРОГРАММ ДЛЯ ОЦЕНКИ И ПРОГНОЗИРОВАНИЯ
ПОКАЗАТЕЛЕЙ, ИСПОЛЬЗУЕМЫХ ПРИ ОСУЩЕСТВЛЕНИИ АНАЛИТИЧЕСКОЙ РАБОТЫ СОТРУДНИКАМИ ПРАВООХРАНИТЕЛЬНЫХ ОРГАНОВ
Для верификации и практического использования разработанных во втором и третьем разделах численных методов и алгоритмов необходимо создать соответствующий комплекс программ. Данный комплекс должен обеспечивать решение следующих задач:
- определение состава расчётных показателей и данных для решения всех типов основных расчётных задач в интересах решения задач аналитической работы;
- приведение полученных показателей к требуемому масштабу;
- выявление структурных и параметрических аномалий в динамических рядах, а также выявление аномалий в статистических панелях;
- оценка значимости показателей и представление их в виде лингвистических оценок;
- проведение регрессионного анализа в целях их прогнозирования;
- прогнозирование значений уровней динамических рядов на основе актуальных выборок.
Обратимся к обоснованию состава комплекса, описанию компьютерных программ, включённых в комплекс, и их использованию в составе системы принятия решений сотрудниками правоохранительных органов, занимающимися аналитической работой в исследовательских целях.
4.1. Обоснование состава и описание процесса функционирования
комплекса программ
В современных условиях сотрудникам правоохранительных органов, занимающимся аналитической работой или исследовательской деятельностью, предоставляется большой объём информации, позволяющий осуществлять решение задач аналитической работы в интересах подготовки и принятия управленческих решений в области правоохранительной деятельности.
Обратимся к представлению решаемых сотрудниками правоохранительных органов задач аналитической работы. Как правило, поставленные задачи аналитической работы предполагают использование результатов решения расчётных задач определения различных показателей, базирующихся на анализе данных правовой статистики. Следовательно, чем выше точность указанных показателей, тем выше обоснованность результатов решения этих задач и, следовательно, эффективность принимаемых управленческих решений.
Особую важность для принятия управленческих решений имеют результаты оценки текущих и прогнозирования будущих значений показателей, используемых при решении расчётных задач, как было указано ранее в разделе 1.
Как было указанно ранее в разделах 1 и 2, основная часть задач аналитической работы предполагает использование результатов решения расчётных задач определения различных показателей. В связи с этим возникает необходимость определения состава расчётных показателей и данных, которые представляют собой начальные выборки. Найденные начальные выборки необходимо привести к требуемому масштабу. Численный метод масштабирования всех типов начальных выборок (временных данных (динамических рядов), пространственно-временных данных (панелей) и пространственных данных) описан в подразделах 2.1, 2.2. Затем в соответствии с разработанными в разделе 3 численными методами и алгоритмами для различных типов данных найти актуальную выборку. После преобразования данных они
представляют собой актуальные выборки, которые являются основой для решения расчётных задач:
- прогнозирования показателей на основе известных данных, содержащихся в официальной статистике;
- регрессионного анализа данных, которые могут включать лингвистические оценки.
Таким образом, структурная схема реализации разработанных численных методов и алгоритмов имеет вид, представленный на рисунке 4.1.
Для реализации данной структурной схемы должен быть разработан комплекс программ, включающий следующие программы:
1) программа «Определение состава расчетных показателей и данных для решения задач аналитической работы» [86];
2) программа «Масштабирование выборок данных» [80];
3) программа «Выявление структурных аномалий в динамических рядах»
[84];
4) программа «Выявление параметрических аномалий в динамических рядах» [85];
5) программа «Выявление аномалий в статистических панелях» [82];
6) программа «Регрессионный анализ по данным, включающим лингвистические оценки» [83];
7) программа «Прогнозирование значений уровней динамических рядов с выявленными аномалиями» [81].
Обратимся к подробному описанию принципов работы программного комплекса. Комплекс программ может быть использован
- в составе системы принятия решений сотрудниками правоохранительных органов, занимающихся аналитической работой;
- в исследовательских целях для получения различного вида зависимостей.
Рисунок 4.1 - Структурная схема функционирования комплекса программ
Функционирование программ, включённых в данный комплекс, осуществляется в интерактивном режиме так, что пользователь в процессе выполнения программ задаёт необходимую дополнительную информацию.
Обратимся к описанию программ.
Аналитическая работа сотрудников правоохранительных органов включает в себя решение задач на основе ряда количественных и/или качественных показателей, получаемых в результате решения расчётных задач на основе данных правовой статистики. При использовании программы «Определение состава расчетных показателей и данных для решения задач аналитической работы» сотрудники, занимающиеся аналитической работой, могут найти искомое множество показателей, получаемых в результате решения расчётных задач, т.е. начальную выборку. Входными данными для указанной программы является информация о решаемой расчётной задаче и промежуточных расчётных значениях показателей. В ходе работы программы с помощью матричного метода представления сетей Петри, описанного в подразделе 3.1, возможно нахождение искомого множество показателей, после чего формируется итоговый отчет об искомом множестве показателей. Полученные результаты хранятся в памяти данной программы и необходимы для нахождения масштабируемой и актуальной выборки данных.
Полученное искомое множество показателей, т. е. начальную выборку, в зависимости от решаемой расчётной задачи необходимо привести к требуемому масштабу при использовании программы «Масштабирование выборок данных». Входными данными для указанной программы является искомое множество показателей правовой статистики, полученное в результате работы предыдущей программы. В ходе работы программы с помощью операции агрегирования, описанной в подразделе 2.2, начальную выборку в зависимости от решаемой задачи сотрудники правоохранительных органов приводят к требуемому виду для дальнейшего анализа, после чего формируется итоговый отчет об масштабированной выборке показателей. Полученные результаты хранятся в
памяти данной программы и необходимы для нахождения актуальной выборки данных.
Для определения актуальной выборки разработаны программы, работа которых основывается на анализе динамических рядов, статистических панелей, пространственных данных.
Определение актуальной выборки для динамических рядов заключается в выявлении структурных и параметрических аномальных значений данных правовой статистики при использовании программ «Выявление структурных аномалий в динамических рядах» и «Выявление параметрических аномалий в динамических рядах». Входными данными для указанных программ являются таблица с информацией о количестве преступлений различного вида или данные о различных категориях населения и данные о временных промежутках или территориальных образованиях. В ходе работы программы проводятся требуемые вычисления в соответствии с численными методами и алгоритмами, описанными в подразделе 3.2, после чего формируется итоговый отчет об имеющихся структурных и/или параметрических аномалиях в представленных выборках данных. В случае заполнения таблиц ненадлежащими символами предусмотрена возможность внесения исправлений в файлы таблиц. Полученные оценки хранятся в памяти данной программы.
Разработанная программа для работы с панельными данными подразумевает выявление аномальных значений данных правовой статистики в предложенной панели данных с помощью программы «Выявление аномалий в статистических панелях». Входными данными для указанной программы являются таблицы с информацией о количестве преступлений различного вида или данные о различных категориях населения, о временных промежутках и территориальных образованиях, данные представлены в виде массива. В ходе работы программы проводятся требуемые вычисления в соответствии с численными методами и алгоритмами, описанными в подразделе 3.3, где сначала определяется количество аномальных значений в статистической панели, после чего определяются сами аномальные значения. Итогом работы программы
является отчет об имеющихся аномалиях в представленных данных. В случае заполнения таблиц ненадлежащими символами предусмотрена возможность внесения исправлений в файлы таблиц. Полученные оценки хранятся в памяти данной программы.
Для работы с пространственными данными разработана программа, которая позволяет оценить значимость используемых показателей, представить данные правовой статистики в виде вербально заданных оценок или наоборот, а также делать прогноз будущих значений показателей с помощью программы «Регрессионный анализ по данным, включающим лингвистические оценки». Входными данными для указанной программы являются таблицы с информацией о количестве преступлений различного вида или данные о различных категориях населения и о временных промежутках. В ходе работы программы проводятся вычисления в соответствии с численными методами и алгоритмами, описанными в подразделе 3.4, где сначала определяется значимость используемых показателей, вид данных, представленных в таблице (количественные значения или вербальные оценки), затем согласно выбранному алгоритму, данные представляются в необходимом виде для решения расчётной задачи, после чего при необходимости возможно произвести прогноз будущих значений показателей. Итогом работы программы является таблица данных, преобразованных в заданный вид и прогнозируемые значения. Полученные оценки хранятся в памяти данной программы.
На основе вышеперечисленных программ решаются расчётные задачи в интересах решения задач аналитической работы сотрудников правоохранительных органов, одной из которых является прогнозирование будущих значений показателей при использовании программы «Прогнозирование значений уровней динамических рядов с выявленными аномалиями». Данная программа позволяет на основе полученных начальных, масштабированных и актуальных выборок осуществить прогноз будущих значений показателей. Заметим, что определение актуальной выборки позволит увеличить точность прогноза показателей.
Таким образом, в данном подразделе описан процесс функционирования комплекса программ, обоснована необходимость их использования для поэтапного решения задачи, поставленной в рамках настоящего диссертационного исследования.
4.2. Описание программ комплекса для работы с данными
правовой статистики
В разделе 4.1 рассмотрены различные варианты использования разработанного комплекса компьютерных программ.
Программный комплекс написан на языке программирования высокого уровня Python 3 [11, 109, 114, 115]. Дополнительно используются библиотеки Pandas, NumPy, Scipy Stats и модуль array.
Pandas - это пакет для анализа данных в Python. Этот пакет дает возможность строить сводные таблицы, выполнять группировки, предоставляет удобный доступ к табличным данным, а при наличии пакета Matplotlib дает возможность рисовать графики на полученных наборах данных.
NumPy - библиотека языка программирования Python, добавляющая поддержку больших многомерных массивов и матриц, а также большой набор высокоуровневых математических функций для работы с этими массивами.
Scipy Stats - это библиотека в Python, которая содержит огромное количество статистических функций. Хотя статистика является очень широкой областью, этот модуль содержит функции, связанные с некоторыми основными статистическими данными.
Модуль array определяет массивы в Python. Данный модуль определяет тип объекта, который может компактно представлять массив основных значений: символы, целые числа, числа с плавающей запятой.
Обратимся к более детальному описанию компьютерных программ, входящих в его состав.
Опишем работу программы «Определение состава расчётных показателей и данных для решения задач аналитической работы». Алгоритм программы основан на матричном описании сетей Петри.
Рассмотрим результат работы программы на примере сети Петри, указанной в подразделе 3.1.
Суть данного подхода заключается в определении двух матриц и Б~, представляющих входную и выходную функции и представленных в виде отдельных файлов с расширением .Ш (рисунок 4.2).
Ц 4output_f.txt - Блокнот □ X j] *input_f.txt - Блокнот □ X
Файл Правка Формат Вид Справка Файл Правка Формат Вид Справка
16 0 0 6 0 0 6 0 0 0 0 0 0 0 0 0 0 0 0 л 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 А
0 10 0 6 0 0 6 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 6 1 0 6 0 0 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0
0 6 0 1 6 0 0 6 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0
0 6 0 0 1 0 0 6 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
0 6 0 0 6 1 0 6 0 0 0 0 0 0 0 6 0 0 6 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0
0 6 0 0 6 0 1 6 0 0 0 0 0 0 0 6 0 0 6 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0
0 6 0 0 6 0 0 1 0 0 0 0 0 0 0 6 0 0 6 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0
0 6 0 0 6 0 0 6 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0
0 6 0 0 6 0 0 6 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 0 0 0 0
0 6 0 0 6 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 6 0 0 0 0 6 0 0 1 0 6 0 0 0 1 6 0 0
0 6 0 0 6 0 0 6 0 0 0 1 0 0 0 0 0 0 0 0 0 0 6 0 0 0 0 6 0 0 0 1 6 0 0 0 1 6 0 0
0 6 0 0 6 0 0 6 0 0 0 0 1 0 0 0 0 0 0 0 0 0 6 0 0 0 0 6 0 0 0 0 1 0 0 0 0 1 0 0
0 6 0 0 6 0 0 6 0 0 0 0 0 1 0 0 0 0 0 0 0 0 6 0 0 0 0 6 0 0 0 0 6 1 0 0 0 6 1 0
0 6 0 0 6 0 0 6 0 0 0 0 0 0 1 0 0 0 0 0 0 0 6 0 0 0 0 6 0 0 0 0 6 0 1 0 0 6 1 0
0 6 0 0 6 0 0 6 0 0 0 0 0 0 0 1 0 0 0 0 V 0 0 6 0 0 0 0 6 0 0 0 0 6 0 0 1 0 6 0 1 V
< > < >
Стр 20, стлб 1 100% Windows (CRLF) UTF-S Стр 19, стлб 1 100% Windows (CRLF) UTF-8
Рисунок 4.2 - Матрицы, представляющие собой входную и выходную функции
Далее необходимо заполнить поля с информацией о расчётной задаче (рисунок 4.3). В качестве примера рассмотрим решение расчетной задачи
аналитической работы . Заполнение всех полей является обязательным. В случае отсутствия данных в каком-либо из полей программа выдаст предупреждение о невозможности выполнения дальнейших вычислений.
0 Определение состава расчетных показателей и данных для решения задач аналитической работы
Выбор файла с входной матрицей Г" Открыть файл
Выбор файла с выходной матрицей Открыть файл
Ввод количества расчетных задач 4 Ввод количества переходов 16 Ввод номера расчетной задачи |г|
Рассчитать
Рисунок 4.3 - Оконный интерфейс программы «Определение состава расчётных показателей и данных для решения задач аналитической работы»
После нажатия кнопки «Рассчитать» осуществляется вывод на экран значений (рисунок 4.4), которые являются результатом расчётной задачи, решение которой осуществляется на основе множества данных правовой статистики. Ненулевые координаты вектора соответствуют позициям для искомых множеств 2^, 8^, Л^.
Искомые множества имеют вид = {?2, }, Б^2 = , ^, ¿4}, Л^2 = {/, 12, /3}.
$ Определение состава расчетным показателей и данный для решения задач аналитической работы 1 си 1 Н 1- ¿г
Ввод количества расчетныхзадач |4 Ввод количества переходов ¡16 Ввод номера расчетной задачи г
Результат [0 10001001001110 0]
Рисунок 4. 4 - Оконный интерфейс программы «Определение состава расчетных показателей и данных для решения задач аналитической работы»
Далее опишем работу программы «Масштабирование выборок данных».
При работе на вход программы подаются данные о количестве преступлений различного вида или о различных категориях населения в определенном временном промежутке.
Выходными данными работы программы являются данные о количестве преступлений различного вида или о различных категориях населения в требуемом масштабе для решаемой задачи аналитической работы.
Рассмотрим подробнее структуру описываемой программы.
Первоначально необходимо выбрать файл Excel с разрешением .xlsx (рисунок 4.5), в котором представлены данные о количестве преступлений или информация о различных категориях населения и данные о временном промежутке в заданном виде, представленном на рисунке 4.4, при этом нажав на кнопку «Открыть файл» (рисунок 4.6).
а в с d е f g н j к l
1 2012 201} 2014 2015 2016 2017 2018 2019 2020 2021 2022
2 1 2677 2910 2931 3973 3757 3252 3393 3698 3917 3651 3863
3 2 2902 3162 5546 4167 3994 3495 4040 4256 3700 3769 4143
4 3469 3568 4706 4729 4062 5263 4365 4600 4319 4376
5 4 3396 3574 4126 4415 3847 2669 4018 4256 4045 4165
Рисунок 4.5 - Пример файла с данными правовой статистики
Для примера возьмем данные, взятые из официальной статистики [74, 78, 79], для показателя правовой статистики «Количество зарегистрированных преступлений в отношении иностранных граждан и лиц без гражданства» (данные взяты поквартально).
После загрузки необходимого файла необходимо выбрать из выпадающих окон соответствующий масштаб представленных данных и требуемый масштаб для решения расчётной задачи в интересах решения задач аналитической работы (рисунки 4.6, 4.7), после чего нажать на кнопку «Далее».
Рисунок 4.6 - Оконный интерфейс программы «Масштабирование выборок данных»
0 Масштабирование выборок данных
Загрузите файл с разрешением .xlsx
[ Открыть файл ]
Выберете масштаб представленных данных | М
Выберете требуемый масштаб данных
День
Месяц
Квартал
Год
Далее |
Рисунок 4.7 - Оконный интерфейс программы «Масштабирование выборок данных»
Далее согласно представленному в подразделе 2.2 алгоритму, численному методу и используемым библиотекам, производится операция агрегирования и в отдельный файл Excel с разрешением .xlsx выводятся значения представленных данных в требуемом масштабе (рисунке 4.8).
А в с о Е н К 1-
1 2012 2013 2014 2015 2016 2017 2013 2019 2020 2021 2022
2 1 12444 13214 17309 17289 15660 14679 15816 16810 15981 15961 12203
Рисунок 4.8 - Результат работы программы «Масштабирование выборок данных»
Опишем работу программ «Выявление структурных аномалий в динамических рядах» и «Выявление параметрических аномалий в динамических рядах».
При работе на вход программы подаются следующие данные:
1) количество преступлений различного вида или информация о различных категориях населения;
2) данные о временном промежутке.
Выходными данными работы программы является сведенья о наличии структурных и/или параметрических аномальных значений в выбранном промежутке времени.
Рассмотрим подробнее структуру описываемой программы.
Оконный интерфейс программы «Выявление структурных аномалий в динамических рядах» представлен на рисунке 4.9.
Рисунок 4.9 - Оконный интерфейс программы «Выявление структурных аномалий в динамических рядах»
После нажатия на кнопку «Открыть файл» необходимо выбрать файл Excel с разрешением .xlsx, в котором представлены данные о количестве преступлений или информация о различных категориях населения и данные о временном промежутке в заданном виде, представленном на рисунке 4.10. Для примера возьмем данные, взятые из официальной статистики [74, 78, 79], для показателя правовой статистики «Количество зарегистрированных преступлений в отношении иностранных граждан и лиц без гражданства» (данные взяты поквартально).
а в с d е f g н j к l
1 2012 2011 2014 2015 2016 2017 2018 2019 2020 2021 2022
2 1 2677 2910 2931 397в 3757 3252 3393 3698 3917 3651 3868
3 2 2902 3162 5546 4167 3994 3495 4040 4256 3700 3769 4143
4 3469 3568 4706 4729 4062 5263 4365 4600 4319 4376
5 4 3396 3574 4126 4415 3847 2669 4018 4256 4045 4165
Рисунок 4.10 - Пример файла с данными правовой статистики
После загрузки необходимого файла, необходимо нажать на кнопку «Далее». Далее согласно представленному в подразделе 3.2 алгоритму, численному методу и используемым библиотекам, выявляется момент или интервал времени, в котором присутствуют структурные аномальные значения элементов выборки, после чего в отдельном окне выводятся результаты работы программы, как представлено на рисунке 4. 11.
Рисунок 4.11 - Пример результата работы программы
Оконный интерфейс следующей программы «Выявление параметрических аномалий в динамических рядах» представлен на рисунке 4. 12.
Рисунок 4.12 - Оконный интерфейс программы «Выявление параметрических аномалий в динамических рядах»
Для работы с данной программой необходимо ввести в соответственное окно длину известного стабильного периода изменения сезонной компоненты, затем необходимо нажать на кнопку «Открыть файл» и выбрать файл Excel с разрешением .xlsx, в котором представлены данные о количестве преступлений или информация о различных категориях населения и данные о временном
промежутке в заданном виде, представленном на рисунке 4.10. Для выбранного показателя длина известного стабильного периода изменения сезонной компоненты равна четырем.
После загрузки необходимого файла необходимо нажать на кнопку «Далее». Далее согласно представленному в подразделе 3.2 алгоритму, численному методу и используемым библиотекам выявляется момент или интервал времени, в котором присутствуют параметрические аномальные значения элементов выборки, после чего в отдельном окне выводятся результаты работы программы, как представлено на рисунке 4.13.
Рисунок 4.13 - Пример результата работы программы
В заключение опишем работу программы «Выявление аномалий в статистических панелях».
При работе на вход программы подаются следующие данные:
1) количество преступлений различного вида или информация о различных категориях населения;
2) данные о временном промежутке времени или данные о территориальном образовании.
Выходными данными работы программы являются сведенья о количестве аномальных значений и сами аномальные значения взятой панели данных. Оконный интерфейс программы представлен на рисунке 4.14.
$ Выявление аномалий в статистических панелях 1 =1-® ЬйЧ
Загрузите файл с разрешением .xlsx
!Открыть файл;|
ДI
Рисунок 4.14 - Оконный интерфейс программы «Выявление аномалий в статистических панелях»
Для выявления аномальных изменений в статистических панелях после запуска данной программы необходимо загрузить файл Excel с разрешением .xlsx, нажав на кнопку «Открыть файл», в котором представлены данные о количестве преступлений или информация о различных категориях населения и данные о временном промежутке в заданном виде, представленном на рисунке 4.15.
Л А В с D Е F G н J К L М
1 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022
г Республика Сев. Осетия-Алания 2 0 1 7 10 35 51 23 6 13 9 7
3 Республика Ингушетия 67 38 34 64 54 105 67 54 46 99 115 61
4 Республика Дагестан 220 295 365 472 679 966 531 447 532 723 493 226
5 Карачаево-Черкесская Республика 19 30 16 41 69 90 57 43 18 44 24 11
6 Кабардино-Балкарская Республика 48 67 93 157 110 139 143 91 120 113 74 20
7 Ставропольский край 2 8 4 21 38 50 41 41 46 60 68 18
а Чеченская Республика 21S 127 66 121 208 1S7 256 141 149 143 127 37
Рисунок 4.15 - Пример файла с данными правовой статистики
После нажатия на кнопку «Далее» согласно методу представленному в подразделе 3.3, и используемым библиотекам проводится расчет. Согласно предложенному алгоритму в подразделе 3.3 проводится корреляционный анализ исходного массива, рассчитывается средний коэффициент корреляции, проверяется значимость значений средних коэффициентов корреляции и находится пороговое значение, как нижняя граница доверительного интервала случайной величины. Проведя данные расчеты, выявляется момент или интервал времени, в котором присутствуют аномальные значения элементов выборки и конкретные элементы, имеющие аномальные значения в данном моменте или интервале времени.
После этого в отдельном окне выводятся результаты работы программы, как представлено на рисунке 4.16.
Рисунок 4.16 - Пример результата работы программы
Таким образом, в данном разделе было представлено описание всех программ, входящих в состав разработанного комплекса, в отдельности: представлено описание интерфейсов разработанных программ, выделены особенности работы с ними, приведены наглядные примеры результатов работы каждой из программ.
4.3. Описание программ комплекса для решения расчётных задач
В подразделах 4.1 и 4.2 был представлен и описан состав комплекса программ для нахождения показателей, необходимых для решения расчётных задач в интересах решения задач аналитической работы сотрудников правоохранительных органов.
С помощью разработанного комплекса программ в данном разделе будет проведено исследование влияния аномальных изменений показателей правовой статистики на точность прогноза будущих значений, а также описана программа для представления числовых данных правовой статистики в виде вербальных оценок, что способствует увеличению скорости принятия управленческих решений.
Как было сказано ранее в подразделах 3.2 и 3.4, прогнозирование будущих значений показателя можно осуществлять, используя два подхода.
Первый подход к прогнозированию будущих значений показателей правовой статистики предполагает построение уравнений - линейной, квадратичной, экспоненциальной, логарифмической и т. п. регрессии. Такое представление является целесообразным при решении задачи прогнозирования качественных значений, характеризующих различные процессы, как было описано выше.
Второй подход предполагает использование трендовых компонент всех отрезков динамического ряда для прогнозирования будущих значений показателей правовой статистики.
Рассмотрим первый подход. Для этого опишем работу программы «Регрессионный анализ по данным, включающим лингвистические оценки»;
Данная программа, так же как и предыдущие в подразделе 4.2, была написана с использованием языка программирования Python 3 [11, 109, 114, 115]. При работе на вход программы подаются следующие данные:
1) о количестве преступлений различного вида или о различных категориях населения;
2) о временном промежутке времени или о территориальном образовании;
3) о лингвистических значениях показателей.
Выходными данными работы программы являются данные правовой статистики, заданные в виде лингвистических оценок показателей, и прогнозируемые значения показателей. Оконный интерфейс программы представлен на рисунке 4.18.
Для представления данных правовой статистики в виде лингвистических оценок после запуска данной программы необходимо в текстовое поле ввести количество известных значений показателей Хх,Х2,...,Хт (рис. 4.17).
$ Регрессионный анализ по данным, включающие лингвистические оценку Введите количество значений X |2| |
Представленные данные имеют лингвистические значения? [ Да ~] [ Нет ~ Загрузите файл с разрешением .х1зх [открыть файл]
Рисунок 4.17 - Оконный интерфейс программы «Регрессионный анализ по данным, включающим лингвистические оценки»
Для работы с данной программой необходимо отметить наличие или отсутствие в предложенных данных лингвистических значений (рис. 4.18).
$ Регрессионный анализ по данным, включающие лингвистические оценки
Введите количество значений X [2_|
Представленные данные имеют лингвистические значения? |; Да 1] [ Нет Загрузите файл с разрешением .х1зх [открыть файл]
Рисунок 4.18 - Оконный интерфейс программы «Регрессионный анализ по данным, включающим лингвистические оценки»
Далее, если в предложенных данных значения показателей правовой статистики заданы лингвистически, то следует нажать на кнопку «Да», если в предложенных данных значения показателей правовой статистики заданы в виде числовых значений и предполагается их дальнейшее представление в виде лингвистических значений, то следует нажать на кнопку «Нет» и выбрать количество заданных лингвистических значений, как правило 3 или 5 (рисунок 4.19).
Рисунок 4.19 - Оконный интерфейс программы «Регрессионный анализ по данным, включающим лингвистические оценки»
Рисунок 4.20 - Оконный интерфейс программы «Регрессионный анализ по данным, включающим лингвистические оценки»
А А в с с
1 Регионы РФ Уровень преступности Численность постоянного населенн Количество безработными!.
2 У XI Х2
3 Алтайский край средний 2268179 63000
4 Амурская область ниже среднего 772525 21000
5 Архангельская область ниже среднего 1114322 33000
6 Астраханская область ниже среднего 939430 37000
7 Белгородская область ниже среднего 1531917 32000
а Брянская область ниже среднего 1168771 20000
9 Владимирская область ниже среднего 1323659 31000
10 Волгоградская область средний 2449731 70000
11 Вологодская область ниже среднего 1139439 25000
12 Воронежская область средний 2237678 49000
13 Еврейская АО низкий 153831 5000
м Забайкальский край ниже среднего 1043467 48000
li Ивановская область низкий 976918 18000
16 Иркутская область средний 2357134 83000
17 Кабардино-Балкарская Рес низкий 870487 23000
18 Калининградская область ниже среднего 1027678 21000
19 Калужская область ниже среднего 1012844 7000
20 Камчатский край низкий 312704 24000
21 Карачаево-Черкесская Рес низкий 4&4219 49000
22 Кировская область ниже среднего 1234780 28000
23 Костромская область низкий 620776 12000
24 Краснодарский край высокий 5637378 137000
25 Красноярский край средний 2849169 63000
26 Курганская область ниже среднего 805510 ЗЗООО
27 Курская область ниже среднего 1033534 22000
28 Ленингоадская область ниже среднего 1911586 35000
■
| Sheetl | Лист! | Лист? | ... (+)
НЕ
И и
Рисунок 4.21 - Пример файла с данными правовой статистики
Далее после загрузки необходимого файла согласно представленному в подразделе 3.4 алгоритму, численному методу и используемым библиотекам происходит оценка значимости показателей, а затем данные представляются в виде числовых значений. На основе полученных данных проводится регрессионный анализ, где в окне программы отражаются индекс детерминации и основные коэффициенты, после чего в отдельном окне выводятся результаты работы программы, как представлено на рисунке 4.22.
0 Регрессионный анализ по данным, включающие лингвистические оценки
Введите количество значений X |2 Представленные данные имеют лингвистические значения? [ Да II т. 1
Загрузите файл с разрешением .х15х ¡Открыть файл;
И"2 = 0.544205648979571
Ь = [0.00168953661575796, 0.378683117240977]
а = [3029.23172778096]
Для прогнозирования будущих значений показателей введите XI.., Хт |И9М 069,П300С| | Ввод
Рисунок 4.22 - Оконный интерфейс программы «Регрессионный анализ по данным, включающим лингвистические оценки»
Для прогнозирования будущих значений показателей в соответствующее окно (рис. 4.23) необходимо ввести предполагаемые значения Х1,X,,...,Хт. Результат работы программы представлен на рисунке 4.23.
Аналогичным образом можно произвести прогноз будущих значений показателей правовой статистики в случае, если данные заданы в виде числовых значений.
Рисунок 4.23 - Результат работы программы «Регрессионный анализ по данным,
включающим лингвистические оценки»
Обратимся к описанию программы, использующей второй подход.
Для прогноза будущих значений показателей, используемых при осуществлении аналитической работы, воспользуемся программой «Прогнозирование значений уровней динамических рядов с выявленными аномалиями». Входными данными программы являются сведенья о количестве преступлений различного вида или информация о различных категориях населения, а также данные о временном промежутке, используемые в программах, представленных ранее, «Выявление структурных аномалий в динамических рядах» и «Выявление параметрических аномалий в динамических рядах», а также результаты работы указанных программ, т. е. структурные и параметрические аномалии.
Выходными данными работы программы являются прогнозируемые значения показателей.
Рассмотрим подробнее структуру описываемой программы.
После нажатия на кнопку «Открыть файл» необходимо выбрать файл Excel с разрешением .xlsx, в котором представлены данные о количестве преступлений
или информация о различных категориях населения и данные о временном промежутке в заданном виде, представленном на рисунке 4.10.
После загрузки необходимого файла необходимо нажать на кнопку «Далее». Далее согласно представленному в подразделе 3.2 алгоритму, численному методу и используемым библиотекам, на основе используемых выше программ в подразделе 4.2 рассчитываются прогнозируемые значения выбранного показателя, после чего в отдельном файле Excel с разрешением .xlsx выводятся результаты работы программы в виде графического представления.
4.4. Результаты моделирования с использованием комплекса программ
На основе разработанного метода построения функциональной схемы и алгоритма из раздела 2, численных методов и алгоритмов из раздела 3 и комплекс программ из подразделов 4.1 - 4.3 получены результаты работы программ и найдены теоретические значения для всех видов статистических данных.
1. Для динамических рядов.
Проиллюстрируем описанный в подразделе 3.2 подход на примере анализа фрагмента уголовной статистики [74, 78, 79], показателя преступности «Количество прибывших иностранных граждан» с 2012 по 2022 г. (данные взяты по полугодиям).
Первоначально определим тип модели динамического ряда. Данная модель является аддитивной, т. к. амплитуда данной модели изменяется не монотонно. Проведем корреляционный анализ показателей с целью проверки наличия сезонной компоненты.
Корреляционный анализ показал отсутствие сезонной компоненты, что визуально можно определить и по рисунку 4.24. Найдем линию тренда. Учитывая малое количество уровней между всплесками, целесообразно использовать
нелинейную модель ряда. Уравнение тренда для данного динамического ряда принимает вид
T = 0,747х6 - 45,87x5 +1072x4 -11880x3 + 63180x2 -146000x + 248200, индекс детерминации равен r2 = 0,66.
180000 160000 140000 120000 100000 80000 60000 40000 20000 О
_ известные статистические данные правовой статистики
.......... линия тренда
Рисунок 4.24 - Статистические данные правовой статистики
С помощью численных методов, описанных в разделе 3, выявлены аномальные изменения уровней ряда в 2012, 2014, 2017, 2018 и 2021 годах.
Найденные аномалии соотносятся со следующими социально-экономическими, внешне и/или внутриполитическими событиями, связанными с осуществлением миграционной политики:
- в конце 2012 года глава государства подписал документ, согласно которому увеличилось количество трудовых мигрантов;
- в начале 2014 года всплеск обусловлен последствиями политического кризиса на Украине;
... 1 2 1 2 1 2 1 2 1 2 1 2 12 12 12 12 1 2 .
2012 2013 2014 2015 2016 2017 201S 2019 2020 2021 2022
- в начале 2017 и конце 2018 года всплеск связан с ужесточением миграционного законодательства и оттоком трудовых мигрантов;
- в начале 2021 года всплеск обуславливается мерами по эффективному преодолению новой коронавирусной инфекцией СОУГО-19.
Далее заменим аномальные значение усредненным значением показателей за предшествующий и следующий период. Как видно из анализа, выявление и учёт аномальных значений приводит к увеличению значения индекса детерминации на 21% (скорректированный индекс детерминации г2 = 0,80), что способствует уменьшению значения относительной погрешности прогнозируемых значений на 15 % (рисунок 4.25).
180000 160000 140000 120000 100000 80000 60000 40000 20000
1 2 1 2 1 2 1 2 1 2 1 2 12 12 1 2
2013 2014 2015 2016 2017 2018 2019 2020 2021
известные статистические данные показателя линия тренда
прогнозируемые статистические данные показателя
Рисунок 4.25 - Статистические данные правовой статистики
Таким образом, разработанный метод позволяет найти только те значения, которые потенциально могут быть аномальными. При использовании
дополнительной информации о значениях уровней ряда можно существенно улучшить этот результат.
Далее рассмотрим пример использования разработанного метода в подразделе 3.2, когда априори известно о наличии сезонной компоненты. Проиллюстрируем подход на примере анализа фрагмента уголовной статистики показателя преступности «Количество зарегистрированных преступлений, совершенных иностранными гражданами и лицами без гражданства» с 2012 по 2021 г. [74, 78, 79]. Сезонная компонента в силу наличия аномалий классическими методами не выявляется. Вместе с тем криминологические исследования показывают существование сезонной компоненты, содержащей 4 уровня ряда с немонотонной амплитудой изменения уровней, что определяет целесообразность использования аддитивной модели (рис. 4.26) [9, 10, 30].
С помощью разработанного метода выявлены структурные аномальные изменения уровней в 2014 и 2017 году (рис. 4.26).
.12 3 4 12 3 4 12 3 4 12 3 4 12 3 4 12 3 4 12 3 4 12 3 4 12 3 4 1 2 3 4 ...
2012 2013 2014 2015 2016 2017 2018 2019 2020 2021
Ч ^ параметрические аномалии О структурные аномалии
Аномальные уровни в динамическом ряду коррелируют со следующими внешними дестабилизирующими факторами, связанными с осуществлением государственной миграционной политики:
- в 2014 году всплеск увеличения числа преступлений обусловлен увеличением числа мигрантов вследствие политического кризиса на Украине;
- в 2017 году всплеск обуславливается ужесточением миграционного законодательства Российской Федерации.
Параметрические аномалии в 2015 и 2019 году также связаны с изменением миграционного законодательства Российской Федерации.
Учитывая полученные результаты, для прогнозирования будущих значений уровней ряд разбивается на отрезки, для каждого из которых найдены уравнения линейного тренда по формуле
Г2/2 = а + Ь ■ п.
'1, л
Заметим, что найденная в подразделе 3.2 относительная погрешность для всего динамического ряда не превышает 3,9 %. Указанное обстоятельство позволяет считать точность данной модели приемлемой.
Для динамических рядов результатом моделирования является прогноз будущих значений уровней динамических рядов без учета найденных структурных и параметрических аномалий, который осуществляли по описанному численному в подразделе 3.2 методу, как продолжение отрезка динамического ряда, т. к. последний уровень не является аномальным (рисунок 4.27).
При этом относительная погрешность найденных прогнозируемых значений уровней ряда для четырех кварталов (4 квартала 2021 года и 1-3 кварталов 2022 г.) для показателя «Количество зарегистрированных преступлений, совершенных иностранными гражданами и лицами без гражданства» не превышает 5,3% для всех прогнозируемых значений, в то время как относительная погрешность прогнозируемых значений без учета выявленных аномальных значений превысила 9,9%.
5500 5000 4500 4000 3500 3000
12 3 4 1 2 3 4 12 3 4 1 2 3 ...
2012 2013 2014 - 2020 2021 2022
- известные статистические данные правовой статистики
------ прогнозируемое значение показателя после исключения аномальных
значений
....... прогнозируемое значение показателя без исключения аномальных
значений
Рисунок 4.27 - Результаты прогнозирования будущих значений
динамического ряда
Таким образом, выявление структурных и параметрических аномальных значений уровней ряда позволяют объективно оценить состояние и динамику криминогенной ситуации. Применение разработанного математического метода позволяет повысить точность прогнозирования будущих значений показателей правовой статистики.
2. Для статистических панелей.
Для проверки корректности разработанных алгоритмов, численных методов и комплекса программ для работы со статистическими плоскими панелями проиллюстрируем описанный в подразделе 3.3 подход на примере анализа фрагмента уголовной статистики показателя «Преступления террористической направленности» с 2011 по 2021 г. для Северо-Кавказского федерального округа (таблица 4.1).
Территориальное образование 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021
Республика Северная Осетия-Алания 2 0 1 7 10 35 51 23 6 13 9
Республика Ингушетия 67 38 34 64 54 105 67 54 46 99 115
Республика Дагестан 220 295 365 472 679 966 531 447 532 723 493
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.