Алгоритмы адаптивного обучения структуры и параметров байесовской сети на основе смесей гауссовских распределений тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Деева Ирина Юрьевна
- Специальность ВАК РФ00.00.00
- Количество страниц 240
Оглавление диссертации кандидат наук Деева Ирина Юрьевна
Содержание
Реферат
Synopsis
Введение
Глава 1. Подходы к моделированию многомерных распределений и обучению байесовских сетей
1.1 Модели многомерных распределений
1.2 Алгоритмы обучения байесовских сетей
1.3 Выводы к главе
Глава 2. Метод и реализующий его алгоритм построения гауссовой смеси на данных со сложной формой распределения
2.1 Модель гауссовых смесей и её свойства
2.2 Алгоритм построения смеси гауссовых распределений с гибким подбором количества компонент
2.3 Выводы к главе
Глава 3. Метод и реализующий его алгоритм адаптивного обучения БС с помощью построения смесей гауссовых распределений
3.1 Алгоритм структурного обучения байесовской сети на основе моделей смесей гауссовых распределений
3.2 Исследование свойств адаптивного алгоритма обучения байесовских сетей
3.3 Выводы к главе
Глава 4. Экспериментальные исследования алгоритма адаптивного обучения байесовских сетей
4.1 Эксперименты на синтетических данных
4.2 Эксперименты на реальных (отраслевых) данных
4.3 Выводы к главе
Заключение
Список используемых сокращений
Список литературы
Публикации автора по теме диссертации
ПРИЛОЖЕНИЕ А. СВИДЕТЕЛЬСТВА О РЕГИСТРАЦИИ ПРОГРАММ
ДЛЯ ЭВМ
ПРИЛОЖЕНИЕ Б. ТЕКСТЫ ПУБЛИКАЦИЙ
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Методы интерпретации математических моделей нефтегазовой отрасли на основе ретроспективных данных2024 год, кандидат наук Воскресенский Антон Георгиевич
Групповая классификация на основе байесовских моделей2006 год, кандидат физико-математических наук Бабушкина, Елена Вадимовна
Выбор оптимальной сложности класса логических решающих функций в задачах анализа разнотипных данных2006 год, доктор технических наук Бериков, Владимир Борисович
Интеллектуальная поддержка принятия решений для предупреждения поллинозов на основе автоматического распознавания изображений пыльцы2021 год, кандидат наук Ханжина Наталья Евгеньевна
Обработка сигналов на фоне негауссовых помех в информационно-телекоммуникационных системах и сетях2004 год, доктор технических наук Шевцов, Вячеслав Алексеевич
Введение диссертации (часть автореферата) на тему «Алгоритмы адаптивного обучения структуры и параметров байесовской сети на основе смесей гауссовских распределений»
Реферат
Актуальность темы исследования. Комплексные объекты реального мира порождают, как правило, большие данные, обладающие высокой размерностью и сложной структурой взаимосвязей. Для вероятностного описания их изменчивости используются различные модели многомерных распределений. В настоящее время существуют разнообразные подходы к решению данной задачи, использующие различные факторизации, разложения в ряды Эджворта, а также конструктивные представления на основе набора маргинальных распределений. В Российской Федерации они разрабатывались в рамках научных школ Ю.В.Прохорова, А.А. Боровкова, И.А. Ибрагимова, А.Л. Тулупьева, В.А. Рожкова, а также А.В. Бухановского. Однако большинство таких подходов предназначено для задач относительно невысокой размерности и справедливо только в рамках определенной вероятностной модели. Как следствие, для работы с реальными данными в условиях неопределенности (когда вероятностная модель не может быть в полной мере установлена) требуется использовать подходы машинного обучения (МО). Так, одним из наиболее перспективных подходов МО для конструирования многомерных распределений является теория байесовских сетей (БС). Их ключевое преимущество заключается в возможности построить разреженный граф зависимостей, который и определяет структуру произведения условных распределений, тем самым кардинально снижая число членов в факторизационном представлении. Однако сам аппарат БС не способен однозначно определить класс и параметры условных распределений. Существующие алгоритмы построения структуры БС используют либо непараметрические статистики, либо классические аналитические модели распределений (например, распределения Гаусса). Однако использование БС для описания свойств многомерных объектов реального мира требует создания алгоритмов обучения, в работе которых особенности данных будут учитываться прямо на этапе построения сети, что позволит значимо улучшить качество
приближения исходного распределения. Потому данное исследование посвящено развитию алгоритмической базы машинного обучения БС на данных сложной структуры, способной учитывать как сложную форму самих распределений, так и нелинейные зависимости между узлами БС.
Цель исследования. Повышение качества представления многомерных распределений сложной формы с помощью байесовских сетей в условиях неопределенности и неполноты сведений о виде условных распределений и типе связей.
Задачи исследования:
1) Проведение углубленного анализа современного состояния исследуемой области и обоснование выбора решений на основе аналитического обзора научно-технической литературы;
2) Формальная постановка задачи и разработка требований к методу адаптивного обучения байесовских сетей на данных объектов реального мира;
3) Разработка метода и реализующего его алгоритма обучения распределения произвольной формы на основе аппроксимации смесью гауссовых распределений;
4) Разработка метода и реализующего его алгоритма адаптивного обучения байесовской сети с использованием смесей гауссовых распределений;
5) Проведение экспериментальных исследований применимости разработанных алгоритмов на примере синтетических и реальных (отраслевых) данных с последующим внедрением результатов в алгоритмическое ядро открытой библиотеки ВАМТ.
Научная новизна определяется тем, что для решения задачи моделирования многомерных распределений впервые предложен алгоритм обучения БС, в котором процессы построения смесей для аппроксимации условных распределений и выращивания структуры сети итеративно связаны между собой, что позволяет
значимо повысить качество приближения и воспроизводить как линейные, так и нелинейные связи между узлами сети.
Теоретическая значимость работы состоит в развитии алгоритмов обучения байесовских сетей на распределениях сложной формы с нелинейными зависимостями между данными.
Практическая значимость работы определяется разработкой авторской открытой библиотеки BAMT на языке Python 3.9 для работы с байесовскими сетями, которая включает следующие программные модули:
— модуль структурного обучения, включающий возможность обучать структуру классическими алгоритмами, а также адаптивным алгоритмом на основе смесей;
— модуль параметрического обучения, позволяющий обучать параметры распределений в узлах для дискретных, непрерывных и смешанных данных;
— модуль вероятностного вывода из обученной байесовской сети.
На защиту выносятся:
1) метод и реализующий его алгоритм построения гауссовой смеси для приближения исходных распределений в узлах БС с возможностью выбора количества компонент, исходя из особенностей формы распределения и объема выборки;
2) метод и реализующий его алгоритм адаптивного обучения БС с помощью построения смесей гауссовых распределений на данных сложной формы с нелинейными зависимостями между случайными величинами.
Соответствие паспорту специальности 1.2.1:
п. 15 - математические исследования в области статистики, логики, алгебры, топологии, анализа функции и других областях, ориентированные на решение задач искусственного интеллекта и машинного обучения - в части разработки алгоритмов обучения структуры байесовской сети и параметров распределений в узлах
байесовской сети на данных сложной формы и с нелинейными зависимостями между узлами.
п. 16 - исследования в области специальных методов оптимизации, проблем сложность и элиминации перебора, снижения размерности - в части разработки алгоритма подбора количества компонент смеси гауссовых распределений на основе формы имеющихся распределений, а также с учётом объёма имеющихся данных.
Внедрение результатов работы. Результаты диссертационного исследования получены в рамках проектов Национального центра когнитивных разработок Университета ИТМО, а также при выполнении хоздоговорных проектов по заказу ООО «Газпромнефть НТЦ» и ассоциации «Искусственный интеллект в промышленности» в интересах компании «Газпром нефть»:
— «Разработка вероятностной ориентированной модели параметров месторождений для решения задачи поиска месторождений-аналогов»;
— «Разработка ориентированной вероятностной модели работ и ресурсов строительства объектов месторождений для генерации возможных ресурсных команд под пулы работ на площадке».
Результаты работ также внедрены в деятельность Исследовательского центра «Сильный ИИ в промышленности» в рамках федерального проекта «Искусственный интеллект». Также результаты проекта использовались в рамках проекта № 075-152020-808 «Надежный и логически прозрачный искусственный интеллект: технология, верификация и применение при социально-значимых и инфекционных заболеваниях».
Степень достоверности и апробации результатов. Достоверность научных результатов подтверждает корректным использованием математических методов, обоснованной постановкой задач, экспериментальными исследованиями, которые покрывают разработанные алгоритмы и подходы. Основные результаты исследования были представлены на пяти международных конференциях:
— 18th EAI International Conference on Mobile and Ubiquitous Systems: Computing, Networking and Services, 08.11.2021 - 10.11.2021, online
— The International Conference on Computational Science (ICCS 2021), 06.06.2021 - 18.06.2021, online
— Интеллектуальный анализ данных в нефтегазовой отрасли, 19.10.2020 -20.10.2020, online
— EAI GOODTECHS 2020 - 6th EAI International Conference on Smart Obj ects and Technologies for Social Good, 14.09.2020 - 16.09.2020, online
— 8th International Young Scientists Conference in Computational Science, 24.06.2019 - 28.07.2019
Также результаты диссертационного исследования были апробированы в рамках соревнования по анализу данных AgroCode Hack 2022 [1], в рамках которого решалась задача выявления признаков, которые влияют на болезни коров. Обученная байесовская сеть позволила выявить такие признаки на основе найденных зависимостей в многомерном распределении и заняла первое место в общем списке моделей, предложенных участниками.
Публикации. По результатам диссертации опубликовано семь статей в рецензируемых научных изданиях, входящих в международные реферативные базы данных и системы цитирования Scopus, Web of Science, а также в списки журналов, рекомендованных ВАК. Также было получено два свидетельства о регистрации программ для ЭВМ.
Личный вклад автора. Из работ, которые были выполнены в соавторстве, в диссертацию включены результаты, которые представляют личный вклад автора. Личный вклад автора заключается в разработке алгоритма обучения байесовской сети для смешанных данных в работе [1], в работе [2] автор разрабатывал алгоритм обучения структуры сети на основе соединения блоков частой сети в единую сеть для повышения интерпретируемости структур сетей, а также для решения проблемы
большого количества узлов в сети. В работе [3] автор разрабатывал и проводил эксперименты для тестирования алгоритма обучения структуры байесовской сети на основе гауссовых распределений. В работах [4,5] автор проводил апробацию полученных байесовских сетей на задаче генерации синтетических персональных данных. В работе [6] автор помогал разработать алгоритм поиска месторождений -аналогов на основе кластеризации структур байесовских сетей, а также в работе [7] автор разрабатывал алгоритм обучения байесовской сети для моделирования распределений параметров месторождений, имеющих сложную форму распределений.
1. Deeva I. et al. Oil and Gas Reservoirs Parameters Analysis Using Mixed Learning of Bayesian Networks // International Conference on Computational Science. 2021. P. 394-407.
2. Deeva I. et al. Bayesian Networks-based personal data synthesis // Proceedings of the 6th EAI International Conference on Smart Objects and Technologies for Social Good. 2020. P. 6-11.
3. Deeva I. et al. MIxBN: library for learning Bayesian networks from mixed data // arXiv preprint arXiv:2106.13194. 2021. P. 6-11.
4. Deeva I. et al. MVAESynth: a unified framework for multimodal data generation, modality restoration, and controlled generation // International Conference on Mobile and Ubiquitous Systems: Computing, Networking, and Services. Elsevier, 2021. Vol. 2020, № 1. P. 1-10.
5. Deeva I., Mossyayev A., Kalyuzhnaya A. V. A Multimodal Approach to Synthetic Personal Data Generation with Mixed Modelling: Bayesian Networks, GAN's and Classification Models // International Conference on Mobile and Ubiquitous Systems: Computing, Networking, and Services. 2021. P. 847-859.
6. Безбородов А.К. Д.И.Ю. Поиск месторождений-аналогов на основе кластеризации байесовских сетей // Известия высших учебных заведений. Приборостроение. 2022. Vol. 65, № 1. P. 64-72.
7. Andriushchenko P.D. et al. Analysis of parameters of oil and gas fields using Bayesian networks // Data Science in Oil \& Gas. 2020. Vol. 2020, № 1. P. 1-10.
Структура и объём диссертации. Диссертация состоит из введения, четырёх глав, описывающих основные подходы и результаты, заключения и списка литературы.
Первая глава включает аналитический обзор подходов к обучению структуры и параметров БС, а также подходов к вероятностному выводу на полученных сетях. Описаны как классические алгоритмы, основанные на непараметрических подходах (например, на основе дискретизации данных), а также на основе известных распределений (например, на основе гауссовых распределений), так и методы, решающие похожие задачи обучения БС на данных сложной формы и нелинейными зависимостями между узлами.
Вторая глава описывает формальную постановку задачи выращивания смесей гауссовых распределений по данным. Также описывает метод и реализующий его алгоритм обучения модели смеси гауссовых распределений на данных с адаптивным подбором количества компонент.
Третья глава содержит формальную постановку задачи обучения структуры байесовской сети, а также описание метода и реализующего его алгоритма обучения структуры и параметров байесовской сети на основе гауссовых распределений.
Четвёртая глава описывает экспериментальные исследования полученных алгоритмов на примере синтетических наборов данных, а также на примере реальных наборов данных различной природы - медицинские, социальные и геологические данные. Также эта глава содержит описание программного комплекса, включающего
разработанные алгоритмы и являющегося частью библиотеки для обучения БС ВАМТ.
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Интеллектуальные методы анализа и синтеза организационных структур для цифровой трансформации процессов разведки и разработки нефтегазовых месторождений2020 год, кандидат наук Буханов Никита Владимирович
Технология интеллектуальной организации процесса выполнения неоднородных композитных приложений в распределенной вычислительной среде2019 год, кандидат наук Мельник Михаил Алексеевич
Композитные методы автоматического машинного обучения для моделей временных рядов2024 год, кандидат наук Ревин Илья Евгеньевич
Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней2012 год, доктор экономических наук Бирюков, Александр Николаевич
Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов2001 год, кандидат физико-математических наук Верденская, Наталья Владимировна
Заключение диссертации по теме «Другие cпециальности», Деева Ирина Юрьевна
Заключение
В результате выполнения диссертационного исследования:
— Был проведён углубленного анализа современного состояния исследуемой области, на основе которого было сформулировано обоснование выбора решений;
— Была сформулирована формальная постановка задачи и были разработаны требования к методу адаптивного обучения байесовских сетей на данных объектов реального мира;
— Был разработан метод и реализующий его алгоритма обучения распределения произвольной формы на основе аппроксимации смесью гауссовых распределений;
— Был разработан метод и реализующий его алгоритма адаптивного обучения байесовской сети с использованием смесей гауссовых распределений;
— Проведены экспериментальные исследования применимости разработанных алгоритмов на примере синтетических и реальных (отраслевых), показавшие увеличение качества моделирования многомерных распределений в среднем на 20% по сравнению с классическими подходами к обучению БС. Также описано внедрение результатов в алгоритмическое ядро открытой библиотеки BAMT.
Тема диссертационного исследования может быть развита в направлении расширения разработанных алгоритмов на случаи со смешанными типами данных, а также в направлении использования предложенных способов вычисления оценочных функций для эволюционных алгоритмов обучения байесовских сетей.
Список литературы диссертационного исследования кандидат наук Деева Ирина Юрьевна, 2022 год
Список литературы
1. AgroCode Hack 2022. No Title [Electronic resource] // Cows Task. 2022. URL: https : //hack.rshbdigital .ru/cows.
2. Deeva I. et al. Oil and Gas Reservoirs Parameters Analysis Using Mixed Learning of Bayesian Networks // International Conference on Computational Science. 2021. P. 394-407.
3. Deeva I. et al. Bayesian Networks-based personal data synthesis // Proceedings of the 6th EAI International Conference on Smart Objects and Technologies for Social Good. 2020. P. 6-11.
4. Deeva I. et al. MIxBN: library for learning Bayesian networks from mixed data // arXiv preprint arXiv:2106.13194. 2021. P. 6-11.
5. Deeva I.U. et al. MVAESynth: a unified framework for multimodal data generation, modality restoration, and controlled generation // International Conference on Mobile and Ubiquitous Systems: Computing, Networking, and Services. Elsevier, 2021. Vol. 2020, № 1. P. 1-10.
6. Deeva I., Mossyayev A., Kalyuzhnaya A. V. A Multimodal Approach to Synthetic Personal Data Generation with Mixed Modelling: Bayesian Networks, GAN's and Classification Models // International Conference on Mobile and Ubiquitous Systems: Computing, Networking, and Services. 2021. P. 847-859.
7. Безбородов А.К. Д.И.Ю. Поиск месторождений-аналогов на основе кластеризации байесовских сетей // Известия высших учебных заведений. Приборостроение. 2022. Vol. 65, № 1. P. 64-72.
8. Andriushchenko P.D. et al. Analysis of parameters of oil and gas fields using Bayesian networks // Data Science in Oil \& Gas. 2020. Vol. 2020, № 1. P. 1-10.
9. Cheng J. et al. Learning Bayesian networks from data: An information-theory based approach // Artif. Intell. Elsevier, 2002. Vol. 137, № 1-2. P. 43-90.
10. De La Fuente A. et al. Discovery of meaningful associations in genomic data using partial correlation coefficients // Bioinformatics. Oxford University Press, 2004. Vol. 20, № 18. P. 3565-3574.
11. Spirtes P. et al. Causation, prediction, and search. MIT press, 2000.
12. Scheines R. et al. Tetrad ii: Tools for discovery. Lawrence Erlbaum Associates, Hillsdale, NJ, 1994.
13. Chickering D.M. Optimal structure identification with greedy search // J. Mach. Learn. Res. 2002. Vol. 3, № Nov. P. 507-554.
14. LarranAga P. et al. A review on evolutionary algorithms in Bayesian network learning and inference tasks // Inf. Sci. (Ny). Elsevier, 2013. Vol. 233. P. 109-125.
15. Scutari M., Graafland C.E., Gutiérrez J.M. Who learns better Bayesian network structures: Accuracy and speed of structure learning algorithms // Int. J. Approx. Reason. Elsevier, 2019. Vol. 115. P. 235-253.
16. Zhang K. et al. Kernel-based conditional independence test and application in causal discovery // arXiv Prepr. arXiv1202.3775. 2012.
17. Tsamardinos I., Brown L.E., Aliferis C.F. The max-min hill-climbing Bayesian network structure learning algorithm // Mach. Learn. Springer, 2006. Vol. 65, № 1. P. 31-78.
18. Chatrabgoun O. et al. Approximating non-Gaussian Bayesian networks using minimum information vine model with applications in financial modelling // J. Comput. Sci. Elsevier, 2018. Vol. 24. P. 266-276.
19. Langseth H. et al. Mixtures of truncated basis functions // Int. J. Approx. Reason. Elsevier, 2012. Vol. 53, № 2. P. 212-227.
20. Ickstadt K. et al. Nonparametric bayesian networks // Bayesian Stat. 2010. Vol. 9. P. 283-316.
21. Osorio P. et al. Gaussian mixture models for affordance learning using bayesian networks // 2010 IEEE/RSJ International Conference on Intelligent Robots and
Systems. 2010. P. 4432-4437.
22. Ramos-Lopez D. et al. Scalable importance sampling estimation of Gaussian mixture posteriors in Bayesian networks // Int. J. Approx. Reason. Elsevier, 2018. Vol. 100. P. 115-134.
23. Wu Y., Ghosal S. Kullback Leibler property of kernel mixture priors in Bayesian density estimation // Electron. J. Stat. Institute of Mathematical Statistics and Bernoulli Society, 2008. Vol. 2. P. 298-331.
24. Bishop C.M., Nasrabadi N.M. Pattern recognition and machine learning. Springer, 2006. Vol. 4, № 4.
25. McLachlan G.J., Rathnayake S. On the number of components in a Gaussian mixture model // Wiley Interdiscip. Rev. Data Min. Knowl. Discov. Wiley Online Library, 2014. Vol. 4, № 5. P. 341-355.
26. Pernkopf F., Bouchaffra D. Genetic-based EM algorithm for learning Gaussian mixture models // IEEE Trans. Pattern Anal. Mach. Intell. IEEE, 2005. Vol. 27, № 8. P. 1344-1348.
27. Agresti A. Categorical data analysis. John Wiley \& Sons, 2003.
28. Sun H., Wang S. Measuring the component overlapping in the Gaussian mixture model // Data Min. Knowl. Discov. Springer, 2011. Vol. 23, № 3. P. 479-502.
29. Pavlovskii V. V, Derevitskii I. V, Kovalchuk S. V. Hybrid Predictive Modelling for Finding Optimal Multipurpose Multicomponent Therapy // International Conference on Computational Science. 2021. P. 479-493.
30. Vikse B.E. et al. Distribution and determinants of serum creatinine in the general population: the Hordaland Health Study // Scand. J. Clin. Lab. Invest. Taylor \& Francis, 2004. Vol. 64, № 8. P. 709-722.
31. Azzalini A., Bowman A.W. A look at some data on the Old Faithful geyser // J. R. Stat. Soc. Ser. C (Applied Stat. Wiley Online Library, 1990. Vol. 39, № 3. P. 357365.
32. Cvetkovic M., Velic J., Malvic T. Application of neural networks in petroleum reservoir lithology and saturation prediction // Geol. Croat. Hrvatski geoloski institut, 2009. Vol. 62, № 2. P. 115-121.
33. Poon S.-H., Rockinger M., Tawn J. Extreme value dependence in financial markets: Diagnostics, models, and financial implications // Rev. Financ. Stud. Oxford University Press, 2004. Vol. 17, № 2. P. 581-610.
34. Mishra A. et al. Multivariate approach in analyzing medical data with correlated multiple outcomes: an exploration using ACCORD trial data // Clin. Epidemiol. Glob. Heal. Elsevier, 2021. Vol. 11. P. 100785.
35. Hair J.F. Multivariate data analysis: An overview // Int. Encycl. Stat. Sci. Springer, 2011. P. 904-907.
36. Fujikoshi Y., Ulyanov V. V, Shimizu R. Multivariate statistics: High-dimensional and large-sample approximations. John Wiley \& Sons, 2011.
37. Liu X. et al. Statistical-based monitoring of multivariate non-Gaussian systems // AIChE J. Wiley Online Library, 2008. Vol. 54, № 9. P. 2379-2391.
38. Olkin I. Multivariate non-normal distributions and models of dependency // Lect. Notes-Monograph Ser. JSTOR, 1994. P. 37-53.
39. Rencher A.C. A review of "Methods of Multivariate Analysis, ." Taylor \& Francis, 2005.
40. Song S., Singh V.P. Frequency analysis of droughts using the Plackett copula and parameter estimation by genetic algorithm // Stoch. Environ. Res. Risk Assess. Springer, 2010. Vol. 24, № 5. P. 783-805.
41. Molenberghs G., Lesaffre E. Marginal modeling of correlated ordinal data using a multivariate Plackett distribution // J. Am. Stat. Assoc. Taylor \& Francis, 1994. Vol. 89, № 426. P. 633-644.
42. Krupskii P., Joe H. Factor copula models for multivariate data // J. Multivar. Anal. Elsevier, 2013. Vol. 120. P. 85-101.
43
44
45
46
47
48
49
50
51
52
53
54
55
56
Kolenikov S. Calibrating survey data using iterative proportional fitting (raking) // Stata J. SAGE Publications Sage CA: Los Angeles, CA, 2014. Vol. 14, № 1. P. 2259.
Artyushenko V.M., Volovach V.I. Description of non-Gaussian Random Processes, Signals and Noise Using the Statistical Linearization Method // 2019 International Multi-Conference on Industrial Engineering and Modern Technologies (FarEastCon). 2019. P. 1-7.
Haugh M. MCMC and Bayesian modeling // IEOR E4703 Monte-Carlo Simulation, Columbia Univ. 2017.
Robinson R.W. Counting labeled acyclic digraphs // New Dir. theory graphs. Academic Press, 1973. P. 239-273.
Cannon S. Reservoir modelling: a practical guide. John Wiley \& Sons, 2018. Petersson K.J.F. et al. Semiparametric distributions with estimated shape parameters // Pharm. Res. Springer, 2009. Vol. 26, № 9. P. 2174-2185. Korb K.B., Nicholson A.E. Bayesian artificial intelligence. CRC press, 2010. Koller D., Friedman N. Probabilistic graphical models: principles and techniques. MIT press, 2009.
Behjati S., Beigy H. Improved K2 algorithm for Bayesian network structure learning // Eng. Appl. Artif. Intell. Elsevier, 2020. Vol. 91. P. 103617. McLachlan G., Peel D. Finite mixture models: Wiley Interscience. 2000. McNicholas P.D. Mixture model-based classification. Chapman and Hall/CRC, 2016. Schlattmann P. Medical applications of finite mixture models. Springer, 2009. Li J., Barron A. Mixture density estimation // Adv. Neural Inf. Process. Syst. 1999. Vol. 12.
Tewari A., Giering M.J., Raghunathan A. Parametric characterization of multimodal distributions with non-gaussian modes // 2011 IEEE 11th International Conference on Data Mining Workshops. 2011. P. 286-292.
57. Leroux B.G., Schwarz G. Estimating the dimension of a model // Ann. Stat. JSTOR, 1992. P. 461-464.
58. McLachlan G.J. On bootstrapping the likelihood ratio test statistic for the number of components in a normal mixture // J. R. Stat. Soc. Ser. C (Applied Stat. Wiley Online Library, 1987. Vol. 36, № 3. P. 318-324.
59. Biernacki C., Govaert G. Using the classification likelihood to choose the number of clusters // Comput. Sci. Stat. PROCEEDINGS PUBLISHED BY VARIOUS PUBLISHERS, 1997. P. 451-457.
60. Rahman M., Rahman R., Pearson L.M. Quantiles for finite mixtures of Normal distributions // Int. J. Math. Educ. Sci. Technol. Taylor \& Francis, 2006. Vol. 37, № 3. P. 352-358.
61. Psutka J. V, Psutka J. Sample size for maximum-likelihood estimates of Gaussian model depending on dimensionality of pattern space // Pattern Recognit. Elsevier, 2019. Vol. 91. P. 25-33.
62. Jin C. et al. Local maxima in the likelihood of gaussian mixture models: Structural results and algorithmic consequences // Adv. Neural Inf. Process. Syst. 2016. Vol. 29. P. 4116-4124.
63. BAMT. Repository experiments and data // GitHub repository. GitHub, 2021.
Публикации автора по теме диссертации
Свидетельства о регистрации программ для ЭВМ:
1. Свидетельство о регистрации №2 2019664484 от 24.10.2019 «Программный комплекс для настройки и валидации гидродинамических моделей» // Никитин Н.О., Вычужанин П.В., Хватов А.А., Деева И.Ю., Калюжная А.В.
2. Свидетельство о регистрации №2 2021680887 от 15.12.2021 «Программный комплекс для структурного и параметрического обучения байесовских сетей на данных BAMT» // Деева И.Ю., Калюжная А.В., Бубнова А.В.
Публикации в изданиях, индексируемых в Scopus, Web of science, а также входящих в списки, рекомендованные ВАК:
1. Deeva I. et al. Oil and Gas Reservoirs Parameters Analysis Using Mixed Learning of Bayesian Networks // International Conference on Computational Science. 2021. P. 394-407.
2. Deeva I. et al. Bayesian Networks-based personal data synthesis // Proceedings of the 6th EAI International Conference on Smart Objects and Technologies for Social Good. 2020. P. 6-11.
3. Deeva I. et al. MIxBN: library for learning Bayesian networks from mixed data // arXiv preprint arXiv:2106.13194. 2021. P. 6-11.
4. Deeva I. et al. MVAESynth: a unified framework for multimodal data generation, modality restoration, and controlled generation // International Conference on Mobile and Ubiquitous Systems: Computing, Networking, and Services. Elsevier, 2021. Vol. 2020, № 1. P. 1-10.
5. Deeva I., Mossyayev A., Kalyuzhnaya A. V. A Multimodal Approach to Synthetic Personal Data Generation with Mixed Modelling: Bayesian Networks, GAN's and Classification Models // International Conference on Mobile and Ubiquitous Systems: Computing, Networking, and Services. 2021. P. 847-859.
6. Безбородов А.К. Д.И.Ю. Поиск месторождений-аналогов на основе
кластеризации байесовских сетей // Известия высших учебных заведений. Приборостроение. 2022. Vol. 65, № 1. P. 64-72.
7. Andriushchenko P.D. et al. Analysis of parameters of oil and gas fields using Bayesian networks // Data Science in Oil \& Gas. 2020. Vol. 2020, № 1. P. 1-10.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.