Методы и алгоритмы машинного обучения для предобработки и классификации слабоструктурированных текстовых данных в научных рекомендательных системах тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Кузнецов Игорь Александрович
- Специальность ВАК РФ05.13.01
- Количество страниц 127
Оглавление диссертации кандидат наук Кузнецов Игорь Александрович
ВВЕДЕНИЕ
Глава 1. Анализ рекомендательных систем и место алгоритмов машинного обучения в них
1.1. Существующие виды рекомендательных систем
1.2. Особенности научных рекомендательных систем
1.3. Пертинентность информации
1.4. Место задачи классификации при обработке данных на основе машинного обучения
1.5. Сравнительный анализ методов классификации
1.6. Постановка задачи диссертационного исследования
1.7. Выводы по первой главе
Глава 2. Метод обогащения признакового пространства с помощью выявления вида научного результата
2.1. Особенности научных «Больших данных»
2.2. Расширение онтологии научной деятельности для научной рекомендательной системы
2.3. Разработка метода выявления вида научных результатов на основе параметрического подхода
2.4. Разработка алгоритма выявления вида научного результата
2.5. Экспериментальные результаты применения алгоритма выявления вида научного результата
2.6. Выводы по второй главе
Глава 3. Ансамбль алгоритмов классификации для слабоструктурированных текстовых научных данных
3.1. Существующие подходы к формированию ансамблей алгоритмов
3.2. Предлагаемый ансамблевый метод классификации на основе энтропии с использованием базовых алгоритмов машинного обучения
3.3. Результаты экспериментального исследования ансамблевого метода классификации на основе энтропии
3.4. Выводы по третьей главе
Глава 4. Внедрение разработанных алгоритмов
4.1. Разработка программно-технических решений повышения пертинентности информации
4.2. Структура программно-технического решения повышения пертинентности информации
4.2.1. Перечень разработанных подсистем
4.2.2. Архитектура системы
4.3. Выводы по четвертой главе
Глава 5. Оценка пертинентности научных рекомендательных систем при использовании разработанных методов
5.1. Информационная система Международный конгресс конференций «ИТО»
5.2. Ранжирование поисковой выдачи в соответствии с потребностью пользователя
5.3. Выводы по пятой главе
Заключение
Список использованных источников
Приложение 1. Акты об использовании результатов диссертационной работы
Приложения 2. Свидетельства о государственной регистрации баз данных
Приложения 3. Свидетельства о государственной регистрации программы для ЭВМ
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Методы и алгоритмы анализа паттернов сигналов электромиографии на основе задачи классификации данных2023 год, кандидат наук Кабанов Артемий Андреевич
Методы и алгоритмы оценки и учета пользовательских предпочтений в персональной транспортной интеллектуальной рекомендательной системе2020 год, кандидат наук Бородинов Александр Александрович
Методы и алгоритмы анализа паттернов сигналов электромиографии на основе задачи классификации данных2022 год, кандидат наук Кабанов Артемий Андреевич
Разработка и исследование методов и алгоритмов бинарной и многоклассовой классификации многомерных данных2022 год, кандидат наук Клюева Ирина Алексеевна
Методы и алгоритмы семантической структуризации текстовой информации на основе логико-онтологических преобразований2021 год, кандидат наук Мизюков Григорий Сергеевич
Введение диссертации (часть автореферата) на тему «Методы и алгоритмы машинного обучения для предобработки и классификации слабоструктурированных текстовых данных в научных рекомендательных системах»
ВВЕДЕНИЕ
Диссертационная работа направлена на решение научно-технической задачи создания, применения и исследования эффективности методов и алгоритмов машинного обучения для обработки слабоструктурированных текстовых данных в научных рекомендательных системах.
Актуальность исследования. Переход от бумажных носителей информации к цифровым, вызванный повсеместным использованием информационных и телекоммуникационных технологий, открывает перспективы для работы с постоянно возрастающим объемом информации и возможностью извлечения знаний из слабоструктурированного массива данных. Несмотря на относительно небольшой срок активного применения в промышленности цифровых носителей, объем данных на них растет год от года в геометрической прогрессии, что является следствием преобразования и перевода данных из различных областей жизнедеятельности человека в цифровой вид. К 2016 году накопленное количество данных оценивалось в 16 зеттабайт, но по прогнозам аналитической компании IDC к 2025 году объем всех данных достигнет отметки в 163 зеттабайт [1]. В связи с этим на первый план выходят способы хранения, обработки, поиска и извлечения знаний из данных. Эта технология получила название сквозной цифровой технологии «Большие данные».
К 2024 году государство намерено осуществить комплексную цифровую трансформацию экономики и социальной сферы России. Направление по обработке «больших данных» входит в зону ответственности ГК «Росатом», где в рамках создания цифровой платформы «Распределенная среда обработки больших данных» предусмотрены работы по развитию компонентов систем поддержки принятия решений, программных интерфейсов доступа к данным и др.
Ввиду возрастания объема данных и необходимости осуществлять поиск среди них на первый план выходит задача определения релевантности и перти-нентности информации. Понятие «релевантность» означает «соответствие полученной информации информационному запросу». Таким образом, релевантность определяется исключительно используемыми математическими моделями в кон-
кретной информационно-поисковой системе. Под понятием «пертинентность» понимается «соответствие полученной информации информационной потребности», т.е. пертинентность - соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя независимо от того, как полно и точно эта потребность выражена в форме запроса.
Один из подходов для повышения пертинентности информационного поиска - использование методов машинного обучения как частный случай применения интеллектуального анализа данных. Данное направление исследования лежит на пересечении целого ряда дисциплин: математики, информатики, статистики, теории вероятностей и прочих. Выделяют особый подкласс информационных систем, опирающийся на математические модели и позволяющий решать задачи по определению релевантности и пертинентности данных, который называется рекомендательными системами. Отсутствие универсальных подходов для решения задач предобработки и классификации в рекомендательных системах делает разработку методов и алгоритмов машинного обучения в этом случае особо актуальной.
Рекомендательная система представляет собой программное средство и методы, назначением которых является прогнозирование поведения пользователя в отношении объекта информационного поиска и формирование рекомендаций для объектов, с которыми он еще не встречался [2, 3]. Потребность в персонификации информационных предложений также будет реализовываться в развитие интеллектуальных советников, которые будут адаптироваться под конкретного пользователя. Источником данных для рекомендательной системы выступают профили пользователей, явные и неявные. В профиле фиксируются данные о самом пользователе, предоставленные как лично, так и через перечень действий, которые он совершил за время работы с системой.
Предложенные в диссертационной работе методы и алгоритмы направлены на увеличение точности и стабильности работы методов машинного обучения при предобработке и классификации больших объемов слабоструктурированных текстовых данных и повышение пертинентности информационного поиска в научных рекомендательных системах.
Степень разработанности проблемы. Исследованию, разработке и развитию математических моделей и алгоритмов классификации посвящены работы отечественных и зарубежных ученых Воронцова К.В. [4, 5], Дьяконова А.Г. [6, 7], Пылькина А.Н. [8, 9, 10, 11], Лупина С.А. [12, 13, 14], Аматриаин К. [15], М. де Геммис [2], Бреймана Л. [16, 17], Блей Д. [18].
Вопросом повышения пертинентности информации и развитием рекомендательных систем занимались Пальчунов Д.Е. [19, 20], Захаров В.Н. [21, 22, 23, 24, 25], Адомавичус Г. [26], Бурке Р. [27], Ступников С.А. [21, 28, 25], Фелферниг А. [29], Констан Д. [30].
Развитием сквозной цифровой технологии «Большие данные» и интеллектуальным анализом данных занимаются Цветков В.Я. [31], Бойд Д. [32], Ву Ксиндонг [33], Линч Клиффорд [34], Кузнецов С.Д. [35].
Объектом исследования диссертационной работы являются научные рекомендательные системы.
Предметом исследования выступают математические методы и алгоритмы машинного обучения, используемые в научных рекомендательных системах.
Теоретическую базу исследования составили фундаментальные научные труды российских и зарубежных авторов, касающиеся разработки методов и алгоритмов обработки данных, принципов формирования ансамблевых подходов, подходов работы с «большими данными», принципов Data Mining и Text Mining, теории автоматизированного управления, поддержки принятия решений и системного анализа.
Информационной базой исследования являются монографии, посвященные проблемам анализа и обработки информации; публикации в научных журналах; Российская государственная библиотека; Российская научно-техническая библиотека; научная база ВИНИТИ; научная электронная библиотека КиберЛенинка; материалы научно-практических конференций, сети Интернет.
Цель диссертационного исследования состоит в разработке математических методов и алгоритмов машинного обучения для обработки и анализа больших
объемов слабоструктурированных текстовых данных в научных рекомендательных системах.
Для достижения поставленной цели необходимо решить следующие задачи диссертационного исследования:
• исследовать существующие подходы к построению рекомендательных систем, выполнить системный анализ методов машинного обучения для решения задачи классификации, выявить наиболее перспективные методы для работы со слабоструктурированными текстовыми данными больших объемов;
• разработать и исследовать метод и алгоритмы обогащения признакового пространства в рамках решения задачи предобработки слабоструктурированного набора текстовых данных;
• разработать и исследовать ансамблевый метод и алгоритмы для решения задачи классификации при обработке слабоструктурированных текстовых данных;
• провести апробацию предложенных методов и алгоритмов в виде разработанных программных средств повышения пертинентности информации в научных рекомендательных системах;
• провести экспериментальную проверку эффективности использования предложенных методов и алгоритмов машинного обучения в научных рекомендательных системах.
Методы исследования. В работе использовались методы структурного системного анализа, методы теории управления и принятия решений, методы интеллектуального анализа данных и машинного обучения, методология объектно-ориентированного проектирования RUP (Rational Unified Process) и подходы, применяемые при разработке программного обеспечения.
Научная новизна заключается в следующем:
• обоснован параметрический подход для решения задачи предобработки слабоструктурированного набора текстовых данных на основе извлечения нового семантического параметра из текстовых публикаций - вида научного результата;
• на основе параметрического подхода предложен метод и разработаны алгоритмы предобработки текстовых публикаций в научных рекомендательных системах, позволяющие существенно повысить пертинентность информационного поиска;
• разработаны и исследованы новый метод и алгоритмы ансамблевой классификации, обладающие высокой прогнозной точностью и стабильностью, основанные на комбинации существующих алгоритмов с использованием энтропии в качестве меры взвешивания. Использование энтропии позволяет существенно повысить качество методов машинного обучения для решения задачи классификации по сравнению с аналогами;
• проведено экспериментальное исследование эффективности применения методов предобработки и ансамблевой классификации на слабоструктурированных текстовых научных данных.
Теоретическая и практическая значимость работы заключается в следующем:
1. Проведенные исследования принципов формирования различных видов рекомендательных систем показывают, что использование контентной фильтрации способствует устранению таких проблем функционирования, как «холодный старт», «новый пользователь» и идентификации контекста для пользователя.
2. Предложенный параметрический подход и разработанные на его основе метод и алгоритмы обогащения признакового пространства слабоструктурированных научных данных позволяют выделить новый семантический параметр - вид научного результата, приводящий к расширению онтологии описания научной деятельности.
3. Проведенный системный анализ методов машинного обучения для решения задачи классификации показал, что наиболее острой проблемой при работе со слабоструктурированными данными является несоответствие между структурами данных обучающей выборки и генеральной совокупности, для уменьшения этого несоответствия предложено использовать ансамблевые методы.
4. Предложенный метод и разработанные алгоритмы ансамблевой классификации на основе энтропии позволяют повысить стабильность и точность работы ансамбля на больших объемах слабоструктурированных текстовых данных.
5. Разработанное инструментальное средство классификации данных защищено свидетельством о государственной регистрации и было успешно использовано в рамках выполнения проекта № 15-07-08742 РФФИ, что подтверждается соответствующим актом об использовании.
6. Разработанные базы данных учебно-методических материалов и научных публикаций защищены свидетельствами о госрегистрации и используются в течении ряда лет в учебной деятельности в НИЯУ МИФИ, что подтверждается соответствующим актом об использовании.
7. Разработанные методы и алгоритмы были реализованы в информационной системе Международный конгресс конференций «Информационные технологии в образовании» и показали свою эффективность, что подтверждается соответствующим актом о внедрении.
Достоверность полученных результатов. Научные положения и выводы, полученные в диссертационной работе, являются достоверными и обоснованными. Это подтверждается использованием научной методологии исследования, достаточно большим объемом обработанных отечественных и зарубежных источников по теме исследования, последовательным подходом к решению поставленных задач, проведенными в работе экспериментами, анализом полученных результатов в сравнении с другими моделями, соответствующими актами об использовании, а также обсуждением основных положений диссертации на международных и российских научно-практических конференциях.
Научные результаты, полученные лично автором и выносимые на защиту: 1. Параметрический подход, метод и алгоритмы для извлечения нового семантического параметра - вида научного результата из слабоструктурированных текстовых данных научных публикаций, позволяющий повысить пертинентность информационного поиска.
2. Метод и алгоритмы машинного обучения с использованием энтропии в качестве меры взвешивания для ансамблевой классификации, отличающиеся стабильностью и точностью по сравнению с известными аналогами и позволяющий повысить пертинентность информационного поиска.
3. Результаты экспериментального исследования применимости алгоритмов предобработки и ансамблевой классификации на слабоструктурированных текстовых данных, показывающие прирост пертинентности при информационном поиске в научных рекомендательных системах.
4. Разработанное инструментальное средство для решения задачи классификации и набор баз данных для использования в научно-исследовательской и учебной деятельности.
5. Разработанная научная рекомендательная система для информационной системы Международного конгресса конференций «Информационные технологии в образовании».
Авторский вклад. Все результаты диссертационной работы получены либо лично автором, либо при его непосредственном участии.
Область исследования. Область диссертационного исследования соответствует по своему содержанию Паспорту научных специальностей ВАК Министерства образования и науки РФ по специальности 05.13.01 «Системный анализ, управление и обработка информации (в информационных системах)»: п.1. «Теоретические основы и методы системного анализа, оптимизации, управления, принятия решений и обработки информации»; п.4. «Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации»; п.12. «Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации».
Апробация результатов исследования. Основные положения и результаты диссертационного исследования были успешно доложены и обсуждены на XIX Международной телекоммуникационной конференции молодых ученых и студентов «Молодежь и наука» (Москва, 2015 г.); Международной научно-практической конференции «Информационные Технологии в Образовании XXI
века» (Москва, 2015 г.); Международном научно-техническом семинаре «Современные технологии в задачах управления, автоматики и обработки информации» (Алушта, Республика Крым, 2016 г.); XVIII международной конференции DAMDID/RSDL'2016 «Аналитика и управление данными в областях с интенсивным использованием данных» (Ершово, Московская область, 2016 г.); XXII Всероссийской научно-технической конференции студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях» НИТ-
2017 (Рязань, 2017 г.); XIX Международной конференции DAMDID / RCDL'2017 «Аналитика и управление данными в областях с интенсивным использованием данных» (Москва, 2017 г.); Innovate-Data 2017 The 3rd International Conference on Big Data Innovations and Applications, IEEE-CS TCI (Prague, Czech Republic, 2017 г.); V Всероссийской научной конференции молодых ученых с международным участием «Информатика, Управление и Системный Анализ» ИУСА-2018 (Ростов,
2018 г.); XXIII Всероссийской научно-технической конференции студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях» НИТ-2018 (Рязань, 2018 г.); 2019 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (Москва, 2019 г.).
Внедрение результатов исследования. Результаты диссертационного исследования использовались при выполнении проектов:
• № 2014-14-576-0146 «Разработка метода и программно-технических решений повышения пертинентности информации в научных и аналитических рекомендательных системах» (2014-2016, ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 20142020 годы»);
• № 15-07-08742 «Принципы создания алгоритмического обеспечения для многомерной классификации на примере анализа научных направлений» (20152017, РФФИ).
Научные результаты успешно используются в информационной системе Международного конгресса конференций «Информационные технологии в образо-
вании», что подтверждает соответствующий акт о внедрении. Научные и практические результаты диссертационного исследования были использованы в учебном процессе НИЯУ МИФИ в рамках научно-практического семинара для магистров «Информационные технологии в науке и образовании», что подтверждается соответствующим актом об использовании.
Публикации. Основные результаты диссертации опубликованы в 25 печатных работах, из них 5 статей в периодических научных изданиях, рекомендованных ВАК РФ; 5 в журналах и сборниках трудов конференций, включенных в базу SCOPUS и/или Web of Science; главы в монографии и 5 работ в статьях и материалах конференций; 8 свидетельств о регистрации баз данных и программ для ЭВМ.
Структура и объем работы. Диссертация состоит из введения, пяти глав, заключения, списка литературы и трех приложений. Основной текст работы изложен на 116 страницах, приложения - на 11 страницах текста. Иллюстративный материал включает 34 рисунка и 12 таблиц. Список литературы содержит 103 наименования.
Глава 1. Анализ рекомендательных систем и место алгоритмов машинного обучения в них
1.1. Существующие виды рекомендательных систем
В современных условиях обострившейся конкуренции за потребителя во всех сферах экономики особое внимание уделяется персонализации рыночного предложения и прогнозированию потребности конечного покупателя. Кто предскажет интерес и намерения потребителя точнее, тот и получит преимущество перед конкурентами.
Развитие новых технологий оказывает существенное влияние на манеру поведения пользователей и построение способов коммуникации. Тренд, основанный на работе с данными, говорит о том, что мировое сообщество стремительно отказывается от бумажных источников информации в пользу электронных.
Эти приоритеты опираются в том числе и на следующую статистику: общий объем только проиндексированных основными поисковыми системами интернет-страниц превысил 3 млрд. единиц. Чем дальше, тем сложнее человеку становится найти нужную ему информацию. Более того, особую сложность представляет поиск по массивам научной и аналитической информации, где главенствующую роль играет качество ресурсов.
В настоящее время так и не сложилась удобная инфраструктура, с помощью которой возможно было бы не только быстро найти релевантную информацию, но и отслеживать появление новых ресурсов.
Отслеживание современных тенденций и новых научных работ по интересующим направлениям требует серьезных трудозатрат и высоких временных затрат, что не всегда выполнимо. Существующие информационные системы хранения и цитирования предусматривают некоторые механизмы облегчения поиска и мониторинга, но весьма ограниченные - фильтры по атрибутам и подписка на публикации конкретного человека, ограниченные только статьями и тезисами.
При формировании рекомендаций пользователь зачастую использует упрощенный набор параметров и показателей - простые статистические механизмы, указывающие на общее мнение: самое читаемое, самое посещаемое, самое обсуждаемое и т.п., которые явным образом подталкивают пользователя к той или иной теме.
Более того, до сих пор факты того, что человек искал определённые данные, читал определённые статьи, выделял и копировал определённые фрагменты, уделял информации больше или меньше времени, т.е. совершал ряд неявных поведенческих действий в процессе своей траектории изучения информационных массивов, практически никак не обрабатывается и не используется.
Всё вышесказанное порождает неудовлетворённый запрос на качественный и быстрый поиск специализированной информации, что делает актуальными информационные системы, реализуемые в парадигмах SmartAdvisors и PerspectiveAnalytics (выросшее из направления SocialAnalytics).
Одной из проблем, с которой сталкивается пользователь при выполнении поиска информации, является то, что он не владеет предметной областью и имеет самое поверхностное представление об интересующем его документе или объекте. Сюда же можно отнести незнание ключевых слов, которые являются базовыми и общеупотребимыми в конкретной предметной области. Главной проблемой информационного поиска считается проблема адекватного отображения информационных потребностей пользователей и, как следствие, повышения пертинентности поиска. В качестве приоритетной области для внедрения методов повышения пер-тинентности и программно-технических решений являются аналитические рекомендательные системы.
Рекомендательная система - особый класс систем, основной задачей которых является определение предпочтений и интересов пользователей на сайте, а также формирование предложений из наиболее интересных и релевантных объектов, с которыми они ранее не встречались. Рекомендательные системы подстраиваются под интересы пользователя и пытаются предсказать информационную потребность на основе профиля пользователя. Сформированные рекомендации помогают поль-
зователю в различных процессах принятия решений, например: какую статью прочитать, какой фильм посмотреть и т.д. [30].
Развитие рекомендательных систем возможно только на основе мультидис-циплинарного подхода, когда используется совместно интеллектуальный анализ данных (Data Mining), теория принятия решений, статистические методы обработки данных, маркетинг, теория поведения потребителя, экспертные системы и т.д. Формирование рекомендаций выполняется только на основе полученных данных от пользователя или объекта, а все данные можно отнести к одному из следующих видов:
• объекты,
• пользователи,
• транзакции (отношения между пользователями и объектами).
Как правило, любая предметная область сводится к взаимодействию пользователя с некоторым объектом, где в результате этих взаимодействий формируются транзакции. В зависимости от предметной области, каждый объект может характеризоваться своим набором признаков. В свою очередь, в каждой предметной области информация о пользователе может также иметь различный набор признаков, начиная с анкеты с актуальными данными о пользователе и заканчивая полным отсутствием каких-либо данных о нем.
Рекомендательные системы сравнивают данные одного типа от разных пользователей и создают подборку рекомендаций для определенного пользователя.
Формальная постановка задачи для рекомендаций выглядит следующим образом. Рассмотрим U - множество пользователей и D - множество объектов. Необходимо найти функцию r, r : U х D ^ R, которая формирует рекомендацию R таким образом, что для любого пользователя значение r между ним и объектом i максимально, т.е. является аргументом максимизации [26]:
Vu eU, du = arg(max r(u, d)). (1.1)
deD
Выделяют четыре вида рекомендательных систем [21, 29]:
• рекомендации, формируемые экспертным методом - связи между объектами устанавливаются вручную или на основе заранее определенных правил, но данный способ является актуальным только при небольшом перечне рекомендуемых объектов;
• коллаборативная фильтрация - рекомендации, которые основываются на оценках пользователей по отношению к просмотренным объектам. Рекомендации могут строиться либо на основе поиска схожих пользователей по отношению к рассматриваемому пользователю (user-based), либо на основе поиска схожих объектов по отношению к объектам с выставленными ранее оценками рассматриваемым пользователем (item-based);
• контентная фильтрация - рекомендации для рассматриваемого пользователя, которые формируются на основе понравившихся ему объектов с учетом присвоенных каждому объекту набору параметров;
• гибридная фильтрация - используется комбинация подходов, основанных на контентной и коллаборативной фильтрации, что приводит к повышению качества формируемых рекомендаций.
Контентная фильтрация направлена на четкую классификацию как пользователей, так и объектов, фигурирующих в информационном предложении. В указанном случае устанавливается прямое соответствие между пользователями и объектами на основе их характеристик. В целом стратегия хорошо работает в областях с конечным и относительно небольшим количеством критериев оценки, вытекающих из природы вещей при больших потоках информации и допускает большое количество критериев при небольшом информационном потоке.
При фильтрации на основе контента (содержания) создаются профили пользователей и объектов: профили пользователей могут включать демографическую информацию или ответы на определённый набор вопросов; профили объектов -различную атрибутивную информацию в зависимости от типа объекта.
В случае контентной фильтрации рекомендации даются для объектов, похожих на объекты, уже выбранные пользователем, а основная идея сводится к тому,
что если пользователю понравился один объект, то ему должен понравиться и аналогичный [36]. Контентная фильтрация изначально была разработана для формирования текстовых рекомендаций, которые описывают текстовый объект определенным набором термов. Для формирования рекомендаций из такого набора данных применяют специальную метрику TF-IDF [37], которая позволяет определить важность терма в рамках конкретного предложения и, тем самым, повысить значимость данного текстового документа по сравнению с другими документами.
Формальная постановка задачи для контентных рекомендательных систем выглядит следующим образом. Рассмотрим множество текстовых документов В. Пусть Р(й) будет являться профилем документа ^ £ В, представляющее собой множество признаков данного объекта. Каждый признак представляет собой коэффициент важности терма в документе й, рассчитанный в соответствии с метрикой ТР-ШБ и имеет следующий вид:
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Разработка методов и инструментальных средств повышения пертинентности поиска в современных информационных средах2010 год, кандидат технических наук Терехов, Алексей Андреевич
Математическое и программное обеспечения обучения и оценки рекомендательных систем на основе синтетических данных2023 год, кандидат наук Лысенко Антон Викторович
Разработка методики и алгоритмов линейной классификации неструктурированной текстовой информации в технических системах2022 год, кандидат наук Капитанов Андрей Иванович
Методы обработки многомерных временных рядов для анализа параметров дыхательной системы человека и подбора персонализированных рекомендаций2023 год, кандидат наук Зубков Александр Владимирович
Метод и алгоритмы создания онтологий на основе анализа метаданных и контекста слабоструктурированного контента2019 год, кандидат наук Волчек Дмитрий Геннадьевич
Список литературы диссертационного исследования кандидат наук Кузнецов Игорь Александрович, 2019 год
Список использованных источников
1. David Reinsel, John Gantz, John Rydning. Data Age 2025: The Evolution of Data to Life-Critical. [Электронный ресурс]. - Режим доступа: URL: https://www.seagate.com/www-content/our-story/trends/files/Seagate-WP-DataAge2025-March-2017.pdf.
2. de Gemmis M., Lops P., Musto C., Narducci F., Semeraro G. Semantics-Aware Content-Based Recommender Systems. In: Ricci F., Rokach L., Shapira B. (eds) Recommender Systems Handbook. Springer, Boston, MA. 2015. pp. 119-159.
3. Nicolenko С. Recommender Systems. [Электронный ресурс]. - Режим доступа: URL: http://www.compsciclub.ru/csclub/sites/default/files/slides/20111202_machine_learning_nikolenko_le cture07.pdf (25.11.2014).
4. Воронцов К.В. Лекции по алгоритмическим композициям // Электронные лекции, 7 октября 2012 г. [Электронный ресурс]: http://www.machmeleaming.m/wiki/images/0/0d/Voron-ML-Compositions.pdf (дата обращения 17.10.2018).
5. Янина А.О., Воронцов К.В. Мультимодальные тематические модели для разведочного поиска в коллективном блоге // Машинное обучение и анализ данных, 2016. Т. 2, №2. С. 173186.
6. Дьяконов А.Г. Прогноз поведения клиентов супермаркетов с помощью весовых схем оценок вероятностей и плотностей // Бизнес-информатика, 2014. Т. 1, № 27. С. 68-77.
7. Grigorios Tsoumakas, Apostolos Papadopoulos, Weining Qian, Stavros Vologiannidis, Alexander D'yakonov, Antti Puurula, Jesse Read, Jan Svec, Stanislav Semenov. WISE 2014 Challenge: Multi-label Classification of Print Media Articles to Topics // Lecture Notes in Computer Science. 2014, № 8787, pp. 541-548
8. Учет качества разбиения при использовании модифицированного алгоритма нечеткой кластеризации исследуемых данных и методика ее построения/ Пылькин А.Н., Майков К.А., Крошилин А.В., Белицкий А.М.// Вестник Рязанского государственного радиотехнического университета, 2016. № 58. С.57-63.
9. Support of decision-making in the conditions of uncertainty of different types/Doan Ha.D., Pylkin A.N., Kroshilin A.V., Kroshilina S.V., Tishkina V.V.// ITM Web of Conferences, 2016.
10. Принятие решений в условиях неопределенности/ Демидова Л.А., Кираковский В.В., Пылькин А.Н. - 2-е изд., переработанное. // М., 2015.
11. Tishkina V.V., Pylkin A.N., Kroshilin A.V., Kroshilina S.V. Development of the automated information system for monitoring of results of accounting object activities using semantic networks// ITM Web of Conferences, 2017. Т. 10.
12. Лупин С.А., Давыдова А.П. Особенности программной реализации имитационной модели для оценки алгоритмической устойчивости систем управления // Естественные и технические науки, 2015. № 11 (89). С. 399-404.
13. Лупин С.А., Ба Хла Т. Распределение нагрузки в многопоточных алгоритмах частотного анализа текстовой информации // Инновационные подходы к решению технико-экономических проблем, 2015. С. 208-211.
14. Давыдова А.П., Вагапов Ю.Ф., Лупин С.А. Имитационное моделирование при оценке живучести цифровых систем управления // Проблемы разработки перспективных микро- и наноэлектронных систем (МЭС), 2014. № 2. С. 7-10.
15. Amatriain X., Pujol J.M. Data Mining Methods for Recommender Systems // In: Ricci F., Rokach L., Shapira B. (eds) Recommender Systems Handbook, 2015. Рp. 227-262. DOI: 10.1007/9781-4899-7637-6 7.
16. Breiman L., Friedman J. H., Olshen R. A., Stone C. J. Classification and regression trees. Monterey, CA: Wadsworth & Brooks // Cole Advanced Books & Software, 1984.
17. Breiman, Leo. Random Forests //Machine Learning, 2001. 45 (1), pp. 5-32.
18. Blei D., Ng A., Jordan A. Latent dirichlet allocation. // J/ of Machine Learning Research, Vol. 3, 2003, pp. 993-1022.
19. Пальчунов Д. Е., Ульянова Е. А. Методы автоматического порождения поисковых эвристик // Вестник НГУ. Сер.: Информационные технологии, 2010. Т. 8. Вып. 3. С. 6-12.
20. Пальчунов Д.Е. Решение задачи поиска информации на основе онтологий // Бизнес-Информатика, 2008. № 1. C. 3-13.
21. Филиппов С.А., Захаров В.Н., Ступников С.А., Ковалев Д.Ю. Метод определения подобия информационных единиц по неявным пользовательским предпочтениям в рекомендательных системах поддержки жизнеобеспечения // Аналитика и управление данными в областях с интенсивным использованием данных. Сб. науч. тр. VIII международной конференции, 2016. С. 169-174.
22. Филиппов С.А., Захаров В.Н. Метод повышения пертинентности информации в рекомендательных системах поддержки жизнеобеспечения на основе неявных данных // Системы и средства информатики, 2016. Т. 26. № 4. С. 4-18.
23. Филиппов С.А., Захаров В.Н. Оценка эффективности метода повышения пертинент-ности информации в рекомендательных системах поддержки жизнеобеспечения на основе неявных данных // Современные информационные технологии и ИТ-образование, 2016. Т. 12. № 2. С. 186-193.
24. Захаров В.Н., Мунерман В.И. Модели и методы параллельной обработки структурированных больших данных // Современные информационные технологии и ИТ-образование, 2014. № 10. С. 534-547.
25. Филиппов С.А., Захаров В.Н., Ступников С.А., Ковалев Д.Ю. Кластеризация профилей пользователей в рекомендательных системах поддержки жизнеобеспечения на основе реальных неявных данных // Аналитика и управление данными в областях с интенсивным использованием данных. Сб. науч. тр. XIII международной конференции, 2016. С.163-168.
26. G. Adomavicius, A. Tuzhilin. Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions // IEEE Transactions on Knowledge and Data Engineering, 2005. Vol. 17, Number. 6, pp. 734-749.
27. Burke R. Hybrid Recommender Systems: Survey and Experiments // User Modeling and User-Adapted Interaction, 2002. Vol. 12, Issue 4, pp. 331-370
28. Philippov S., Zakharov V., Stupnikov S., Kovalev D. Organization of Big Data in the Global E-commerce Platforms // CEUR Workshop Proceedings, Vol.1536 [Selected Papers of the XVII International Conference on Data Analytics and Management in Data Intensive Domains (DAMDID/RCDL 2015)] Obninsk, Russia, October 13-16, 2015, pp. 119-124.
29. Alexander Felfernig, Michael Jeran, Gerald Ninaus, Florian Reinfrank, Stefan Reiterer, Martin Stettinger. Basic Approaches in Recommendation Systems // Recommendation Systems in Software Engineering, 2014. pp. 15-37.
30. Joseph A. Konstan, John Riedl. Recommender systems: from algorithms to user experience // User Modeling and User-Adapted Interaction. 2012. Vol. 22, Issue 1-2, pp. 101-123.
31. Tsvetkov V. Y., Lobanov A. A. Big Data as Information Barrier //European researcher. Series A. 2014. №. 7-1. С. 1237-1242.
32. Boyd D., Crawford K. Critical questions for big data: Provocations for a cultural, technological, and scholarly phenomenon //Information, communication & society, 2012. Vol. 15. №. 5. С. 662-679.
33. Wu X. et al. Data mining with big data //IEEE transactions on knowledge and data engineering, 2014. Т. 26. №. 1. С. 97-107.
34. Lynch C. Big data: How do your data grow? //Nature, 2008. Т. 455. №. 7209. С. 28.
35. Клеменков П.А., Кузнецов С.Д. Большие данные: современные подходы к хранению и обработке // Труды Института системного программирования РАН, 2012. Т. 23. С. 143-158.
36. C. Ono, Y. Takishima, Y. Motomura, H. Asoh. Context-Aware Preference Model Based on a Study of Difference between Real and Supposed Situation Data // In: Houben GJ., McCalla G., Pianesi F., Zancanaro M. (eds) User Modeling, Adaptation, and Personalization, 2009. Lecture Notes in Computer Science, vol. 5535, pp. 102-113.
37. Akiko Aizawa. An information-theoretic perspective of tf-idf measures // Information Processing & Management, 2003. Vol. 39, Issue 1, pp. 45-65.
38. Xiaoyuan Su, Taghi M. Khoshgoftaar. A survey of collaborative filtering techniques // Advances in Artificial Intelligence, 2009. Vol. 2009, p. 19.
39. William P. Jones, George W. Furnas. Pictures of relevance: a geometric analysis of similarity measures // J. of the American Society for Information Science archive, 1987. Vol. 38, Issue 6, pp. 420-442.
40. Marius Kaminskas, Derek Bridge. Diversity, Serendipity, Novelty, and Coverage: A Survey and Empirical Analysis of Beyond-Accuracy Objectives in Recommender Systems // ACM Transactions on Interactive Intelligent Systems, 2016. Vol. 7, Issue 1, Article 2, p. 42.
41. Thomas Gottron, Felix Schwagereit. The Impact of the Filter Bubble - A Simulation Based Framework for Measuring Personalisation Macro Effects in Online Communities. CoRR, abs/1612.06551, 2016.
42. Guseva A. I., Kireev V. S., Bochkarev P. V., Kuznetsov I.A., Philippov S.A. Scientific and Educational Recommender Systems // 2017 Information Technologies in Education of the XXI Century (ITE-XXI), AIP Conf. Proc. 1797, 020002-1-020002-11; doi: 10.1063/1.4972422
43. Lupin S., Pachin A., Kostrova O., Fedyashin D. Using the applications' reentering for improvement the grid computing efficiency // Proceedings of the 2016 IEEE North West Russia Section Young Researchers in Electrical and Electronic Engineering Conference, EIConRusNW 2016, 2016. С. 256-258.
44. Eckhardt А. Various aspects of user preference learning and recommender systems // Conference: Proceedings of the Dateso 2009, Annual International Workshop on DAtabases, TExts, Specifications and Objects, Spindleruv Mlyn, Czech Republic, April 15-17, 2009.
45. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика / Большакова Е.И., Клышинский Э.С., Ландэ Д.В и др. Учебное пособие для студентов высших учебных заведений, обучающихся по направлению 231300 «Прикладная математика». М., 2011.
46. Жуликов С.Е., Жуликова О.В. Проблема пертинентности современных информационно-поисковых систем// Вестник ТГУ, 2013. Т. 18, Вып. 1. С. 224-226.
47. Иванова О.Г., Громов Ю.Ю., Дидрих В.Е., Поляков Д.В. Нечеткий подход к определению пертинентности результатов поиска и выбору оптимального запроса // Вестник Воронежского института ФСИН России, 2011. № 2. С. 49-54.
48. N. Landia, S.S. Anand, Personalised tag recommendation // Proceedings of the 2009 ACM Conference on Recommender Systems, 2009, pp. 83-36.
49. ГОСТ 7.73-96 Система стандартов по информации, библиотечному и издательскому делу. Поиск и распространение информации. Термины и определения. - М.: ИПК Изд-во стандартов, 1997.
50. Кузнецов И.А. Повышение пертинентности информации в научных рекомендательных системах с использованием ансамблей алгоритмов машинного обучения // Сб. трудов:
Международный научно-технический семинар «Современные технологии в задачах управления, автоматики и обработки информации» Алушта, Республика Крым, РФ, 14 - 20 сентября 2016 г. С.160-161.
51. Гусева А.И., Киреев В.С., Кузнецов И.А., Бочкарёв П.В. Исследование алгоритмов многомерной классификации научных данных// Фундаментальные исследования, 2015. № 11. Ч. 5. С. 868-874.
52. Кузнецов И. А., Коптелов М. В. Подходы и их реализация при анализе данных общественного мнения о развитии атомного промышленного комплекса // Научное обозрение, 2014. № 6. C. 112-114.
53. Аксенов А. Кузнецов И.А. Разработка алгоритма контент-анализа в социальных сетях [Электронный ресурс] // Материалы 19-й Международной телекоммуникационной конференции молодых ученых и студентов «Молодежь и наука» (Москва, 1 окт.-10 дек. 2015 г.). URL http://mn.mephi.ru/articles/1659 (дата обращения 21.12.2015).
54. Patra A., Singh D. A Survey Report on Text Classification with Different Term Weighing Methods and Comparison between Classification Algorithms // International Journal of Computer Applications. 2013. № 7 (75). Р. 14-18.
55. Satyanarayana N., Ramalingaswamy C., Ramadevi Y. Survey of classification techniques in data mining // IJISET - International Journal of Innovative Science, Engineering & Technology. 2014. № 9 (1). Р. 268-278.
56. Crisci C., Ghattas B., Perera G. A review of supervised machine learning algorithms and their applications to ecological data // Ecological Modelling, 2012. (240). Р. 113-122.
57. Wang Z., Crammer K., Vucetic S. Breaking the Curse of Kernelization: Budgeted Stochastic Gradient Descent for Large-Scale SVM Training // J. of Machine Learning Research, 2012. (13). Р. 3103-3131.
58. Altman N. S. An introduction to kernel and nearest-neighbor nonparametric regression // The American Statistician, 1992. 46 (3). Р. 175-185.
59. Kalhori S.R.N., Zeng X.-J. Evaluation and Comparison of Different Machine Learning Methods to Predict Outcome of Tuberculosis Treatment Course // J. of Intelligent Learning Systems and Applications, 2013. (5). Р. 184-193.
60. Pries K. H., Dunnigan R. Big Data Analytics: A practical guide for managers. // Auerbach Publications, 2015.
61. Нессонова М. Н. Метод рейтингового голосования комитета алгоритмов в задачах классификации с учителем // ЗМЖ, Zaporoz. med. z. 2013. № 1 (76). URL: http://cyberleninka. ru/article/n/metod-reytingovogo-golosovaniya-komiteta-algoritmov-v-zadachah-klassifikatsii-s-uchitelem (дата обращения: 28.04.2016).
62. Wingerath Wolfram, Felix Gessert, Steffen Friedrich, Norbert Ritter. Real-time stream processing for Big Data // Information Technology, 2016. 58(4), Р. 186-194.
63. Hongzhi Wang, Hong Gao, Shenjun Yin, Jie Zhu. The design of course architecture for big data. // In Proceedings of the ACM Turing 50th Celebration Conference - China (ACM TUR-C '17). ACM, NY, USA, Article 13, 2017.
64. Danah Boyd, Kate Crawford. Critical questions for Big Data // Information, Communication & Society. 2012. Vol. 15, Issue 5. Р. 662-679.
65. Min Chen, Shiwen Mao, Yunhao Liu. Big Data: A Survey // Mobile Networks and Applications, 2014. Vol. 19. Issue 2. Р. 171-209.
66. Киреев В.С., Кузнецов И.А., Бочкарёв П.В., Гусева А.И., Филиппов С.А. Разработка модели пользователя научных сетей на основе концепции OPENSCIENCE/ // Фундаментальные исследования, 2015. № 12. Ч. 5. C. 907-913.
67. Бочкарёв П.В., Гусева А.И., Киреев В.С., Кузнецов И.А., Филиппов С.А. Модель научного направления на основе интеграции объектно-ориентированного, наукометрического и экспертного подходов // Фундаментальные исследования, 2015. № 12. Ч. 6. С. 1095-1102.
68. Едронова В.Н., Овчаров А.О. Организация научного исследования // Экономический анализ: теория и практика, 2013. №3 (306)
69. Вареников Д.А., Шлей М.Д., Муромцев Д.И. Построение научных профилей участников научно-образовательного процесса в информационной системе университета // Современные проблемы науки и образования, 2015. № 2-2. С. 178.
70. Кузнецов И.А. Метод автоматизированной классификации научных статей по типу результата в научных аналитических системах // Современные наукоемкие технологии, 2018. № 2. С. 59-63.
71. Lyse Gunn Inger, Gisle Andersen. Collocations and statistical analysis of n-grams: Multiword expressions in newspaper text // Andersen, Gisle (ed.) Exploring Newspaper Language. Amsterdam/New York: John Benjamins, 2012. Р. 79-109.
72. Кузнецов И.А. Автоматизация процесса формирования онтологии на основе классов пользователей в научных рекомендательных системах // Новые информационные технологии в научных исследованиях: материалы XXII Всероссийской научно-технической конференции студентов, молодых ученых и специалистов. Рязань, РГРТУ, 15-17 ноября 2017 г. С. 34-36.
73. Артамонова Е.В., Лештаев С.В. Преобразование естественно-языковых текстов в RDF-граф // Современные наукоемкие технологии, 2016. № 11-2. С. 214-218.
74. Кузнецов И.А. Предобработка данных, выбор и формирование признаков при анализе данных [Электронный ресурс] // Материалы 19-й Международной телекоммуникационной конференции молодых ученых и студентов «Молодежь и наука» (Москва, 1 окт.-10 дек. 2015 г.): материалы конференции. URL:http://mn.mephi.ru/artides/1538 (дата обращения 21.12.2015)
75. Shang J., Liu J., Jiang M., Ren X., Voss C. R., Han J. Automated Phrase Mining from Massive Text Corpora. // CoRR., 2017. Vol. abs/1702.04457.
76. Кузнецов И.А. Автоматизация процесса формирования онтологии на основе классов пользователей в научных рекомендательных системах// Новые информационные технологии в научных исследованиях: материалы XXII Всероссийской научно-технической конференции студентов, молодых ученых и специалистов, Рязань, РГРТУ, 15-17 ноября 2017 г. С. 34-36.
77. Chris Manning, Hinrich Schütze. Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May, 1999.
78. Коляда А.С., Яковенко В.А, Гогунский В.Д. Применение латентного размещения Дирихле для анализа публикаций из наукометрических баз данных // Труды Одесского политехнического университета, 2014. № 1. С. 186-191.
79. Röder М., Both А., Hinneburg А. Exploring the Space of Topic Coherence Measures // Proceedings of the Eighth ACM International Conference on Web Search and Data Mining (WSDM '15). ACM, New York, NY, USA, 2015, 399-408. DOI: https://doi.org/10.1145/ 2684822.2685324
80. Kuznetsov I.A., Guseva A. I. A Method for Obtaining a Type of Scientific Result From the Text of an Article Abstract to Improve the Quality of Recommender Systems // IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (EIConRus, 2019), 28-31 Jan. 2019, Saint Petersburg and Moscow, Russia, Russia. DOI: 10.1109/EIConRus.2019.8656806.
81. Городецкий В.И., Серебряков С.В. Методы и алгоритмы коллективного распознавания: Обзор // Труды СПИИРАН, Т. 1. Вып. 3. Ст.-Петербург, Наука, 2006. C. 139-171.
82. Demidova L., Klyueva I. Data classification based on the hybrid versions of the particle swarm optimization algorithm // 7th Mediterranean Conference on Embedded Computing (MECO), 2018. С. 319-322.
83. Орлов А. И. Базовые результаты математической теории классификации // Научный журнал КубГАУ (Scientific Journal of KubSAU), 2015. № 110. URL: http://cyberleninka.ru/ article/n/bazovye-rezultaty-matematicheskoy-teorii-klassifikatsii (дата обращения: 28.04.2016).
84. Кузнецов И.А., Киреев В.С. Разработка ансамбля алгоритмов классификации с использованием энтропийного показателя качества для решения задачи поведенческого скоринга // Труды конференции «Аналитика и управление данными в областях с интенсивным использованием данных»: XVIII международная конференция DAMDID/RSDL'2016 (11-14 октября 2016 г., Ершово, Московская область, Россия). М.: ФИЦ ИУ РАН, 2016. С. 79-85. Одновременная электронная публикация в CEUR Workshop Proceedings, 2016. Vol. 1752. P. 37-43.
85. Arieh Ben-Naim. Entropy, Shannon's Measure of Information and Boltzmann's H-Theorem // Entropy, 2017. 19(2). Р. 48. DOI: 10.3390/e19020048.
86. Jun Li, Yanghui Rao, Fengmei Jin, Huijun Chen, Xiyun Xiang: Multi-label maximum entropy model for social emotion classification over short text. // Neurocomputing 210: 247-256 (2016).
87. Yanghui Rao, Haoran Xie, Jun Li, Fengmei Jin, Fu Lee Wang, Qing Li: Social emotion classification of short text via topic-level maximum entropy model. // Information & Management, 2016. 53(8): 978-986.
88. Mohammad Hossein Shakoor, Farshad Tajeripour. Noise robust and rotation invariant entropy features for texture classification // Multimedia Tools Appl. 76(6): 8031-8066 (2017)
89. Kireev V. S., Kuznetsov I. A. Development of algorithms ensemble in case of the solution of the task of statistical classification in recommender systems// International Journal of Applied Engineering Research, 2016. Vol. 11. № 9. Р. 6613-6618.
90. Guseva A. I, Kuznetsov I. A. The Use of Entropy Measure for Higher Quality Machine Learning Algorithms in Text Data Processing // 5th International Conference on Future Internet of Things and Cloud Workshops (FiCloudW), 2017. P. 47-52.
91. Бекирова Г. А., Кузнецов И. А. Выделение паттернов поведения пользователей информационно-образовательного пространства университета с использованием алгоритмов кластеризации данных // Молодежный научный вестник, 2016. № 12. http://www.mnvnauka.ru/ 2016/12/Bekirova.pdf (дата обращения 19.06.2018).
92. Киселев Ю.В., Кузнецов И.А. Разработка и тестирование базы данных рекомендательной системы // Теория. Практика. Инновации, 2016. - № 7. http://tpi.vectorscience.ru/ 2016/07/Kisselev.pdf (дата обращения 19.06.2018).
93. Википедия. Свободная энциклопедия [Электронный ресурс] Семантическая сеть. Режим доступа: https://ru.wikipedia.org/wiki.
94. Кодд Э. Расширение реляционной модели для лучшего отражения семантики // СУБД, 1996. № 5-6.
95. Burges C. J. C. A tutorial on support vector machines for pattern recognition // Data Mining and Knowledge Discovery, 1998. Vol. 2. № 2. Р. 121-167.
96. Кузнецов И. А., Гусева А. И., Киреев В. С., Гудков П. Г., Филиппов С. А. Автоматизированная система многомерной классификации данных с использованием ансамбля алгоритмов машинного обучения на базе энтропии // Свидетельство о государственной регистрации программы для ЭВМ РФ № 2017612002. Правообладатель НИЯУ МИФИ (Россия). 2017. Бюлл. № 2.
97. Гусева А.И., Киреев В.С., Кузнецов И.А., Бочкарёв П.В., Коптелов М.В Программа классификации неявных профилей пользователей научных и аналитических рекомендательных систем на основе комбинированного правила голосования // Свидетельство о государственной регистрации программы для ЭВМ РФ № 2015662714. Правообладатель Общество с ограничен-
ной ответственностью «Социальные конференционные технологии» (Россия). 2015. Бюлл. № 12.
98. Гусева А.И., Киреев В.С., Филиппов С.А., Бочкарёв П.В., Кузнецов И.А., Гаврось Л.В., Гудков П.Г. База данных публикаций по тематике «Методы обработки больших данных (BigData) в научных и социальных сетях, включая методы классификации с учителем и без» // Свидетельство о государственной регистрации базы данных РФ № 2015621524. Правообладатель НИЯУ МИФИ (Россия). 2015. Бюлл. № 11.
99. Гусева А.И., Киреев В.С., Филиппов С.А., Бочкарёв П.В., Кузнецов И.А., Сомова О.А. База данных публикаций по тематике «Исследование поведенческих профилей пользователей научных и социальных сетей» // Свидетельство о государственной регистрации базы данных РФ № 2015621512. Правообладатель НИЯУ МИФИ (Россия). 2015. Бюлл. № 10.
100. Гусева А.И., Киреев В.С., Филиппов С.А., Бочкарёв П.В., Кузнецов И.А., Кузьмин Д.С. База данных публикаций по тематике «Дифференциация поведенческих профилей пользователей научных и социальных сетей с учетом фактора ботов» // Свидетельство о государственной регистрации базы данных РФ № 2015621457. Правообладатель НИЯУ МИФИ (Россия). 2015. Бюлл. № 10.
101. Гусева А.И., Тихомирова А.Н., Коровкина Л.Н., Киреев В.С., Цыганов А.А., Филиппов С.А., Матросова Е.В., Кузнецов И.А., Кирьяков И.Л., Маслий Н.П. База данных учебно-методических материалов по направлению подготовки «Бизнес-информатика» // Свидетельство о государственной регистрации базы данных РФ № 2015620231. Правообладатель НИЯУ МИФИ (Россия). 2015. Бюлл. № 3.
102. Гусева А.И., Золотухина Е.Б., Киреев В.С., Путилов А.В., Тихомирова А.Н., Филиппов С.А., Шнырев С.Л., Кузнецов И.А., Гриб И.И., Маслий Н.П. База данных учебно-методических материалов по направлению подготовки «Прикладная информатика» // Свидетельство о государственной регистрации базы данных РФ № 2015620233. Правообладатель НИЯУ МИФИ (Россия). 2015. Бюлл. № 3.
103. Кузнецов И. А., Коптелов М. В.Программа для ЭВМ «Автоматизированная система оценки тональности информационных ресурсов о реализации проектов в атомной промышленности» // Свидетельство о государственной регистрации программы для ЭВМ РФ № 2015610216. Правообладатель НИЯУ МИФИ (Россия). 2016. Бюлл. № 2.
Приложение 1. Акты диссертационной работы
об использовании результатов
«УТВЕРЖДАЮ»
Проректор НИЯУ МИФИ, профессор, д.т.н.
Н.И. Каргин
дирс-лд, 2018 г.
АКТ об использовании результатов диссертационного исследования аспиранта кафедры экономики и менеджмента в промышленности Кузнецова Игоря Александровича в Национальном исследовательском ядерном университете «МИФИ»
Настоящий акт подтверждает, что следующие результаты диссертационного исследования на соискание ученой степени кандидата технических наук Кузнецова Игоря Александровича были внедрены в НИЯУ МИФИ и в течении ряда лет успешно используются на факультете бизнес-информатики и управления комплексными системами (ФБИУКС).
1. Метод предобработки неструктурированных текстовых данных научных статей и метод ансамблевой классификации на основе комбинирования существующих алгоритмов с использованием энтропии в качестве меры взвешиванияв рамках проведенных исследований по проекту РФФИ № 15-07-08742 «Принципы создания алгоритмического обеспечения для многомерной классификации на примере анализа научных направлений» (2015-2017 гг.). В ходе выполнения проекта были разработаны и зарегистрированы в установленном порядке две программы для ЭВМ.
2. Модель формирования кортежа информационных предложений пользователю и экспериментальные результаты применения разработанных методов при проведении практических занятий по курсам «Учебно-исследовательская работа и курсовой проект (Проектирование и разработка информационных систем)» и подготовке выпускных квалификационных работ (бакалавриат, группы У07-712, У08-712, Б14-903, Б15-903, 971, 972); «Научно-практический семинар «Информационные технологии в науке и образовании» (магистратура, группы У01-71И, 71БИ, 71М;У02-71И, 71БИ, 71М; У03-71И, 71БИ,
71М; Ml6-901,904, 914). Для использования в учебном процессе были разработаны и зарегистрированы в установленном порядке шесть баз данных.
Учитывая вышесказанное, можно сделать вывод о том, что результаты диссертационного исследования Кузнецова Игоря Александровича обладают научной новизной и практической значимостью и могут быть рекомендованы для дальнейшего использования как в НИЯУ МИФИ, так и в других образовательных организациях высшего образования для подготовки по таким направлениям подготовки как экономика, бизнес-информатика, прикладная информатика (в экономике), системный анализ и управление.
Декан ФБИУКС, д.т.н, профессор
Начальник Управления научных исследований НИЯУ МИФ
д.т.н., профессор
енюков В.А./
и
с
3
с
о
о\
■О О)
Uj
о
Тел: (495) 514-33-57
Автономная некоммерческая организация «Информационные технологии в образовании»
ito@ito.edu.ru
Шр://ано-ито.рф
АКТ о внедрении результатов диссертационного исследования
аспиранта кафедры экономики и менеджмента в промышленности
Настоящий акт подтверждает, что следующие результаты диссертационного исследования на соискание ученой степени кандидата технических наук Кузнецова Игоря Александровича были внедрены в бизнес-процессы AHO «НТО» и в течение последних лет успешно используются в профессиональной социальной сети KONGRESS:
1. Метод и алгоритмы обогащения признакового пространства для слабоструктурированных текстовых научных данных.
2. Метод и алгоритмы ансамблевой классификации, основанные на комбинации существующих алгоритмов машинного обучения с использованием энтропии в качестве меры взвешивания.
3. Алгоритм формирования пертинентного набора в виде кортежа информационных предложений пользователю на основе комбинированного подхода долгосрочных и краткосрочных трендов.
Результаты научных и практических исследований, представленных в диссертационном исследовании Кузнецова Игоря Александровича, обладают научной новизной и практической ценностью и могут быть рекомендованы для дальнейшего использования в деятельности как сотрудникам AHO «ИТО», так и в других организациях в сфере анализа и обработки научных публикаций и тезисов конференций.
Кузнецова Игори Александровича
Исполнительный директор
Приложения 2. Свидетельства о государственной регистрации баз данных
Приложения 3. Свидетельства о государственной регистрации программы для ЭВМ
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.