Компонентная архитектура программного комплекса интеллектуального анализа научно-технической информации тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Антонов Евгений Вячеславович

  • Антонов Евгений Вячеславович
  • кандидат науккандидат наук
  • 2025, ФГБОУ ВО «Университет «Дубна»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 133
Антонов Евгений Вячеславович. Компонентная архитектура программного комплекса интеллектуального анализа научно-технической информации: дис. кандидат наук: 00.00.00 - Другие cпециальности. ФГБОУ ВО «Университет «Дубна». 2025. 133 с.

Оглавление диссертации кандидат наук Антонов Евгений Вячеславович

ВВЕДЕНИЕ

РАЗДЕЛ 1. ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ НАУЧНО-ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ: ТЕКУЩЕЕ СОСТОЯНИЕ, ОСОБЕННОСТИ, ПРОБЛЕМЫ

1.1. Понятие интеллектуального анализа данных

1.2. Обзор методов интеллектуального анализа данных и существующих программных решений

1.3. Особенности интеллектуального анализа слабоструктурированных и неструктурированных данных

1.4. Проблемы сбора, обработки и анализа научно-технической

информации

Результаты и выводы по разделу

РАЗДЕЛ 2. СТРУКТУРИЗАЦИЯ И ПРОГРАММНОЕ ВЫДЕЛЕНИЕ ДАННЫХ ИЗ РАЗНОТИПОВЫХ МАТЕРИАЛОВ НАУЧНО-ТЕХНИЧЕСКОЙ НАПРАВЛЕННОСТИ

2.1. Исследование информационных ресурсов материалов научно-технической направленности

2.2. Методы и алгоритм программного извлечения данных

2.3. Методы и алгоритмы насыщения данных

2.4. Проектирование формата структуры данных

Результаты и выводы по разделу

РАЗДЕЛ 3. ПРОГРАММНЫЙ КОМПЛЕКС ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА НАУЧНО-ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ

3.1. Описание функциональной модели

3.2. Компонентная архитектура программного комплекса интеллектуального анализа данных

3.3. Предлагаемый перечень программных инструментов, технологий и развертывание системы

3.4. Рабочий процесс обработки данных в рамках разработанной методики

ИАД НТИ

Результаты и выводы по разделу

РАЗДЕЛ 4. АПРОБАЦИЯ ПРОГРАММНОГО КОМПЛЕКСА В ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИХ ИССЛЕДОВАНИЯХ

4.1. Интерактивные аналитические панели в задачах анализа научно-технической информации

4.2. База знаний свойств и структур облученных материалов из мировых источников информации

4.3. Формирование репозитория публикаций научной организации

Выводы по разделу

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ПРИЛОЖЕНИЕ

ПРИЛОЖЕНИЕ

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Компонентная архитектура программного комплекса интеллектуального анализа научно-технической информации»

ВВЕДЕНИЕ

Современное развитие информационно-коммуникационных технологий привело к увеличению потоков информационных материалов. Для научно-исследовательских организаций, лабораторий, коммерческих организаций и отдельных исследователей остроактуальным становится вопрос обработки и анализа поступающих и накопленных материалов. Используя передовые методы работы с неструктурированными или слабоструктурированными данными, например обработки естественного языка или машинного обучения возможно определить ключевые тенденции и возникающие области исследований, оценить их влияние и актуальность отдельных материалов. Это не только упростит поиск информации, но и даст ценные сведения исследователям, поможет при принятии решений в различных областях человеческой деятельности. При этом важным является необходимость обработки большого количества неструктурированных (текстовых, графических и мультимедийных) данных.

Актуальность работы заключается в том, что разработка системы интеллектуального анализа данных научно-технической информации, то есть больших массивов неструктурированных или слабоструктурированных данных, позволит исследователям и аналитикам единолично получать необходимую информацию и проводить анализ без посредника в лице разработчика. Кроме этого, учитывая рост доступной научно-технической информации, необходимы решения для управления и масштабирования задач ее сбора, обработки и хранения.

Интеллектуальный анализ данных представляет собой область науки, которая сочетает в себе методы обработки и хранения больших данных, распределенные вычисления, машинное обучение, извлечение знаний и визуализация информации. Российские и зарубежные ученые, такие как Дюк В. А., Замятин А. В., Кореньков В. В., Сахаров Ю. С., Благовещенский И. Г., Зеленков Ю.А., Аветисян А. И., Янковская А. Е., Яковлев В. Б.,

Пятецкий-Шапиро Г., Агравал Р., Фан Ц., Симудис Е., внесли значительный вклад в разработку методов программной работы с большими объемами данных и области интеллектуального анализа данных. Их исследования заложили основу, предложив решения для поиска скрытых закономерностей в разнородных массивах информации. Проблема обработки слабоструктурированных данных также получила внимание в работах исследователей Оныкий Б. Н., Артамонов А. А., Турдаков Д. Ю., Чхабра П., Кеим Д.А., Осей-Брайсон К.-М., Мишра С. Несмотря на значительный вклад в развитие теории и практики, существующие методы в основном ориентированы на общие текстовые данные, либо не учитывают специфику научно-технической информации, которая требует дополнительных алгоритмов для выделения значимых характеристик.

Существующие программные системы и архитектуры, предназначенные для интеллектуального анализа данных, предложенные, например в работах исследователей Хламов С., Саваневич В., Уиттен А., Холл М., Пивоварчик О. В., Рыбальченко М. В., посвящены разработке отдельных компонентов систем и методов работы с данными, а не созданию единой интегрированной системы для научно-технического анализа или требуют адаптации для работы с разнотиповыми научными данными.

Поэтому, несмотря на активное развитие интеллектуального анализа данных, остаются проблемы, связанные с обработкой слабоструктурированных научно-технических данных, возможностью масштабирования и интеграцией процессов сбора, обработки и анализа данных в единый программный комплекс. Настоящее исследование предлагает новые подходы к решению этих задач, развивая существующие методы и предлагая решения, которые обеспечивают специализированный анализ научно-технической информации.

Объектом исследования данной работы является система интеллектуального анализа данных.

Предметом исследования является архитектура системы интеллектуального анализа данных и алгоритмы насыщения данных научно-технической информации.

Цель диссертационной работы состоит в разработке архитектуры программного комплекса интеллектуального анализа научно-технической информации, обеспечивающей горизонтальную масштабируемость системы для сбора, обработки и хранения разнотиповых входящих данных.

Для достижения цели в работе решаются следующие основные задачи:

1. Провести обзор существующих программных решений, алгоритмов и методов интеллектуального анализа данных, применимых для обработки и хранения разнотиповой научно-технической информации.

2. Разработать специализированные алгоритмы извлечения и насыщения данных из разнотиповых входящих данных.

3. Разработать методику интеллектуального анализа данных для получения значимых характеристик научно-технической информации.

4. Спроектировать компонентную архитектуру программного комплекса интеллектуального анализа научно-технической информации.

5. Разработать программный комплекс интеллектуального анализа научно-технической информации и провести его апробацию.

В работе используются следующие методы исследования: системного анализа, обработки естественного языка, математической статистики, визуальной компьютерной аналитики.

Научная новизна. Новые научные результаты, полученные лично автором, состоят в следующем:

1. Предложена и обоснована методика извлечения значимых характеристик из слабоструктурированных массивов данных, отличающаяся от существующих подходов адаптацией к специфике научно-технической информации.

2. Разработаны метод сбора разнотиповых данных, отличающийся от существующих методов учетом возможности добавления новых информационных источников, а также алгоритмы насыщения данных, отличающиеся возможностью обработки специфической научно-технической информации, что обеспечивает выделение новых значимых характеристик.

3. Предложена новая компонентная архитектура программного комплекса интеллектуального анализа научно-технической информации, которая обеспечивает универсальность системы за счет интеграции процессов сбора, обработки, насыщения разнотиповых данных и горизонтальной масштабируемости программного комплекса.

Теоретическая и практическая значимость работы. Теоретическая значимость исследования заключается в развитии существующих подходов к интеллектуальному анализу данных. Автор уточнил и расширил существующее определение понятия интеллектуального анализа данных, предложив его формальное математическое описание в контексте обработки научно-технической информации. Изложены особенности программной работы с разнотиповыми данными научно-технической направленности при разработке алгоритмов сбора и насыщения данных. Представлена авторская компонентная архитектура программного комплекса интеллектуального анализа научно-технических данных.

Теоретические и практические результаты работы использованы при выполнении работ по договору № 223/8724-Д от 22 ноября 2021 г. с АО НИИГРАФИТ об оказании информационно-консультационных услуг для подготовки информации, разработке критериев и проведению экспертной оценки надежности данных для базы данных по свойствам материалов Госкорпорации «Росатом» и договора № 1707 от 29 августа 2022 г. с ФГУП ВНИИА по выполнению НИР «Разработка программы выборки данных по свойствам и структурам облученных реакторных материалов из мировых источников информации», при выполнении гранта РНФ №19-71-30008 «Развитие технологий и платформ для решения задач цифровой экономики и

научных проектов класса мегасайенс на основе синтеза технологий Больших данных, суперкомпьютерных технологий, озер данных и машинного обучения», при выполнении государственного задания Министерства науки и высшего образования РФ №3466-22 «Создание учебно-методических материалов по финансовой безопасности для школьников и студентов, в том числе для передачи указанных учебно-методических материалов в зарубежные страны-партнеры Международного сетевого института в сфере противодействия отмыванию доходов, полученных преступным путем, и финансированию терроризма», при выполнении работ по договору N° 349ГСТС10-05/80243 от 12 декабря 2022 года с Федеральным государственным бюджетным учреждением «Фонд содействия развитию малых форм предприятий в научно-технической сфере» на выполнение научно-исследовательских и опытно-конструкторских работ (НИОКР) по теме «Разработка и тестирование прототипа мультиагентной системы обработки и представления неструктурированных массивов данных».

Апробация результатов работы. Основные результаты работы представлены на следующих конференциях: 27th Symposium on Nuclear Electronics and Computing - NEC'2019 / Черногория, Будва, Сентябрь 2019; International Scientific Conference on Innovations in Digital Economy: SPBPU IDE-2020» / Санкт-Петербург, Октябрь 2020; International Conference on Brain-Inspired Cognitive Architectures for Artificial Intelligence: Eleventh Annual Meeting of the BICA Society, BICA*AI 2020 / Онлайн-участие, Октябрь 2020; III Школа молодых ученых "Высокопроизводительные платформы для цифровой экономики и научных проектов класса мегасайенс" / Москва, ноябрь 2021; International Conference "Distributed Computing and Grid-technologies in Science and Education" (GRID 2023) / Дубна, 2023.

Публикация результатов.

Основные положения диссертационной работы опубликованы в 12 печатных работах, из них 5 статей в изданиях, индексируемых в библиографических и реферативных базах данных Web of Science и/или

Scopus, 1 статья в издании, рекомендованном ВАК при Министерстве науки и высшего образования Российской Федерации для опубликования основных научных результатов диссертаций на соискание ученой степени кандидата наук, 6 статей в материалах международных конференций. По научно-техническим разработкам в составе коллектива авторов получено 4 свидетельства о регистрации баз данных и 5 свидетельств о регистрации программ для ЭВМ в Федеральной службе по интеллектуальной собственности Российской Федерации.

Основные положения, выносимые на защиту:

1. Разработанный алгоритм сбора разнотиповых научно-технических материалов обеспечивает возможность оперативного масштабирования по заданному перечню информационных ресурсов.

2. Методика интеллектуального анализа данных, предложенная в работе, обеспечивает получение значимых характеристик научно-технической информации из слабоструктурированных массивов данных с помощью разработанных алгоритмов насыщения данных, которые позволяют извлекать и нормировать физические величины и единицы измерений; извлекать таблицы и изображения, международные объединения, гео-данные объектов; унифицировать наименования аффилиаций и стран.

3. Компонентная архитектура системы интеллектуального анализа научно-технической информации позволяет собирать, обрабатывать, насыщать и хранить большой объем слабоструктурированных данных, а также визуализировать данные для получения новых знаний и использовать при принятии управленческих решений.

4. Предложенные методы решения информационно-аналитических задач позволяют создать специализированные информационные базы знаний и репозитории, формировать интерактивные аналитические панели по широкому спектру задач анализа научно-технической информации.

Структура и объем диссертационной работы. Диссертационная работа состоит из введения, четырех разделов, заключения, списка литературы

и 2 приложений. В приложении 1 приведен пример полученных данных в результате обработки научных публикации, в приложении 2 представлены 2 акта внедрения результатов диссертационной работы. Общий объем работы составляет 123 страницы (без учета приложения). Работа содержит 27 иллюстраций и 9 таблиц. Список литературы состоит из 128 наименований.

Содержание диссертации и публикаций автора относятся к научной специальности 2.3.1. «Системный анализ, управление и обработка информации, статистика (технические науки)» и соответствуют следующим позициям паспорта данной специальности: п. 4 «Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений, обработки информации и искусственного интеллекта»; п. 10 «Методы и алгоритмы интеллектуальной поддержки при принятии управленческих решений в технических системах»; п. 12 «Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации».

РАЗДЕЛ 1. ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ НАУЧНО-ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ: ТЕКУЩЕЕ СОСТОЯНИЕ,

ОСОБЕННОСТИ, ПРОБЛЕМЫ

В настоящее время, в эпоху цифровых технологий, отмечается рост доступной научно-технической информации (НТИ) [1]. С одной стороны, это предоставляет возможности для доступа к обширным объемам научных знаний, ежегодно публикуется большое количество научных статей в различных областях. С другой стороны, вместе с этим ростом возникают проблемы, связанные с поиском, сбором и анализом целевой информации. НТИ становится не только ценным ресурсом, но и вызовом, требующим разработки как новых методов анализа и обработки, так и систем управления этим потоком данных.

1.1. Понятие интеллектуального анализа данных

Термин «интеллектуальный анализ данных» (ИАД) возник в информационных технологиях и компьютерных науках для описания результата извлечения знаний из обширных наборов данных. Широкое использование термина началось в 1990-х годах, с увеличением объемов данных в различных организациях и с развитием алгоритмов анализа данных [2][3][4]. В результате появилось множество терминов в англоязычной научной литературе: "database mining" (букв. добыча информации из баз данных) [5], "data mining" (букв. добыча данных) [6], "knowledge discovery in databases" (букв. обнаружение знаний в базах данных) [7], "intelligent data analysis" (букв. интеллектуальный анализ данных) [8], "discovery-driven data mining" (букв. добыча данных на основе открытий) [9].

Несмотря на то, что термин "intelligent data analysis" дословно переводится на русский язык как «интеллектуальный анализ данных», они неравнозначны. Впервые в англоязычной научной литературе термин появляется на симпозиуме "International Symposium on Intelligent Data Analysis (IDA-95)", который проходил 17-19 августа 1995 года в Германии, далее

подробно раскрыт в работе Ксиаху Лью (Xiaohui Liu) [8], где он определяет его как общий термин для методов машинного обучения.

В российской академической среде термин «интеллектуальный анализ данных» употребляется синонимично с терминами "knowledge discovery in databases" и/или "data mining" (например, в работах [10][11][12][13][14]). Авторы научных трудов отмечают, что термин имеет неустоявшийся статус в российской литературе. Это приводит к разнообразию его толкований в рамках конкретных исследований, что подчеркивает важность точного определения терминологии в научных исследованиях, чтобы обеспечить единое понимание и коммуникацию в области анализа данных. Исходя из этого, в работе подробно рассмотрена история возникновения терминов и их использование в русскоязычной научной литературе.

Термин "knowledge discovery in databases" впервые встречается в рамках конференции "International Joint Conferences on Artificial Intelligence (IJCAI-89)", проходившей 20-26 августа 1989 года в Соединенных Штатах Америки на семинаре «The Knowledge Discovery in Databases workshop». По результатам этого семинара его председатель Григорий Пятецкий-Шапиро (Gregory Piatetsky-Shapiro) в статье "Knowledge Discovery in Real Databases: A Report on the IJCAI-89 Workshop" [15] описал общую идею данного термина и далее в статье «Knowledge Discovery in Databases: An Overview» [7] закрепил его, дав определение. В работе термин определяют как «нетривиальный процесс выявления достоверных, новых, потенциально полезных и в конечном итоге понятных закономерностей в данных». Под «нетривиальным» понимается поиск умозаключений, т.е. это не простое вычисление заранее определенных величин, например, вычисление среднего значения набора чисел. Обнаруженные закономерности должны быть применимы к новым данным с некоторой степенью уверенности и потенциальной пользой для пользователей.

В научной статье «Knowledge Discovery and Data Mining: Towards a Unifying Framework» [16] Григорий Пятецкий-Шапиро подчеркивает, что

термин "data mining" не является синонимом "knowledge discovery in databases" (что часто встречается в научных публикациях на русском языке), а «этап процесса knowledge discovery in databases, состоящий в применении алгоритмов анализа и обнаружения данных, которые при допустимых ограничениях вычислительной эффективности позволяют получить определенное множество закономерностей в данных». В статье авторы приводят схему процесса "knowledge discovery in databases" (Рисунок 1).

Рисунок 1. Этапы процесса knowledge discovery in databases1

Процесс состоит из следующих этапов:

1. Выбор определенного набора данных Ds, на которых будет производиться анализ:

5: D ^ Ds, Ds С D, (1.1)

где D - исходные данные, 5 обозначает операцию отбора данных, в которой из исходного набора данных D выбирается подмножество Ds.

2. Выполнение основных операций по обработке данных, таких как, удаление шума, сбор необходимой дополнительной информации, принятие решения о стратегии обработки полей данных, которые можно представить в следующем математическом виде:

с: Dс

Dc, Dc с Ds

(1.2)

Другими словами, с определяет операции обработки выбранных данных Ю3 к виду Юс для дальнейшего шага процесса.

1 Переведенный рисунок из научной публикации [16]

3. Применение методов преобразования для структуризации и выделение параметров для дальнейшего анализа данных:

t: Dc ^ Dp, (1.3)

Dp = [Р!,... , рп}, (1.4)

где t - операция преобразования и структуризации данных, в результате которых получается набор Dp из извлеченных базовых параметров р^, i = 1, ...п, где п - количество базовых параметров.

4. Реализация шага насыщения данных (data mining), который дополняет новые параметры к выделенным из исходных данных:

т: Dp ^ Dp*, (1.5)

Dp* = [Pi, ...,Pi,. , pn, P*r., P*j, P*k}, (1.6)

где m - правила для насыщения набора параметров новыми параметрами р*.,

j = 1,..,к, где к - количество новых параметров. Заметим, что Dp Q Dp*.

5. Интерпретация Е найденных закономерностей, которая может включать визуализацию данных Dp*, необходима для получения знаний К, полезных для принятия решений.

6. Консолидация обнаруженных знаний К и интеграция этих знаний в другие системы для дальнейшего использования и/или их документирование и предоставление заинтересованным сторонам.

Таким образом, термин "knowledge discovery in databases" описывает

общий процесс обнаружения значимых и неочевидных закономерностей в

больших объемах данных. В общем виде представлен в виде

последовательности действий, включающая описанные ранее этапы:

s с t т Е ,л

D ^ Ds^Dc^Dp^Dp*^K (1.7)

В российской академической среде дают различные определения понятию ИАД, например:

• «процесс, используемый компаниями для превращения необработанных данных в полезную информацию» [17];

• «процесс обнаружения в сырых данных раннее неизвестных, нетривиальных, практически полезных, доступных интерпретации знаний (закономерностей), необходимых для принятия решений в различных сферах человеческой деятельности» [18];

• «извлечение неявной, ранее неизвестной и потенциально полезной информации из данных» [19].

Основные характеристики ИАД сформулированы В. А. Дюком и его коллегами в статье [20]:

• присуще многомерная задача - поиск связи между значением целевого показателя и набором значений группы других показателей БД;

• предназначена для обработки разнородной информации;

• не стремится к выявлению взаимосвязей, характерных для всего набора данных, а нацелена на выявление правил, объединяющих значения показателей в подвыборках данных;

• алгоритмы насыщения данных производят поиск вышеупомянутых подвыборок данных и взаимосвязей в этих данных в автоматическом режиме.

При рассмотрении определения ИАД в литературе часто отмечается его синонимичность с концепцией "data mining". Тем не менее, на основе анализа определений представляется, что термин "knowledge discovery in databases" более точно отражает его суть. В учебном пособии «Интеллектуальный анализ данных» [21] А.В. Замятин подчеркивает, что концепция ИАД охватывает больший спектр, чем термин "data mining". В пособие приводится определение "data mining" как «совокупность методов обнаружения в данных таких знаний, которые обязательно обладают следующими свойствами: ранее неизвестные, неожиданные; практически полезные; доступные для интерпретации; необходимые для принятия решений в различных сферах человеческой деятельности».

В настоящем исследовании придерживаемся понимания интеллектуального анализа данных как эквивалент англоязычному термину

"knowledge discovery in databases", а насыщение данных или методы интеллектуального анализа данных как эквивалент термину "data mining".

Таким образом, интеллектуальный анализ данных (ИАД) - процесс выявления ранее неизвестных, нетривиальных, и потенциально полезных закономерностей или взаимосвязей в большом наборе разнотиповых данных для принятия решений в различных областях человеческой деятельности. Этот процесс включает в себя этапы отбора данных, их очистки, преобразования, насыщения и интерпретации полученных результатов анализа. Ключевыми аспектами ИАД являются обобщение закономерностей из данных и поиск потенциально полезных выводов, которые могут быть применены пользователями.

1.2. Обзор методов интеллектуального анализа данных и существующих

программных решений

С развитием технологий и расширением доступности информации методы ИАД становятся все более значимыми в научных исследованиях. Насыщение данных в интеллектуальном анализе представляет собой синтез современных достижений в областях статистики, искусственного интеллекта и машинного обучения [22]. Возникает потребность в специализированных исследованиях, направленных на создание новаторских методов интеллектуального анализа данных или разработку комплексных подходов анализа разнотиповых данных. Выбор методик насыщения данных зависит от конкретной задачи и может потребовать использование различных алгоритмов [23]. В данном подразделе представлен библиографический обзор ИАД, примеры их применения в реальных задачах, обзор существующих систем.

В библиографической и реферативной базе данных рецензируемой научной литературы Scopus по данным с 1989 по 2023 года опубликовано 215 486 научных работ (Рисунок 2) в области интеллектуального анализа данных (ИАД) и 28 882 научные работы, посвященные разработке систем интеллектуального анализа (СИА).

e 18000 Л 17460

g 16000

S 14000

ч ю

^ 12000

Я 10000 и

II 8000

и

g 6000 р

а 4000

о 2000

2072

___ __ , т » I >

0 --IM

v> S* V V V V V V

Год публикации

—•—ИАД —•- СИА

Рисунок 2. Линейный график публикационной активности в области ИАД и

разработки СИА с 1989 по 2023 года Поиск проводился с помощью ключевых слов "knowledge discovery" и "data mining" и был ограничен 60 предложенными платформой дополнительными ключевыми словами, связанными с ИАД. Анализ количества работ по типам научной публикации показывает, что большинство из них, а именно 121 584 или 56,4% от общего числа за рассматриваемый период - материалы конференций. Это указывает на значительную долю дискуссионного исследования и развития тематики на глобальном уровне. Конференции служат платформой для обмена идеями, критического обсуждения результатов и стимулирования новаторских подходов в области, отражают научный интерес и активное вовлечение сообщества в обсуждение и продвижение темы, подтверждая таким образом ее актуальность в научной среде.

Существенный вклад в данную научно-исследовательскую сферу приносят ученые из Китайской Народной Республики и Соединенных Штатов Америки (Рисунок 3). Их количество работ составляет 49,1% (или 105 746 научных публикаций) от общего объема исследований. Необходимо отметить, что Российская Федерация, имеет относительно небольшой объем публикаций

(2 420 публикаций за выбранный период, что составляет 1,1% от всего объема), занимает 20е место по общему рейтингу стран, но в целом публикационная активность свидетельствует о наличии научной активности в этой области в российской академической среде.

Испания ^^у0! 5823

Франция ^^ 6148

Италия ^^У92 6332

| Канада ^^ 6806

| Япония 7272

Ч^ Австралия ^^^^ 7422

| Германия ^^^^^^ 9224

^ Великобритания ^^^^^^ 9320

Рисунок 3. Линейчатая гистограмма распределения научных публикаций по странам в области ИАД и разработки СИА с 1989 по 2023 года Проведен анализ публикаций, посвященных разработке СИА, с ограничением поиска до 10 ключевых слов. За период с 1989 по 2023 года опубликовано 28 882 научные работы (Рисунок 2), что свидетельствует о практической применимости этой области в современном мире. В 2008 году наблюдается первая пиковая точка в количестве научных работ, а именно 1 968 публикаций, что скорее всего связано с резким увеличением числа публикаций из Китайской Народной Республики. С 2007 по 2008 год количество публикаций в данной стране выросло в 2,5 раза, достигнув отметки в 608 публикаций за год. Этот всплеск активности может быть обусловлен применением методов насыщения данных на практике, а также реализацией государственных стратегий развития информационных технологий, принятых в 2006 году [24]. Стратегия развития информационных технологий, принятые в Китайской Народной Республике, остаются актуальными и продолжают

Индия США КНР

_ _

0 10000

■СИА "ИАД

оказывать значительное влияние на научную активность в этой области до настоящего времени [25].

350

Год публикации

—•—ИАД —*-СИА

Рисунок 4. Линейный график публикационная активность в области ИАД и разработки СИА с 1989 по 2023 года в Российской Федерации В Российской Федерации наблюдается изменение динамики публикационной активности (Рисунок 4) после принятия стратегии развития в 2011 году. Стратегии инновационного развития Российской Федерации на период до 2020 года, а также решений, принятых Правительством и Президентом РФ [26] [27].

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования кандидат наук Антонов Евгений Вячеславович, 2025 год

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. Bornmann L., Haunschild R., Mutz R. Growth rates of modern science: a latent piecewise growth curve approach to model publication numbers from established and new literature databases // Humanit Soc Sci Commun. 2021. Vol. 8, № 1.

2. Chen M.S., Han J., Yu P.S. Data mining: An overview from a database perspective // IEEE Transactions on Knowledge and Data Engineering. 1996. Vol. 8, № 6.

3. Agrawal R., Imielinski T., Swami A. Mining Association Rules Between Sets of Items in Large Databases // ACM SIGMOD Record. 1993. Vol. 22, № 2.

4. Agrawal R., Srikant R. Fast Algorithms for Mining Association Rules // Proc. of 20th International Conference on Very Large Data Bases, {VLDB'94}. 1994.

5. Agrawal R., Swami A., Imielinski T. Database Mining: A Performance Perspective // IEEE Trans Knowl Data Eng. 1993. Vol. 5, № 6.

6. Holsheimer M., Arno PJM S. Data mining: The search for knowledge in databases. Centrum voor Wiskunde en Informatica, 1994.

7. Frawley W.J., Piatetsky-Shapiro G., Matheus C.J. Knowledge Discovery in Databases: An Overview // AI Mag. 1992. Vol. 13, № 3. P. 57-70.

8. Liu X. Intelligent data analysis: Issues and challenges // Knowledge Engineering Review. 1996. Vol. 11, № 4.

9. Simoudis E. Reality check for data mining // IEEE Expert. 1996. Vol. 11, № 5. P. 26-33.

10. Козлова С.А., Козлов А.Н. Применение интеллектуального анализа в управлении продажами и мерчандайзинге // Агротехнологии XXI века. 2015. P. 59-63.

11. Варганов И.А. Методология и принципы интеллектуального анализа данных // Державинские чтения. 2017. P. 388-394.

12. Москвитин А.А. Особенности современных методов интеллектуального анализа данных // Современная наука и инновации. 2017. Vol. 3, № 19. P. 59-66.

13. Нефедов С.Н., Пархименко В.А., Татур М.М. Применение методов интеллектуального анализа данных в криминалистике и судебной экспертизе // Вопросы криминологии, криминалистики и судебной экспертизы. 2017. Vol. 2, № 42. P. 59-68.

14. Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Litres, 2022.

15. Piatetsky-Shapiro G. Knowledge Discovery in Real Databases: A Report on the IJCAI-89 Workshop // AI Mag. 1990. Vol. 11, № 4.

16. Fayyad U., Piatetsky-Shapiro G., Smyth P. Knowledge Discovery and Data Mining: Towards a Unifying Framework // Proceedings - 2nd International Conference on Knowledge Discovery and Data Mining, KDD 1996. 1996.

17. Арланова А.А., Нобатов А.М. Интеллектуальный анализ данных: виды и методы // Вестник науки. 2023. Vol. 1, № 58. P. 7-10.

18. Дядичев В.В., Ромашка Е.В., Голуб Т.В. Задачи и методы интеллектуального анализа данных // Геополитика и экогеодинамика регионов. 2015. Vol. 1, № 3. P. 23-29.

19. Зеленков Ю.А., Анисичкина Е.А. Динамика исследований в области интеллектуального анализа данных: тематический анализ публикаций за 20 лет // Бизнес-информатика. 2021. Vol. 15, № 1. P. 30-46.

20. Дюк В.А., Флегонтов А.В., Фомина И.К. Применение технологий интеллектуального анализа данных в естественнонаучных, технических и гуманитарных областях // Известия Российского государственного педагогического университета им. АИ Герцена. 2011. Vol. 138. P. 77-84.

21. Замятин А.В. Интеллектуальный анализ данных: учебное пособие. Томск: Издательский Дом Томского государственного университета, 2020.

22. Kadyan R., Arora N., Chhabra P. An overview of data mining // Int J Sci Eng Res. 2012. Vol. 3, № 11. P. 1-7.

23. Gupta M.K., Chandra P. A comprehensive survey of data mining // International Journal of Information Technology (Singapore). 2020. Vol. 12, № 4.

ШШМШШ [Electronic resource] // https://www.gov.cn/jrzg/2006-

02/09/content_183787.htm. 2005.

25. Зарбуева А.И., Зарубина И.А., Шитикова Ю.А. Стратегия Китая в области искусственного интеллекта // Вопросы национальных и федеративных отношений. 2022. Vol. 12, №2 5. P. 1822-1837.

26. Министерство цифрового развития связи и массовых коммуникаций РФ. Стратегия развития отрасли информационных технологий в Российской Федерации на 2014 - 2020 годы и на перспективу до 2025 года [Electronic resource] // https://digital.gov.ru/ru/documents/4084/. 2013.

27. Правительство РФ. Ключевые решения: Отрасль информационных технологий [Electronic resource] // http://government.ru/rugovclassifier/665/main/.

28. da Costa J.F.P., Cabral M. Statistical Methods with Applications in Data Mining: A Review of the Most Recent Works // Mathematics. 2022. Vol. 10, № 6.

29. Jackson J. Data Mining; A Conceptual Overview // Communications of the Association for Information Systems. 2002. Vol. 8.

30. Zhang S., Wu X. Fundamentals of association rules in data mining and knowledge discovery // Wiley Interdiscip Rev Data Min Knowl Discov. 2011. Vol. 1, № 2.

31. Зайко Т.А., Олейник А.А., Субботин С.А. Ассоциативные правила в интеллектуальном анализе данных // Вестник Национального

технического университета Харьковский политехнический институт. Серия: Информатика и моделирование. 2013. Vol. 39. P. 82-96.

32. Smyth P. Data mining: Data analysis on a grand scale? // Statistical Methods in Medical Research. 2000. Vol. 9, № 4.

33. Черезов Д.С., Тюкачев Н.А. Обзор основных методов классификации и кластеризации данных // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. 2009. Vol. 2. P. 25-29.

34. Kontsewaya Y., Antonov E., Artamonov A. Evaluating the Effectiveness of Machine Learning Methods for Spam Detection // Procedia Comput Sci. 2021. Vol. 190. P. 479-486.

35. Тамбиева Д.А. Кластеризация данных в контексте «Data Mining» // Теоретические и экспериментальные исследования в науке. 2020. P. 253261.

36. Kaur S., Kaur K. Web Mining and Data Mining: A Comparative Approach // International Journal of Novel Research in Computer Science and Software Engineering. 2015. Vol. 2, № 1. P. 36-42.

37. Hamid Mughal M.J. Data mining: Web data mining techniques, tools and algorithms: An overview // International Journal of Advanced Computer Science and Applications. 2018. Vol. 9, № 6.

38. Keim D.A. Information visualization and visual data mining // IEEE Trans Vis Comput Graph. 2002. Vol. 8, № 1.

39. Figueiras A. Visualization overview: Using modern text mining techniques to provide insight into visualization research practice // Proceedings of the International Conference on Information Visualisation. 2022. Vol. 2022-July.

40. Янковская А.Е., Китлер С.В. Интеллектуальный анализ данных и знаний по стентированию коронарных артерий // Машинное обучение и анализ данных. 2013. Vol. 1, № 5. P. 580-589.

41. Благовещенский И.Г. et al. Интеллектуальный анализ данных для систем поддержки принятия решений диагностики процессов производства

пищевой продукции // Цифровизация агропромышленного комплекса. 2020. P. 105-109.

42. Khlamov S., Savanevych V. Big Astronomical Datasets and Discovery of New Celestial Bodies in the Solar System in Automated Mode by the CoLiTec Software // Knowledge Discovery in Big Data from Astronomy and Earth Observation: Astrogeoinformatics. 2020.

43. Khlamov S. et al. Astronomical Knowledge Discovery in Databases by the CoLiTec Software // Proceedings - International Conference on Advanced Computer Information Technologies, ACIT. 2022.

44. Khlamov S. et al. Data Mining of the Astronomical Images by the CoLiTec Software // CEUR Workshop Proceedings. 2022. Vol. 3171.

45. Hall M. et al. The WEKA data mining software: An update // ACM SIGKDD Explorations Newsletter. 2009. Vol. 11, № 1.

46. WEKA - The workbench for machine learning [Electronic resource] // https://waikato.github.io/weka-site/index.html.

47. Sunita B Aher, LOBO L.M.R.J. Data Mining in Educational System using WEKA // IJCA Proceedings on International Conference on .... 2011.

48. Othman M.F. Bin, Yau T.M.S. Comparison of different classification techniques using WEKA for breast cancer // IFMBE Proceedings. 2007. Vol. 15.

49. Ivanciuc O. Weka Machine Learning for Predicting the Phospholipidosis Inducing Potential // Curr Top Med Chem. 2008. Vol. 8, № 18.

50. Mierswa I. et al. YALE: Rapid prototyping for complex data mining tasks // Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2006. Vol. 2006.

51. Jungermann F. Information Extraction with RapidMiner // GSCL Symposium Sprachtechnologie und eHumanities 2009. 2009. Vol. 2009, № 09/28.

52. Турдаков Д.Ю. et al. TALISMAN: pat. 2018615539 USA. Россия, 2018.

53. Яковлев В.Б. Анализ данных в аналитической платформе Loginom. LAP LAMBERT, 2020.

54. Paklin N.B., Katsko I.A., Kremyanskaya E. V. Using Loginom Low-Code Platform for the Modeling of LTV Site Subscriber // Lecture Notes in Networks and Systems. 2022. Vol. 442 LNNS.

55. Inkina V.A. et al. Multiagent information technologies in system analysis // CEUR Workshop Proceedings. 2019. Vol. 2507.

56. Onwujekwe G., Osei-Bryson K.-M., Ngwum N. A Framework for Capturing and Analyzing Unstructured and Semi-Structured Data for a Knowledge Management System. 2020.

57. Zaman G. et al. Information extraction from semi and unstructured data sources: A systematic literature review // ICIC Express Letters. 2020. Vol. 14, № 6.

58. Mishra S., Misra A. Structured and Unstructured Big Data Analytics // International Conference on Current Trends in Computer, Electrical, Electronics and Communication, CTCEEC 2017. 2018.

59. Nagarajan S., Perumal K. Structured and Unstructured Information Extraction Using Text Mining and Natural Language Processing Techniques // International Journal on Recent and Innovation Trends in Computing and Communication. 2020. Vol. 5, № 11.

60. Reuss P. et al. Semi-automatic knowledge extraction from semi-structured and unstructured data within the OMAHA project // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2015. Vol. 9343.

61. Krutikhina T.A., Antonov E.V., Ionkina K.V. The fuzzy objects recognition in scientific and technical papers by means of natural languages processing technologies // Procedia Comput Sci. 2022. Vol. 213. P. 656-665.

62. Jha R. et al. NLP-driven citation analysis for scientometrics // Nat Lang Eng. 2017. Vol. 23, № 1.

63. Uematsu H., Nguyen P., Takeda H. Design for Data Structures: Data Unification and Federation with Wikibase // Proceedings - 2022 IEEE International Conference on Big Data, Big Data 2022. 2022.

64. Bhoi B. et al. Data duplication avoidance in larger database // Proceedings of 2017 International Conference on Innovations in Information, Embedded and Communication Systems, ICIIECS 2017. 2017. Vol. 2018-January.

65. Antonov E. et al. Agent data merging // Procedia Comput Sci. 2020. Vol. 169. P. 473-478.

66. Costa G. et al. Data de-duplication: A review // Studies in Computational Intelligence. 2011. Vol. 375.

67. Alqahtani T. et al. The emergent role of artificial intelligence, natural learning processing, and large language models in higher education and research // Research in Social and Administrative Pharmacy. 2023. Vol. 19, № 8.

68. Dagdelen J. et al. Structured information extraction from scientific text with large language models // Nat Commun. 2024. Vol. 15, № 1.

69. Polak M.P., Morgan D. Extracting accurate materials data from research papers with conversational language models and prompt engineering // Nat Commun. 2024. Vol. 15, № 1.

70. Gupta T. et al. MatSciBERT: A materials domain language model for text mining and information extraction // NPJ Comput Mater. 2022. Vol. 8, № 1.

71. E. Antonov et al. Processing of Scientific and Technical Information in Interdisciplinary Research by Methods of Mathematical and Linguistic Directed Search by the Example of the Study of Biomaterials for Tissue Engineering // International Journal of Open Information Technologies. 2022. Vol. 10, № 11. P. 134-140.

72. Clarivate. Clarivate to Cease all Commercial Activity in Russia [Electronic resource] // https://clarivate.com/news/clarivate-to-cease-all-commercial-activity-in-russia/. 2022.

73. Qi C. chong. Big data management in the mining industry // International Journal of Minerals, Metallurgy and Materials. 2020. Vol. 27, № 2.

74. Благинин А.Л., Сайфулин Э.Р., Саркисова А.Ю. Из опыта организации автоматизированного сбора данных в Томском университете // Большие данные и проблемы общества. 2022. P. 34-46.

75. Gheorghe M., Mihai F.-C., Dardala M. Modern techniques of web scraping for data scientists // Revista Romana de Interactiune Om-Calculator. 2018. Vol. 11, № 1.

76. Fan C. et al. A Review on Data Preprocessing Techniques Toward Efficient and Reliable Knowledge Discovery From Building Operational Data // Frontiers in Energy Research. 2021. Vol. 9.

77. Sakharov Y.S., Ivanov D.V., Yaskevich O.G. Intellectualization of management investment objects in conflict and uncertainty // Journal of Advanced Research in Dynamical and Control Systems. 2019. Vol. 11, № 5. P. 51-60.

78. Qin X. et al. Making data visualization more efficient and effective: a survey // VLDB Journal. 2020. Vol. 29, № 1.

79. Кононова О.В., Прокудин Д.Е. Технологии извлечения и интеллектуального анализа данных в научных исследованиях: учебное пособие. Университет ИТМО, 2021.

80. Глушановский А.В., Каленов Н.Е. Научные знания, библиотеки и интернет-взаимодействие на современном этапе // Научные и технические библиотеки. 2020. № 8. P. 97-114.

81. Ковязина Е.В. Электронный архив научных публикаций: этапы развития // Научные и технические библиотеки. 2014. Vol. 2. P. 19-26.

82. Lee S.J., Siau K. A review of data mining techniques // Industrial Management and Data Systems. 2001. Vol. 101, № 1.

83. Жучкова С.В., Ротмистров А.Н. Автоматическое извлечение текстовых и числовых веб-данных для целей социальных наук // Социология: методология, методы, математическое моделирование. 2020. Vol. 50, № 51. P. 141-183.

84. Wu X. et al. Top 10 algorithms in data mining // Knowl Inf Syst. 2008. Vol. 14, № 1.

85. ISO 32000-1:2008 Document management — Portable document format [Electronic resource] // https://www.iso.org/ru/standard/51502.html.

86. Foppiano L. et al. Automatic extraction of materials and properties from superconductors scientific literature // Science and Technology of Advanced Materials: Methods. 2023. Vol. 3, № 1.

87. Lopez P. et al. Mining Software Entities in Scientific Literature: Document-level NER for an Extremely Imbalance and Large-scale Task // International Conference on Information and Knowledge Management, Proceedings. 2021.

88. Cioffi A., Peroni S. Structured References from PDF Articles: Assessing the Tools for Bibliographic Reference Extraction and Parsing // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2022. Vol. 13541 LNCS.

89. GitHub. GROBID [Electronic resource] // https://github.com/kermitt2/grobid.

90. PyMuPDF Documentation. Module fitz [Electronic resource] // https://pymupdf.readthedocs.io/en/latest/module.html .

91. Chang C.H. et al. A survey of Web information extraction systems // IEEE Trans Knowl Data Eng. 2006. Vol. 18, № 10.

92. Onykiy B. et al. Information Analysis Support for Decision-Making in Scientific and Technological Development // International Journal of Technology. 2020. Vol. 11, № 6. P. 1125.

93. Gunawan R. et al. Comparison of Web Scraping Techniques: Regular Expression, HTML DOM and Xpath. 2019.

94. Krotov V., Johnson L., Silva L. Tutorial: Legality and ethics of web scraping // Communications of the Association for Information Systems. 2020. Vol. 47, № 1.

95. De Ryck P. et al. Protected web components: Hiding sensitive information in the shadows // IT Prof. 2015. Vol. 17, № 1.

96. Bale A.S. et al. Web Scraping Approaches and their Performance on Modern Websites // 3rd International Conference on Electronics and Sustainable Communication Systems, ICESC 2022 - Proceedings. 2022.

97. Chapagain Anish. Hands-on web scraping with Python perform advanced scraping operations using various Python libraries and tools such as Selenium, Regex, and others // Packt Publishing Ltda. 2019.

98. Gold Z., Latonero M. Robots Welcome? Ethical and Legal Considerations for Web Crawling and Scraping // Washington Journal of Law, Technology & Arts. 2018. Vol. 13, № 3.

99. Уголовный кодекс Российской Федерации" от 13.06.1996 N 63 -ФЗ (ред. от 06.04.2024) [Electronic resource] // https://www.consultant.ru/document/cons_doc_LAW_10699/4234a27af714c c608ea71b7bae9400f3613c8f60/.

100. Ali M. et al. User Profiling Through Browser Finger Printing. 2016.

101. Mwita K. Factors influencing data saturation in qualitative studies // International Journal of Research in Business and Social Science (2147- 4478). 2022. Vol. 11, № 4.

102. Eliaz N. Corrosion of metallic biomaterials: A review // Materials. 2019. Vol. 12, № 3.

103. Campos R. et al. A Text Feature Based Automatic Keyword Extraction Method for Single Documents. 2018. P. 684-691.

104. Campos R. et al. YAKE! Keyword extraction from single documents using multiple local features // Inf Sci (N Y). 2020. Vol. 509.

105. Altinok D. Mastering spaCy: An end-to-end practical guide to implementing NLP applications using the Python ecosystem. Packt Publishing Ltd, 2021.

106. Vargas-Munoz J.E. et al. OpenStreetMap: Challenges and Opportunities in Machine Learning and Remote Sensing // IEEE Geosci Remote Sens Mag. 2021. Vol. 9, № 1.

107. Novikov T., Subbotin D.A., Makhmutov A. Determining the Best Geolocation for Business // Proceedings of the 2021 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering, ElConRus 2021. 2021.

108. Isazawa T., Cole J.M. Single Model for Organic and Inorganic Chemical Named Entity Recognition in ChemDataExtractor // J Chem Inf Model. 2022. Vol. 62, № 5.

109. Tai R.H. et al. An Examination of the Use of Large Language Models to Aid Analysis of Textual Data // Int J Qual Methods. 2024. Vol. 23.

110. Son J., Kim B. Trend Analysis of Large Language Models through a Developer Community: A Focus on Stack Overflow // Information (Switzerland). 2023. Vol. 14, № 11.

111. IlyaGusev / saiga_mistral_7b_merged [Electronic resource] // https://huggingface.co/IlyaGusev/saiga_mistral_7b_merged.

112. Zylon by PrivateGPT. PrivateGPT [Electronic resource] // https://github.com/zylon-ai/private-gpt. 2023.

113. Martino A., Iannelli M., Truong C. Knowledge Injection to Counter Large Language Model (LLM) Hallucination // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2023. Vol. 13998 LNCS.

114. Stonebraker M. SQL databases v. NoSQL databases // Commun ACM. 2010. Vol. 53, № 4.

115. Jatana N. et al. A Survey and Comparison of Relational and Non-Relational Database // International Journal of Engineering Research & Technology. 2012. Vol. 1, № 6.

116. Bhat U., Jadhav S. Moving Towards Non-Relational Databases // Int J Comput Appl. 2010. Vol. 1, № 13.

117. Zamfir V.A. et al. Systems monitoring and big data analysis using the elasticsearch system // Proceedings - 2019 22nd International Conference on Control Systems and Computer Science, CSCS 2019. 2019.

118. A Comprehensive Study of Elastic Search // Journal of Research in Science and Engineering. 2022. Vol. 4, № 11.

119. Ulizko M.S. et al. Data Preparation for Advanced Data Analysis on Elastic Stack. 2024. P. 884-893.

120. Network File System (NFS) version 4 Protocol [Electronic resource] // https://www.rfc-editor.org/rfc/rfc3530.html. 2003.

121. ГОСТ 19.101-77 Виды программ и программных документов [Electronic resource] // https://protect.gost.ru/document.aspx?control=7&id=158686.

122. Булгаков С.В. et al. Функциональная модель информационного управления // Вестник Государственного университета просвещения. Серия: Экономика. 2010. Vol. 2. P. 57-60.

123. Рыбальченко М. Архитектура информационных систем. Учебное пособие для СПО. Litres, 2021.

124. Щекочихин О.В., Черкасова Н.В. Анализ шаблонов проектирования информационных систем клиент- серверной архитектуры // Информационно-экономические аспекты стандартизации и технического регулирования. 2019. Vol. 5, № 51. P. 26-29.

125. Пивоварчик О.В. Компонентная архитектура интеллектуальной системы консультационного обслуживания и обучения разработчиков программ // Открытые семантические технологии проектирования интеллектуальных систем. 2020. Vol. 5. P. 965-968.

126. Korenkov V. V. Trends and Prospects of the Development of Distributed Computing and Big Data Analytics for Support of Megascience Projects // Physics of Atomic Nuclei. 2020. Vol. 83, № 6.

127. Mitchell R. et al. Exploration of Workflow Management Systems Emerging Features from Users Perspectives // Proceedings - 2019 IEEE International Conference on Big Data, Big Data 2019. 2019.

128. Antonov E.V. et al. Trend Visualization of Academic Field: Proposed Method and Big Data Review // Scientific Visualization. 2022. Vol. 14, № 2.

124

ПРИЛОЖЕНИЕ 1

Пример структурированных данных научной публикации "Corrosion of Metallic Biomaterials: A Review"

"title": "Corrosion of Metallic Biomaterials: A Review", "published": {

"journal": "Materials", "publisher": "MDPI AG", "volume": "12", "issue": "3", "pub place": null, "page": {

"start": null, "end": null

},

"eISSN": "1996-1944", "ISSN": null, "year": 2019, "month": 1, "day": 28,

"doi": "10.33 9 0/ma12030407",

"submission info": "Received: 17 December 2018; Accepted: 26 January

2019;" },

"authors": [ {

"name": "Noam Eliaz", "email": "neliaz@tau.ac.il", "ids": {

"ORCID": "000 0-00 02-1184-4706"

},

"aff_keys": [ 1

]

}

],

"affiliations": [ {

"key": 1,

"src": "Department of Materials Science and Engineering, Tel-Aviv University, Ramat Aviv 6997801, Israel;", "name": "Tel-Aviv University",

"department": "Department of Materials Science and Engineering", "address": {

"post_code": "6997801", "settlement": null, "region": null, "country": "Israel"

},

"location": {

"lat": 32.1037064, "long": 34.8046101

}

}

],

"countries": ["Israel"], "countries_code": ["IL"], "abstract": [

"Metallic biomaterials are used in medical devices in humans more than any other family of materials.",

"The corrosion resistance of an implant material affects its functionality and durability and is a prime factor governing biocompatibility.",

"The fundamental paradigm of metallic biomaterials, except biodegradable metals, has been \"the more corrosion resistant, the more biocompatible.\"",

"The body environment is harsh and raises several challenges with respect to corrosion control.",

"In this invited review paper, the body environment is analysed in detail and the possible effects of the corrosion of different biomaterials on biocompatibility are discussed.",

"Then, the kinetics of corrosion, passivity, its breakdown and regeneration in vivo are conferred.",

"Next, the mostly used metallic biomaterials and their corrosion performance are reviewed.",

"These biomaterials include stainless steels, cobalt-chromium alloys, titanium and its alloys, Nitinol shape memory alloy, dental amalgams, gold, metallic glasses and biodegradable metals.",

"Then, the principles of implant failure, retrieval and failure analysis are highlighted, followed by description of the most common corrosion processes in vivo.",

"Finally, approaches to control the corrosion of metallic biomaterials are highlighted." ],

"keywords": [

"biomaterials", "biocompatibility", "corrosion", "failure", "titanium alloys", "stainless steels", "shape memory alloys", "biodegradable metals", "metallic glasses", "body environment"

],

"full_text": { "plain": [

"title": "Introduction",

"content": [ [

"Biomaterials are commonly defined as nonviable materials intended to interface with biological systems to evaluate, treat, augment or replace any tissue, organ or function of the body [1].",...

"It should be noted that the FDA does not regulate the materials used in medical devices but rather the devices themselves."

], ...

}, ...

{

"title": "Conclusions",

"content": [ [

"Metallic biomaterials represent the class of materials with the largest use in medical devices in humans today.",

"Metals and alloys have a large range of biomedical applications, including devices for fracture fixation, partial and total joint replacement, external splints, craniofacial plates and screws, braces and traction apparatus, dental amalgams, cardiovascular surgery and so forth.",

"The most common metallic biomaterials are reviewed in this article, with focus on their corrosion performance in vitro and in vivo.",

"These biomaterials include stainless steels, cobalt-chromium alloys, titanium and its alloys, Nitinol shape memory alloy, dental amalgams, gold, metallic glasses and biodegradable metals.",

"The importance of passivity, its breakdown and regeneration is highlighted.",

"Corrosion is an important factor in the design and selection of metals and alloys for service in vivo.",

"The corrosion resistance of an implant material affects its functionality and durability and is a primary factor governing biocompatibility.",

"Ion toxicity levels, possibly leading to hypersensitivity and caner, may be attained even at corrosion rates that are insignificant with respect to the physical performance of the implant.",

"From the perspective of corrosion, the most important characteristics of body fluids are the chloride, dissolved oxygen and pH levels.",

"Different parts of the body have different pH values and oxygen concentrations.",

"Consequently, a metal which performs well in one part of the body may suffer an unacceptable amount of corrosion in another part.",

"Biological macromolecules can influence the rate of corrosion by interfering in different ways with the anodic or cathodic reactions.",

"When combined with mechanics (static loading, dynamic loading or wear), restricted crevice-like geometries, inflammation or any combination thereof, corrosion is intensified.",

"Failures of implants are usually classified as either mechanical, electrochemical, biological or combinations of these.",

"The corrosion behaviour of a metal in non-physiological in vitro studies versus physiological in vitro studies versus in vivo studies may vary dramatically.",

"The forms of corrosion most typical of implants and other medical devices include localized (both pitting and crevice), intergranular, dealloying and galvanic corrosion, as well as stress corrosion cracking, corrosion fatigue and fretting corrosion.",

"Most practices commonly used in industry to mitigate corrosion are not applicable in the body environment.",

"Therefore, corrosion control in vivo is currently limited to careful design, proper material selection and surface modification.",

"The effectiveness of coatings may be limited in

vivo due to wear.",

"Advanced 3D-printed metal implants raise special

concerns regarding their corrosion resistance."

]

]

}

],

"keywords": ["corrosion resistance", "fretting corrosion", "stainless steel", "pitting corrosion", "crevice corrosion", "corrosion potential", "corrosion rate", "corrosion behaviour", "metals", "surface oxide"],

"measurement_units": [{"Symbol": "Hz", "Value": ["7"], "SI_converted": "7.0, sA-1"}, {"Symbol": "mg", "Value": ["1"], "SI_converted": "1e-06, kg"}, {"Symbol": "mg", "Value": ["447"], "SI_converted": "0.00044699999999999997, kg"}, ..., {"Symbol": "V", "Value": [0.4, 3.0], "SI_converted": "0.4-3.0, kg*mA2*sA-3*AA-1"}],

"images": [

{

"height": "426", "width": "368", "name": "Figure 1.", "number": "1",

"caption": "Application of metallic biomaterials as implants in different areas of the human body [39]. Reproduced with permission from Bentham Science Publishers.",

"src": "Fig 1_YB29jRJZ.jpeg"

},

{

"height": "246", "width": "328", "name": "Figure 2.", "number": "2",

"caption": "Two possible toxicity routes for metal ions released into body \ufb02uids due to corrosion and wear [42]. Reprinted with permission from Springer Nature.",

"src": "Fig 2_lze5ZBcV.png"

},...,

{

"height": "184", "width": "220", "name": "Figure 35.", "number": "35",

"caption": "A miniature glaucoma implant (Ex-PRESS\u2122, Optonol Ltd.) made of 316LVM steel. (a) A close-up after mechanical grinding, and (b) A device after novel electropolishing [369]. Reprinted with permission of John Wiley and Sons.",

"src": "Fig 35_QOc6q8ku.jpeg"

}

],

"tables": [ {

"name": "Table 1", "number": "1",

"caption": "Compositions of various body fluids [55].", "src": "Table 1 g3Rj5FOy.html"

},

{

"name": "Table 2", "number": "2",

"caption": "Compositions of various simulated body fluids

(SBFs) [55].",

"src": "Table 2 4Geml2rp.html"

},...,

{

"name": "Table 7", "number": "7",

"caption": "Mechanical properties of selected

biomaterials.",

"src": "/opt/airflow/pdf_files/materials-12-0 04 07-

v2/tables/Table 7 L4J7WOTk.html" }

]

},

"acknowledgement": null,

"funding": "Funding: This work received no external funding., The author declares no conflict of interest.",

"references": [ {

"src": "Williams, D.F.; Black, J.; Doherty, P.J. Consensus report of second conference on definitions in biomaterials. In Biomaterial-Tissue Interfaces; Doherty, P.J., Williams, R.L., Williams, D.F., Lee, A.J.C., Eds.; Elsevier: Amsterdam, The Netherlands, 1992; Volume 10, pp. 525-533.",

"title": "Consensus report of second conference on definitions in biomaterials",

"year": 1992, "journal": null,

"ISSN": null, "ISSNe": null

}, ...,

{

"src": "Atkinson, J.R.; Jobbins, B. Properties of engineering materials for use in body. In Introduction to Biomechanics of Joint and Joint Replacement; Dowson, D., Wright, V., Eds.; Wiley: Hoboken, NJ, USA, 1981; pp. 141-145.",

"title": "Properties of engineering materials for use in body",

"year": 1981,

"journal": null,

"ISSN": null,

"ISSNe": null

}

]

}

ПРИЛОЖЕНИЕ 2

Акты внедрения результатов диссертационной работы на соискание ученой степени кандидата технических наук

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ

ФЕДЕРАЦИИ

Федеральное государственное автономное образовательное учреждение высшего образования Национальный исследовательский ядерный университет «МИФИ»

(НИНУ МИФИ)

внедрения в НИЯУ МИФИ результатов диссертационной работы Антонова Евгения Вячеславовича на соискание ученой степени кандидата технических наук по теме «Компонентная архитектура программного комплекса интеллекту ального анализа научно-технической информации» по специальности 2.3Л.

Настоящий акт подтверждает. что результаты диссертационной работы Антонова F,.B. на тему «Компонентная архитектура программного комплекса интеллектуального анализа научно-технической информации» использованы для информационно-аналитической поддержки кафедры «Физические проблемы материаловедении « ,4j9 НИЯУ МИФИ. Комиссия в составе:

И.И. Чернов, д.ф.-м.н„ проф.. каф. «Физические проблемы материаловедения» íVj9; А.Н. Сучков, к.т.н.. доц. каф. «Физические проблемы материаловедения» №9: М.С. Сталыюв. к.ф.-м.н.. доц.. каф. «Физические проблемы материаловедения» №9: рассмотрела материалы диссертационной работы Антонова Е.В.. представленной на соискание ученой степени кштдидата технических наук и отмечает, что в результате совместной работы кафедры №9 «Фитичсскис проблемы материаловедения» с кафедрой №65 «Анализ конкурентных систем» лично Антонов F.B. внес определяющий вклад п создание следующих интеллекту альных проду ктов:

1. Управляющая база данных по свойствам и структу рам облученных реакторных

АКТ

материалов из мировых источников информации. Свидетельство о государственной регистрации базы данных 2022620590. март 09, 2022.

2. Методика сбора и выборки данных, а также автоматизированного извлечения изображений и таблиц и их харшаериезик язя проведения зкепертиой оценки надежности по тематике облученных реакторных материалов.

3. В спроектированном и разработанном программном комплексе используются разработанные н опубликованные автором методы сбора, обработки и визуализации данных, а также специализированные алгоритмы насыщения данных научно-технической информации, которые позволили сократить время поиска релевантных данных при жеперзной оценке в рамках разработки базы данных облученных реакторных материалов.

Заключение комиссии:

Перечисленные выше результаты диссертационной работы Антонова Е.В. по теме «Компонентная архитекту ра программного комплекса интеллектуального анализа научно-технической информации», выполненной по специальности «Системный анализ, управление и обработка информации, статистика» иод научным рукоиолсиюм к.т.н.. доц.. зав каф. «Анализ конкурентных систем» Хг 65 A.A. Артамоновым, вошли в проекты по (1) договору № 223 8724-Д от 22 ноября 2021 г. с АО НИИГРАФИТ об оказании информационно-консультационных услуг для подготовки информалии, разработке критериев н проведению экспертной оценки надежности данных для базы данных по свойствам материалов Госкорпорацин «Росаггом» и (2) договору № 1707от 29авгу ста 2022 г. с ФГУ11 ИНИНА по выполнению НИР «Разработка программы выборки данных по свойствам и структурам облученных реакторных материалов из мировых источников информации» и свидетельствует о высокой практической значимости диссертационной работы.

Члены комиссии:

Доцент кафедры № 9. к.т.н.

Доцент кафедры №9. к.ф.-м.н.

Профессор кафедры №9, д.ф.-м.н.

М.С. Стальное

H.H. Чернов

А. Н. Сучков

Общество с ограниченной о т ве т с г вен ноет ью «СИСТЕМЫ ИНФОРМАЦИОННОЙ АНАЛИТИКИ

УТВЕРЖДАЮ». tlbHblfi директор иШиколасв B.C.

[ МФОРМДП^ОЙ^У 202Уг м_аналитики

АКТ

внедрения в СНА результатов диссертационной работы Антонова Е В. на соискание ученой степени кандидат технических нц> к по теме «Компонентная архитектура программного комплекса интеллектуального анализа нау чно-технической информации» по специальности 2.3.1.

Настоящий акт подтверждает, что результаты диссертации работы Антонова Е.В. на тему «Компонента» архитектура про1ра.ммного комплекса интеллектуального анализа нау чно-технической информации» использованы в деятельное™ по разработке системы Общества с ограниченной ответственностью «Системы информационной аналитики»

Комиссии и составе:

B.C. Николаев - председатель комиссии, генеральный директор:

М.С. Улизко - член комиссии, разработчик программного обеспечения:

Д.Н. Кателевский - член комиссии, системный аналитик

рассмотрела результаты использования спроектированной компонентной архитектуры программного комплекса интеллектуального анализа научно-технической информации в ходе разработки системы СИА Агташе по договору с Фондом содействия инновациям У? 349ГС1ЦТС10-05/80243 от 12.12.2022. а также в ходе использования разработанного программного комплекса для выполнения информационно-аналитических работ.

Спроектированная и внедренная архитекту ра позволила разработать программный комплекс интеллектуального анализа нау чно-технической информации, обеспечивающей горизонтальную масштабируемость системы для сбора, обработки и хранения разнотиповых входящих данных.

(СИЛ).

Внедрение результатов диссертационной работы в практическу ю деятельность СИЛ позволила:

• решить проблему распределенного хранения н обработки больших объемов данных различных форматов:

• автоматизировать рабочий процесс по сбору и обработке данных научно-технической направленности;

• снизить время выполнения работ по сбору, обработке и анализа данных сократив календарные сроки выполнения работ до 60% за счет автомат ищи и выполнения ттих процессов и предложенным в работе алгоритмам насыщения ланиых.

Новым качеством разработанной системы интеллектуального анализа данных является возможность распределенного автоматизированного сбора информации по заданным ключевым словам в различных источниках Глобальной сети интернет, а также возможность оперативного масштабирования этого списка источников н внедрения в рабочий процесс Также специализированные методы насыщения данных научно-технической информации, помогающие улу чшить качество анализа данных и выполнения аналитических работ.

С использованием спроектированной компонентной архитектуры программного комплекса интеллектуального анализа научно-технической информации выполнен ряд заказных работ в том числе по договорам № 2024-51а-<1{>к-1 от 15.04.2024 и № 2024-*|ач1£к-2 от 15.05.2024.

Председатель комиссии: Генеральный директор Члены комиссии:

Разработчик программного обеспечения Системный аналитик

В.С. Николаев

М.С. Улизко

С1

Д.Н. Катслевский

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.