Модели и методы построения многоязычного облака лингвистических открытых связанных данных тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат наук Кириллович Александр Витальевич

  • Кириллович Александр Витальевич
  • кандидат науккандидат наук
  • 2019, ФГАОУ ВО «Казанский (Приволжский) федеральный университет»
  • Специальность ВАК РФ05.13.11
  • Количество страниц 150
Кириллович Александр Витальевич. Модели и методы построения многоязычного облака лингвистических открытых связанных данных: дис. кандидат наук: 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей. ФГАОУ ВО «Казанский (Приволжский) федеральный университет». 2019. 150 с.

Оглавление диссертации кандидат наук Кириллович Александр Витальевич

Введение

Глава 1. Многоуровневый набор Лингвистических открытых связанных данных RuThes Cloud

1.1. Обзор онтологических моделей

1.2. Обзор лингвистических ресурсов из облака LLOD

1.3. Описание ресурса RuThes Cloud

1.4. Пример использования в задаче расширения поискового запроса

1.5. Заключение к главе

Глава 2. Онтологический анализ системы категорий Википедии

2.1. Связанные работы

2.2. Анализ причин нарушения транзитивности

2.3. Подход к устранению нарушений транзитивности

2.4. Заключение к главе

Глава 3. Онтология профессиональной математики OntoMathPro и ее приложения

3.1. Онтология OntoMathPro

3.2. Экосистема OntoMath

3.3. Платформа семантической публикации

3.4. Сервис семантического поиска по математическим формулам

3.5. Заключение к главе

Список литературы

Приложение. Свидетельства о регистрации базы данных и программ для ЭВМ

Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Введение диссертации (часть автореферата) на тему «Модели и методы построения многоязычного облака лингвистических открытых связанных данных»

Введение

Актуальность темы. Представление лингвистических ресурсов на основе открытых международных стандартов в облаке Лингвистических открытых связанных данных (Linguistic Linked Open Data, LLOD) [Chiarcos, et al, 2013; McCrae, et al., 2016] является научным мейнстримом для компьютерной лингвистики и представления знаний.

Данный подход имеет следующие преимущества:

1. Решение проблемы несовместимости моделей и интероперабельности.

2. Совместное использование нескольких лингвистических ресурсов для решения общей задачи. Так, например, задача нахождения всех упоминаний населенных пунктов требует задействования, с одной стороны, тезауруса для составления списка населенных пунктов, а с другой стороны корпуса для извлечения их упоминаний. Наличие связей между корпусом и тезаурусом позволяет решить эту задачу за один запрос.

3. Совместное использование лингвистических ресурсов вместе с нелингвистическими ресурсами из облака Открытых связанных данных (LOD). Примерами такого совместного использования могут быть: (а) Извлечение информации из текста на основе онтологий. (б) Семантическая разметка и семантический поиск документов, опубликованных в облаке LOD. (в) Генерация запросов к базе знаний на основе вопроса, заданного на естественном языке. (г) Вербализация фактов из баз знаний и онтологий в виде текста на естественном языке.

4. Поддержка мощной инфраструктуры Semantic Web, включающей хранилища триплетов, системы логического вывода, онтологии и т.д.

Для публикации лингвистических ресурсов используются стандарты, разработанные международными организациями: Международной организации по стандартизации (ISO), Консорциумом всемирной паутины (W3C) и Фондом открытого знания (Open Knowledge Foundation).

Лингвистические ресурсы для большинства крупных языков уже интегрированы в облако LLOD. Примерами таких ресурсов является тезаурус WordNet, английская и немецкая версии Викисловаря, FrameNet, VerbNet, англоязычный корпус BROWN, а также некоторые тезаурусы для узкоспециализированных областей (EuroVoc, AgroVoc, TheSoz, Library of Congress Subject Headings). Однако лингвистические ресурсы для русского языка и языков народов России в облаке LLOD практически не представлены.

В связи с этим задача интеграции данных ресурсов в облако LLOD является актуальной.

Целью диссертации является разработка моделей и методов построения интегрированного фрагмента глобального облака Лингвистических открытых связанных данных (Linguistic Linked Open Data) для русского и татарского языков, полностью удовлетворяющего стандартом Открытых связанных данных (LOD), с последующим его использованием в приложениях компьютерной лингвистики.

Данный фрагмент должен удовлетворять следующим требованиям:

(R1) покрывать основные языковые уровни: семантический, лексический, синтаксический и морфологический;

(R2) содержать языковые единицы, представляющие как (R2.1) общие понятия, так и (R2.2) именованные сущности;

(R3) содержать языковые единицы, относящиеся как к (R3.1) общей, так и к (R3.2) специальной тематике.

Основные задачи диссертации:

1. Интеграция в облако LLOD существующих лингвистических ресурсов для русского и татарского языков.

2. Онтологический анализ системы категорий Википедии и разработка на его основе методов полуавтоматического извлечения иерархии топи-ков из этой системы.

3. Разработка лингвистического ресурса по узкой тематике (математика) и его приложений.

Основные положения, выносимые на защиту:

1. Многоуровневые модели (семантика, морфология, синтаксис, лексика) для построения облака Лингвистических открытых связанных данных для русского и татарского языков.

2. RuThes Cloud - многоязычный многоуровневый ресурс лингвистических открытых связанных данных для русского и татарского языков, построенный на базе разработанных моделей.

3. Формализация отношения онтологической зависимости. Построение формальной модели системы категорий Википедии. Онтологический анализ системы категорий Википедии.

4. Метод полу-автоматического извлечения из системы категорий Википедии иерархии топиков, сохраняющей свойство транзитивности.

5. Модули цифровой экосистемы OntoMath, в том числе: структура онтологии профессиональной математики OntoMathPro, компоненты платформы семантической публикации коллекции математических документов, сервис семантического поиска по математическим формулам.

Научная новизна работы состоит в том, что: 1) впервые на базе единой модели многоуровневые лингвистические ресурсы для русского и татарского языков были интегрированы в облако LLOD; 2) впервые был осуществлен анализ системы категорий Википедии на базе методологий онтологического моделирования, на основе которого были выявлены и систематизированы причины нарушений транзитивности, и предложен полу-автоматический подход к их устранению; 3) создан ряд компонентов цифровой экосистемы OntoMath, поз-

воляющей извлекать структурированную информацию из математических публикаций, с последующей интеграцией в облаке LOD.

Теоретическая ценность результатов работы. (1) Выявлены причины нарушения транзитивности в системе категорий Википедии, которые препятствуют использованию данной системы для автоматического извлечения релевантных статей. (2) Развит подход К. Файна к определению отношения онтологической зависимости.

Практическая ценность. (1) Интегрированные в облако LLOD лингвистические ресурсы могут быть использованы для решения задач компьютерной лингвистики для русского и татарского языков. (2) Разработанные многоуровневые модели могут быть применены к другим родственным языкам для их интеграции в облако LLOD. (3) Онтологический анализ системы категорий Википедии может быть использован для полуавтоматической верификации и корректировки других крупных систем категорий, таких как каталоги интернет-магазинов. (4) Экосистема OntoMath является шагом на пути к построению Всемирной цифровой математической библиотеки (WDML), разрабатываемой под эгидой Всемирного математического союза.

Достоверность определяется тем, что (1) Разработанные модели и методы основаны на принятых международных стандартах; (2) Произведено тестирование созданных программных модулей; (3) Статьи по теме диссертации опубликованы в трудах ведущих рецензируемых конференций и журналах.

Апробация результатов диссертационного исследования

Результаты выполненной работы были представлены на следующих конференциях:

Основные:

1. 12th International Semantic Web Conference (ISWC 2013). Sydney, Australia, 21-25 October 2013

2. 5th International Conference on Knowledge Engineering and Semantic Web (KESW 2014). Kazan, Russia, 29.09.2014 - 01.10.2014

3. Semantic Representation of Mathematical Knowledge Workshop. Toronto, Canada, Fields Institute, 03-02 February 2016

4. XVIII Международная конференция «Аналитика и управление данными в областях с интенсивным использованием данных» (DAMDID

2016). Москва, 11.10.2016 - 14.10.2016

5. International Academic Workshop «Information Technology and Computational Linguistics» (ITCL-2017). St. Petersburg, Russia, 22-23 June 2017

6. 2nd Russian-Pacific Conference on Computer Technology and Applications (RPC 2017). Vladivostok, Russia, 25.09.2017 - 29.09.2017

7. XIX Международная конференция «Аналитика и управление данными в областях с интенсивным использованием данных» (DAMDID/RCDL

2017). Москва, 10-13 октября 2017

8. 8th International Conference on Knowledge Engineering and Semantic Web (KESW 2017). Szczecin, Poland, 08-10 November 2017

9. XX International Conference on Data Analytics and Management in Data Intensive Domains (DAMDID/RCDL 2018). Moscow, Russia, 09-12 October 2018

10.10th International Conference on Knowledge Engineering and Ontology Development (KEOD 2018). Seville, Spain, 18-20 September 2018

Прочие:

11. Открытые семантические технологии проектирования интеллектуальных систем «0STIS-2013». Минск, 21-23 февраля 2013

12.XIII Всероссийская конференция с международным участием по компьютерной и когнитивной лингвистике TEL'2014. Казань, 06-09 февраля 2014

13.XVII Международная конференции «Аналитика и управление данными в областях с интенсивным использованием данных» (DAMDID/RCDL'2015). Обнинск, 13-16 октября 2015

14.14-я национальная конференция по искусственному интеллекту КИИ-2014. Казань, 24-27 октября 2014

15.Международная научно-практическая конференция «Информационные технологии в образовании и науке» (ИТОН - 2014). Казань, 10-13 декабря 2014

16.VII Международная научно-практическая конференция «Электронная Казань 2015». Казань, 21-23 апреля 2015

17.XVII Всероссийская научная конференция «Научный сервис в сети Интернет». Новороссийск, 21-26 сентября 2015 года

18.XIV Международная конференция по компьютерной и когнитивной лингвистике TEL 2016. Казань, 21-24 апреля 2016

19.IX Международная научно-практической конференция «Электронная Казань 2017». Казань, 25-26 апреля 2017

20. Международная научная конференция «Десятые Смирновские чтения по логике». Москва, 15-17 июня 2017

21.Юбилейная X Международная научно-практическая конференция «Электронная Казань». Казань, 24-25 апреля 2018

22. ХХ Всероссийская научная конференция «Научный сервис в сети интернет». Новороссийск, 17-22 сентября 2018

23.16-я Национальная конференция по искусственному интеллекту с международным участием КИИ-2018. Москва, 24.09.2018 - 27.10.2018

24.XV Международная конференция по компьютерной и когнитивной лингвистике TEL'2018. Казань, 31 октября - 3 ноября 2018

25.13th annual International Technology, Education and Development Conference (INTED 2019). 11-13 March 2019, Valencia, Spain

26.Международная конференция «uAnalytiCon-2019: Тождество, индивидные понятия и семантическое единообразие». Екатеринбург, 18-19 мая 2019.

Публикации. Основные результаты по теме диссертации изложены в 41 печатной работе, 6 из которых — в журналах, рекомендованных ВАК и 18 работ — в изданиях, индексируемых в базах Scopus и/или WoS.

Статьи в журналах и сборниках, входящих в базы Scopus и WoS:

1. Olga Nevzorova, Nikita Zhiltsov, Danila Zaikin, Olga Zhibrik, Alexander Kirillovich, Vladimir Nevzorov, Evgeniy Birialtsev. Bringing Math to LOD: A Semantic Publishing Platform Prototype for Scientific Collections in Mathematics // Harith Alani, et al. (eds.) Proceedings of the 12th International Semantic Web Conference (ISWC 2013). Lecture Notes in Computer Science, vol. 8218. Springer Berlin Heidelberg, 2013. Pp. 379-394

2. Olga Nevzorova, Nikita Zhiltsov, Alexander Kirillovich, Evgeny Li-pachev. OntoMathPRO Ontology: A Linked Data Hub for Mathematics // Pavel Klinov, Dmitry Mouromstev (eds.) Proceedings of the 5th International Conference on Knowledge Engineering and Semantic Web (KESW 2014). Communications in Computer and Information Science, vol. 468. Springer, Cham, 2014. Pp. 105-119

3. Alexander M. Elizarov, Alexander V. Kirillovich, Evgeny K. Lipachev, Olga A. Nevzorova, Valery D. Solovyev, Nikita G. Zhiltsov. Mathematical knowledge representation: semantic models and formalisms // Lobachevskii Journal of Mathematics, Vol. 35, No. 4, October 2014. Pleiades Publishing, 2014. Pp. 348354

4. A.M. Elizarov, A.V. Kirillovich, E.K. Lipachev, A.B. Zhizhchenko, N.G. Zhil'tsovc. Mathematical Knowledge Ontologies and Recommender Systems for Collections of Documents in Physics and Mathematics // Doklady Mathematics, vol. 93, No. 2, 2016. Pp. 1-3

5. Elizarov, A. Kirilovich, E. Lipachev, O. Nevzorova. Mathematical Knowledge Management: Ontological Models and Digital Technology // CEUR Workshop Proceedings, Vol. 1752, 2016. Pp. 44-50

6. Alexander Elizarov, Alexander Kirillovich, Evgeny Lipachev, Olga Nevzorova. Digital Ecosystem OntoMath: Mathematical Knowledge Analytics and

Management // Kalinichenko L., Kuznetsov S., Manolopoulos Y. (eds). XVIII International Conference on Data Analytics and Management in Data Intensive Domains (DAMDID/RCDL 2016). Communications in Computer and Information Science, vol. 706. Springer, Cham, 2017. Pp. 33-46

7. Alexander Kirillovich, Olga Nevzorova, Emil Gimadiev, Natalia Louka-chevitch. RuThes Cloud: Towards a Multilevel Linguistic Linked Open Data Resource for Russian // Przemyslaw Rozewski, Christoph Lange (eds.) Proceedings of the 8th International Conference on Knowledge Engineering and Semantic Web (KESW 2017). Communications in Computer and Information Science, vol 786. Springer, 2017. Pp. 38-52

8. Alfiya Galieva, Alexander Kirillovich, Bulat Khakimov, Natalia Louka-chevitch, Olga Nevzorova, Dzhavdet Suleymanov. Toward Domain-Specific Russian-Tatar Thesaurus Construction // Proceedings of the International Conference IMS-2017. ACM, 2017

9. Alexander Elizarov, Alexander Kirillovich, Evenvgeny Lipachev, Olga Nevzorova. Semantic Formula Search in Digital Mathematical Libraries // Proceedings of the 2nd Russia and Pacific Conference on Computer Technology and Applications (RPC 2017). IEEE, 2017. Pp. 39-43

10. Olga Nevzorova, Vladimir Nevzorov, Alexander Kirillovich. A Syntactic Method of Extracting Terms from Special Texts for Replenishing Domain Ontologies // Proceedings of the 2nd Russia and Pacific Conference on Computer Technology and Applications (RPC 2017). IEEE, 2017. Pp. 127-131

11. Alexander Kirillovich, Olga Nevzorova. Problem of Transitivity of Wik-ipedia Category System // Leonid Kalinichenko, et al. (eds). Selected Papers of the XIX International Conference on Data Analytics and Management in Data Intensive Domains (DAMDID/RCDL 2017). CEUR Workshop Proceedings, vol. 2022. CEUR-WS.org, 2017. Pp. 57-63

12. Alexander Kirillovich and Olga Nevzorova. Ontological Analysis of the Wikipedia Category System // David Aveiro, Jan Dietz, Joaquim Filipe (eds). Pro-

ceedings of the 10th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management (IC3K 201S). Seville, Spain, 1S-20 September, 201S. Volume 2: KEOD. SCITEPRESS, 201S. Pp. 35S-366

13. Olga Nevzorova, Alexander Kirillovich, Vladimir Nevzorov, Konstantin Nikolaev. The Semantic Context Models of Mathematical Formulas in Scientific Papers // Leonid Kalinichenko, et al. (eds). Selected Papers of the XX International Conference on Data Analytics and Management in Data Intensive Domains (DAMDID/RCDL 201S). CEUR Workshop Proceedings, vol. 2277. CEUR-WS.org, 201S. Pp. 33-40

14. A.M. Elizarov, A.V. Kirillovich, E.K. Lipachev, O.A. Nevzorova, L.R. Shakirova. Open linked data and ontologies in mathematics education (Открытые связанные данные и онтологии в математическом образовании) // V. Voevodin, et al (eds). Proceedings of the 20th Conference Scientific Services & Internet (SSI-201S). CEUR Workshop Proceedings, vol. 2260. CEUR-WS, 201S. Pp. 1S6-196

15. Alexander Kirillovich, Liliana Shakirova, Marina Falileeva, Eugeny Li-pachev. Towards an Educational Mathematical Ontology // L. Gómez Chova, et al. (eds). Proceedings of the 13 th International Technology, Education and Development Conference (INTED2019), Valencia, Spain, March 11th-13th, 2019. IATED, 2019. Pp. 6S23-6S29

16. Liliana Shakirova, Marina Falileeva, Alexander Kirillovich, Eugeny Li-pachev. Problems and Solutions in the Design of Formal Taxonomy of Concepts of Geometry // L. Gómez Chova, et al. (eds). Proceedings of the 13th International Technology, Education and Development Conference (INTED2019), Valencia, Spain, March 11th-13th, 2019. IATED, 2019. Pp. 6793-6S01

17. Alfiya Galieva, Alexander Kirillovich, Natalia Loukachevich, Olga Nev-zorova. Towards a Tatar Wordnet: a Methodology of Using Tatar Thesaurus // Selected Papers of the XXI International Conference on Data Analytics and Management in Data Intensive Domains (DAMDID/RCDL 2019). CEUR Workshop Proceedings (принята)

18. Alexander Kirillovich, Olga Nevzorova, Marina Falileeva, Eugeny Li-pachev, Liliana Shakirova. OntoMathEdu: Towards an Educational Mathematical Ontology // Workshop Papers at 12th Conference on Intelligent Computer Mathematics (CICM-WS 2019), Prague, Czech Republic, 8-12 July 2019. CEUR Workshop Proceedings (принята)

Статьи в изданиях, рекомендованных ВАК РФ:

19. О. А. Невзорова, Н. Г. Жильцов, Д. А. Заикин, О. Н. Жибрик, А. В. Кириллович, В. Н. Невзоров, Е. В. Биряльцев. Прототип программной платформы для публикации семантических данных из математических научных коллекций в облаке LOD // Учёные записки Казанского государственного университета. Серия Физико-математические науки, 154, № 3, Изд-во Казанского ун-та, Казань, 2012, С. 216-232

20. Alexander M. Elizarov, Alexander V. Kirillovich, Evgeny K. Lipachev, Olga A. Nevzorova, Valery D. Solovyev, Nikita G. Zhiltsov. Mathematical knowledge representation: semantic models and formalisms // Lobachevskii Journal of Mathematics, Vol. 35, No. 4, October 2014. Pleiades Publishing, 2014. Pp. 348354

21. А. М. Елизаров, А.Б. Жижченко, Н. Г. Жильцов, А. В. Кириллович, Е. К. Липачёв. Онтологии математического знания и рекомендательная система для коллекций физико-математических документов // Доклады РАН. - 2016. - Т. 467. - № 4. - С. 392-395

22. А.М. Галиева, А.В. Кириллович, Н.В. Лукашевич, О. А. Невзорова, Д.Ш. Сулейманов. Создание русско-татарского тезауруса по общественно-политической тематике: общие принципы и аспекты реализации // Научно-техническая информация. Серия 2: Информационные процессы и системы. — 2017. — № 2 — С. 20-28

23. А.М. Галиева, А.В. Кириллович, Н.В. Лукашевич, О.А. Невзорова, Д.Ш. Сулейманов, Д.Д. Якубова. Русско-татарский общественно-политический

тезаурус: публикация в облаке лингвистических открытых связанных данных // International Journal of Open Information Technologies, vol. 5, no. 11, 2017. Pp. 6473

24. А.В. Кириллович, А.М. Баширов, А.Р. Гатиатуллин. Программная система для разработки многоязычного тезауруса // Программные продукты и системы. 2018, Т. 31. № 1. С. 112-120

Свидетельства о государственной регистрации:

25. Свидетельство 2018622131 Российская Федерация. Свидетельство об государственной регистрации базы данных. Онтология профессиональной математики «OntoMathPro» / А.В. Кириллович, Н.Г. Жильцов, П.Н. Иваньшин,

A.В. Каюмова, И.Р. Каюмов, Е.К. Липачев, М.С. Матвейчук, О. А. Невзорова,

B. Д. Соловьев, Е.А. Уткина; заявитель и правообладатель ФГАОУ ВО КФУ (RU). - №2018622131; заявл. 06.11.2018; опубл. 25.12.2018, Реестр баз данных. -1 с.

26. Свидетельство 2019610460 Российская Федерация. Свидетельство об государственной регистрации программы для ЭВМ. OntoMathSearch: система семантического поиска по математическим формулам / А.В. Кириллович, Н.Г. Жильцов; заявитель и правообладатель ФГАОУ ВО КФУ (RU). -№2018664807; заявление 18.12.2018; опубликовано 10.01.2019, Реестр программ для ЭВМ. - 1 с.

27. Свидетельство 2019610241 Российская Федерация. Свидетельство об государственной регистрации программы для ЭВМ. Программный комплекс автоматического препроцессинга цифровых коллекций математических документов / А.М. Елизаров, Н.Г. Жильцов, А.В. Кириллович, Е.К. Липачев, О.А. Невзорова; заявитель и правообладатель ФГАОУ ВО КФУ (RU). - № 2018664769; заявление 18.12.2018; опубликовано 10.01.2019, Реестр программ для ЭВМ. - 1 с.

Прочие публикации:

28. О.А. Невзорова, А.В. Кириллович. Технологии связывания данных в пространстве Открытых данных на примере математической коллекции // В.В. Голенков и др. (ред). Материалы II Международной научно-технической конференции «Открытые семантические технологии проектирования интеллектуальных систем» (08Ш-2013). БГУИР, 2013. С. 91-96.

29. А.В. Кириллович. Висячая пунктуация в web-типографике // Труды Казанской школы по компьютерной и когнитивной лингвистике ТБЬ-2014. ФЕН, 2014

30. А.М. Елизаров, Н.Г. Жильцов, А.В. Кириллович, Е.К. Липачёв, О.А. Невзорова, В. Д. Соловьев. Онтологии математических знаний и их применение в науке и образовании // Материалы международной научно-практической конференции «Информационные технологии в образовании и науке (ИТОН -2014)». ФОЛИАНТ, 2014. Стр. 60-64

31. А.М. Елизаров, Н.Г. Жильцов, В.В. Иванов, А.В. Кириллович, Е.К. Липачёв, О.А. Невзорова. Семантический рекомендательный сервис в профессиональной деятельности математика // Ученые записки ИСГЗ. 2015. № 1. С. 190-197

32. А. М. Елизаров, Н.Г. Жильцов, А.В. Кириллович, Е.К. Липачёв. Терминологическое аннотирование и рекомендательный сервис в системе управления физико-математическим контентом // Труды XVII Международной конференции «Аналитика и управление данными в областях с интенсивным использованием данных» (ВАМВГО/КСБЬ'2015). Обнинск: ИАТЭ НИЯУ МИФИ, 2015. С.357-350

33. А. М. Елизаров, Н.Г. Жильцов, А.В. Кириллович, Е.К. Липачёв. Семантическое аннотирование в системе управления физико-математическим контентом // Труды XVII Всероссийской научной конференции «Научный сервис в сети Интернет». М.: ИПМ им. М.В.Келдыша, 2015. Стр. 98-103.

34. А.М. Елизаров, Н.Г. Жильцов, А.В. Кириллович, Е.К. Липачёв, О.А. Невзорова. Экосистема 0КТ0МАТИ и проект Всемирной цифровой математи-

ческой библиотеки // Труды международной конференции по компьютерной и когнитивной лингвистике TEL-2016. Казань: Изд-во Казанского унивесрситета, 2016. Стр. 25-28

35. А.М. Елизаров, А.В. Кириллович, Е.К. Липачёв, О.А. Невзорова. Управление математическими знаниями: онтологические модели и цифровые технологии // Сборник статей XVIII международной конференции «Аналитика и управление данными в областях с интенсивным использованием данных» (DAMDID/RCDL'2016). М.: ФИЦ ИУ РАН, 2016. Стр. 95-101

36. А.М. Елизаров, А.В. Кириллович, Е.К. Липачёв. Блоги в системе научных коммуникаций // Ученые записки ИСГЗ. 2017. №1(15). С. 209-214

37. А.В. Кириллович. Информационная архитектура блогов // Электронные библиотеки. Том 20, № 2, 2017. Стр. 147-162

38. А.В. Кириллович. Логические константы и проблема демаркации логики // Материалы международной научной конференции «Десятые Смирновские чтения по логике». М.: Современные тетради, 2017. Стр. 82-84

39. А.М. Елизаров, А.В. Кириллович, Е.К. Липачев, О.А. Невзорова, Л.Р. Шакирова. Семантические технологии в математическом образовании: онтологии и открытые связанные данные // Ученые записки ИСГЗ, 2018. №1. С. 222-227

40. Л.Р. Шакирова, М.В. Фалилеева, А.В. Кириллович, Е.К. Липачев. Проектирование образовательной математической онтологии: проблемы и методы решения на примере курса планиметрии // XV Международная конференция по компьютерной и когнитивной лингвистике TEL 2018. Сборник трудов: в 2-х томах. Т. 1. Казань: Изд.-во АН РТ, 2018. С. 393-405

41. Невзорова О.А., Кириллович А.В., Невзоров В.Н., Николаев К.С. Модели семантического контекста математических формул в научных статьях // 16-я Национальная конференция по искусственному интеллекту с международным участием КИИ-2018. 24-27 сентября 2018 г., г. Москва, Россия. Труды конференции. В 2-х томах. Т 1. Москва: РКП, 2018. С. 271-278

А.В. Кириллович. Релятивизм в отношении истины // Материалы международной научной конференции «Десятые Смирновские чтения по логике», 1921 июня 2019, г. Москва, МГУ. М.: Современные тетради, 2019. Стр. 82-84

Личный вклад. Все выносимые на защиту результаты получены соискателем лично. В опубликованных совместных работах постановка задачи осуществлялась совместными усилиями соавторов при непосредственном участии соискателя.

Благодарности. Работа выполнена при поддержке субсидии, выделенной Казанскому федеральному университету для выполнения государственного задания в сфере научной деятельности, проект 1.2368.2017/ПЧ.

Структура и объем работы. Диссертационная работа состоит из введения, трех глав и заключения. Полный объём диссертации составляет 150 страниц с 12 рисунками и 4 таблицами. Список литературы содержит 155 наименований.

В соответствии с поставленным планом, решение задачи состоит из трех основных блоков:

1. Интеграция в облако Лингвистических открытых связанных данных (ЬЬОБ) созданных вручную лингвистических ресурсов для русского и татарского языков. Данные ресурсы включают как уже существующие ресурсы, так и новые ресурсы, разработанные при участии диссертанта. В результате облако ЬЬОБ будет содержать лингвистические ресурсы, которые покрывают основные языковые уровни (требования Я1.1-Я1.4), относятся к общей тематике (требование Я2.1) и содержат преимущественно языковые единицы, представляющие общие понятия (требование Я3.1).

2. Разработка методов полуавтоматического излечения иерархии топиков из системы категорий Википедии. С помощью данных методов облако ЬЬОБ может быть пополнено именованными сущностями (требование Я2.2).

3. Разработка онтологии математического знания и ее приложений для управления математическим знанием. В результате, облако LLOD будет содержать лингвистические ресурсы, относящиеся к специальной тематике (требование R3.2).

Главы диссертации соответствуют перечисленным блокам решения поставленной задачи.

Глава 1 описывает RuThes Cloud — многоуровневый набор Лингвистических открытых связанных данных (LLOD) общей тематики. Параграф 0 содержит общее описание ресурса RuThes Cloud. Параграф 1 содержит описание основных онтологических моделей и стандартов, используемых для представления лингвистических ресурсов в облаке Лингвистических открытых связанных данных. Параграф 2 содержит подробный сравнительный обзор основных лингвистических ресурсов, представленных в облаке Лингвистических открытых связанных данных. Параграф 3 содержит описание структуры ресурса RuThes Cloud. В Параграфе 4 демонстрируется использование RuThes Cloud в задаче расширения поискового запроса.

Глава 2 содержит онтологический анализ системы категорий Википеди и описание основанного на нем метода полуавтоматического извлечения иерархии топиков из данной системы. В Параграфе 0 дается описание системы категорий Википедии, и описывается проблема транзитивности. Параграф 1 содержит краткое описание альтернативных проектов по извлечению структурированных данных из Википедии. В Параграфе 2 система категорий исследована с помощью классических методов онтологического моделирования и выявлены причины потери транзитивности. В Параграфе 3 предложен метод, который исправляет систему категорий, удаляя из нее нетранзитивные цепочки. Параграф 5 содержит заключительные положения к данной главе.

Глава 3 содержит описание онтологии профессиональной математики OntoMathPro, и основанной на ней цифровой экосистемы OntoMath. В Параграфе 1 описывается онтология профессиональной математики OntoMath . В Па-

раграфе 2 описывается Оп1;оМа1;Ь — цифровая экосистема онтологий, инструментов текстовой аналитики и приложений для управления математическим знанием. В Параграфе 3 описывается центральный компонент экосистемы Оп-ШМаШ — платформа семантической публикации, и ее модули, разработанные автором. В Параграфе 4 описывается одно из приложений экосистемы Оп-ШМаШ — система семантического поиска по математическим формулам.

В Заключении подводится итог проделанной работы.

Глава 1. Многоуровневый набор Лингвистических открытых связанных данных RuThes Cloud

В данной главе описывается RuThes Cloud — многоуровневый набор Лингвистических открытых связанных данных (LLOD) общей тематики.

Данный ресурс включает в себя:

1. Иерархию независимых от языка концептов.

2. Лексические единицы на русском и татарском языках, привязанные к обозначаемым ими концептам через лексические смыслы.

3. Формы русских лексических единиц, снабженные грамматическими показателями.

4. Синтаксические фреймы.

5. Деревья декомпозиции многословных лексических единиц на составляющие их слова.

Ресурс был построен на базе тезауруса РуТез, грамматического словаря Зализняка, фреймового ресурса FrameBank и русско-татарского социо-политического тезауруса.

Данный ресурс имеет полу-децентрализованный и полу-распределенный характер. Его ядро разрабатывается централизовано и хранится в виде единого ресурса. Однако, используя принципы открытых связанных данных, сторонние разработчики смогут публиковать расширения в виде собственных ресурсов. Такие расширения могут включать: добавление лексических единиц на новых языках, привязанных к концептам из ядра; добавление листовых концептов; добавление промежуточных концептов.

1.1. Обзор онтологических моделей

Данный параграф содержит описание основных онтологических моделей и стандартов, используемых для представления лингвистических ресурсов в облаке Лингвистических открытых связанных данных.

Онтология SKOS

Для представления простейших лексических ресурсов используется онтология SKOS [Baker, et al., 2013; Isaac and Summers, 2009; Miles and Bechhofer, 2009a]. Центральным понятием данной онтологии является «Концепт» (Concept). Концепты — „единицы мысли", которые являются абстрактными и независимыми от конкретного языка.

Концепты могут иметь имена (лейблы, Lexical labels) — выражения, которые используются для обозначения данного концепта на том или ином языке. Для связи концепта с его именем используются следующие свойства:

1. skos:prefLabel — предпочтительный лейбл данного концепта (например, дескрипторы в тезаурусе);

2. skos:altLabel — альтернативный лейбл;

3. skos:hiddenLabel — скрытый лейбл, используется для ошибочных вариантов обозначения концепта и т.п.

Данные свойства являются подсвойствами свойства rdfs:label.

Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Список литературы диссертационного исследования кандидат наук Кириллович Александр Витальевич, 2019 год

Список литературы

1. ANSI/NISO Z39.19-2005 (R2010). Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies

2. Assem van M., Gangemi A., Schreiber G. Conversion of WordNet to a standard RDF/OWL representation // Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC'06) - ELRA, 2006 - Pp. 237-242.

3. Auer, S. et al. (2007). DBpedia: A Nucleus for a Web of Open Data. In Aber-er K. et al. (Eds.), Proceedings of the 6th International Semantic Web Conference and the 2nd Asian Semantic Web Conference (ISWC 2007 + ASWC 2007). The Semantic Web. Lecture Notes in Computer Science, vol. 4825, pp. 722-735. Berlin, Heidelberg: Springer. doi:10.1007/978-3-540-76298-0_52

4. Baker C.F., Fillmore C.J., Lowe J.B. The Berkeley FrameNet Project // Proceedings of the 17th international conference on Computational linguistics (COLING '98). - Montreal, 1998. - Pp. 86-90.

5. Baker T., Bechhofer S., Isaac A., Miles A., Schreiber G., Summers E. Key choices in the design of Simple Knowledge Organization System (SKOS) // Journal of Web Semantics - 2013. Vol. 20. - Pp. 35-49. doi:10.1016/j.websem.2013.05.001.

6. Balysheva K., Kartashova E., Kondratiev K., Mikheev A. LexInfo as a Model for Creating Ontology-Based Dictionary of Russian Grammatical Forms // McCrae J. P., et al. (eds.) Proceedings of the LDK 2017 Workshops: 1st Workshop on the OntoLex Model (OntoLex-2017), Shared Task on Translation Inference Across Dictionaries & Challenges for Wordnets co-located with 1st Conference on Language, Data and Knowledge (LDK 2017). CEUR Workshop Proceedings. Vol. 1899 - CEUR-WS, 2017. - Pp. 51-59.

7. Bilgin O., Çetinoglu O., Oflazer K. Building a Wordnet for Turkish // Romanian Journal of Information Science and Technology, Volume 7, Numbers 12, 2004. Pp. 163-172

8. Bizer, C. et al. (2009). DBpedia: A Crystallization Point for the Web of Data. Journal of Web Semantics, 7 (3), 154-165. Elsevier. doi:10.1016/j.websem.2009.07.002

9. Bond F., Foster R. Linking and Extending an Open Multilingual Wordnet // Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (ACL 2013). Pp. 1352-1362

10. Brasileiro, F., Almeida, J.P.A., Carvalho, V.A., and Guizzardi, G.: Expressive Multi-level Modeling for the Semantic Web. In: Groth, P., et al. (eds.) Proceedings of the 15th International Semantic Web Conference (ISWC 2016). Part I. Lecture Notes in Computer Science, vol. 9981, pp. 53-69. Springer, Cham (2016). doi:10.1007/978-3-319-46523-4_4

11. Broughton V. Essential Classification. 2nd Edition. Facet Publishing, 2015

12. Buswell S., et al (eds). The OpenMath Standard. Version 2.0. The OpenMath Society, 2004. Url:https://www.openmath.org/standard/om20-2004-06-30/omstd20.html

13. Caracciolo C., Stellato A. Thesaurus maintenance, alignment and publication as Linked Data: the AGROVOC use case // International Journal of Metadata Semantic Ontologies. - 2012. # 7(1). Pp. 65-75. doi: 10.1504/IJMSO.2012.048511.

14. Caracciolo C., Stellato A., Morshed A., Johannsen G., Rajbhandari S., Jaques Y., Keizer J. The AGROVOC linked dataset // Semantic Web. - 2013. # 4(3). - Pp. 341-348. doi: 10.3233/SW-130106.

15. Carvalho, V.A., Almeida, J.P.A., Fonseca, C.M., and Guizzardi, G.: Multilevel ontology-based conceptual modeling. In: Data & Knowledge Engineering, vol. 109, May 2017, pp. 3-24. doi:10.1016/j.datak.2017.03.002

16. Çetinoglu O., Bilgin O., Oflazer K. Turkish Wordnet // K. Oflazer, M. Saraçlar (eds). Turkish Natural Language Processing. Springer, 2018. doi:10.1007/978-3-319-90165-7_15

17. Chiarcos C. OLiA - Ontologies of Linguistic Annotation // Semant. Web. -2015. # 6(4). - Pp. 379-386. doi: 10.3233/SW-140167.

18. Chiarcos C. Ontologies of linguistic annotation: survey and perspectives // Calzolari N., et al. (eds). Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012) - ELRA, 2012 - Pp. 303310.

19. Chiarcos C., McCrae J., Cimiano P., Fellbaum C. Towards open data for linguistics: Linguistic linked data // Oltramari A., Vossen P., Qin L., Hovy E. (eds). New Trends of Research in Ontologies and Lexical Resources. - Heidelberg: Springer, 2013. - Pp. 7-25. doi:doi:10.1007/978-3-642-31782-8_2.

20. Chiarcos C., Walther D., Ionov M. From language documentation data to LLOD: A case study in Turkic lemon dictionaries // McCrae J. P. et al. (eds). Proceedings of the LDK 2017 Workshops. CEUR Workshop Proceedings, vol. 1899. - 2017. - Pp. 22-32.

21. Cimiano P., McCrae J.P., Buitelaar P. Lexicon model for ontologies. Final community group report, 10 May 2016. - URL: https://www.w3.org/2016/05/ontolex/.

22. Corcoglioniti F., Rospocher M., Palmero Aprosio A., Tonelli S. PreMOn: a Lemon Extension for Exposing Predicate Models as Linked Data // Calzolari N., et al. (eds). Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016) - ELRA, 2016 - Pp. 23-28.

23. Correia, F. (2008). Ontological Dependence. Philosophy Compass, 3 (5), 1013-1032. Blackwell. doi:10.1111/j.1747-9991.2008.00170.x

24. Cramer M. Proof-checking mathematical texts in controlled natural language. Dissertation. Universität Bonn, 2013

25. D. Carlisle, et al (eds). Mathematical Markup Language (MathML). Version 3.0. 2nd Edition. W3C Recommendation, 10 April 2014. §4 Content Markup. Url:https://www.w3.org/TR/MathML3/chapter4.html

26. Daubechies I., et al. Developing a 21st Century Global Library for Mathematics Research. The National Academies Press, 2014. doi:10.17226/18619

27. de Melo, G., Weikum, G. (2010). MENTA: Inducing Multilingual Taxonomies from Wikipedia. In Proceedings of the 19th ACM international conference on Information and knowledge management (CIKM '10), pp. 10991108. New York: ACM. doi:10.1145/1871437.1871577

28. Dehaye, P.-O., Iancu, M., Kohlhase, M., Konovalov, A., Lelièvre, S., Müller, D., Pfeiffer, M., Rabe, F., Thiéry, N.M., and Wiesing, T.: Interoperability in the OpenDreamKit Project: The Math-in-the-Middle Approach. In: Kohlhase, M., et al. (eds.) Proceeding of the 9th International Conference on Intelligent Computer Mathematics (CICM 2016). Lecture Notes in Computer Science, vol. 9791. Springer, Cham (2016). doi:10.1007/978-3-319-42547-4_9

29. Dextre Clarke S.G. Evolution towards ISO 25964: an international standard with guidelines for thesauri and other types of controlled vocabulary // Information Wissenschaft & Praxis, Vol. 58, Num. 8, Nov-Dec 2007. Pp. 441-444

30. Dextre Clarke S.G. ISO 2788 + ISO 5964 + Much Energy = ISO 25964 // Bulletin of the American Society for Information Science and Technology, Volume 35, Number 1, October/November 2008

31. Dextre Clarke S.G., Zeng M.L. From ISO 2788 to ISO 25964: The evolution of thesaurus standards towards interoperability and data modeling // Information Standards Quarterly, Volume 24, Issue 1, Winter 2012. Pp. 20-26

32. Divjak D. Structuring the lexicon: A clustered model for near-synonymy. -Walter de Gruyter, 2010.

33. Eckle-Kohler J., McCrae J.P., Chiarcos C. LemonUby - a large, interlinked, syntactically-rich lexical resource for ontologies // Semantic Web. - 2015. # 6(4). - Pp. 371-378. doi:10.3233/SW-140159.

34. Ehrmann M., Cecconi F., Vannella D., McCrae J., Cimiano P., Navigli R. Representing multilingual data as Linked Data: the case of BabelNet 2.0 // Calzolari N., et al. (eds). Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC 2014) - ELRA, 2014 - Pp. 401408

35. Ehsani R. KeNet: A Comprehensive Turkish Wordnet and Using It in Text Clustering. PhD Thesis. I§ik University, 2018

36. Ehsani R., Solak E., Yildiz O.T. Constructing a WordNet for Turkish Using Manual and Automatic Annotation // ACM Transactions on Asian and Low-Resource Language Information Processing, Volume 17 Issue 3, May 2018. Article No. 24. doi:10.1145/3185664

37. El Maarouf I., Bradbury J., Hanks P. PDEV-lemon: a Linked Data implementation of the Pattern Dictionary of English Verbs based on the Lemon model // C. Chiarcos, et al. (eds). Proceedings of the 3rd Workshop on Linked Data in Linguistics (LDL-2014) - ELRA, 2014 - Pp. 87-93

38. Fine, K. (1994). Essence and Modality. Philosophical Perspectives, 8, 1-16. Ridgeview Publishing Company. doi:10.2307/2214160

39. Fine, K. (1995). Ontological Dependence. Proceedings of the Aristotelian Society, 95, 269-290. Wiley

40. Flati, T. et al. (2014). Two Is Bigger (and Better) Than One: the Wikipedia Bitaxonomy Project. In Toutanova K., Wu H. (Eds.), Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (ACL 2014), vol. 1, pp. 945-955. ACL. doi:10.3115/v1/P14-1089

41. Flati, T. et al. (2016). MultiWiBi: The multilingual Wikipedia bitaxonomy project. Artificial Intelligence, 241, 66-102. doi:10.1016/j.artint.2016.08.004

42. Frické M. Logic and the Organization of Information. Springer, 2012

43. Ganesalingam M. The Language of Mathematics: A Linguistic and Philosophical Investigation. Springer, 2013

44. Gangemi A., Navigli R., Velardi P. The OntoWordNet Project: Extension and Axiomatization of Conceptual Relations in WordNet // Meersman R., Tari Z., Schmidt D.C. (eds). OTM Confederated International Conferences, CoopIS, DOA, and ODBASE 2003. LNCS, vol. 2888 - Berlin, Heidelberg: Springer, 2003 - Pp. 820-838.

45. Gangemi, A. et al. (2002). Sweetening Ontologies with DOLCE. In Gómez-Pérez A., Benjamins V.R. (Eds.), Proceedings of the 13th International Conference on Knowledge Engineering and Knowledge Management (EKAW 2002). Lecture Notes in Computer Science, vol. 2473, pp. 166-181. Springer, Berlin, Heidelberg. doi:10.1007/3-540-45810-7_18

46. Gangemi, A. et al. (2012). Automatic Typing of DBpedia Entities. In Cudré-Mauroux P. et al. (Eds.), Proceedings of the 11th International Semantic Web Conference (ISWC 2012). Lecture Notes in Computer Science, vol. 7649, pp. 65-81. Springer, Berlin, Heidelberg. doi:10.1007/978-3-642-35176-1_5

47. Gangemi, A., Guarino, N., Oltramari, A. (2001). Conceptual Analysis of Lexical Taxonomies: The Case of WordNet Top-Level. In Welty C., Smith B. (Eds.), Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS 2001), pp. 285-296. New York: ACM. doi:10.1145/505168.505195

48. Gella, S., Strapparava, C., Nastase, V. (2014). Mapping WordNet Domains, WordNet Topics and Wikipedia Categories to Generate Multilingual Domain Specific Resources. In Calzolari N. et al. (Eds.), Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC 2014), pp. 1117-1121. ELRA

49. Gil Y., Miles S. PROV Model Primer. W3C Working Group Note, 30 April 2013. - URL: https://www.w3.org/TR/prov-primer/.

50. Ginev, D., et al. The SMGloM Project and System: Towards a Terminology and Ontology for Mathematics. In: Greuel, GM., et al. (eds.) 5th International Conference on Mathematical Software (ICMS 2016). Lecture Notes in Com-

puter Science, vol. 9725, pp. 451-457. Springer, Cham (2016). doi:10.1007/978-3-319-42432-3_58

51. Gnoli C. Classifying phenomena. Part 1: Dimensions // Knowledge Organization, Volume 43, Issue 6, 2016. Pp. 403-415

52. Gnoli C. Classifying phenomena. Part 2: Types and Levels // Knowledge Organization, Volume 44, Issue 1, 2017. Pp. 37-54

53. Gnoli C. Classifying phenomena. Part 3: Facets // Richard P. Smiraglia, Hur-Li Lee (eds). Dimensions of Knowledge: Facets for Knowledge Organization. Ergon, 2017. Pp. 55-67

54. Gnoli C. Classifying phenomena. Part 4: Themes and Rhemes // Knowledge Organization, Volume 45, Issue 1, 2018. Pp. 43-53

55. Guarino N., Welty C.A. A Formal ontology of properties // Dieng R., Corby O. (eds). Proceedings of the 12th International Conference on Knowledge Engineering and Knowledge Management Methods, Models, and Tools (EKAW 2000). Lecture Notes in Computer Science, vol. 1937 - Heidelberg: Springer, 2000. - Pp. 97-112. doi: 10.1007/3-540-39967-4_8.

56. Guarino, N., Welty, C. (2000). A Formal Ontology of Properties. In Dieng R., Corby O. (Eds.), Proceedings of the 12th International Conference on Knowledge Engineering and Knowledge Management Methods, Models, and Tools (EKAW 2000). Lecture Notes in Computer Science, vol. 1937, pp. 97112. Springer, Berlin, Heidelberg. doi:10.1007/3-540-39967-4_8

57. Guarino, N., Welty, C. (2009). An Overview of OntoClean. In Staab S., Stu-der R. (Eds.), Handbook on Ontologies (2nd ed., pp. 201-220). Springer, Berlin, Heidelberg. doi:10.1007/978-3-540-92673-3_9

58. Guizzardi, G. (2005). Ontological foundations for structural conceptual models. Enschede: CTIT

59. Gurevych I., Eckle-Kohler J., Hartmann S., Matuschek M., Meyer C. M., Wirth C. Uby: a large-scale unified lexical-semantic resource based on LMF // Proceedings of the 13th Conference of the European Chapter of the Associ-

ation for Computational Linguistics (EACL '12) - Stroudsburg: ACM, 2012 -Pp. 580-590.

60. Harris S., Seaborne A. SPARQL 1.1 Query Language. W3C Recommendation 21 March 2013. URL: https://www.w3.org/TR/sparql11-query/

61. Hawke, P. (2017). Theories of Aboutness. Australasian Journal of Philosophy. Taylor & Francis. doi:10.1080/00048402.2017.1388826

62. Hellmann S., Lehmann J., Auer S., Brammer M. Integrating NLP using Linked Data // Alani H. et al. (eds.). International Semantic Web Conference, 2013. Part II. LNCS, vol 8219 - Heidelberg: Springer, 2013. - Pp. 98-113. doi: 10.1007/978-3-642-41338-4_7.

63. Hitzler P., Krötzsch M., Parsia B., Patel-Schneider P.F., Rudolph S. OWL 2 Web Ontology Language. Primer (Second Edition). W3C Recommendation 11 December 2012. - URL: https://www.w3.org/TR/owl-primer/

64. Hj0rland, B. (1992). The Concept of 'Subject' in Information Science. Journal of Documentation, 48 (2), 172-200. MCB UP Ltd

65. Hj0rland, B. (2016). Subject (of documents). In Hj0rland B. (Ed.), Encyclopedia of Knowledge Organization. ISKO. Retrieved from: http://www.isko.org/cyclo/subject

66. Hoffart, J. et al. (2013). YAGO2: A spatially and temporally enhanced knowledge base from Wikipedia. Artificial Intelligence, 194, 28-61. Elsevier. doi:10.1016/j.artint.2012.06.001

67. Hovy, E., Navigli, R., Ponzetto, S.P. (2013). Collaboratively built semi-structured content and Artificial Intelligence: The story so far. Artificial Intelligence, 194, 2-27. Elsevier. doi:10.1016/j.artint.2012.10.002

68. INIS Thesaurus. English version. IAEA-INIS Reference Series, 2016.

69. Isaac A. and ISO TC46/SC9/WG8. Correspondence between ISO 25964 and SKOS/SKOS-XL Models. Technical Report. NISO, 2013. Url:https://groups.niso.org/apps/group_public/download.php/12351/Correspo ndence%20ISO25964-SKOSXL-MADS-2013-12-11.pdf

70. Isaac A., Summers E. SKOS Simple Knowledge Organization System Primer. W3C Working Group Note 18 August 2009. - URL: https://www.w3.org/TR/skos-primer/

71. ISO 12620:2009: Terminology and other language and content resources— Specification of data categories and management of a Data Category Registry for language resources. - URL: https://www.iso.org/standard/37243.html.

72. ISO 24613:2008: Language resource management - Lexical markup framework (LMF). - URL: https://www.iso.org/standard/37327.html.

73. ISO 25964-1:2011: Information and documentation - Thesauri and interoperability with other vocabularies - Part 1: Thesauri for information retrieval. -URL: http://www.iso.org/iso/catalogue_detail.htm?csnumber=53657.

74. ISO 25964-1:2011. Information and documentation — Thesauri and interoperability with other vocabularies — Part 1: Thesauri for information retrieval

75. ISO 5964-1985. Documentation - Guidelines for the establishment and development of multilingual thesauri. - URL: http://www.iso.org/iso/catalogue_detail.htm?csnumber=12159.

76. Kemps-Snijders M., Windhouwer M., Wittenburg P., Wright S.E. ISOcat: corralling data categories in the wild // Calzolari N., et al. (eds). Proceedings of the 6th International Conference on Language Resources and Evaluation (LREC 2008) - ELRA, 2008 - Pp. 887-891.

77. Kemps-Snijders M., Windhouwer M., Wittenburg P., Wright S.E. ISOcat: remodelling metadata for language resources. // International Journal of Metadata, Semantics and Ontologies. - 2009. # 4(4). - Pp. 261-276. doi:10.1504/IJMSO.2009.029230.

78. Kipper-Schuler K. VerbNet: a broad-coverage, comprehensive verb lexicon: A Dissertation in Computer and Information Science - University of Pennsylvania, 2005.

79. Kohlhase A., Kohlhase A. Towards a Flexible Notion of Document Context // A. Protopsaltis, et al (eds). Proceedings of the 29th ACM international con-

ference on Design of communication (SIGDOC 2011). ACM, 2011. Pp. 181188. doi:10.1145/2038476.2038512

80. Kohlhase M. and Iancu M. Co-Representing Structure and Meaning of Mathematical Documents // Sprache und Datenverarbeitung: International Journal for Language Data Processing, Volume 38, Number 2, 2014. Pp. 49-80

81. Kohlhase M. Mathematical Knowledge Management: Transcending the One-Brain-Barrier with Theory Graphs // EMS Newsletter, Issue 92, June 2014. Pp. 22-27

82. Kohlhase M. OMDoc - An Open Markup Format for Mathematical Documents [version 1.2]. Springer, 2006

83. Kohlhase M. The Flexiformalist Manifesto // A. Voronkov, et al. (eds). Proceedings of the 14th International Symposium on Symbolic and Numeric Algorithms for Scientific Computing (SYNASC 2012). IEEE, 2012. Pp. 30-35. doi:10.1109/SYNASC.2012.78

84. Kohlhase M., Rabe F. Semantics of OpenMath and MathML3 // Mathematics in Computer Science, Volume 6, Issue 3, September 2012. Pp 235-260. doi:10.1007/s11786-012-0113-x

85. Kohlhase, M.: A Data Model and Encoding for a Semantic, Multilingual Terminology of Mathematics. In: Watt S.M., et al. (eds.) Proceedings of the International Conference on Intelligent Computer Mathematics (CICM 2014). Lecture Notes in Computer Science, vol. 8543, pp. 169-183. Springer, Cham (2014). doi:10.1007/978-3-319-08434-3_13

86. Koslicki, K. (2012). Varieties of Ontological Dependence. In Correia F., Schnieder B. (Eds.), Metaphysical Grounding: Understanding the Structure of Reality (pp. 186-213). Cambridge: Cambridge University Press

87. Koslicki, K. (2013). Ontological Dependence: An Opinionated Survey. In Hoeltje M. et al. (Eds.), Varieties of Dependence (pp. 31-64). Munich: Philosophia Verlag

88. Lange C. Ontologies and Languages for Representing Mathematical Knowledge on the Semantic Web // Semantic Web, vol. 4, no. 2, 2013. Pp. 119-158. doi:10.3233/SW-2012-0059

89. Lehmann, J. et al. (2015). DBpedia: A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia. Semantic Web Journal, 6 (2), 167-195. IOS Press. doi:10.3233/SW-140134

90. LexInfo. - URL: http://www.lexinfo.net/.

91. Loukachevitch N., Dobrov B. Development of ontologies with minimal set of conceptual relations // Lino, M.T., et al. (eds). Proceedings of the 4th International Conference on Language Resources and Evaluation (LREC 2004) -ELRA, 2004 - Pp. 1889-1892.

92. Loukachevitch N., Dobrov B. The Sociopolitical Thesaurus as a resource for automatic document processing in Russian // Terminology. - 2015. Vol. 21, # 2. - Pp. 237-262.

93. Loukachevitch N., Dobrov B., Chetviorkin I. RuThes-Lite, a publicly available version of thesaurus of Russian language RuThes. // Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference "Dialogue" - 2014. RGGU: 2014. - Pp. 340-349.

94. Loukachevitch, N. (2011). Thesauri in Information Retrieval Tasks. Moscow: Moscow University Press

95. Loukachevitch, N., Dobrov, B. (2004a). Development of Ontologies with Minimal Set of Conceptual Relations. In Lino, M.T. et al. (Eds.), Proceedings of the 4th International Conference on Language Resources and Evaluation (LREC'04), pp. 1889-1892. ELRA

96. Loukachevitch, N., Dobrov, B. (2004b). Ontological Types of Associative Relations in Information-Retrieval Thesauri and Automatic Query Expansion. In Oltramari A. et al. (Eds.), Proceedings of the LREC Workshop on Ontologies and Lexical Resources in Distributed Environments (Ontolex 2004), pp. 24-29

97. Loukachevitch, N., Dobrov, B. (2014). RuThes Linguistic Ontology vs. Russian Wordnets. In Orav H., Fellbaum C., Vossen P. (Eds.), Proceedings of the 7th Conference on Global WordNet (GWC 2014), pp. 154-162. University of Tartu Press

98. Loukachevitch, N., Dobrov, B., Chetviorkin, I. (2014). RuThes-Lite, a Publicly Available Version of Thesauru of Russian Language RuThes. In Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference "Dialogue", pp. 340-349. Moscow: RGGU

99. Lyashevskaya O., Kashkin E. FrameBank: A Database of Russian Lexical Constructions // Khachay M. Yu. et al. (eds). AIST 2015. CCIS, vol. 542. -Springer, Cham,2015. - Pp. 350-360. doi:10.1007/978-3-319-26123-2_34.

100. Mahdisoltani, F., Biega, J., Suchanek, F.M. (2015). YAGO3: A Knowledge Base from Multilingual Wikipedias. In Proceedings of the 7th Biennial Conference on Innovative Data Systems Research (CIDR 2015)

101. Mares, E.D. (2004). Relevant Logic: A Philosophical Interpretation. New York: Cambridge University Press

102. McCrae J. P., Chiarcos C., Bond F., Cimiano P., Declerck T., de Melo G., Gracia J., Hellmann S., Klimek B., Moran S., Osenova P., Pareja-Lora A. and Pool J. The Open Linguistics Working Group: Developing the Linguistic Linked Open Data Cloud // Calzolari N., et al. (eds). Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016) - ELRA, 2016 — Pp. 2435-2441.

103. McCrae J., Aguado-de-Cea G., Buitelaar P., Cimiano P., Declerck T., Gómez Pérez A., Gracia J., Hollink L., Montiel-Ponsoda E., Spohr D. and Wunner T. The Lemon cookbook. http://lemon-model.net/lemon-cookbook.pdf.

104. McCrae J., Spohr D., Cimiano P. Linking lexical resources and ontologies on the Semantic Web with Lemon // Antoniou G. et al. (eds). Extended Semantic Web Conference, 2011. Part I, LNCS, vol. 6643, Heidelberg: Springer, 2011. - Pp. 245-259.. doi: 10.1007/978-3-642-21034-1_17.

105. McCrae J.P., Bosque-Gil J., Gracia J., Buitelaar P., Cimiano P. The OntoLex-Lemon Model, Development and Applications // Kosem I., et al (eds). Proceedings of the 5th biennial conference on Electronic Lexicography (eLex 2017) - Lexical Computing CZ, 2017 - Pp. 587-597.

106. McCrae J.P., Fellbaum C., Cimiano P. Publishing and linking WordNet using Lemon and RDF // Chiarcos C. et al. (eds). Proceedings of the 3rd Workshop on Linked Data in Linguistics (LDL-2014) - ELRA, 2014 - Pp. 13-16

107. Medelyan, O. et al. (2009). Mining meaning from Wikipedia. International Journal of Human-Computer Studies, 67 (9), 716-754. Academic Press. doi:10.1016/j.ijhcs.2009.05.004

108. Miles A., Bechhofer S. SKOS Simple Knowledge Organization System Reference. W3C Recommendation 18 August 2009. - Url: https://www.w3.org/TR/skos-reference/

109. Miles A., Bechhofer S. SKOS Simple Knowledge Organization System extension for Labels (SKOS-XL) Namespace Document - HTML Variant. 18th August 2009 Recommendation Edition. - URL: https://www.w3.org/TR/skos-reference/skos-xl.html

110. Mills J. and Broughton V. Bliss bibliographic classification. 2nd ed. Introduction and auxiliary schedules. Butterworth, 1977

111. Moro, A., Navigli, R. (2012). WiSeNet: Building a Wikipedia-based Semantic Network with Ontologized Relations. In Proceedings of the 21st ACM international conference on Information and knowledge management (CIKM 2012), pp. 1672-1676. New York: ACM. doi:10.1145/2396761.2398495

112. Moussallem D. LIDIOMS: A Multilingual Linked Idioms Data Set // N. Cal-zolari, et al. (eds). Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC 2018) - ELRA, 2018 - Pp. 24682474.

113. Nastase, V. et al. (2010). WikiNet: A Very Large Scale Multi-Lingual Concept Network. In Calzolari N. et al. (Eds.), Proceedings of the 7th International Conference on Language Resources and Evaluation (LREC 2010), pp. 1015-1022

114. Nastase, V., Strube, M. (2008). Decoding Wikipedia Categories for Knowledge Acquisition. In Cohn A. (Ed.), Proceedings of the 23rd National Conference on Artificial Intelligence (AAAI 2008), vol. 2, pp. 1219-1224. AAAI Press

115. Nastase, V., Strube, M. (2013). Transforming Wikipedia into a large scale multilingual concept network. Artificial Intelligence, 194, 62-85. Elsevier. doi:10.1016/j.artint.2012.06.008

116. Navigli R., Ponzetto S.P. BabelNet: the automatic construction, evaluation and application of a wide-coverage multilingual semantic network // Artificial Intelligence. - 2012. # 193. - Pp. 217-250. doi: 10.1016/j.artint.2012.07.001.

117. Navigli, R., Ponzetto, S.P. (2010). BabelNet: Building a Very Large Multilingual Semantic Network. In Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics (ACL 2010), pp. 216-225. ACL

118. Navigli, R., Ponzetto, S.P. (2012). BabelNet: The automatic construction, evaluation and application of a wide-coverage multilingual semantic network. Artificial Intelligence, 193, 217-250. Elsevier. doi:10.1016/j.artint.2012.07.001

119. Niemann, E., Gurevych, I. (2011). The people's web meets linguistic knowledge: automatic sense alignment of Wikipedia and WordNet. In Proceedings of the 9th International Conference on Computational Semantics (IWCS 2011), pp. 205-214. Stroudsburg: ACL

120. Nuzzolese, A.G. et al. (2013). Towards the Natural Ontology of Wikipedia. In Blomqvist E., Groza T. (Eds.), Proceedings of the ISWC 2013 Posters & Demonstrations Track. CEUR Workshop Proceedings, vol. 1035, pp. 273276

121. Paredes L.P., Alvarez Rodriguez J.M., Azcona E.R. Promoting government controlled vocabularies for the Semantic Web: the EUROVOC thesaurus and the CPV product classification system // Kollias S., Cousins J. (eds). Proceedings of the 1 st International Workshop on Semantic Interoperability in the European Digital Library (SIEDL 2008). - 2008. - Pp. 111-122. - URL: http://image.ntua.gr/swamm2006/SIEDLproceedings.pdf.

122. Pitman J., Lynch C. Planning a 21st Century Global Library for Mathematics Research // Notices of the AMS, Volume 61, Number 7, August 2014. Pp. 776-777. doi:10.1090/noti 1143

123. Ponzetto, S.P., Navigli, R. (2009). Large-Scale Taxonomy Mapping for Restructuring and Integrating Wikipedia. In Proceedings of the 21st International Joint Conference on Artificial Intelligence (IJCAI 2009), pp. 2083-2088. San Francisco: Morgan Kaufmann Publishers

124. Ponzetto, S.P., Strube, M. (2007). Deriving a Large Scale Taxonomy from Wikipedia. In Proceedings of the 22nd National Conference on Artificial Intelligence (AAAI 2007), pp. 1440-1445. AAAI Press

125. Ponzetto, S.P., Strube, M. (2011). Taxonomy induction based on a collaboratively built knowledge repository. Artificial Intelligence, 175 (9-10), 17371756. Elsevier. doi:10.1016/j.artint.2011.01.003

126. Rospocher M., Corcoglioniti F., Palmero Aprosio A. PreMOn: LODifing linguistic predicate models // Language Resources and Evaluation - Springer, 2018. doi:10.1007/s10579-018-9437-8

127. Ruiz-Casado, M., Alfonseca, E., Castells, P. (2005). Automatic Assignment of Wikipedia Encyclopedic Entries to WordNet Synsets. In Szczepaniak P.S. et al. (Eds.), Proceedings of the 3rd International Conference on Advances in Web Intelligence (AWIC 2005). Lecture Notes in Computer Science, vol. 3528, pp. 380-386. Springer, Berlin, Heidelberg. doi:10.1007/11495772_59

128. Sanderson R., Ciccarese P., Young B. Web annotation data model. W3C Recommendation, 23 February 2017. - URL: https://www.w3.org/TR/annotation-model/.

129. Schreiber G., Raimond Y. RDF 1.1 Primer. W3C Working Group Note 24 June 2014. - URL: https://www.w3.org/TR/rdf11-primer/

130. Sérasset G. DBnary: Wiktionary as a Lemon-based multilingual lexical resource in RDF. // Semant. Web. - 2014. 6(4). - Pp. 355-361. doi:10.3233/SW-140147.

131. Simons, P. (1987). Parts: A Study in Ontology. Oxford: Clarendon Press. doi:10.1093/acprof:oso/9780199241460.001.0001

132. Suchanek, F. M., Kasneci, G., Weikum, G. (2007). Yago: a Core of Semantic Knowledge. In Proceedings of the 16th international conference on World Wide Web (WWW 2007), pp. 697-706. New York, ACM. doi:10.1145/1242572.1242667

133. Summers E., Isaac A., Redding C., Krech D. LCSH, SKOS and Linked Data // Greenberg J., Klas W. (eds). Proceedings of the 2008 International Conference on Dublin Core and Metadata Applications (DC 2008). - Singapore: Dublin Core Metadata Initiative, Göttingen: Universitätsverlag, 2008. - Pp. 25-33.

134. Tahko, T.E., Lowe, E.J. (2016). Ontological Dependence. In Zalta E.N. (Ed.), The Stanford Encyclopedia of Philosophy. Retrieved from: http://plato.stanford.edu/entries/dependence-ontological/

135. Thomasson, A.L. (1999). Fiction and Metaphysics. Cambridge: Cambridge University Press

136. Thomasson, A.L. (2008). Existence Questions. Philosophical Studies, 141(1), 63-78. Springer Netherlands. doi:10.1007/s11098-008-9263-8

137. Thomasson, A.L. (2009). Answerable and Unanswerable Questions. In Chalmers D.J. et al. (Eds.), Metametaphysics: New Essays on the Foundations of Ontology. New York: Oxford University Press

138. Titze, G. et al. (2014). DBpedia Domains: augmenting DBpedia with domain information. In Calzolari N. et al. (Eds.), Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC 2014), pp. 14381442. ELRA

139. Toral, A., Muñoz, R., Monachini, M. (2008). Named Entity WordNet. In Proceedings of the 6th Conference on Language Resources and Evaluation (LREC 2008), pp. 741-747

140. Tufis D., Cristea D., Stamou S. BalkaNet: Aims, Methods, Results and Perspectives. A General Overview // Romanian Journal of Information Science and Technology, Volume 7, Numbers 1-2, 2004. Pp. 9-43

141. UDC: Universal Decimal Classification. Standard Edition. Volume 1. Systematic tables. BSI Standards, 2005

142. UDC: Universal Decimal Classification. Standard Edition. Volume 2. Alphabetical index. BSI Standards, 2006

143. Ustalov D. Russian Thesauri as Linked Open Data // Computational Linguistics and Intellectual Technologies: papers from the Annual conference "Dialogue", Vol. 1. - Moscow: RGGU, 2015. - Pp. 616-625.

144. Vossen P. J. T. M. (ed.). EuroWordNet: general document. - Amsterdam: University of Amsterdam, 2002.

145. Vossen P., Bond F., McCrae J. Toward a truly multilingual Global Wordnet Grid // Verginica Barbu Mititelu, et al. (eds). Proceedings of the 8th Global WordNet Conference (GWC 2016) - Bucharest, Romania, January 27-30, 2016. - Pp. 419-426. - URL: http://jiangbian.me/papers/2016/gwc2016.pdf.

146. Will L. The ISO 25964 data model for the structure of an information retrieval thesaurus // Bulletin of the American Society for Information Science and Technology banner, Volume 38, Issue 4, April/May 2012. Pp. 48-51

147. Windhouwer M., Wright S.E. Linking to linguistic data categories in ISOcat // Chiarcos C., Nordhoff S., Hellmann S. (eds). Linked Data in Linguistics. -

Heidelberg: Springer, 2012 - Pp. 99-107. doi: 10.1007/978-3-642-28249-2_10.

148. Wu, F., Weld, D.S. (2008). Automatically Refining the Wikipedia Infobox Ontology. In Proceedings of the 17th international conference on World Wide Web (WWW 2008), pp. 635-644. New York: ACM. doi:10.1145/1367497.1367583

149. Yablo, S. (2014). Aboutness. Princeton: Princeton University Press

150. Zapilko B., Schaible J., Mayr P., Mathiak B. TheSoz: a SKOS representation of the thesaurus for the social sciences // Semantic Web. - 2013. # 4(3). Pp. 257-263. doi: 10.3233/SW-2012-0081.

151. Zirn, C., Nastase, V., Strube, M. (2008). Distinguishing between Instances and Classes in the Wikipedia Taxonomy. In Zirn C. et al. (Eds.), Proceedings of the 5th European Semantic Web Conference (ESWC 2008). Lecture Notes in Computer Science, vol. 5021, pp. 376-387. Springer, Berlin, Heidelberg. doi:10.1007/978-3-540-68234-9

152. Кашкин Е. В. Семантические роли и сеть конструкций в системе FrameBank / Кашкин Е. В., Ляшевская О. Н. // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). Вып. 12 (19). В 2 т. Т. 1: Основная программа конференции. М.: РГГУ, 2013. С. 297-311.

153. Лукашевич Н.В. Тезаурусы в задачах информационного поиска. - М.:: Изд-во МГУ, 2011. - 512 с.

154. Ляшевская О.Н., Кашкин Е.В. Типы информации о лексических конструкциях в системе ФреймБанк // Труды института русского языка им. В.В. Виноградова - 2015. - №6. - С. 464-555.

155. Универсальная десятичная классификация: Сокращенное издание. 6-е издание - М.: ВИНИТИ, 2012

Приложение. Свидетельства о регистрации базы данных и программ для ЭВМ

Свидетельство о гос. регистрации базы данных №2018622131

ТООТЖЙСТАИ ФВДШРМЩЕШ

СВИДЕТЕЛЬСТВО

о государственной регистрации базы данных

№ 2018622131

Онтология профессиональной математики "Оп^Ма^Рго"

Правообладатель: федеральное государственное автономное образовательное учреждение высшего образования «Казанский (Приволжский) федеральный университет» (ФГАОУ ВО КФУ)

(яи)

Авторы: Кириллович Александр Витальевич (ЯП), Жильцов Никита Геннадьевич (Ш1), Иваньшин Пётр Николаевич (Я11), Каюмова Анна Васи.1ьевна (Я11), Каюмов Ильгиз Рифатович (Ш'), Липачев Евгений Константинович (Я11), Матвеичу к Марьян Степанович (ЛИ), Невзорова Ольга Авенировна (Я1Г), Соловьев Валерий Дмитриевич (ЯII), Уткина Елена Анатольевна (1Ш)

Заявка № 2018621602

Дата поступления 06 ноября 2018 Г. Дата государственной регистрации в Реестре баз данных 25 декабря 2018 г.

Руководитель Федеральной службы по инте.пектуальной собственности

Г.П. Ив.чиев

Свидетельство о гос. регистрации программы для ЭВМ №2018664807

РО(0(0Ж11(0ЖАЖ ФВДШРАЩШШ

« ж

СВИДЕТЕЛЬСТВО

о государственной регистрации программы для ЭВМ

№ 2019610460

0|иоМа(118еагсЬ: система семантического поиска по математическим формулам

Правообладатель: федеральное государственное автономное образовательное учреждение высшего образования «Казанский (Приволжский) федеральный университет» (ФГАОУ ВО КФУ)

(яи)

Авторы: Кириллович Александр Витальевич (Я11), Жильцов Никита Геннадьевич (Я11)

Заявка № 2018664807

Дата поступления 18 декабря 2018 г.

Дата государственной регистрации в Реестре программ для ЭВМ 10 января 2019 г.

Руководитель Федеральной службы по интеллектуальной собственности

ГП Ивлиев

Свидетельство о гос. регистрации программы для ЭВМ №2018664769

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.