Системный анализ, онтологический синтез и инструментальные средства обработки информации в процессах интеграции профессиональных знаний тема диссертации и автореферата по ВАК РФ 05.13.01, доктор технических наук Минаков, Игорь Александрович
- Специальность ВАК РФ05.13.01
- Количество страниц 413
Оглавление диссертации доктор технических наук Минаков, Игорь Александрович
ВВЕДЕНИЕ .•.
1. ОНТОЛОГИЧЕСКИЙ ПОДХОД В ПРОЦЕССАХ ОБРАБОТКИ ИНФОРМАЦИИ В СФЕРЕ ПРОМЫШЛЕННОГО ПРОЕКТИРОВАНИЯ И ПРОИЗВОДСТВА, НАПРАВЛЕННЫЙ НА ИНТЕГРАЦИЮ НАУЧНО-ТЕХНИЧЕСКИХ ЗНАНИЙ.
1.1. Проблема использования разнородных знаний в сфере промышленного проектирования и производства.
1.2. Задача интеграции знаний. Специфика профессиональных и научнотехнических знаний.
1.3. Субъектно-ориентированная модель приобретения знаний как метод интеграции разнородных научно-технических знаний
1.4. Два вида научно-технической информации - знание, основанное на объяснении, и знание, основанное на понимании.
1.5. Обобщенная логическая модель приобретения научно-технических знаний. Цикл приобретения и интеграции знаний, основанный на концептуальной модели эксперта.
1.6. Модель онтологии для представления знаний, основанных на понимании.
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Методы и технологии комплексного информационного обеспечения управления инновационным развитием региональной экономики2009 год, доктор технических наук Шишаев, Максим Геннадьевич
Исследование методов анализа Интернет-ресурсов и реализация на этой основе мультиагентной системы поиска информации1999 год, кандидат технических наук Майкевич, Наталия Вадимовна
Модели и методы построения корпоративных интеллектуальных систем поддержки принятия решений2004 год, доктор технических наук Швецов, Анатолий Николаевич
Модели и методы интеграции структурированных текстовых описаний на основе онтологий2009 год, кандидат физико-математических наук Иванов, Владимир Владимирович
Метод и технологии семантической обработки информации для государственного и муниципального управления2011 год, кандидат технических наук Ломов, Павел Андреевич
Введение диссертации (часть автореферата) на тему «Системный анализ, онтологический синтез и инструментальные средства обработки информации в процессах интеграции профессиональных знаний»
Актуальность темы. В современном информационном обществе возникает острая необходимость в методах и средствах, ориентированных на обработку и анализ семантики доступных информационных материалов, для решения таких задач, как поддержка принятия решений при промышленном проектировании (например, образцов новой техники), классификация научно-технической документации, интеграция информационных служб промышленных компаний-партнеров.
В процессе решения подобных задач эксперт - лицо, принимающее решение, осуществляет интеграцию знаний, в рамках которой анализируются и систематизируются разнородные информационные материалы, произведенные другими исследователями, с целью получения знаний об изучаемом объекте, для чего обрабатываются различные электронные ресурсы: проектно-конструкторская документация, статьи научно-технических библиотек, промышленные и бизнес новости, страницы профессионально-ориентированных Интернет-порталов, онлайн-конференции, форумы, блоги.
К сожалению, существующие инструментальные средства обладают рядом ограничений, которые существенно уменьшают область и эффективность их практического применения. Это связано с тем, что имеющиеся поисковые системы и системы документооборота, при наличии множества методов для работы с текстом документов (анализ ключевых слов, морфология, грамматика, шаблоны, таксономия и пр.), практически не способны работать со смыслом текста, не анализируют знания, представленные в текстовой форме, что и является главной неразрешенной проблемой анализа.
В то же время в практических задачах все чаще экспертов не устраивает единый стандартизованный механизм поиска и анализа, доступный на сегодняшний день для обработки электронных документов. Возникает необходимость индивидуализировать процесс анализа, сделав его субъектно-ориентированным, принимая во внимание знания и цели самого эксперта.
Особенно востребована подобного рода задача в научно-промышленных исследованиях при работе с профессиональными знаниями, которые отличает целевая направленность документа, узкоспециализированная предметная область, сжатость и информативность текста.
Для решения задачи интеграции профессиональных знаний необходимы возможность представлять имеющуюся текстовую информацию в формализованном виде, механизмы поиска и сравнения семантики документов, возможность классификации согласно содержащимся в них знаниях, интерактивное взаимодействие с экспертом при построении модели предметной области, и даже механизмы автоматизированного уточнения модели на основе результатов анализа.
В области теории и практики работы со знаниями с помощью вычислительной техники накоплен значительный положительный опыт. Вопросы построения содержательных онтологий для моделирования реальности отражены в трудах отечественных ученых Т.А. Гавриловой, В.В. Девяткова, Г.Б. Евгенева, Г.С. Поспелова, Д.А. Поспелова, В.Ш. Рубаш-кина, В.А. Виггиха, A.B. Смирнова, C.B. Смирнова, В.Ф. Хорошевского, Г.П. Щедровиц-кого, а также многих зарубежных специалистов: T.R. Gruber, N. Guarino, J.F. Sowa, M. Uschold, B.J. Wielinga и др.
К работам, характеризующим предысторию развития, современное состояние и тенденции в области обработки естественно-языковых текстов можно отнести фундаментальные исследования Т. Винограда, Н. Хомского, Р. Шенка, В. Гумбгольдта, Ч. Филлмо-ра и др.
Среди российских работ можно выделить труды Ю.Д. Апресяна, Б.Ю. Городецкого, Ю.А. Загорулько, H.H. Леонтьевой, Н.В. Лукашевич, М.Г. Мальковского, И.А. Мельчука, A.C. Нариньяни, Г.С. Осипова, Э.В. Попова, В.А. Тузова, С.Д. Шелова и др.
В области кластеризации данных - труды И.З. Батыршина, Ж. Бола, В.Н. Вагина, Б. Дюрана, В.И. Городецкого, Н.Г. Загоруйко, Дж. Вэн Райзина, R. Agrawal, A. Maedche и др.
Необходимо также отметить, что данная диссертационная работа базируется на работах В.А. Виттиха, сформулировавшего принципы онтологического анализа и синтеза, применяемые в процессе познания, и П.О. Скобелева, выработавшего принципы создания открытых мультиагентных систем для поддержки процессов принятия решения в сложных системах.
Но, несмотря на актуальность методов по работе со знаниями и обработке текстов на естественном языке, нужно отметить, что известные публикации в большинстве своем носят либо концептуальный характер и не предлагают конструктивных подходов, либо относятся к частным методам (например, построение тезаурусов, работа с шаблонами, кластеризация числовых полей и др.).
В то же время с точки зрения инструментальных средств ситуация значительно хуже. Не только не существует единой инструментальной среды, обеспечивающей все шаги процесса интеграции и приобретения знаний, но и имеющиеся системы, ориентированные на решение подзадач, обладают целым рядом ограничений, существенно уменьшающих эффективность их практического использования.
Рассматривались такие алгоритмы и системы, как ASUIM, Chameleon, ConExt, DOE, KEA, LTG, OntoLearn, Promethee, SIMER+MIR, SOAT, SubWordNet, SVETLAN, TFIDF,
TERMINAE, Welkin для задач автоматизированного построения/поддержки онтологий, HPSG, SFG, LFG, SAM, ПОЭТ, ИВОС, InterBase, KRITON, ТАКТ, DocMiner, Enkata, In-tellexer, Inxight, Ontos, Text Analyst, SAS Text Miner, Clearforest, dtSearch, TEMIS, Vantage-Point - для анализа текстов на естественном языке, LSA/LSI, STC, Bayesian classifiers, Single Link, Complete Link, Group Average, Scatter/Gather, K-means, CI, Concept vector-based clustering, SOM, Clusty, Quintura, Nigma, Vivísimo Search Platform, iBoogie, CarrotSearch -для кластеризации документов.
К сожалению, для каждой группы программных систем можно выделить ряд принципиальных недостатков, включая необходимость существенной ручной предобработки данных человеком-экспертом; невозможность анализа всего набора текстов с точки зрения семантики предметной области; зависимость качества результатов от языка документов; отсутствие открытой модели предметной области, позволяющей в полной мере использовать знания эксперта и пополнять ее в процессе работы; ограниченность работы с семантическими сетями; непрозрачность и неинтерактивность алгоритмов; критичность к наличию «мусорной информации»; зависимость качества результатов от изначальной предпосылки - догадки о «правильной структуре»; нетерпимость к наличию неполной или противоречивой информации.
Поэтому задача интеграции знаний по-прежнему является актуальной, и разработка инструментальной системы для интеграции профессиональных научно-технических знаний, представленных на естественном языке, представляется важной задачей для данной диссертационной работы.
Предмет исследования составляют процессы обработки информации, направленные на интеграцию научно-технических знаний.
Цель исследования состоит в разработке теоретических основ и инструментальных программных средств для решения проблемы интеграции научно-технических профессиональных знаний, представленных в виде текстов на естественном языке, в сфере промышленного проектирования и производства.
Для достижения поставленной цели в работе решаются следующие задачи: 1. Построить обобщенную логическую модель приобретения научно-технических знаний, позволяющую формализовать и применять знания эксперта с учетом промышленной и производственной специфики; разработать принципы онтологического подхода, позволяющего реализовать все этапы процесса приобретения и интеграции знаний в рамках единой методологии и концептуальной модели (онтологии).
2. Разработать метод автоматизированного конструирования начальной онтологии предметной области.
3. Разработать метод понимания научно-технических текстов на естественном языке в виде преобразования электронных текстовых документов в семантическую сеть в терминах онтологии предметной области с целью представления семантики документа.
4. Разработать методы получения, анализа и обработки научно-технической информации, представленной в виде семантической сети, в том числе механизмы сравнения, поиска, структурирования и классификации с помощью кластерного анализа.
5. Разработать метод самокоррекции и саморегуляции системы путем автоматизированного уточнения и пополнения знаний, представленных в терминах онтологии.
6. Разработать архитектуру системы и программно-инструментальную среду для работы со знанием, реализующую предложенные методы.
7. Выработать критерии оценки и провести исследование параметров и качественных характеристик разработанных методов и средств работы со знаниями, выработать рекомендаций по их применению.
8. Оценить эффективность предложенных методов и средств при решении ряда практических задач в сфере промышленного проектирования и производства и других применениях.
Методы исследования. Использованы теория и методы системного анализа, компьютерной лингвистики, эпистемологии, теории кластерного анализа, методы конструирования онтологий, теории графов, математической статистики, проектирования систем баз данных и знаний, структурного и объектно-ориентированного проектирования и программирования.
Научная новизна выполненных исследований заключается в развитии теоретических основ построения систем извлечения знаний и обработки неструктурированной информации на естественном языке:
• Новизна предложенного онтологического подхода к решению задачи интеграции профессиональных научно-технических знаний состоит в использовании единой методологии, основанной на концептуальной модели эксперта, для реализации всех шагов цикла приобретения и интеграции знаний, что обеспечивает индивидуализацию процесса и учет целей эксперта.
• Новизна предложенного метода автоматизированного построения онтологии предметной области заключается в итеративном анализе строящейся онтологии с помощью предложенного мультиагентного метода понимания текстов на естественном языке с применением базовой онтологии языка и набора предметно-ориентированных текстов, что обеспечивает механизмы самокоррекции и саморегуляции в процессе построения начальной онтологии предметной области.
• Новизна предложенного метода преобразования неструктурированной информации на естественном языке в семантическую сеть в терминах онтологии предметной области заключается в применении механизмов агентного взаимодействия квантов знаний, позволяющих реконструировать смысл предложения и всего документа, что дает возможность представлять смысл научно-технического текста в виде семантических сетей, обеспечивает механизмы уточнения семантики в режиме реального времени по мере поступления новой информации и предоставляет механизмы сравнения семантики связных профессиональных текстов.
• Новизна предложенного метода кластерного анализа состоит в реализации его на основе агентных механизмов переговоров, что обеспечивает механизмы динамической иерархии групп семантически схожих объектов как в пакетном режиме, так и в режиме реального времени, а также дает возможность работы с неструктурированными квантами информации, представленными в виде семантических сетей.
• Новизна метода автоматизированного пополнения онтологии состоит в использовании мультиагентного кластерного анализа групп семантически схожих документов для выявления закономерностей, позволяющих уточнять онтологию предметной области, улучшая качество представления, поиска и анализа документов.
• Новым является предложенная архитектура инструментальной среды онтологического анализа и синтеза, основанная на субъектно-ориентированной модели приобретения знания с применением агентных взаимодействий, и заключающаяся в совместном использовании агентных механизмов работы со знанием на естественном языке и мультиагентного кластерного анализа, что обеспечивает полный цикл приобретения и интеграции знаний, необходимый для эффективного и оперативного использования научно-технической информации.
Практическая значимость. Научные результаты работы явились основой создания инструментальной среды онтологического анализа и синтеза, включающей подсистемы формирования, накопления, использования, анализа и пополнения разнородных знаний, необходимые для решения прикладных задач в сфере промышленного производства; предложены адекватные этим целям инструментальные программные средства.
Созданные программные инструментальные средства для реализации методов автоматизированного конструирования онтологий, обработки и представления информации, анализа результатов и пополнения знаний применяются в задачах мониторинга проектноконструкторской информации в Интернет, логистики, поисковых и метапоисковых системах, системах классификации документооборота, онлайн-анализа и других применениях, поскольку использование созданного инструментария повышает скорость анализа и обработки информации, сокращает стоимость и сроки работ, увеличивает производительность и функциональность используемых систем.
Разработанные инструментальные средства имеют открытую архитектуру, гибкие механизмы импорта\экспорта, прозрачную процедуру настройки на любую предметную область посредством адаптации онтологии без необходимости изменения программного кода, что делает систему доступной экспертам предметных областей и открывает широкие перспективы как интеграции разработанных программных средств с имеющимся инструментарием, так и использования системы в тех научно-технических задачах, где актуальна проблема эффективного и оперативного анализа и приобретения научно-технических знаний, представленных в виде текстов на естественном языке.
Реализация работы. Результаты диссертационной работы нашли применение при выполнении научно-исследовательских работ:
- по Комплексной программе фундаментальных исследований РАН по проблемам машиностроения, механики и процессов управления 2004-2006 гг. (раздел VI, тема «Онтологический анализ и синтез в процессах принятия решений», гос. per. №0120.0403300);
- по Комплексной программе фундаментальных исследований РАН по проблемам машиностроения, механики и процессов управления 2000-2003 гг. (раздел III «Управление и автоматизация», тема «Разработка основ теории управления сложными открытыми системами с применением компьютерного представления и обработки знаний», гос. per. №0120.0110152);
- по Комплексной программе фундаментальных исследований РАН по проблемам машиностроения, механики и процессов управления 1996-2000 гг. (п. 3.1.2 «Разработка моделей управляемых процессов, методов прогнозирования экономической эффективности и социальных последствий», тема «Разработка методов и средств построения теорий артефактов для компьютерной интеграции знаний и автоматической генерации моделей объектов управления», гос. per. № 01.9.60002398).
Прикладные разработки, связанные с проведением онтологического анализа и онтологического синтеза систем и созданием предметно-ориентированных пакетов прикладных программ выполнялись как в рамках перечисленных научных программ, так и по договорам с предприятиями на проведение НИОКР:
- с ФГУП ГНПРКЦ «ЦСКБ-ПРОГРЕСС» по созданию системы интеллектуального ме-тапоиска в сети Интернет для оперативного нахождения и мониторинга релевантной информации в области малых космических аппаратов (2007 г.);
- с ООО «Научно-производственная компания «Маджента Девелопмент», г. Самара (1999-2007 гг.), при разработке систем извлечения знаний и понимания текстов на естественном языке;
По результатам разработок подготовлен учебный курс «Мультиагентные системы», включающий цикл методических пособий и лабораторных работ, внедренный в учебный процесс в Самарском государственном аэрокосмическом университете и Поволжской государственной академии информатики и телекоммуникаций.
Апробация. Основные положения и результаты работы докладывались и обсуждались на международных и национальных конференциях и семинарах, в том числе: I-IX Международных конференциях по проблемам управления и моделирования сложных систем (Самара, 1999 - 2007), 2-м Международном семинаре «Автономные интеллектуальные системы: извлечение знаний из данных и интеллектуальные агенты» (AIS-ADM 07, Санкт-Петербург), 6-й Международной конференции по телекоммуникациям и информатике (WSEAS TELEINFO '07 Даллас, США), 5-й Международной объединенной конференции по автономным агентам и мультиагентным системам (AAMAS-06, Хакодате, Япония), 1-й Международной конференции «Бизнес: информация, организация и менеджмент» (ВЮРоМ 2006, Лондон, Великобритания), Международной научной конференции «Интеллектуальные системы принятия решений и прикладные аспекты информационных технологий» (ISDMIT'2005, Херсон), Международной конференции «ИТ в бизнесе» (ITIB2005, Санкт-Петербург), Международной конференции по развитию инфраструктуры электронного бизнеса, науки, образования и медицины в Интернет (Аквила, Италия, 2002), 3-м Международном семинаре по новым информационным технологиям (CSIT'2001, Уфа), VII Национальной конференции по искусственному интеллекту (Пере-славль-Залесский, 2000).
Публикации. По теме диссертации опубликовано самостоятельно и в соавторстве свыше 50 работ, в том числе в перечне, рекомендованном ВАК - 13; а также 3 авторских свидетельства об официальной регистрации программ для ЭВМ. Опубликованные материалы отражают основное содержание диссертации.
Структура и объем работы. Диссертация состоит из введения, пяти разделов, заключения, приложений и списка использованных источников, содержащего 256 наименований. Основная часть работы содержит 332 страницы, включая 111 рисунков и 13 таблиц.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Онтолого-семантические модели в корпоративных системах управления знаниями2007 год, доктор технических наук Тузовский, Анатолий Федорович
Методы и средства предикатно-онтологического контроля семантики проектных задач и проектных решений2010 год, кандидат технических наук Шамшев, Алексей Борисович
Интеллектуализация управления бизнес-процессами предприятия2007 год, кандидат технических наук Жебрун, Николай Николаевич
Методы и программные средства для анализа документов на основе модели предметной области2006 год, кандидат физико-математических наук Сидорова, Елена Анатольевна
Модели, методы и программные средства для построения интегрированных экспертных систем2004 год, доктор технических наук Рыбина, Галина Валентиновна
Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Минаков, Игорь Александрович
Основные результаты и выводы к разделу 5
1. На основе разработанных методов и средств создан ряд прикладных промышленных систем для применения в задачах логистики, поисковых и метапоисковых системах, системах классификации документооборота, онлайн анализе покупателей сайта, электронной коммерции и других. Полученный опыт свидетельствует, что разработанные методы и средства позволяют эффективно решать задачи анализа и извлечения знаний из естественно-языковых текстов, а использование созданного инструментария повышает производительность труда, сокращает стоимость и сроки разработки, а также упрощает процессы интеграции и сопровождения рассматриваемых систем.
2. В задаче интеграции информационных служб промышленных бизнес-компаний показано, что предложенный подход позволяет автоматизировать процесс регистрации новых форматов обмена данными и ускорить процесс интеграции форматов за счет использования единого формата представления знаний, что дает возможность автоматически строить схемы перевода из вновь зарегистрированного формата в любой из уже зарегистрированных в системе, метод автоматизированного построения онтологии и понимания текстов позволяет ускорить процесс распознавания новых форматов, а методы кластеризации и пополнения онтологии могут использоваться для решения задачи очистки данных в режиме реального времени.
3. При решении задачи интеллектуального поиска информации в области современных биотехнологий показано, что при сравнении результатов системы со статьями, вручную проверенными и отобранными экспертами, предложенный подход позволяет добиться точности от 82 до 90% в отборе правильных рефератов (зависит от типа запроса), и порядка 5-8 % ошибки в процессе отсечения неправильных. На выполнение конкретного практического задания заказчиков-биологов по оценке
310 вручную требовалось порядка 4 человеко-лет, с помощью разработанной системы удалось решить задачу за 8 человеко-месяцев, т.е. более, чем в 6 раз быстрее, тем самым высвободив ценные человеческие ресурсы и сэкономив значительные средства.
4. В задаче классификации профессиональных, деловых, и научно-технических документов по предварительным оценкам страховой фирмы-заказчика, на решение задачи классификации и формирования шаблонов групп документов должно было потребоваться порядка 16 человеко-лет. С помощью разработанной системы задачу удалось решить в 30 человеко-месяцев - 6.5 раз быстрее (при пересчете на сэкономленные средства эта цифра преобразуется в существенную экономическую прибыль).
ЗАКЛЮЧЕНИЕ
В диссертации решена научная проблема разработки и развития теоретических основ и инструментальных программных средств для решения проблемы интеграции профессиональных знаний, представленных в виде текстов на естественном языке, с целью индивидуализации процесса приобретения и анализа знаний.
Сущность предложенного подхода состоит в использовании единого онтологического подхода в рамках субъектно-ориентированной модели приобретения знаний для индивидуализации процесса представления и анализа знаний для эксперта предметной области, и использовании мультиагентного подхода для реализации основных блоков инструментальной среды онтологического анализа и синтеза.
Основные научные и практические результаты работы состоят в следующем:
1. Предложен подход к задаче интеграции профессиональных знаний, ориентированный на субъекта исследования и реализуемый на основе использования онтологии предметной области, индивидуально подстраиваемой под субъекта, и автоматизировано сконструированной с помощью имеющихся материалов и знаний эксперта о предметной области, предоставляющий универсальный механизм для работы со знаниями.
2. Предложен принцип построения инструментальной среды онтологического анализа и синтеза, базирующийся на агентных взаимодействиях и заключающийся в совместном использовании агентных механизмов работы со знанием на естественном языке и мультиагентного кластерного анализа, что обеспечивает полный цикл при обретения знаний, необходимый для эффективного и оперативного использования информации.
3. Предложен метод автоматизированного построения начальной онтологии, реализующийся путем итеративного анализа строящейся онтологии с помощью предложенных методов понимания текстов на естественном языке с применением базовой / онтологии и набора предметно-ориентированных текстов, позволяющий оперативно получать начальное формализованное знание о предметной области.
4. Предложен метод представления неструктурированной информации на естественном языке, заключающийся в применении механизмов агентного взаимодействия квантов знаний, позволяющих реконструировать смысл предложения, и использовании построенных онтологии для хранения межфразового контекста в виде семантических дескрипторов.
5. Предложен метод кластерного анализа, реализованный на основе агентного взаимодействия, что обеспечивает механизмы динамической иерархии групп семантически схожих объектов как в пошаговом, так и в пакетном режимах, а также дает возможность работы с неструктурированными квантами информации.
6. Предложен метод машинного обучения системы в форме автоматизированного пополнения онтологии новыми знаниями на основе зависимостей, найденных в процессе анализа выявленных групп кластеров, что дает возможность уточнять знания о предметной области, улучшая качество представления, поиска и анализа документов.
7. Разработана и реализована инструментальная среда онтологического анализа и синтеза, где инструментарий инженерии знаний включает в себя конструктор он-тологий, автоматизированную систему построения онтологий, систему понимания текста на естественном языке, систему извлечения знаний, модуль пополнения онтологических знаний и ряд дополнительных модулей, включая отладочную систему, интерфейсы работы с базами данных и внешними приложениями.
8. Проведены экспериментальные исследования реализационных характеристик разработанных методов и средств, выработано порядка 50 рекомендаций по применению предлагаемых алгоритмов. Исследования подтвердили эффективность предлагаемых методов, в частности было показано, что начальное автоматизированное построение онтологии позволяет сконструировать от 60 до 85% онтологии, представление текста в виде семантического дескриптора остается корректным примерно в 85-90% случаев, кластерное извлечение знаний формулирует до 22-27% значимых правил, при этом порядка 10-12% являются неизвестными для экспертов предметных областей, а пополнение онтологий позволяет дополнительно расширить начальную онтологию до 32% от первоначального объема.
9. На основе разработанных методов и средств создан ряд прикладных промышленных систем для применения в задачах мониторинга информации в области малых космических аппаратов, логистики, поисковых и мета-поисковых системах, системах классификации документооборота, семантическом анализе действий пользователя в режиме онлайн, электронной коммерции и других. Полученный опыт свидетельствует, что разработанные методы и средства позволяют эффективно решать задачи анализа и извлечения знаний из естественно-языковых текстов, а использование созданного инструментария повышает производительность труда, сокращает стоимость и сроки разработки, а также упрощает процессы интеграции и сопровождения рассматриваемых систем.
Список литературы диссертационного исследования доктор технических наук Минаков, Игорь Александрович, 2007 год
1. П.Андреев В.В., Ивкушкин К.В., Карягин Д.В., Минаков И.А., Ржевский Г.А., Пшеничников В.В., Симонова Е.В., Скобелев П.О. Основы построения мультиагентных систем. Ч. I. Уч. пособие // Самара: ПГАТИ, 2005. - 114 с.
2. Батищев С., Ивкушкин К., Минаков И., Ржевский Г., Скобелев П. Открытые мультиагентные системы для поддержки процессов принятия решений при управлении предприятиями // Изв. СНЦ РАН, январь июнь 2001. - Самара: СНЦ РАН, 2001. -С.71-79.
3. Батищев C.B., Лахин О.И., Минаков И.А., Ржевский Г.А., Скобелев П.О. Разработка мультиагентной системы дистанционного обучения для Интернет-портала «Оптик-сити» // Изв. СНЦ РАН. Самара: СНЦ РАН, 2003. Т.5, №1. - С.91-95.
4. Батищев C.B., Лахин О.И., Минаков И.А., Ржевский Г.А., Скобелев П.О. Разработка инструментальной системы для создания мультиагентных приложений в сети Интернет // Изв. СНЦ РАН. Самара: СНЦ РАН, 2001. Т.З. №1. - С. 131-135.
5. Виттих В.А., Минаков И.А. Интеграция профессиональных знаний: основные положения подхода // Проблемы управления и моделирования в сложных системах:
6. Тр. IX Междунар. конф., Самара, 22 июня 29 июня 2007. - Самара: СНЦ РАН, 2007. - С.191-197.
7. Вольман С.И., Минаков И.А. Применение методов извлечения знаний в задачах транспортной логистики // Проблемы управления и моделирования в сложных системах: Тр. VIII Междунар. конф., Самара, 24 июня 28 июня 2006. - Самара: СНЦ РАН, 2006. -С.516-521.
8. Кораблин М.А., Минаков И.А. Эволюционные алгоритмы в имитационном моделировании // Проблемы управления и моделирования в сложных системах: Тр. междунар. конф. Самара: СНЦ РАН, 1999. - С. 45-50.
9. Минаков И.А. Автоматизированное пополнение онтологии на основе знаний, извлеченных в процессе кластеризации // Вестник Самар. гос. техн. ун-та. Серия «Технические науки». Самара: СамГТУ, 2005. Вып. 33. - С. 321-326.
10. Минаков И.А. Архитектура инструментальной среды, ориентированной на решение задач извлечения знаний и понимания текста на естественном языке // Вестник Самар. гос. техн. ун-та. Серия «Технические науки», Самара: СамГТУ, 2005. Вып. 32. -С.12-19.
11. Минаков И.А. Разработка автоматизированной системы построения онтологии предметной области на основе анализа текстов на естественном языке // Вестник Самар. гос. техн. ун-та. Серия «Технические науки». Самара: СамГТУ, 2004. Вып. 20. - С. 44-48.
12. Минаков И.А. Интеграция профессиональных знаний, представленных в виде текстов на естественном языке // Вестник Самарского гос. техн. ун-та. Серия «Технические науки». Самара: СамГТУ, 2006. Вып. 41. - С. 18-25.
13. Минаков И.А. Интеграция профессиональных знаний: методы и средства // Проблемы управления и моделирования в сложных системах: Тр. IX Междунар. конф. Самара, 22 июня 29 июня 2007. - Самара: СНЦ РАН, 2007. - С. 498-510.
14. Минаков И.А. Кластеризация неструктурированной информации, представленной в виде текстов на естественном языке // Вестник Самарского гос. техн. ун-та. Серия «Технические науки». Самара: СамГТУ, 2006. Вып. 40. - С. 15-22.
15. Минаков И.А. Онлайн-анализ пользователей Интернет-портала продажи «горящих» авиабилетов //Информационные технологии, 2006. № 1. С.62-68.
16. Минаков И.А. Сравнительный анализ некоторых методов случайного поиска и оптимизации // Изв. СНЦ РАН. Самара: СНЦ РАН, № 2. 1999. - С.286-293.
17. Свидетельство о регистрации программы № 2004610966 от 20 апреля 2004 г. Мультиагентная система извлечения знаний методом кластеризации // С.й. Вольман, Д.В. Карягин, И.А. Минаков, Г.А. Ржевский П.О. Скобелев.
18. Свидетельство о регистрации программы № 2004610968 от 20 апреля 2004 г. Инструментальная система конструирования мультиагентных систем для десктопных приложений //В.В. Андреев, К.В. Ивкушкин, И.А. Минаков, Г.А. Ржевский, А.В. Сафронов, П.О. Скобелев.
19. Свидетельство о регистрации программы № 2004610970 от 20 апреля 2004 г. Мультиагентная система понимания текстов на естественном языке //В.В. Андреев, И.А. Минаков, Г.А. Ржевский, П.О. Скобелев, М.С. Томин.
20. Batishev S.V., Ivkushkin C.V., Minakov I.A., Rzevski G.A., Skobelev P.O. A Multi-Agent Simulation of Car Manufacturing and Distribution Logistics // Proc. of the II International
21. Conference "Complex Systems: Control and Modelling Problems", Samara, Russia, June 2023, 2000, pp. 100-104.
22. Minakov I., Tomin M., Volman S. Development of Multiagent Internet Meta-Search Engine // Международная конференция «ИТ в бизнесе» (ПТВ), Санкт-Петербург, 14-17 июня 2005 г. http://itib.fmec.ru/ru/05/
23. Абдеев Р.Ф. Философия информационной цивилизации. М.: ВЛАДОС, 1994. 336 с.
24. Алексеев П.В., Панин A.B. Теория познания и диалектика. Москва: Высшая школа, 1991.-383 с.
25. Аналитические бизнес-решения www.anbr.ru
26. Анфилатов B.C., Емельянов A.A., Кукушкин A.A. Системный анализ в управлении -- М.: Финансы и статистика 2002. 368 с.
27. Апресян Ю.Д., Богуславский И.М., Иомдин JI.JT. и др. Лингвистическое обеспечение системы ЭТАП-2. -М.: Наука, 1989.-231 с.
28. Апресян Ю.Д. Экспериментальное исследование семантики русского глагола. М.: Наука, 1967.-251 с.
29. Апресян Ю.Д., Богуславский И.М., Иомдин JI.JT. и др. Лингвистический процессор для сложных информационных систем. М.: Наука, 1992. - 256 с.
30. Баженов Л. Б. Обладает ли наука особым эпистемологическим статусом? // Вопросы философии. 1988. № 7.
31. Бельнап Н., Стил Т. Логика вопросов и ответов. М.: Прогресс. 1981. - 288 с.
32. Брябрин В.М., и др. ДИЛОС диалоговая система для взаимодействия с ЭВМ на естественном языке. - М.: Изд. ВЦ АН СССР, 1979.
33. Бухараев Р.Г., Сулейманов Д.Ш. Семантический анализ в вопросно-ответных системах. Казань: Изд. КГУ. 1990. - 124 с.
34. Бэкон Ф. Новый Органон // Соч.: В 2 т. М., 1972. Т. 2. - С. 27-28.
35. Вейценбаум И. Понимание связного текста вычислительной машиной // Распознавание образов: Исследование живых и автоматических распознающих систем. -М.: Мир, 1970. С.214-245.
36. Виноград Т. Программа, понимающая естественный язык. М.: Мир, 1976. - 296 с.
37. Виттих В.А. Знания, основанные на понимании, в процессах принятия решений // Проблемы управления и моделирования в сложных системах: Тр. VI Междунар. конф. Самара: СНЦ РАН , 2004. - С. 37-44.
38. Виттих В.А. Инженерная эпистемология // Проблемы управления и моделирования в сложных системах: Тр. III Междунар. конф. Самара: СНЦ РАН , 2001. - С. 92-100.
39. Виттих В.А. Интеграция знаний при исследованиях сложных систем на основе инженерных теорий. // Известия РАН Теория и системы управления, 1998. №5.
40. Виттих В.А. Онтологии сложных систем организаций // Препринт ИПУСС РАН, №3,-Самара, 1998.- 15 с.
41. Виттих В.А. Онтологический анализ и синтез при управлении сложными открытыми системами // Проблемы управления и моделирования в сложных системах: Тр. V Междунар. конф. Самара: СНЦ РАН, 2003. - С.56-60.
42. Виттих В.А. Процессы управления в социо-технических системах // Проблемы управления и моделирования в сложных системах: Тр. VII Междунар. конф. -Самара: СНЦ РАН, 2005. С. 32-42.
43. Виттих В.А. Согласованная инженерная деятельность. Состояние, проблемы, перспективы // Проблемы машиностроения и надежности машин, 1997. №1. С. 6-15.
44. Виттих В.А. Управление открытыми системами на основе интеграции знаний. // Автометрия, 1998. № 3. С. 38 - 49.
45. Виттих В.А., Ржевский Г.А., Скобелев П.О. Мультиагентные модели взаимодействия в системах принятия решений // Проблемы управления и моделирования в сложных системах: Tp.IV Междунар. конф. Самара, 17-24 июня 2002. Самара: СНЦ РАН,2002.-С. 116-126.
46. Гаврилова Т. А. Онтологический подход к управлению знаниями при разработке корпоративных информационных систем // Новости искусственного интеллекта,2003. №2. С.24-30.
47. Гаврилова Т.А. Использование онтологий в системах управления знаниями, http:// big.spb.ru/publications/bigspb/km/useontologymsuz.shtml БИГ-Петербург, 2001.
48. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. СПб.: Изд-во «Питер», 2001. - 382 с.
49. Гарант-Парк-Интернет Технологии анализа и поиска текстовой информации. www.rco.ru
50. Городецкий Б. Ю. К созданию Машинного фонда русского языка (определение, применения, актуальные проблемы) // Машинный фонд русского языка: идеи и суждения. М., 1986.
51. Городецкий Б.Ю. Компьютерная лингвистика: моделирование языкового общения (Вступительная статья) // Новое в зарубежной литературе. М.: Прогресс. Вып. XXIV. Компьютерная лингвистика. - С. 5-31.
52. Городецкий В., Самойлов В., Малов А. Технология обработки данных для извлечения знаний: Обзор состояния исследований // Новости искусственного интеллекта, 2002. № 3-4.
53. Гумбольдт В. Избранные труды по языкознанию. М., 1984. - 244 с.
54. Дударь З.В., Шуклин Д.Е. Семантическая нейронная сеть, как формальный язык описания и обработки смысла текстов на естественном языке // Радиоэлектроника и информатика. Харьков: Изд-во ХТУРЭ, 2000. №. 3. - С. 72-76.
55. Ермаков А.Е. Неполный синтаксический анализ текста в информационно-поисковых системах // Компьютерная лингвистика и интеллектуальные технологии: Тр. Междунар. семинара Диалог'2002. В двух томах. Т.2. "Прикладные проблемы". М., 2002.-С. 180-185.
56. Жигалов В.А., Соколова Е.Г. InBASE: технология построения ЕЯ интерфейсов к базам данных // Тр. Междунар. семинара Диалог'2001 по компьютерной лингвистике. Т. 2, Аксаково, июнь 2000. М., 2000. - С. 123-135.
57. Забежайло М.И. Data Mining and Knowledge Discovery in Data Bases: Предметная область, задачи, методы и инструменты // 6 Нац. конф. с междунар. участием, Пущино, 5-11 октября 1998: Сб. науч. тр. в 3 т. Т. 2. Пущино, 1998. - С. 592 - 600.
58. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд-во Ин-та матем., 1999. - 270 с.
59. Загорулько Ю.А. Методы представления и обработки знаний: Семантические сети и системы продукций: методическое пособие. Изд-во НГУ. Новосибирск, 1996. 46 с.
60. Загорулько Ю.А., Попов И.Г., Щипунов В.В. Интегрированная технологическая среда для создания систем обработки знаний // Известия РАН. Теория и системы управления. № 5, 1995. С.210-213.
61. Зализняк A.A. Грамматический словарь русского языка: словоизменение. М.: Русский язык, 1987. - 879 с.
62. Ильин В.В. Теория познания. Эпистемология. М.: Изд-во МГУ, 1974. - 136 с.
63. Интеллектуальная поисковая система Nigma, http://nigma.ru
64. Капица П.Л. Эксперимент. Теория. Практика. М.: Наука, 1981.-351 с.
65. Кириченко К.М, Герасимов М.Б. Обзор методов кластеризации текстовой информации. http://www.dialoR-21 .ru/Archive/2001/volume2/2 26.htm
66. Кузин Л.Т., Преображенский А.Б., Хорошевский В.Ф. и др. Разработка и исследование методов построения интеллектуальных вопрос-ответных систем (проект МИВОС). Отчет о НИР. -М.: МИФИ, 1977.-291 с.
67. Кутепов В. П. Проблема и задача в системе познания. Фрунзе, 1988.
68. Леонтьева H.H. Строение семантического компонента в информационной модели автоматического понимания текста. Автореф. дис. д-ра техн. наук. М., 1990.
69. Леонтьева H.H. Автоматическое понимание текстов: системы, модели, ресурсы. М.: Издательский центр «Академия», 2006.
70. Линник Ю. В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений. М.: Физматгиз, 1962. - 352 с.
71. Мальковский М.Г. Программно-информационное обеспечение адаптивных систем общения с ЭВМ на естественном языке. М.: МГУ. Дис. д-ра физ.-мат. наук. 1990.
72. Мельчук И.А. Опыт теории лингвистических моделей типа «Смысл Текст». - М.: Наука, 1974.-314 с.
73. Минский М. Фреймы и представление знаний. М.: Энергия, 1979. - 151 с.
74. Молчанов В. И. Время и сознание. Критика феноменологической философии. М.: Высшая школа, 1988. - 144 с.
75. Назаров А.И. Обобщенная модель познавательной деятельности индивида // Психологическая наука и образование. 2000. №3. С. 40-60.
76. Нариньяни A.C. Проблема понимания ЕЯ-запросов к базам данных решена // В сб. тр. Междунар. семинара «Диалог-95 по компьютерной лингвистике и ее приложениям», Казань, 31 мая 4 июня, 1995 г. - Казань, 1995. - С. 206-215.
77. Нариньяни A.C., Лингвистические процессоры ЗАПСИБ (1-я и 2-я части). Препринт ВЦ СО АН СССР, N 199,1979.
78. Николис Г., Пригожин И. Самоорганизация в неравновесных системах: от диссипа-тивных структур к упорядоченности через флуктуации. -М.: Мир, 1979. 512 с.
79. Новые идеи в математике. Сб. № 1. СПб., 1913. - С. 87.
80. Обработка текста и когнитивные технологии: Сб. / Под ред. В.Д. Соловьева Пущино, 1999. Вып. 3.-304 с.
81. Овдей О.М., Проскудина Г.Ю. Обзор инструментов инженерии онтологий // Электронные библиотеки. 2004. №4http://www.impb.ru/~rcdl2004/ cgi/get paper pdf. cgi?pid=26
82. О'Лири Управление корпоративными знаниями // Открытые системы, 1998. №4-5, -с.31-39.
83. Осипов Г.С. Приобретение знаний интеллектуальными системами. М.: Наука, 1997. -112с.
84. Осипов Г.С. Построение баз знаний на основе взаимодействия полуавтоматических методов приобретения знаний. II. Модель знаний и приобретение знаний. // Изв. РАН, Теория и системы управления, 1995, №5.
85. Попов Э.В. Естественно-языковые системы: прошлое, настоящее и будущее // 7 Нац. конф. по искусст. интеллекту с междунар. участием, КИИ'2000, Переславль-Залесский, 24-27 октября 2000: Тр. конф. Т. 1. М.: ИФМЛ, 2000. - С. 17.
86. Попов, Э.В. Общение с ЭВМ на естественном языке. М.: Наука, 1982. - 360 с.
87. Поспелов Д.А. Моделирование рассуждений. Опыт анализа мыслительный актов. -М.: Радио и связь, 1989. 184 с.
88. Поспелов Д.А. Ситуационное управление: теория и практика. М.: Наука, 1986, -284 с.
89. Пригожин И., Стенгерс И. Порядок из хаоса. М.: Эдиториал, 2000. - 310 с.
90. Рубашкин В.1П. Представление и анализ смысла в интеллектуальных информационных системах. -М.: Наука, 1989. 192 с.
91. Рузавин Г.И. Концепции современного естествознания. М.: ЮНИТИ, 1999. - 287 с.
92. Рузавин Г.И. Методология научного исследования. М.: ЮНИТИ, 1999. - 317 с.
93. Савин Е.Ю. Понимание как форма познавательной активности субъекта: Опыт субъекта в понимании. Калуга, 1996.
94. Семенова С.Ю. Поиск параметрической информации в тексте: алгоритмический и лексикографический аспекты // Тр. Междунар. семинара Диалог'96 по компьютерной лингвистике и приложениям. М., 1996. - С. 227-230.
95. Скобелев П. О. Открытые мультиагентные системы для оперативной обработки информации в процессах принятия решений. Дис. д-ра техн. наук. Самара, 2003. 298 с.
96. Скобелев П.О. Виртуальные миры и интеллектуальные агенты для моделирования деятельности компаний. // Тр. 6-ой Национальной конф. ИИ-1998, 5-7 ноября 1998, -Пущино. Т 2. С. 714-719.
97. Скрэгг Р. Семантические сети как модели памяти. // Новое в зарубежной лингвистике. Вып. XII. М: Прогресс, 1983. - С. 144-154.
98. Смирнов A.B. Логика смысла: Теория и ее приложение к анализу классической арабской философии и культуры / РАН. Ин-т философии. М. :Языки славян, культуры, 2001. - 504 с.
99. Смирнов C.B. Онтологический анализ предметных областей моделирования // Изв. СНЦ РАН. Самара, 2002. Т. 3. №1. - С. 62-70.
100. Смирнов C.B. Онтологический анализ в системах компьютерного моделирования: дис. . д-ра техн. наук. Самара, 2002. - 348 с.
101. Солтон Дж. Динамические библиотечно-информационные системы. М.: Мир, 1979. - 560 с.
102. Сулейманов Д.Ш. Аналитический обзор отечественных и зарубежных работ обработки естественного языка в аспекте прагматически-ориентированного подхода. // Информационные технологии. Казань: Изд-во Казанского гос. техн. ун-та, 1999.
103. Тузов В. А. Языки представления знаний. СПб.: Изд-во СПбГУ. 1990. - 120 с.
104. Филлмор Ч. Фреймы и семантика понимания //НЗЛ. Вып. XXIII. М., 1988. - С. 5290.
105. Финн В.К. Интеллектуальные системы: проблемы их развития и социальные последствия Будущее искусственного интеллекта. - М.: Наука, 2000. - 309 с.
106. Хакен Г. Синергетика: Иерархия неустойчивостей в самоорганизующихся системах и устройствах. М.: Мир, 1985. -423 с.
107. Хомский Н. Язык и мышление. -М.: Изд-во МГУ, 1972. 253 с.
108. Хорошевский В.Ф. OntosMiner: семейство систем извлечения информации из мультиязычных коллекций документов // Девятая Национальная конф. по искусственному интеллекту с международным участием КИИ-2004. Тр. конф. М.: Физматлит, 2004. Т.2. - С.573-581.
109. Чистякова Г.Д. Формирование предметного кода как основы понимания текста // Вопросы психологии. 1981. № 4.
110. Шаров С.А. Средства компьютерного представления лингвистической информации. Обзор, http://www.kcn.ru/tat en/science/ittc/vol000/002/
111. Шелов С.Д., Определение терминов и понятийная структура терминологии. СПб.: Изд-во СПбГУ. 1998.
112. Шенк Р. Обработка концептуальной информации. М.: Энергия, 1980. - 361 с.
113. Щедровицкий Г.П. Философия. Наука. Методология. М., 1997. - 368 с.
114. Adriaans P, Zantinge D. Data Mining. Addisson-Wesley, 1996.
115. Amit Singhal, Mandar Mitra, and Chris Buckley.Learning routing queries in a query zone // In Proc. of the SIGER'97, July 1997. P. 25-32.
116. Apte C., Damerau F., and Weiss S.M. Towards language independent automated learning of text categorization models. In Proc. 17th Int'l Conference on R&D in IR (SIGIR), 1994. P. 23-30.
117. Autonomy Portal-in-a-box www.autonomy.com
118. Baker Douglas L. and Kachites Andrew McCallum. Distributional clustering of words for text classification. In Proceedings of the SIGm.'98, 1998. P. 96-103.
119. Bernaras A., Laresgoiti I. & Corera J. (1996), Building and Reusing Ontologies for Electrical Network Applications, in W. Wahlster, ed., 'ECAI96 Proceedings', John Wiley&Sons P. 298-302.
120. Berners-Lee, Т., Hendler, J. & Lassila, O. The Semantic Web. Scientific American, May 2001.
121. Borst P. Construction of Engineering Ontologies for Knowledge Sharing and Reuse, PhD thesis, Tweente University. 1997.
122. Bresnan J., editor. The Mental Representation of Grammatical Relations. MIT Press, Cambridge, Massachusetts. 1982.
123. Callan J. Learning while filtering documents. In Proc. of SIGER'98, Melbourne, Australia, 1998.-P. 224-231.
124. Chomsky N. Syntactic Structures. The Hague: Mounton. /Рус. пер.: Н.Хомский. Синтаксические структуры. В сб. «Новое в лингвистике», вып.2. Москва: Изд-во ин.лит., 1962.
125. Cristianini N. and Shawe-Taylor J. An introduction to support vector machines (and other kernel-based learning methods) Cambridge University Press 2000.
126. Croft W.B, Callan J., and Broglio J. Trec-2 routing and adhoc retrieval evaluation using the INQUERY system. Proceedings of the 2nd Text Retrieval Conference (TREC-2), 1994.
127. Dietr Merkl. A Handbook of Natural Language Processing: Techniques and Applications for the Processing of Language as Text, chapter Text data mining. Marcel Dekker, New York, 1998.
128. Ding Chris, Xiaofeng He, Hongyuan Zha, Ming Gu, and Horst Simon. Spectral min-max cut for graph partitioning and data clustering. Technical Report TR-2001-XX, Lawrence Berkeley National Laboratory, University of California, Berkeley, CA, 2001.
129. Douglass R. Cutting, David R. Karger, Jan O. Pedersen, and John W. Tukey, Scatter/Gather: A Cluster-based Approach to Browsing Large Document Collections, SIGER '92. 1992. P. 318 - 329.
130. Dubes Richard C. and Jain Anil K. Algorithms for Clustering Data, Prentice Hall, 1988.
131. Dumains Susan T., Furnas George W., Landauer Thomas K. Indexing by Latent Semantic Analysis. Bell Communications Research 435 South St. Morristown, NJ 07960. Richard Rashman: University Of Western Ontario. 1990.
132. El-Hamdouchi A. and P. Willet, Comparison of Hierarchic Agglomerative Clustering Methods for Document Retrieval, The Computer Journal, Vol. 32, No. 3,1989.
133. Farquhar A., Fikes R., Pratt W. & Rice J. Collaborative Ontology Construction for Information Integration, Technical Report KSL-95-63, Knowledge Systems Laboratory, Stanford University. 1995.
134. Fernandez-Lopez M., Gomez-Perez A. and Juristo N., METHODOLOGY: from ontological art towards ontological engineering. In: AAAI-97 Spring Symposium on Ontological Engineering, Stanford University, CA, USA (24-26 March 1997).
135. Foltz P.W. Using latent semantic indexing for information filtering. In ACM Conference on Office Information Systems (COIS), 1990. P. 40-47.
136. Fredrik Kilander, Eva Fehraeus, and Jacob Palme. PEFNA: The private filtering news agent. Technical report, Department of Computer and Systems Sciences, Stockholm University, February 1997.
137. Fuhr Norbert. Optimum polynomial retrieval funcions based on the probability ranking principle. ACM Transactions on Information Systems, 7(3):183-204, 1989.
138. Gavron J.M. et al, Processing English with a Generalised Phrase Structure Grammar. // Proc. 20th ACL. University of Toronto. 1982.
139. General Architecture for Text Engineering, http://www.gate.ac.uk/
140. Gentner, D. On relational meaning: The acquisition of verb meaning. Child Development, 49, 1998. P.988-998.
141. Gomez-Perez A. Manzano-Macho D.: A Survey of Ontology Learning Methods and Techniques. Deliverable 1.5, Onto Web Project, 2003.
142. Grishman Ralph, Discovery Methods for Information Extraction. Proc. Workshop on Spontaneous Speech Processing and Recognition, Tokyo, Japan, April 2003.
143. Gruber T.R. A translation approach to portable ontologies // Knowledge Acquisition. 1993. No.5(2). P. 199-220.
144. Gruber T. Onto lingua: A Mechanism to Support Portable Ontologies, Technical Report KSL-91-66, Knowledge Systems Laboratory, Stanford University. 1993.
145. Gruninger M. and Fox M.S., Methodology for the design and evaluation of ontologies. In: IJCAI95 Workshop on Basic Ontological Issues in Knowledge Sharing. Montreal, Canada (19-20 August 1995).
146. Guarino N., Masolo C. and Vetere G., OntoSeek: content-based access to the Web. IEEE Intelligent Systems (May/June 1999) P.70-80.
147. Guha Sudipto, Rastogi Rajeev, and Shim Kyuseok. CURE: An efficient clustering algorithm for large databases. In Proc. Of 1998 ACM-SIGMOD Int. Conf. on Management of Data, 1998.
148. Guha Sudipto, Rastogi Rajeev, and Shim Kyuseok. ROCK: a robust clustering algorithm for categorical attributes. In Proc. of the 15th Int'l Conf. on Data Eng., 1999.
149. Hahn U, Schulz S. Towards Very Large Terminological Knowledge Bases: A Case Study from Medicine. In Canadian Conference on AI 2000. P. 176-186
150. Hatzivassiloglou Vasileios, Gravano Luis, and Maganti Ankineedu. An investigation of linguistic features and clustering algorithms for topical document clustering. In Proc. of the SIGIR'2000, 2000.
151. Hearst M.A. Automatic acquisition of Hyponyms from large text corpora. In Proceedings of the Fourteenth International Conference on Computational Linguistic, Nantes, France, July 1992.
152. Hinrich Schütze, David A. Hull, Jan O. Pedersen: A Comparison of Classifiers and Document Representations for the Routing Problem. SIGIR 1995. P.229-237.
153. Hinrich Schütze, Christopher D. Manning and Prabhakar Raghavan. Introduction to Information Retrieval, Cambridge University Press. 2007.
154. Hung Chihli, Wermter Stefan, Smith Peter. Hybrid Neural Document Clustering Using Guided Self-Organization and WordNet. IEEE Intelligent Systems, Vol. 19, No.2. P. 6877.
155. Indeijit S. Dhillon and Dharmendra S. Modha. Concept Decompositions for Large Sparse Text Data using Clustering, Machine Learning, vol. 42:1, January, 2001. P.143-175.
156. Intelligent Miner for Text http://www-3.ibm.com/software/data/iminer/fortext/
157. International ISpell http://ftng-www.cs.ucla.edu/fmg-members/geoff7ispell.html
158. Inxight categorizer http://Avww.inxight.com/products/categorizer/
159. Karypis G., Han E.H., and Kumar V. Chameleon: A hierarchical clustering algorithm using dynamic modeling. IEEE Computer, 32(8):68-75, 1999.
160. Klein Michel. Change Management for Distributed Ontologies. PhD thesis, Vrije Universiteit Amsterdam, 2004.
161. Knight K. & Luk S. Building a Large Knowledge Base for Machine Translation, in 'AAAI94 Proceedings', 1994. -P. 773-778.
162. Knuth Donald, The Art of Computer Programming, vol. 3: Sorting and Searching», Addison-Wesley, 1973.
163. Lambrix, P., Habbouche, M. and Perez, M. Evaluation of ontology development tools for bioinformatics. Bioinformatics 19, 2003. P.1564-1571. http://www.ncbi.nlm.nih.gov/ entrez/query.fcgi?db=PubMed&cmd=Retrieve&dopt=Citation&list uids= 12912838
164. Landauer T., Foltz P., and Laham D. An introduction to latent semantic analysis. Discourse Processes, 1998. 25:259-284.
165. Lande D. Добыча знаний, CHIP Ukraine 10'2003.
166. Lenat D. & Guha R. Building Large Knowledge-Based Systems, Representation and Inference in the CYC Project, Addison Wesley. 1990.
167. Lewis David D. An evaluation of phrasal and clustered representations on a text categorization task. In SIGIR, 1992. P. 37-50.
168. Lewis David and Ringuette Marc. A comparison of two learning algorithms for text categorization. In Symposium on Document Analysis and Information Retrieval. University of Nevada, Las Vegas, 1994.
169. Lopez F. Overview of Methodologies for Building Ontologies. In: Proceedings of the IJCAI-99 workshop on Ontologies and Problem-Solving Methods, Stockholm, Sweden, August 2, 1999.
170. Maedche A, Staab S. (2004) Ontology Learning. Handbook on Ontologies, p.173-190.
171. Maedche A, Staab S. (2001) Ontology Learning for the Semantic Web. IEEE Intelligent Systems, Special Issue on the Semantic Web, 16(2).
172. Manning Christopher D., Schutze Hinrich. Foundation of Statistical Language Processing. MIT Press. 1999.
173. McCarthy John. Some expert systems need common sense. In Heinz Pagels, editor, Computer Culture: The Scientific, Intellectual and Social Impact of the Computer, volume 426. 1983. Available as http://www-formal.stanford.edu/imc/someneed.html
174. Megaputer Intelligence Text Analyst http.7/www.megaputer.com/products/ta/
175. Miller G. WordNet: An on-line lexical database. International Journal of Lexicography, 1990.
176. Minsky M. The Society of Mind //New York, 1986. 339 p.
177. Mitchell T. Machine Learning. McGraw Hill, 1997.
178. Morin E (1999) Automatic acquisition of semantic relations between terms from technical corpora. Proc. Of the Fifth Int. Congress on Terminology and Knowledge Engineering (TKE-99), TermNet-Verlag, Vienna.
179. Neidle C. Lexical Functional Grammar // In Proceedings of the ESSLLI, August 12-23, 1996, Prague.-P.107-128.
180. Nerbonne J., Oepen S., Diagne A.K., Konrad K. and Neis I. NLL—Tools for Meaning Representation. // DFKI Workshop on Natural Language Systems: Modularity and Reusability, Stephan Busemann and Karin Harbusch (ed.), Saarbruecken, 1993.
181. Oliver Jonathan: Decision Graphs-An Extension of Decision trees http://citeseer.ni.nec.com/oliver93decision.html
182. Papka Ron and Allan. James Document classification using multiword features. In Proc. of the CIKM'98, New-York, November 1998. P. 124-131.
183. Pelleg Dan, Moore Andrew. X-means: Extending K-means with Efficient Estimation of the Number of Clusters. School of Computer Science, Carnegie Mellon University, Pittsburgh, PA 15213 USA. 2000.
184. Philips Lawrence, Practical Algorithms for Programmers», Binstock & Rex, Addison Wesley, 1995.
185. Pinto H. S., Gomez-Perez A., Martins J. P. Some Issues on Ontology Integration // Proceedings of the IJCAI-99 workshop on Ontologies and Problem Solving Methods (KRR5) Stockholm, Sweden, August 2,1999.
186. Pollard C., Sag I.A. Head-Driven Phrase-Stracture Grammar.// Center for the Study of Language and Information (CSLI) Lecture Notes. Stanford University Press and University of Chicago Press. 1994.
187. Pusteyovsky James. The Generative Lexicon. MIT Press, London. 1995.
188. Qi Lu, Matthias Eichstaedt, and Daniel Ford. Efficient profile matching for large scale webcasting. Computer Networks 30(1-7). 1998. P. 443-455.
189. Raskin V., Nirenburg S., Lexical Semantics of Adjectives, Recent Papers from the Mikrokosmos and Corelli Projects, Vol 2., New Mexico State University, 1996.
190. Readware ConSearch www.readware.com
191. Ruiz Miguel E, Srinivasan Padmini. Automatic Text Categorization Using Neural Networks. Advances in Classification Research vol. 8: Proceedings of the 8th ASIS
192. SIG/CR Classification Research Workshop. Ed. Efthimis Efthimiadis. Information Today, Medford:New Jersey. 1998. P. 59-72
193. Rzevski G. On Behaviour and Architectures of Autonomous Intelligent Agents: An Engineering Perspective. Proc. First International Round-Table on Abstract Intelligent Agents. ENEA, Rome. 1993.
194. SemioMap http://www.entrieva.comyentrievayindex.htm
195. Schreiber G., Weilinga B. & Jansweijer W. The Kactus View on the 'o' World, in 'IJCAI95's workshop on Basic Ontological Issues in Knowledge Sharing'. 1995.
196. Sibson R. SLINK: An optimally efficient algorithm for the single-link cluster method. King's College Research Center, King's College, Cambridge, and Cambridge University Statistical Laboratory. 1973.
197. Skuce D. How We Might Reach Agreement on Shared Ontologies: A Fundamental Approach, in 'AAAI97 Spring Symposium Series, workshop on Ontological Engineering'. 1997.
198. Sowa J. Conceptual Structures: information processing in mind and machine. Cambridge, MA: Addison Wesley, 1984.
199. Stata Raymie, Bharat Krishna, and Maghoul Farzin. The term vector database: fast access to indexing terms for web pages. In Proc. of the WWW-9, May 2000/
200. Steinbach M., G. Karypis, and V. Kumar A comparison of document clustering techniques In KDD Workshop on Text Mining, 2000.
201. Stephen B. Hunter-Gatherer: Applying Constraint Satisfaction, Branch-and-Bound and Solution Synthesis to Natural Language Semantics NMSU CRL Technical Report. MCCS-96-292. 1997.
202. Stojanovic Ljlijana. Methods and Tools for Ontology Evolution. PhD thesis, University of Karlsruhe, 2004.
203. Tong Richard M. and Appelbaum Lee A. Machine learning for knowledge-based document routing Proceedings of the 2nd Text Retrieval Conference (TREC-2), 1994.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.