Разработка и программная реализация метода семантически-ориентированного поиска информации в электронных документах тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат технических наук Люстиг, Инга Владимировна
- Специальность ВАК РФ05.13.11
- Количество страниц 170
Оглавление диссертации кандидат технических наук Люстиг, Инга Владимировна
ВВЕДЕНИЕ.
1. ОСНОВНЫЕ ПОДХОДЫ К ПОИСКУ ИНФОРМАЦИИ В ЭЛЕКТРОННЫХ ДОКУМЕНТАХ.
1.1. Способы поиска информации в электронных документах.
1.1.1. Анализ электронных документов, основанный на их содержании.
1.1.1.1. Анализ отдельных электронных документов, основанный на содержании.
1.1.1.2. Анализ коллекций электронных документов, основанный на содержании
1.1.1.3. Контекст информации.
1.1.1.4. Внутренние ярлыки документов.
1.1.2. Анализ документов, основанный на исследовании поведения отдельных пользователей.
1.2. Семантические аннотации информационных ресурсов.
1.2.1. Язык расширенной разметки XML.
1.2.2. Язык описания метаданных об информационных ресурсах RDF.
1.2.3. Онтологии.
1.2.4. Основные схемы метаданных.
1.3. Методы построения семантических представлений текстов на естественном языке.
1.3.1. Теория концептуальных графов.
1.3.2. Компьютерная семантика русского языка.
1.3.3. Расширенные семантические сети.
1.3.4. Неоднородные семантические сети.
1.3.5. Эпизодическая логика.
1.3.6. Теория К-представлений.
1.3.7. Выбор теории К-представлений в качестве методологической основы диссертационного исследования.
1.4. Медико-биологические информационно-поисковые системы.
1.5. Выводы по материалам главы 1.
2. ПОСТАНОВКА ЗАДАЧИ ДИССЕРТАЦИОННОГО ИССЛЕДОВАНИЯ И РАЗРАБОТКА ЛОГИЧЕСКОЙ СТРУКТУРЫ ЛИНГВИСТИЧЕСКОЙ БАЗЫ ДАННЫХ.
2.1. Постановка задачи диссертационного исследования.
2.2. Краткие сведения о модели для описания системы первичных единиц концептуального уровня, предложенной в теории СК-языков.
2.2.1. Общая характеристика модели.
2.2.2. Основные идеи определения класса сортовых систем.
2.2.3. Типы, порождаемые сортовыми системами, и конкретизации типов.
2.2.4. Концептуально-объектные системы.
2.2.5. Система кванторов и логических связок.
2.3. Формализация дополнительных предположений о рассматриваемых первичных единицах концептуального уровня.
2.4. Модель лингвистической базы данных в теории К-представлений.
2.5. Разработка структуры лингвистической базы данных.
2.5.1. Объединенный словарь предложных и глагольно-предложных фреймов как новый компонент лингвистической базы данных.
2.5.2. Формальное определение единого словаря предложных и глагольно-предложных фреймов.
2.5.3. Примеры статей единого словаря предложных и глагольно-предложных фреймов.
2.6. Общая логическая структура лингвистической базы данных.
2.7. Выводы по материалам главы 2.
3. РАЗРАБОТКА МЕТОДА СЕМАНТИЧЕСКИ-ОРИЕНТИРОВАННОГО ПОИСКА ИНФОРМАЦИИ В ЭЛЕКТРОННЫХ ДОКУМЕНТАХ.
3.1. Основные предположения о рассматриваемом классе электронных документов.
3.2. Описание алгоритма нахождения документов, в которых реализуется смысловое отношение в сочетаниях с лексической единицей, имеющей заданную базовую форму.
3.3. Описание предлагаемого метода поиска смысловых отношений.
3.3.1. Поиск участников смыслового отношения.
3.3.2. Проверка отсутствия слов-отрицаний.
3.3.3. Детализация метода и описание алгоритма поиска смысловых отношений.
3.3.3.1. Детализация метода поиска смысловых отношений.
3.3.3.2. Описание алгоритма поиска смысловых отношений.
3.4. Описание метода семантически-ориентированного поиска.
3.5. Пример применения семантически-ориентированного поиска.
3.6. Выводы по материалам главы 3.
4. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ РАЗРАБОТАННОГО МЕТОДА СЕМАНТИЧЕСКИ
ОРИЕНТИРОВАННОГО ПОИСКА ИНФОРМАЦИИ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ПОИСКА
ЛЕКАРСТВЕННЫХ ПРЕПАРАТОВ.
4.1. Основные направления доработки метода семантически-ориентированного поиска с целью его применения для поиска лекарственных препаратов.
4.2. Получение списка объектов, оказывающих воздействие на некоторый фактор.
4.3. Получение списка объектов, оказывающих воздействие на некоторый фактор, с учетом способа достижения результатов этого воздействия.
4.4. Описание основных подсистем проектируемой системы.
4.5. Разработка метода и алгоритма построения семантического представления основной цели лечения заболевания, сформулированной на ограниченном русском языке.
4.5.1. Структура семантического представления для описания основной цели лечения заболевания.
4.5.2. Метод и алгоритм преобразования выражения об основной цели лечения заболевания, сформулированного на ограниченном русском языке, в его семантическое представление.
4.5.2.1. Описание метода преобразования выражения об основной цели лечения заболевания, сформулированного на ограниченном русском языке, в его семантическое представление.
4.5.2.2. Описание алгоритма преобразования выражения об основной цели лечения заболевания, сформулированного на ограниченном русском языке, в его семантическое представление.
4.6. Выбор средств для программной реализации поисковой системы «СЕМПМЕД».
4.7. Словари морфологии.
4.7.1. Морфологический анализ и способы его реализации.
4.7.2. Словари морфологии проекта «ДИАЛИНГ».
4.7.3. Словари морфологии в системе «СЕМПМЕД».
4.8. Логическая структура лексико-семантического словаря.
4.9. Реализация единого словаря предложных и глагольно-предложных семантико-синтаксических фреймов.
4.9.1. Предложные и глагольно-предложные семантико-синтаксические фреймы.
4.9.2. Струкгура единого словаря предложных и глагольно-предложных семантико-синтаксических фреймов.
4.10. Вариант структуры для хранения текстов описаний объектов.
4.11. Метод получения обобщенных параметров для параметра запроса пользователя
4.12. Выявление разделов текста описания объекта для поиска данных.
4.13. Поиск параметра запроса в текстах описаний объектов.
4.13.1. Цель осуществления поиска параметра запроса в текстах описаний объектов.
4.13.2. Компонент Russian Context Optimizer компании «Гарант-Парк-Интернет» для СУБД Oracle.
4.14. Алгоритм определения целесообразности семантического анализа фрагмента текста.
4.15. Извлечение предложения из фрагмента текста.
4.16. Связь смысловых отношений с видами пользовательских запросов.
4.17. Поиск смысловых отношений.
4.17.1. Поиск участников смыслового отношения.
4.17.2. Проверка отсутствия слов-отрицаний.
4.17.3. Детализация метода и алгоритма поиска смысловых отношений с учетом предлагаемой структуры лингвистической базы данных.
4.17.3.1. Детализация метода поиска смысловых отношений с учетом предлагаемой структуры лингвистической базы данных.
4.17.3.2. Детализация вычисления значений основных вспомогательных структур для алгоритма поиска смысловых отношений с учетом предлагаемой структуры лингвистической базы данных.
4.18. Использование семантического представления выражения об основной цели лечения заболевания для поиска лекарственных препаратов.
4.19. Общая логическая структура лингвистической базы информационно-поисковой системы «СЕМПМЕД».
4.20. Сведения об информационно-поисковой системе «СЕМПМЕД».
4.21. Анализ возможностей адаптации к другим предметным областям.
4.21.1. Анализ возможностей и способы адаптации к другим предметным областям, в том числе в области косметологии.
4.21.2. Анализ возможностей применения разработанного метода семантически-ориентированного поиска в области юриспруденции.
4.22. Применение результатов диссертационного исследования на предприятии
4.22.1. Информация о предприятии.
4.22.2. Цели внедрения ИПС «СЕМПМЕД» на предприятии.
4.22.3. Результаты применения.
4.23. Выводы по материалам главы 4.
Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Метод формального описания содержания сложных естественно-языковых текстов и его применение к проектированию лингвистических процессоров2005 год, доктор технических наук Фомичев, Владимир Александрович
Математическое моделирование и программная реализация семантического преобразования поисковых запросов2012 год, кандидат технических наук Кириллов, Антон Владимирович
Разработка и применение метода формализации проектирования рекомендательных систем с естественно-языковым интерфейсом2011 год, кандидат технических наук Правиков, Алексей Александрович
Исследование и разработка автоматизированной системы смысловой обработки текстов в системе управления электронными архивами2013 год, кандидат технических наук Фаррохбахт Фумани Мехди
Семантизация имени существительного во французских толковых и энциклопедических словарях XVII-XXI вв.: эволюция определений наименований гидрометеоров2008 год, доктор филологических наук Иванова, Екатерина Павловна
Введение диссертации (часть автореферата) на тему «Разработка и программная реализация метода семантически-ориентированного поиска информации в электронных документах»
Актуальность темы исследования. Проблема информационного поиска, вставшая особенно остро из-за постоянно растущего объема электронных документов в разного рода информационных системах, электронных библиотеках, а также в сети Интернет, обусловлена функциональной ограниченностью разработанных поисковых систем. Большинство поисковых систем не позволяет учитывать в работе семантику естественного языка, а использование метода поиска по ключевым словам приводит к выводу большого объема нерелевантных данных. Системы семантически-ориентированного поиска развиты недостаточно: используемые в них модели представления конструкций естественного языка весьма ограничены и не претендуют ни на универсальность, ни на инвариантность относительно выбора предметной области.
Семантически-ориентированный поиск информации предоставляет более широкие возможности по сравнению с традиционными поисковыми системами, где поиск ведется по ключевым словам, вводимым пользователями. Это обусловлено тем, что система, обладающая данными о синтаксисе и семантике естественного языка (в частности, русского языка), может осуществлять поиск с учетом его особенностей. В частности, вместо простой проверки наличия определенных слов в тексте в заданной форме (как при поиске по ключевым словам), может производить поиск смысловых отношений между словами текста, выражающих искомую информацию. Словами-участниками смыслового отношения могут оказаться любые слова естественного языка, удовлетворяющие семантическим и грамматическим ограничениям, являющимся необходимыми условиями реализации рассматриваемого смыслового отношения.
Важной областью применения информационно-поисковых систем является здравоохранение. Это связано со сложной структурой и многообразием форм медико-санитарной информации, которая включает трудно формализуемые понятия и категории, а также зачастую значительные по объему массивы подлежащих учету данных.
Анализ ограничений информационно-поисковых компьютерных систем, в том числе информационно-поисковых систем в области медицины, описанных в доступной научной литературе, позволяет сделать вывод об актуальности разработки новых подходов к автоматическому поиску информации, учитывающих значения лексических единиц и существование определенных смысловых отношений между лексическими единицами в текстах электронных документов.
Описаний программных систем, осуществляющих поиск медикаментов для лечения заболеваний с учетом синтаксиса и семантики русского языка, в доступной литературе обнаружить не удалось.
В связи со сказанным цель данной диссертационной работы заключалась в разработке принципов и метода семантически-ориентированного поиска, а также в программной реализации информационно-поисковой системы «СЕМПМЕД», осуществляющей поиск информации с применением разработанных принципов и метода по текстам описаний лекарственных препаратов на русском языке.
Для достижения данной цели потребовалось решить следующие задачи:
- выбрать наиболее адекватную (с практической точки зрения) методологическую основу для осуществления семантического анализа и представления семантико-синтаксической информации о лексических единицах русского языка;
- формально описать структуру семантико-синтаксических данных, предполагаемых к использованию при поиске;
- выделить пласт медицинских знаний, который должен войти в базу знаний информационно-поисковой системы «СЕМПМЕД»;
- предложить способ представления знаний о медицине, в том числе информации об основных целях при лечении заболеваний.
В процессе поиска методологической основы для осуществления лингвистического анализа текстов анализировались наиболее известные в настоящее время подходы к формализации естественного языка: теория концептуальных графов, эпизодическая логика, теория представления дискурсов, компьютерная семантика русского языка, теория расширенных семантических сетей, теория неоднородных сетей, а также теория К-представлений. Выбор был сделан в пользу теории К-представлений, поскольку в этой теории сформулирована гипотеза о возможности построения концептуальных структур, выражающих смысл произвольных предложений и дискурсов на естественном языке, относящихся к любым областям деятельности человека; кроме того, данная теория предлагает формальный аппарат для использования при разработке лингвистических процессоров.
Научная новизна результатов диссертационного исследования определяется:
1) разработкой новых принципов семантически-ориентированного поиска информации, направленных на создание теоретической основы для достижения разумного компромисса между поиском по ключевым словам и поиском информации, предусматривающим полный семантико-синтаксический анализ текстов электронных документов;
2) разработкой формальной модели лингвистической базы данных (ЛБД), обладающей рядом преимуществ по сравнению с ЛБД, предложенной в теории К-представлений
В. А. Фомичевым;
3) разработкой метода семантически-ориентированного поиска информации, являющегося инвариантным по отношению к выбору предметной области (в частности, применимого к поиску медикаментов, в области юриспруденции и в области косметологии);
4) разработкой алгоритмов, детализирующих отдельные шаги метода семантически-ориентированного поиска информации в текстах электронных документов на русском языке.
Положения, выносимые на защиту. На защиту выносятся следующие укрупненные научные результаты.
1. На основе анализа наиболее известных подходов к автоматическому поиску и оценке информации в электронных документах предложены новые принципы построения информационно-поисковой системы, предназначенной для семантически-ориентированного поиска информации в электронных документах. Цель разработки этих принципов состояла в создании теоретической основы для достижения разумного компромисса между поиском по ключевым словам и поиском информации, предусматривающим полный семантико-синтаксический анализ текстов электронных документов.
2. Разработана формальная модель лингвистической базы данных (ЛБД), представляющая собою определение класса формальных объектов, называемых проблемно-ориентированными лингвистическими базисами. Главными отличиями понятия проблемно-ориентированного лингвистического базиса от введенного В. А. Фомичевым понятия лингвистического базиса являются:
- рассмотрение понятия проблемно-ориентированного концептуального базиса вместо понятия концептуального базиса (преимуществами нового понятия является возможность отражения иерархии понятий и возможность выделения подкласса информационных единиц.);
- разработка и определение единого словаря глагольно-предложных и предложных семантико-синтаксических фреймов; в предложенной модели ЛБД такой словарь используется вместо двух словарей — словаря глагольно-предложных фреймов и словаря предложных фреймов, являющихся компонентами ЛБД в формальной модели ЛБД, предложенной В. А. Фомичевым.
3. Разработан предметно-независимый алгоритм (названный Поиск Текстов) нахождения всех электронных документов рассматриваемой базы данных, содержащих предложения на естественном языке, в которых реализуется некоторое смысловое отношение (из заданной группы смысловых отношений) в сочетаниях с лексической единицей, имеющей заданную базовую форму (лексему). Этот алгоритм использует информацию семантико-синтаксического характера, представленную проблемно-ориентированным концептуальным базисом.
4. Разработана система алгоритмов, создающих предпосылки применения алгоритма ПоискТекстов к поиску лекарственных препаратов, применяемых для лечения заданного заболевания.
5. Программно реализована информационно-поисковая система «СЕМПМЕД», использующая предложенные в работе алгоритмы и метод семантико-синтаксического поиска информации в задаче нахождения лекарственных препаратов по текстам их описаний на русском языке.
Практическая ценность и предложения по использованию результатов. Практическую ценность представляют, во-первых, предложенные в работе формальное описание структуры лингвистической базы данных, метод и алгоритм реализации семантически-ориентированного поиска. Эти результаты могут быть использованы разработчиками лингвистических процессоров для создания систем с похожей функциональностью в других предметных областях. Во-вторых, разработанная информационно-поисковая система (ИПС) «СЕМПМЕД» может использоваться на практике фармацевтами, медицинскими сотрудниками в клиниках, а также применяться в учебных заведениях медицинского профиля в ходе учебного процесса— для пополнения знаний студентов о лекарственных препаратах, поскольку реализация в ИПС «СЕМПМЕД» предложенных в работе принципов и метода семантически-ориентированного автоматического поиска информации в текстах медицинской тематики улучшает качество поиска нужных лекарственных препаратов. Это обусловлено тем, что появляется возможность ухода от типичных проблем, возникающих при работе с традиционными поисковыми системами. Пользователю не требуется вводить ключевые слова для поиска по тексту: система выбирает искомые смысловые отношения для каждого типа запроса, а также набор допустимых лексических единиц для участников отношения и их возможные морфологические характеристики. Наличие базы знаний об основной цели лечения заболевания не только расширяет функциональные возможности системы по поиску лекарств, но и дает возможность использовать систему в качестве программного средства для подготовки студентов-медиков и фармацевтов.
Апробация работы и публикации. Результаты работы докладывались на ряде научных конференций, в том числе на международной конференции InterSymp по системным исследованиям, информатике и кибернетике (Германия, 2001); научно-технических конференциях студентов, аспирантов и молодых специалистов МИЭМ (2002-2005); Международной научной конференции «Гагаринские чтения» (Москва, «МАТИ»— Российский государственный технологический университет им. К. Э. Циолковского, 2001, 2002, 2004, 2005); XIV международной конференции «Проблемы теоретической кибернетики» (Пенза, 2005); международных научных конференциях «Компьютерная лингвистика и интеллектуальные технологии. Диалог'2004» и «Диалог'2005».
По теме диссертационного исследования автором опубликовано 17 научных работ. В и двух работах, выполненных в соавторстве, не менее половины результатов получены автором данной диссертации.
Структура работы. Диссертационная работа содержит 170 страниц, состоит из введения, четырех глав, заключения, списка использованной литературы из 115 наименований и трех приложений; включает 20 таблиц и 11 рисунков.
Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Теоретическое обоснование и разработка интеллектуальной русскоязычной информационно-поисковой системы2002 год, кандидат технических наук Волков, Сергей Сергеевич
Построение модели извлечения информации из технических текстов2006 год, кандидат филологических наук Бабина, Ольга Ивановна
Системно-аспектуальное функционирование компьютерной терминологии2009 год, доктор филологических наук Бабалова, Галина Григорьвна
Расширение "языка цели": предложное целевое новообразование в поисках/в поиске и его структурно-семантические аналоги2001 год, кандидат филологических наук Дмитрук, Галина Владимировна
Системы и информационные технологии обработки естественно-языковых текстов на основе прагматически-ориентированных лингвистических моделей2000 год, доктор технических наук Сулейманов, Джавдет Шевкетович
Заключение диссертации по теме «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», Люстиг, Инга Владимировна
4.23. Выводы по материалам главы 4
1. Основной результат данной главы заключается в разработке структуры и программной реализации информационно-поисковой системы (ИПС) «СЕМПМЕД», построенной с целью апробации предложенного в предыдущей главе метода семантически-ориентированного поиска информации. Программная реализация ИПС «СЕМПМЕД» имеет объем около 1350 строк кода на языке PL/SQL.
2. Рассмотрена основная область применения ИПС «СЕМПМЕД» — поиск медикаментов, лечащих указанное пользователем заболевание или оказывающих на организм человека такое воздействие, которое, по сути, и является основной целью лечения рассматриваемого заболевания.
3. Разработаны метод и алгоритм построения семантического представления основной цели лечения заболевания, сформулированной на ограниченном русском языке. Получаемые таким образом семантические представления входят в состав базы знаний о медицине ИПС «СЕМПМЕД» и используются ею для поиска лекарств, оказывающих воздействие, описанное в основной цели лечения заболевания.
4. Предложен состав подсистем ИПС «СЕМПМЕД» и разработана структура данных лингвистической базы данных системы (включая компонент морфологического анализа), базы знаний о медицине и хранилища документов — описаний лекарственных препаратов.
5. Обоснованы возможности применения предлагаемых в работе принципов и метода семантически-ориентированного поиска информации к решению задач из других предметных областей. В частности, обоснованы возможности применения результатов диссертационного исследования в области юриспруденции и в области косметологии.
6. Работоспособность представленного в диссертации метода семантически-ориентированного поиска информации подтверждена актом внедрения результатов, приведенным в приложении 1 к данной работе.
ЗАКЛЮЧЕНИЕ
Задачи исследования, обусловленные поставленной целью работы и перечисленные во введении, были успешно решены.
В итоге проведенного диссертационного исследования лично автором были получены следующие основные научные результаты, выносимые на защиту.
1. Проанализированы основные подходы к автоматическому поиску и оценке информации в электронных документах.
2. Предложены новые принципы построения информационно-поисковой системы, предназначенной для семантически-ориентированного поиска информации в электронных документах; цель разработки этих принципов заключалась в создании теоретической основы для достижения разумного компромисса между поиском по ключевым словам и поиском, предусматривающим полный семантико-синтаксический анализ каждого предложения из электронного документа.
3. Предложено формальное понятие проблемно-ориентированного концептуального базиса (сложного упорядоченного набора формальных объектов, представляющего наиболее общие сведения о выбранной предметной области), позволяющее по сравнению с введенным В. А. Фомичевым понятием концептуального базиса:
- отразить существование иерархии понятий по степени их общности, а не только существование иерархии наиболее общих понятий (сортов);
- выделить подкласс информационных единиц с отрицательным значением (соответствующих выражениям «противопоказано», «исключено» и некоторым другим).
4. Разработана формальная модель лингвистической базы данных (ЛБД), представляющая собою определение класса формальных объектов, называемых проблемно-ориентированными лингвистическими базисами. Главными отличиями понятия проблемно-ориентированного лингвистического базиса от введенного В. А. Фомичевым понятия лингвистического базиса являются:
- рассмотрение понятия проблемно-ориентированного концептуального базиса вместо понятия концептуального базиса;
- разработка и определение единого словаря глагольно-предложных и предложных семантико-синтаксических фреймов; в предложенной модели ЛБД такой словарь используется вместо двух словарей — словаря глагольно-предложных фреймов и словаря предложных фреймов, являющихся компонентами ЛБД в формальной модели ЛБД, предложенной В. А. Фомичевым.
5. Разработан предметно-независимый алгоритм (названный ПоискТекстов) нахождения всех электронных документов рассматриваемой базы данных, содержащих предложения на естественном языке, в которых реализуется некоторое смысловое отношение (из заданной группы смысловых отношений) в сочетаниях с лексической единицей, имеющей заданную базовую форму (лексему). Этот алгоритм использует информацию семантико-синтаксического характера, представленную проблемно-ориентированным концептуальным базисом.
6. Разработана система алгоритмов, создающих предпосылки применения алгоритма ПоискТекстов к поиску лекарственных препаратов, применяемых для лечения заданного заболевания:
- алгоритм 1 предназначен для построения семантических представлений естественно-языковых описаний основной цели лечения заболевания в виде выражений некоторого СК-языка;
- алгоритм 2 предназначен для поиска по названию заболевания таких препаратов, которые применяются для лечения заданного заболевания; преимуществом алгоритма по сравнению с поиском по ключевым словам является поиск смысловых отношений между лексическими единицами текста, выражающими искомую информацию;
- алгоритм 3 осуществляет поиск препаратов для лечения заданного заболевания по основной цели его лечения, представленной выражением СК-языка в базе знаний информационно-поисковой системы.
7. Разработана информационно-поисковая система «СЕМПМЕД», использующая алгоритм 1 для формирования базы знаний об основных целях лечения заболеваний, а также алгоритм 2 и алгоритм 3 для поиска препаратов, предназначенных для лечения заданного заболевания; программная реализация системы выполнена на языке PL/SQL для СУБД Oracle 9.2.0.1. Работоспособность ИПС «СЕМПМЕД» подтверждена актом внедрения.
8. Обоснована возможность применения разработанной формальной модели лингвистической базы данных и алгоритма Поиск Текстов для поиска информации в электронных документах, относящихся другим предметным областям, в частности, к юриспруденции и косметологии.
Список литературы диссертационного исследования кандидат технических наук Люстиг, Инга Владимировна, 2007 год
1. Аношкина Ж. Г. Морфологический процессор русского языка // Альманах «Говор». — Сыктывкар, 1995. — С. 17-23.
2. Башмаков А. И., Башмаков И. А. Интеллектуальные информационные технологии. — М, Изд-ство МГТУ им. Н. Э. Баумана, 2005. — 302 с.
3. Бездушный А. А., Бездушный А. Н., Жижченко А. Б., Кулагин М. В., Серебряков В. A. RDF схема метаданных ИСИР // Сборник научных трудов X научно-практического семинара «Новые технологии в информационном обеспечении науки».— М., 2003.— С.141-159.
4. Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. — СПб.: ПИТЕР, 2000. — 382 С.
5. Кузнецов И. П. Механизмы обработки семантической информации. — М: Наука, 1978. —174 с.
6. Кузнецов И. П. Семантические представления. — М: Наука, 1986. — 290 с.
7. Кузнецов И. П. Система обработки декларативных структур знаний ДЕКЛАР-2. — М.: Ин-т проблем информатики АН СССР, 1989. — 106 с.
8. Кузнецова А. И., Ефремова Т. Ф. Словарь морфем русского языка. — М.: Русский язык, 1986.
9. Люгер Дж. Ф. Искусственный интеллект. Стратегии и методы решения сложных проблем. 4-е издание. Пер. с англ. — М.: Издательский дом «Вильяме», 2003. — 864 с.
10. Мельчук И. А. Опыт теории лингвистических моделей «Смысл — Текст». — М.: Наука, 1974, —314 С.
11. Осипов Г. С. Построение моделей предметных областей. Неоднородные семантические сети // Изв. АН СССР. Техн. Кибернетика —1990. — № 5. — С. 32-45.
12. Осипов Г. С. Приобретение знаний интеллектуальными системами: основы теории и технологии. — М.: Наука, Физматлит, 1997. — 112 с.
13. Попов Э. В. Общение с ЭВМ на естественном языке. — М.:Наука, Главная редакция физико-математической литературы, 1982. — 360 с.
14. Селезнев К. Обработка текстов на естественном языке // Открытые системы. — 2003. —№12.
15. Солтон Дж. Динамические библиотечно-информационные системы.— М.: Мир,1979.
16. Тихонов А. Н. Морфемно-орфографический словарь: Русская морфемика. — М.: Школа-Пресс, 1996.
17. Тузов В. А. Математическая модель языка. — Д.: Изд-во ЛГУ, 1984. —176 с.
18. Тузов В. А. Компьютерная семантика русского языка // Труды Междунар. семинара Диалог'2001 по компьютерной лингвистике и ее приложениям: Том 2. Прикладные проблемы. — М.: РосНИИ Искусственного Интеллекта, 2001. — С. 356-363.
19. Фомичёв В. А. Представление информации средствами К-исчислений. — М., Московский институт электронного машиностроения (МИЭМ), 1988. — 60 с.
20. Фомичёв В. А. К-языки и разработка новых информационных технологий // Новые информационные технологии в системотехнике / Под ред. JT. С. Болотовой. — М.: Радио и Связь, 1990. —С. 53-62.
21. Харин Н. П. Некоторые особенности семантического поиска текстовой информации // Новости искусственного интеллекта. — 2002. —№ 2. — С. 22-25.
22. Хорошевский В. Ф. Обработка естественно-языковых текстов: от моделей понимания языка к технологиям извлечения знаний// Новости искусственного интеллекта.— 2002, —№6. —С. 19-26.
23. Manning, С., Schutze, Н. Foundations of Statistical Language processing. —The MIT Press, 1999.
24. Andreas Paepcke, Hector Garcia-Molina, Gerard Rodriguez-Mula, Junghoo Cho. Beyond Document Similarity: Understanding Value-Based Search and Browsing Technologies — Stanford University, Draft, 2000. — 21 P.
25. Benjamins V. R., Fensel D., et. all, 1998, Community is Knowledge! in KA2, Submitted to KAW'98, Banff, Canada, April 1998.
26. DobsonS.A., BurrillV. A., 1995, Lightweight databases, Computer Networks and ISDN Systems 27(6), April 1995, pp. 1009-1015. In the Proceedings of the 3rd International World Wide Web Conference, Darmstadt.
27. Fomichov, V. Mathematical models of natural-language-processing systems as cybernetic models of a new kind. Cybernetica (Belgium), 1992. — XXXV (1). — P. 63-91.
28. Luke S., Spector L., Rager D., Hendler J. Ontolodgy-based Knowledge Discovery on the World-Wide-Web, In the Proceedings of the Workshop on Internet-based Information Systems, AAAI-96, Portland, Oregon. —1996.
29. Quillian M. R. Semantic memory // Semantic Information Processing, M. Min-sky (ed.). Cambridge, Massachusetts. — 1968. — P. 27-70.
30. Ramamohanarao, K. and J. Harland, 1994, An Introduction to Deductive Database Languages and Systems // VLDB Journal. — April 1994. — P. 107-122.
31. Sandwall E. Towards a World-Wide Data Base, Fifth International World Wide Web Conference, May 6-10,1996, Paris, France. — 1996.
32. Schubert L. K., Hwang С. H. An episodic knowledge representation for narrative texts // Proceedings of the First Int. Conf. on Principles of Knowledge Representation and Reasoning (KR'89), Toronto, Canada. —1989. — P. 444-458.
33. Simmons R. F. Semantic networks: their computation and use for understanding English sentences // Computer Models of Thought and Language, R. Schank and K. Colby (eds.). — San Francisco: Freeman, 1973. — P. 63-113.
34. Sowa, J. F. Conceptual Structures:Information Processing in Mind and Machine // Addison-Wesley Publ. Сотр.: Reading, MA. —1984.
35. Sowa, J. F. Toward the expressive power of natural language // In Sowa, J. F. (Ed.), Principles of Semantic Networks. Explorations in the Representation of Knowledge. Morgan Kaufman Publ., Inc. —1991. — P. 157-189.
36. Sowa, J. F. Conceptual graphs: draft proposed American National Standard // Conceptual Structures: Standards and Practices / Ed. By W. Tepfenhart & W. Cyre. Lecture Notes in AI #1640. Springer-Verlag. Berlin. 1999. — P. 1-65.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.