Разработка и исследование моделей и информационной технологии семантико-синтаксического анализа русскоязычного текста тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Бледнов, Андрей Михайлович
- Специальность ВАК РФ05.13.18
- Количество страниц 120
Оглавление диссертации кандидат технических наук Бледнов, Андрей Михайлович
УСЛОВНЫЕ ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ.
ВВЕДЕНИЕ.
1. ТЕОРЕТИЧЕСКИЙ ОБЗОР МЕТОДОВ АНАЛИЗА ТЕКСТА.
1.1. Задачи обработки текстов.
1.2. Этапы анализа текста.
1.2.1. Общая схема обработки текстов.
7.2.2. Анализ отдельных слов.
1.2.3. Анализ отдельных предложений.
1.2.4. Семантический анализ.
1.3. Методы семантического анализа.
1.4. Комплексные интеллектуальные программные системы для обработки текстов.
1.5. Выводы и постановка задачи исследования.
2. РАЗРАБОТКА И ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКОЙ МОДЕЛИ ТЕКСТА.
2. 1. Статистическая модель текста.
2.2. Информационный портрет текста.
2.3. Выводы по главе.
3. ИНФОРМАЦИОННАЯ ТЕХНОЛОГИЯ АНАЛИЗА ТЕКСТА.
3.1. Описание модели текста.
3.2. Этапы анализа текста.
3.3. Выделение векторов цели.
3.4. Выводы по главе.
4. СИСТЕМА АНАЛИЗА ТЕКСТА.
4.1. Архитектура системы и сценарий диалога.
4.2. Эксперименты с текстом.
4.2.1. Изучение статистических характеристик текста.
4.2.1. Выделение векторов цели.
4.3. Пополнение баз знаний на основе информационной технологии.
4.4. Выводы по главе.
Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Метод формального описания содержания сложных естественно-языковых текстов и его применение к проектированию лингвистических процессоров2005 год, доктор технических наук Фомичев, Владимир Александрович
Разработка и исследование методов и системы семантического анализа естественно-языковых текстов2010 год, кандидат технических наук Мокроусов, Максим Николаевич
Методология обнаружения угроз нарушения информационной безопасности в открытых компьютерных сетях на основе функциональной модели естественного языка2011 год, доктор технических наук Лебедев, Илья Сергеевич
Разработка и исследование алгоритмических, программных и архитектурных решений для проектирования систем тематической категоризации Интернет-ресурсов в телекоммуникационных сетях2008 год, кандидат технических наук Свечников, Сергей Владимирович
Разработка автоматизированной системы семантического анализа и построения визуальных динамических глоссариев2005 год, кандидат технических наук Кулешов, Сергей Викторович
Введение диссертации (часть автореферата) на тему «Разработка и исследование моделей и информационной технологии семантико-синтаксического анализа русскоязычного текста»
С развитием информационных технологий высокими темпами растут объемы информации по тем или направлениям развития науки и техники. В качестве источников могут выступать различные информационные ресурсы (Интернет, лекции, электронные книги, диссертации, статьи, журналы и др.), представленные в текстовом виде. Актуальность задачи компьютерного анализа текстовой информации связана с необходимостью обработки пользователем больших объемов неструктурированной информации по его профессиональной деятельности.
Среди задач обработки текстов можно выделить следующие: автоматическое реферирование, автоматический машинный перевод, определение принадлежности текста конкретному автору, создание профессиональных каталогов и др.
Особую актуальность приобретает разработка методов извлечения и формирования новых знаний, необходимых для решения конкретных задач в той или иной профессиональной деятельности специалиста. Одним из стратегических направлений решения данной проблемы является комплексное системное использование различных лингвистических подходов и методов искусственного интеллекта, направленных на сокращение объемов хранимой информации, выявление семантической составляющей текста, определяющей основную идею, заложенную автором.
Проблеме анализа текстовых документов посвящено значительное количество работ [1, 2, 7,16, 18, 20, 21, 26, 37, 41 - 45, 60, 64, 66, 81-83, 88-90, 94-98]. В качестве широко используемых методов компьютерного анализа выделяют статистические и лингвистические методы [4, 31, 33, 48, 57, 66, 71, 80, 87].
Статистические методы достаточно хорошо зарекомендовали себя при построении поисковых систем, выделении ключевых слов и словосочетаний и т.п. В основном в них используются общие законы теории вероятности и математической статистики. Ряд алгоритмов основаны на использовании закона Зипфа [25].
В то же время, при решении задач анализа текстовой информации, возникающих при построении информационных систем, в частности, при формировании профессиональных баз знаний, требуется привлечение алгоритмически более сложных процедур проведения синтаксического и семантического анализа.
Основную часть знаний специалисты конкретной предметной области получают в результате сравнения, анализа и синтеза информации из разрозненных фактов, размещенных в текстах. При работе с большими потоками документов процесс автоматического структурирования текстовой информации заменяет экспертный процесс выделения фактографической информации и объектов, выполняемый вручную. В работе рассматривается использование новой технологии извлечения знаний из текстов на русском языке.
До 85% новых знаний пользователи получают, изучая тексты и в ближайшем будущем наиболее востребованными будут системы с максимально автоматизированными ETL-процессами (extract, transfer, load -сбор, выделение, преобразование, загрузка) структурирования контента [38]. Другой важной чертой современных технологий является наличие функции оперативного анализа информации, полученной по запросу для выбора дальнейшего направления исследования документов, выполняемой с помощью методов интеллектуального анализа текста.
Основные методы анализа текста достаточно подробно изложены в трудах Апресяна Ю.Д., Виноградова Д.В., Гладкого A.B., Клосса Б.М., Кожуновой О.С., Мельчука И.Д., Солтона Г., Селезнева К., Супруна А.Е., Тодда А., Трубецкого Н.С., Филмора Ч., Финна В.К., Фоменко А.Т., Харина Н. П., Шведовой Н.Ю. и др. Ряд современных усовершенствованных методов представлены в статьях Ермакова А.Е., Леонтьевой H.H., Мозгового М.В., Плешко В.В., Сокирко А., Толпегина П.В., Тузова В.А. и др. За последние 10 лет реализованы и специализированные программные средства для анализа и поиска информации, например, такие как Cros (Кронос-Информ), diskMETA (ЗАО "МЕТА"), Oracle Text, ODB-Text (НПЦ «ИНТЕЛТЕК ПЛЮС»), TextAnalyst, инструменты компании Smartware, XANALYS Link Explorer, «Аналитический курьер», инструменты компании Гарант-Парк-Интернет, «Медиалогия», «Система управления досье X-Files» и целый ряд других.
Анализ текста предполагает извлечение семантически связанной, полезной для пользователя информации, которая может быть использована им при построении различных онтологий, классификаторов, банков данных, баз данных, баз и систем знаний, в том числе, профессиональных [17, 19, 24, 27, 53, 69].
Однако можно отметить, что на текущий момент задачи автоматического проведения анализа русскоязычных текстов до конца не решены. Это связано, в первую очередь, с характерной особенностью русскоязычных текстов, отличающихся разнообразием и сложностью структуры предложений. Существующие методы компьютерного анализа текста показывают относительно невысокие результаты на уровне семантического анализа предложений сложной структуры.
Таким образом, существующие методы компьютерного анализа текста не полностью обеспечивают потребности конечных пользователей, связанные с обработкой русскоязычных текстов, автоматизацией процессов накопления и использования информационных ресурсов по различным направлениям профессиональной деятельности. Указанные обстоятельства и обусловили выбор темы диссертационного исследования.
Объектом исследования являются методы компьютерного анализа русскоязычного текста на естественном языке.
Предметом исследования являются методы синтаксического и семантического анализа русскоязычного текста.
Целью диссертационной работы является разработка и исследование моделей и информационной технологии семантико-синтаксического анализа русскоязычного текста, обеспечивающих эффективное решение экспертом задач, связанных со структуризацией текстовой информации и формированием информационных ресурсов.
Для достижения поставленной цели требуется решение следующих задач:
- проведение оценки современного состояния проблем анализа русскоязычных текстов и выявление направлений возможных вариантов совершенствования методов анализа текста;
- разработка процедуры нормализации сложных предложений русскоязычного текста;
- построение статистической и векторной моделей текста;
- исследование методов сокращения объема текстовой информации;
- разработка информационной технологии семантико-синтаксического анализа;
- экспериментальная проверка предложенных решений анализа русскоязычных текстов на базе специально созданной компьютерной программы.
Методы исследований. Теоретические исследования выполнены с применением методов системного анализа, метода аналогий, теории графов и математической логики, методов искусственного интеллекта.
Исследование базируется на всестороннем анализе отечественных и зарубежных источников, сравнительном анализе известных программных продуктов компьютерной обработки текстовой информации.
Экспериментальные исследования выполнены с помощью разработанного программного комплекса анализа текстовой информации.
На защиту выносятся предлагаемые модели анализа текстовой информации, а также результаты исследования предложенных методов:
- статистическая модель текста;
- векторная модель текста;
- векторная технология анализа текстовой информации;
- метод нормализации сложных предложений;
- структурная схема и ГОЕРО-диаграмма процессов анализа текстовой информации в программной системе, созданной на основе предложенных моделей и технологии;
- сравнительный анализ результатов работы известных компьютерных программ с результатами работы разработанного компьютерного комплекса «ТЕКСТАН».
Научная новизна полученных результатов заключается в следующем:
- разработана векторная модель представления текста, основанная на целевой функции структурной единицы текста;
- разработан метод нормализации сложных предложений русскоязычных текстов;
- разработана информационная технология анализа русскоязычного текста, включающая в себя этап предварительного анализа и этап семантико-синтаксического анализа текста, при этом, на этапе предварительного анализа текста осуществляется сокращение объема текстовой информации за счет направленной фильтрации с использованием статистических методов анализа, а на этапе семантико-синтаксического анализа проводится качественный разбор и осуществляется структуризация текста, представляемая в виде развернутого плана анализируемого текстового документа. Практическая полезность. Разработанные модели и технология анализа русскоязычных текстов позволяют повысить эффективность систем анализа текста за счет:
- направленной фильтрации на этапе предварительной обработки и уменьшения за счет этого объема обрабатываемой информации;
- применения векторной технологии анализа текста, обеспечивающей высокий уровень структуризации текста и формирование развернутого плана анализируемого текстового документа для работы эксперта;
- применения процедуры нормализации сложного предложения, обеспечивающей однозначное разбиение сложного предложения на множество простых.
Полученные результаты могут быть применимы для дальнейшей научной разработки принципов и методов, связанных с разработкой профессионально-ориентированных информационных систем и формированием соответствующих информационных ресурсов.
Разработанная информационная технология может быть использована при решении следующих задач анализа и обработки русскоязычных текстов:
- классификации объектов;
- разработки систем информационного поиска;
- формирования информационных ресурсов;
- разработки технологий машинного перевода;
- разработки модулей проверки правописания;
- разработки диалоговых систем;
- определения авторства;
- создания spam - фильтров для электронной почты;
- синтеза текстовой информации и др.
Практические рекомендации по решению указанных выше задач могут быть использованы в деятельности образовательных учреждений, коммерческих и других предприятий при создании и использовании соответствующих информационных ресурсов.
Реализация результатов работы. Основные положения, модели и технология обработки русскоязычных текстов реализованы автором в виде программного комплекса «ТЕКСТАН». Данный программный комплекс разработан как часть программного обеспечения информационной системы ИжГТУ и применен при формировании «Фонда электронных изданий» (создание онтологий предметных областей, формирование рефератов, выделение метаинформации) по направлению «Информатика и вычислительная техника».
Программный комплекс «ТЕКСТАН» послужил прототипом создания АРМ преподавателя для подготовки к лекционным и практическим занятиям.
Апробация работы. Основные положения диссертационной работы докладывались на следующих конференциях: научно-техническая конференция с международным участием в рамках форума «Высокие технологии - 2004», ноябрь 2004, г. Ижевск; научная конференции «Технологии информатизации профессиональной деятельности (в науке, образовании и промышленности)», Ижевск, 23-26 ноября 2004 г.; международная научная конференции аспирантов «Управление экономикой в условиях интеграции хозяйственных систем», г.Ижевск, 18-20 апреля 2005 г.; межрегиональная научно-практическая конференция «Реализация стратегии устойчивого развития города Ижевска: опыт и проблемы, г. Ижевск, 28 сентября 2005 г.; международная научная конференция «Современные информационные технологии и письменное наследие: от древних рукописей к электронным текстам», г. Ижевск, 13-17 июля 2006 г.; на рабочих семинарах, проводимых Управлением информатизации и Центром телекоммуникаций и технологий Интернет ИжГТУ по вопросам создания «Фонда электронных изданий» и организации дистанционного обучения.
Публикации. По материалам диссертации опубликовано 6 статей.
Структура и объем работы определены целью и задачами исследования. Работа состоит из введения, четырех глав, заключения, библиографии и приложений. Основной текст изложен на 120 машинописных страницах с иллюстрациями. Список литературы включает 102 наименования.
Аннотация диссертационной работы по главам.
В первой главе диссертационной работы описаны существующие методы и подходы к анализу текстовой информации. Основное внимание уделено особенностям анализа русскоязычных текстов.
Во второй главе диссертационной работы описывается разработанная автором модель и метод статистического анализа текстовой информации.
В данной главе описываются некоторые результаты исследований, проведенных с целью определения статистических зависимостей, характеризующих текстовые документы из различных предметных областей.
В третьей главе рассматриваются вопросы, связанные с разработкой алгоритмов морфологического, синтаксического и семантического анализа текста.
Основное внимание в работе уделено разработке методов, связанных с семантико-синтаксическим анализом текста.
В четвертой главе описываются архитектура системы анализа текста, которая была разработана и использована для проведения экспериментальных исследований.
Экспериментальные исследования разработанных моделей, алгоритмов и методов проводились в основном на текстах следующих предметных областей: техническом, экономическом, экологическом и правовом.
В ходе проведения экспериментов решались такие задачи как проверка правильности выделения именованных групп, определения ключевых слов, выделение векторов цели предложений и абзацев, структуризация текста.
В заключении приведена общая характеристика работы, а также основные выводы и результаты диссертационного исследования.
Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Исследование и разработка автоматизированной системы смысловой обработки текстов в системе управления электронными архивами2013 год, кандидат технических наук Фаррохбахт Фумани Мехди
Методы и программные средства извлечения терминологической информации из научно-технических текстов2013 год, кандидат физико-математических наук Ефремова, Наталья Эрнестовна
Математическое и программное обеспечение полнотекстового поиска в базах данных на основе концептуального моделирования2012 год, кандидат технических наук Колосов, Алексей Павлович
Система поддержки принятия решений на основе хранилища знаний с интеллектуальной обработкой русскоязычного текста на основе объектной семантической сети2004 год, кандидат технических наук Кузнецов, Денис Юрьевич
Системы и информационные технологии обработки естественно-языковых текстов на основе прагматически-ориентированных лингвистических моделей2000 год, доктор технических наук Сулейманов, Джавдет Шевкетович
Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Бледнов, Андрей Михайлович
Выводы и рекомендации, полученные в результате проведенного в работе исследования, применимы для дальнейшей научной разработки принципов и методов решения актуальных проблем создания информационных ресурсов.
Методические подходы и практические рекомендации по решению ряда ключевых проблем анализа текстовой информации могут быть рекомендованы для использования образовательными учреждениями, коммерческими предприятиями в практической деятельности, а также в любой организации, использующей информационные ресурсы.
Основные положения диссертационной работы докладывались на следующих конференциях: научно-техническая конференция с международным участием в рамках форума «Высокие технологии - 2004», ноябрь 2004, г. Ижевск; научная конференции «Технологии информатизации профессиональной деятельности (в науке, образовании и промышленности)», Ижевск, 23-26 ноября 2004 г.; международная научная конференции аспирантов «Управление экономикой в условиях интеграции хозяйственных систем», г.Ижевск, 18-20 апреля 2005 г.; межрегиональная научно-практическая конференция «Реализация стратегии устойчивого развития города Ижевска: опыт и проблемы, г. Ижевск, 28 сентября 2005 г.; международная научная конференция «Современные информационные технологии и письменное наследие: от древних рукописей к электронным текстам», г. Ижевск, 13-17 июля 2006 г.; на рабочих семинарах, проводимых Управлением информатизации и Центром телекоммуникаций и технологий Интернет ИжГТУ по вопросам создания «Фонда электронных изданий» и организации дистанционного обучения.
Достоверность и обоснованность результатов подтверждены теоретическими и экспериментальными исследованиями по анализу различных текстов, выполненными на базе специально разработанного программного комплекса «ТЕКСТАН» анализа текстовой информации.
В настоящее время наиболее приоритетным направлением исследований автора данной работы является механизм пополнения баз знаний.
ЗАКЛЮЧЕНИЕ
Подводя итог проделанной работе, необходимо отметить ситуацию, сложившуюся в области компьютерного анализа текста на ЕЯ. На сегодняшний день задача обработки текстов на естественном языке является одной из наиболее актуальных проблем. Алгоритмы, опирающиеся на частотные характеристики текста (встречаемость слов, корреляция слов и т.п.) уже не дают адекватных результатов. Существующие методы компьютерного анализа текста показывают относительно невысокие результаты на уровне семантического анализа предложений сложной структуры. Это связано, в первую очередь, с характерной особенностью русскоязычных текстов, отличающихся разнообразием и сложностью структуры предложений.
Одним из способов повышения эффективность анализа русскоязычных текстов могут служить методы и информационная технология, основанные на векторном представлении текстовой информации. Подобное представление обеспечивает выражение основной идеи анализируемого текста путем раскрытия множества целей разного ранга, определяемых отдельными предложениями, абзацами, параграфами, главами и т.п.
Целью работы являлась разработка и исследование моделей и информационной технологии семантико-синтаксического анализа русскоязычного текста, обеспечивающих эффективное решение экспертом задач, связанных со структуризацией текстовой информации и формированием информационных ресурсов.
В работе получены следующие основные выводы и результаты:
1. Характерной особенностью русскоязычных текстов является разнообразие и сложность структуры предложений. Существующие методы компьютерного анализа текста показывают относительно невысокие результаты на уровне семантического анализа предложений сложной структуры.
2. Повышение эффективности анализа текста в данной работе достигается путем разработки соответствующих моделей и информационной технологии, основанной на векторном представлении текстовой информации.
Разработанные модели и информационная технология анализа русскоязычных текстов позволяют повысить эффективность систем анализа текста за счет:
- направленной фильтрации на этапе предварительной обработки и уменьшения за счет этого объема обрабатываемой информации;
- применения векторной технологии анализа текста, обеспечивающей высокий уровень структуризации текста и формирование развернутого плана анализируемого текстового документа для работы эксперта;
- применения процедуры нормализации сложного предложения, обеспечивающей однозначное разбиение сложного предложения на множество простых.
3. Разработана процедура нормализации сложных предложений русскоязычного текста.
4. Построена статистическая и векторная модели текста.
5. Разработана информационная технология семантико-синтаксического анализа.
6. Выполнены экспериментальные исследования предложенных решений анализа русскоязычных текстов на базе специально созданного ПК «ТЕКСТАН».
7. Применение разработанной информационной технологии анализа русскоязычных текстов позволяет автоматизировать многие процессы, связанные с созданием и использованием информационных ресурсов профессиональной направленности.
Основные положения, методы и технология обработки текста реализованы автором в виде законченного программного комплекса «ТЕКСТАН». Данный программный комплекс был использован при формировании информационной системы ИжГТУ, при формировании информационных ресурсов по различным направлениям подготовки бакалавров, специалистов, магистров, при изучении принципов построения ИС.
Список литературы диссертационного исследования кандидат технических наук Бледнов, Андрей Михайлович, 2007 год
1. Андреев А.М.,Березкин Д.В.,Сюзев В.В., Шабанов В.И. Модели и методы автоматической классификации текстовых документов// Вестн. МГТУ. Сер. Приборостроение. М.:Изд-во МГТУ.- 2003.- №3.
2. Анно Е.И. К типологии алгоритмов синтаксического анализа (для формальных моделей естественного языка). // НТИ. Сер. 2. 1980,- № 3. - С.15-22.
3. Аношкина Ж.Г. Морфологический процессор русского языка // Альманах «Говор». Сыктывкар. 1995. - С. 17-23.
4. Апресян Ю.Д. Избранные труды, Том 1. Лексическая семантика: 2-е изд., испр. и доп. М.:Школа «Языки русской культуры», 1995. - 302 с.
5. Апресян Ю.Д. Экспериментальное исследование семантики русского глагола. Москва: «Наука», 1967. - 185 с.
6. Арутюнова Н.Д. Время: модели и метафоры. Логический анализ языка: язык и время. М., 1979. - 88 с.
7. Ахутина Т.В. Порождение речи. Нейро-лингвистический анализ синтаксиса. М.: МГУ, 1989. - 41 с.
8. Бледнов A.M. Применение векторной модели представления текстовой информации для пополнения базы знаний. // Вестник ИжГТУ: период, науч.-теор. Журн. ИжГТУ. 2006. - №4. Ижевск: Изд-во ИжГТУ, 2006. С. 56-60.
9. Бледнов A.M., Моченов C.B., Луговских Ю.А. Применение статистических методов при анализе текстовой информации. //
10. BAAJI: Экспертная компьютерная психолингвистическая программа, http ://www.logic.ru/~shalack.
11. Виноград Т. Об одном подходе к изучению дискурса. В сб. «Взаимодействие с ЭВМ на естественном языке», Новосибирск, ВЦ СО АН СССР, 1978. С. 11-47.
12. Гарвин П. Алгоритм синтаксического анализа «Фулькрум» (для русского языка) // Автоматический перевод. -М.: Прогресс, 1971. С. 26-40.
13. Гладкий A.B. Формальные грамматики и языки. М.: Наука, 1973. - 52 с.
14. Гладкий A.B. Синтаксические структуры естественного языка в автоматизированных системах общения. М.,1985. 67 с.
15. Гладун В. П. Процессы формирования новых знаний. София: Педагог, 1994.-190 с.
16. Грязнухина Т.А., Дарчук Н.П., Критская В.И., Маловица Н.П. и др. Синтаксический анализ научного текста на ЭВМ, К.: Научная мысль, 1999.-77 с.
17. Ермаков А.Е. Проблемы полнотекстового поиска и их решение // Мир ПК. 2001. - № 5. (http://www.osp.ru/pcworld/2001/05/161575/)
18. Ермаков А.Е. Тематический анализ текста с выявлением сверхфразовой структуры // Информационные технологии. 2000. - № 11. (http://www.metric.ru/publications.asp?obno=319)
19. Ермаков А.Е., Плешко В.В. Ассоциативная модель порождения текста в задаче классификации // Информационные технологии. 2000. - № 12.-С. 34-37
20. Ермаков А.Е., Плешко В.В. Тематическая навигация в полнотекстовых базах данных // Мир ПК. 2001. - № 8. (http://www.osp.ru/pcworld/2001/08/16203II)
21. Зализняк A.A. Грамматический словарь русского языка: словоизменение. 3-е изд. Москва: Рус. яз., 1987.
22. Игумнов Е. Основные концепции и подходы при создании контекстно-поисковых систем на основе реляционных баз данных. (http://www.citforum.ru/database/articles/searchsys.shtml).
23. Иванов С.А. Стохастические фракталы в информатике / /НТИ. Сер. 2. -2002.-№8.-С. 7-18.
24. Иомдин Л.Л. Симметричные предикаты в русском языке. Проблемы структурной лингвистики 1979, М., Наука, 1981.
25. Искусственный интеллект. В 3-х кн. Кн.1. Системы общения и экспертные системы: Справочник. /Под ред. Д.А.Поспелова. -М.: Наука, 1990.
26. Кандрашина Е.Ю., Очаковская О.Н., Голубева JI.A. Экспериментальная вопросно-ответная система ВОСТОК-О. Описание средств для представления семантической информации. Препринт ВЦ СО АН СССР№ 174,1979.
27. Карпова Г. Д., Пирогова Ю. К., Кобзарева Т. Ю., Микаэлян Е. В. Компьютерный синтаксический анализ: описание моделей и направлений разработок. // Итоги науки и техники (серия «Вычислительные науки»). Т.6. -М.: ВИНИТИ, 1991.
28. Касевич В.Б. Семантика. Синтаксис. Морфология. -М. 1988.
29. Касевич В.Б. Элементы общей лингвистики. М., 1977.
30. Кендалл МДж., Стьюарт А. Статистические выводы и связи. М.: Наука, 1973.
31. Ковальченко И.Д. О применении математических методов при анализе историко-статистических данных // История СССР. 1964. - №1. - С. 3 -15.
32. Кудряшова И.М. О семантическом словаре в системе ФРАП.- М.: МГПИИЯ им. М. Тореза. Сборник научных трудов. Вып. 271., 1986.
33. Кузнецов И.П. Семантические представления. М.: Наука, 1986.
34. Кузнецов И.П., Козеренко Е.Б. Поиск языковых универсалий для лингвистического моделирования на расширенных семантических сетях. Труды Международного семинара Диалог-99 по компьютерной лингвистике и ее приложениям. Таруса, 1999г., С.157-164.
35. Кулагина О.С. Исследования по машинному переводу. М.: Наука, 1979.
36. Ландэ Д.В. Поиск знаний в Internet. М.:Диалектика, 2005. - 272 с.
37. Левин Д.Я., Нариньяни A.C. Экспериментальный минипроцессор: семантически-ориентированный анализ. В сб. «Взаимодействие с ЭВМ на естественном языке», Новосибирск, ВЦ СО АН СССР. 1978, С. 223-233.
38. Леонтьева H.H. «Политекст»: информационный анализ политических текстов. // НТИ. Сер 2. - 1995.- № 4.- С. 20-24.
39. Леонтьева H.H. Система французско-русского автоматического перевода (ФРАП): лингвистические решения, состав, реализация. -МГПИИЯ им. М. Тореза. Сборник научных трудов., Вып. 271., М.,1986.
40. Леонтьева H.H. Строение семантического компонента в информационной модели автоматического понимания текста. Автореф. и дисс. д.т.н. М., 1990.
41. Леонтьева H.H. Русский общесемантический словарь (РОСС):структура, наполнение. // НТИ. Сер. 2. - 1997. - № 12. - С. 5-20.
42. Леонтьева H.H., Кудряшова И.М., Малевич О.Б. Семантические заготовки к пониманию целого текста. М.: МГПИИЯ им. М. Тореза. Сборник научных трудов., Вып. 271., 1986.
43. Леонтьева H.H., Никогосов С.Л. Система ФРАГТ и проблема оценки качества автоматического перевода. -М.: МГПИИЯ им. М. Тореза. Сборник научных трудов., Вып. 20., 1980.
44. Лукашевич Н.В. Автоматизированное формирование информационно-поискового тезауруса по общественно-политической жизни России // НТИ. Сер.2. 1995.-Х» 7.-С. 21-24.
45. Лукашевич Н.В., Салий А.Д. Представление знаний в системе автоматической обработки текстов // НТИ. Сер.2. 1997. - № 3. - С. 27 -33.
46. Лурия А.Р. Язык и сознание. М.1979;
47. Мельчук И.А Опыт теории лингвистических моделей «Смысл-Текст». Семантика, синтаксис. М.: Школа «Языки русской культуры», 1999.
48. Нариньяни A.C. Работы по искусственному интеллекту в
49. Вычислительном центре СО АН СССР. Доклад на Международной конференции по искусственному интеллекту, Репино, 1977.
50. Никогосов С.Л. Программное обеспечение машинного перевода. -ВЦП. Серия Машинный перевод и автоматизация информационных процессов. Вып 9.1984.
51. Новицкий Д.В. Система интерактивной работы с текстом с применением искусственного интеллекта (на семантическом уровне) // История и компьютер. 1998. - №23. - С. 45 - 49.
52. Павиленис Р.И. Проблема смысла. Современный логико-философский анализ языка. М.1983.
53. Падучева Е.В. Коммуникативное выделение на уровне синтаксиса и семантики. Сборник «Семиотика и информатика», Вып. 36,1998.
54. Панкратов Д.В., Гершензон Л.М. Описание синтаксического анализа в системе Диалинг. (http://www.aot.ru/docs/synan.htm)
55. Панфилов В.З. Логика и грамматика. М.1963.
56. Петров А.И. Компьютерный анализ текста. Историография метода // Круг идей: модели и технологии исторической информатики. М., -1999.-С. 255-277.
57. Пешковский A.M. Русский синтаксис в научном освещении. 8-е изд. -М.: УРСС. - 2001.-432 с.
58. Пиотровский Р.Г., Билан В.Н., Боркун М.Н., Бобков А.К. Методы автоматического анализа и синтеза текста. Минск: Вышейшая школа, 1985.
59. Плешко В.В., Ермаков А.Е., Липинский Г.В. TopSOM: визуализация информационных массивов с применением самоорганизующихся тематических карт // Информационные технологии. 2001. - № 8.
60. Попов Э.В. Общение с ЭВМ на естественном языке. -М.: Наука, 1982.
61. Поспелов Д.А. Искусственный интеллект. Кн. 2. М.: Радио и связь, 1990.
62. Прагматика и семантика. ИНИОН. М.1991
63. Прикладное языкознание / Отв. ред. A.C. Герд. СПб., 1996.
64. Реформатский A.A. Введение в языковедение. М.: Аспект Пресс, -2004.-536 с.
65. Розенталь Д.Э. Управление в русском языке. Словарь-справочник. М.: Книга, 1986.
66. Салмин П. Проект фразеологического словаря в системе ПОЛИТЕКСТ. РГТУ, ФТИПЛ, дипломная работа, 1998.
67. Севбо И.П. Графическое представление синтаксических структур и стилистическая диагностика. Киев, Наукова думка, 1981.
68. Семенова С.Ю. Поиск параметрической информации в тексте: алгоритмический и лексикографический аспекты // Труды Международного семинара Диалог'96 по компьютерной лингвистике и приложениям. М., 1996. - С.227-230.
69. Семенова С.Ю. Прилагательные в семантическом словаре одной прикладной системы. // Труды Международного семинара Диалог'98 по компьютерной лингвистике и ее приложениям. -С.553-564.
70. Сепир Э. Статус лингвистики как науки / Сепир Э. Избранные трудыпо языкознанию и культурологии. — М.: Прогресс, 1993. — С. 259-265.
71. Скрипник К.Д. Семиотика. М.: Диалог, 2000. - 102 с.
72. Сменцарев Г.В. О возможностях анализа исторических источников с помощью систем искусственного интеллекта // Информационный Бюллетень Комиссии по применению математических методов и ЭВМ в исторических исследованиях при Отделении истории РАН. 2000. №25.
73. Сокирко A.B. Программная реализация русского общесемантического словаря. // НТИ. Сер 2. 1997.- № 12.- С. 20-24.
74. Сокирко A.B. Реализация первичного семантического анализа в системе Диалинг // Труды Международного семинара Диалог'2000 по компьютерной лингвистике и ее приложениям, Протвино, 1-5 июня 2000 года, (http://www.aot.ru/docs/graphan.html)
75. Солодуб Ю.П. Сопоставительный анализ структуры лексического и фразеологического значений // Филологические науки. НДВШ. 1997. №5. С.43-54.
76. Сусов И.П. Введение в теорию языкознания: Программно-справочное пособие. Тверь, 1978.
77. Сущанская Н.Ф. Программный препроцессор для естественноязыковых интерфейсов. Автореф. дисс. к.т.н. К.: РИО РЖ, 1989.
78. Тихонова Н.В. Концепт как инструмент лингвистического анализа текста, (http://hist.asu.ru/kleio/aik/bullet/23/30.html)
79. Тузов В.А. Компьютерная семантика русского языка. Спб.: Изд-во СПбГУ, 2004.-400 с.
80. Файн В. С. Машинное понимание естественного языка в рамках концепции реагирования// Интеллектуальные процессы и их моделирование. М. Наука, 1987.- С. 375-392.
81. Цейтин Г.С., Откупщикова М.И., Лейкина Б.М., Невлева Т.Н. Система анализа текста с процедурным представлением словарной информации. В кн.: Актуальные вопросы практической реализации систем автоматического перевода. М. 1982.
82. Шихов К. Л. TACT и его тактичность. (http://hist.asu.ru/kleio/aibbullet/23/32.html)
83. E.Bach and B.Halms, N.Y., 1968. 95.International Standards Organization (ISO): 8879: Information Processing: Text and Office Systems: Standard General Markup Language (SGML). Geneva. 1986.
84. ISO/TR 9573: Information Processing SGML Support Facilities -Techniques for Using SGML (ISO, 1988)
85. Levi, Judith N. 1978. The Syntax and Semantics of Complex Nominals. New York: Academic Press.
86. Meadow C.T. Text Information Retrieval Systems. San Diego. 1992.
87. The Computer & Literary Style: Introductionary Essays and Studies. Ed. by J.Leeds. Kent. Ohio. 1966.
88. А Яи в 06 V 17/20. Способ автоматического реферирования при помощи ЭВМ несегментированного текста на языке с идеографической системой письменности / Загибалов Т.Е. № 2004114542/09; Заявл. 27.10.2005.-№30.-С. 462.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.