Нейросетевой подход к интегрированному представлению и обработке информации в интеллектуальных системах тема диссертации и автореферата по ВАК РФ 05.13.01, доктор технических наук Харламов, Александр Александрович
- Специальность ВАК РФ05.13.01
- Количество страниц 275
Оглавление диссертации доктор технических наук Харламов, Александр Александрович
Введение
Глава 1. Проблемы представления и обработки информации в интеллектуальных системах
1.1. Извлечение ключевой информации
1.2. Системы искусственного интеллекта
1.2.1. Тенденции развития систем искусственного интеллекта
1.2.2. Типы искусственно-интеллектуальных систем
1.3. Интеллектуальные системы
1.4. Анализ интеллектуальных систем с точки зрения эффективности обработки информации
1.4.1. Системы распознавания речи
1.4.2. Системы распознавания изображений
1.4.3. Системы анализа текстов
1.4.4. Семантические представления в интеллектуальных системах
Глава 2. Теоретические основы построения нейросетевых технологий обработки неструктурированной информации разных модальностей
2.1. Преобразование, реализующее свойство ассоциативности обращения к информации
2.1.1. Запоминание информации. Воспроизведение. Авто- и гетероассоциативность
2.1.2. Формирование статистической модели. Забывание
2.1.3. Формирование словаря
2.1.4. Формирование синтаксической последовательности. Многоуровневая структура
2.1.5. Расфокусированное преобразование
2.1.6. Механизм локального внимания
2.1.7. Распознавание
2.1.8. Топология сигнального пространства. Устойчивость к разрушению
2.1.9. Передача информации, устойчивая к потерям
2.2. Иерархия, реализующая структурную обработку информации
2.2.1. Концептуальная иерархическая структура
2.2.2. Реальная иерархическая структура
2.3. Фреймовая организация знаний на основе иерархической структуры ассоциативных процессоров обработки информации
2.3.1. Модель мира на основе иерархической структуры ассоциативных процессоров обработки информации - семантическая сеть
2.3.2. Семантические представления
2.3.3. Фрейм-структура - динамическое знание - как отклик подмножества семантической сети на входную ситуацию
2.3.4. Механизм внимания - механизм формирования фрейм-структуры на семантической сети
Глава 3. Нейронные сети для представления информации 98 3.1. Использование нейронных сетей для представления информации 98 3 11. Представление статической и динамической информации с помощью нейронных сетей 98 , 3.1.2. Использование статических нейронных сетей для представления квазидинамической информации
3.2. Использование рекуррентных (динамических) нейронных сетей для представления информации
3.2.1. Гребенки статических нейронных сетей с задержками для представления динамической информации
3.2.2. Введение обратных связей в нейронных сетях и сохранение временного контекста
3.3. Динамическое ассоциативное запоминающее устройство
3.3.1. Нейроподобный элемент с временной суммацией сигналов
3.3.2. Временная суммация сигналов - основа механизма избирательной адресации нейронов
3.3.3. Сеть из нейроподобных элементов с временной суммацией сигналов
3.3.4. Биологические предпосылки
3.4. Нейронная сеть для переупорядочивания информации
3.4.1. Архитектура гиппокампа
3.4.2. Поле СА
3.4.3. Поле СА-|. Конкурентная сеть '
3.4.4. Функция переупорядочивания информации
Глава 4. Структурный подход с использованием нейросетевой технологии -естественный путь решения задачи анализа неструктурированной информации разных модальностей и интеграции их в единую структуру
4.1. Распознавание речи
4.1.1. Многоуровневая иерархия представления лингвистической информации
4.1.2. Формирование многоуровневого языкового представления у человека
4.2. Распознавание изображений
4.2.1. Основные функции элементов зрительного анализатора
4.2.2. Иерархия механизмов обработки информации в модели зрительного анализатора
4.3. Семантический и прагматический уровни представления знаний
4.3.1. Парадигматическая и синтагматическая семантика
4.3.2. Многомодальные семантические представления
4.3.3. Прагматический уровень обработки информации на примере речевого поведения
4.4. Структурная обработка текстовой информации. Подчеркивание существенных элементов модели
4.4.1. Обработка текстовой информации человеком
4.4.2. Структурная обработка текстовой информации
4.4.2. Формирование статистического портрета текста в многомерном пространстве
4.4.3. Формирование ассоциативной сети перенормировкой весовых характеристик слов
4.4.4. Квази-семантическая картина мира на основе текстового представления
Глава 5. Программные приложения на основе нейросетевой технологии обработки информации различных модальностей
5.1. Система для структурного анализа текстов «TextAnalyst»
5.1.1. Программная реализация технологии
5.1.2. Основные функции системы «TextAnalyst»
5.1.3. Электронная книга
5.2. Система распознавания речи
5.2.1. Первичная обработка речевого сигнала
5.2.2. Акустико-фонетическое преобразование
5.2.3. Нейросетевой анализ акустического текста
5.2.4. Лексический уровень обработки информации
5.3. Система распознавания изображений символов
5.3.1. Предобработка и кодирование изображения
5.3.2. Представление и распознавание эталонов символов
Глава 6. Аппаратные реализации на основе нейросетевого подхода
6.1. Аппаратная реализация адресного блока динамического ассоциативного запоминающего устройства 222 6.1.1. Режимы обучения и распознавания
6.2. Нейрочип
6.2.1. Моделирование нейрочипа
6.2.2. Функциональное описание СБИС нейрочипа
6.2.3. Внешние выводы
6.2.4. Каскадирование приборов
6.2.5. Конструктивное исполнение
6.3. Модуль ассоциативной памяти для высокопроизводительных нейрокомпьютеров, решающих задачу обработки информации верхних уровней в системе распознавания ключевых слов в потоке слитной речи
6.3.1. Архитектура модуля ассоциативной памяти
6.3.2. Конструкция модуля ассоциативной памяти
6.3.3. Мягкие вычисления на ассоциативной памяти, реализованной с применением САМ
6.4. Модель обработки речевой информации с использованием модулей ассоциативной памяти
6.5. Ассоциативный поисковик с доступом к информации за один такт. Полнотекстовая индексация на основе динамического ассоциативного запоминающего устройства 247 Заключение , 250 Библиография 263 Приложения. Акты о внедрении
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Исследование и разработка нейросетевых методов анализа и обработки речевого сигнала в задаче распознавания речи2006 год, кандидат технических наук Кушнир, Дмитрий Алексеевич
Аудиовизуальные речевые интерфейсы в ассистивных информационных технологиях2013 год, доктор технических наук Карпов, Алексей Анатольевич
Параллельные цифровые нейрокомпьютеры и их применение в задачах распознавания зрительных образов1997 год, доктор технических наук Галуев, Геннадий Анатольевич
Нейросетевая мультилингвистическая система адаптивного обучения терминологической лексике2004 год, кандидат технических наук Усачев, Александр Владимирович
Методы и программные средства многоканальной дистанционной обработки речи и их применение в интерактивных многомодальных приложениях2010 год, доктор технических наук Ронжин, Андрей Леонидович
Введение диссертации (часть автореферата) на тему «Нейросетевой подход к интегрированному представлению и обработке информации в интеллектуальных системах»
Предыстория и актуальность темы
В настоящее время теория и практика обработки больших информационных массивов имеет длительную и богатую традицию, и большой арсенал успешных решений. Это относится как к области распознавания образов различной природы, так и к области извлечения ключевой информации с целью ее компактного представления пользователю. В данном случае не рассматриваются вопросы сжатия информации для передачи по каналам связи. Рассмотрим подробнее проблему эффективного извлечения ключевой информации из источников различной природы, с целью ее компактного представления пользователю.
Сейчас успешно решаются отдельные задачи из области распознавания образов: известны коммерческие системы распознавания речи, распознавания изображений, автоматического анализа текстов [120, 119, 139]. Степень успешности решения этих задач зависит от степени формализованности описания предметной области [60]. Так, хорошо распознаются изображения символов -букв и цифр [117], менее успешно, но все же решена задача распознавания изображений лиц [119]. Решена задача распознавания изолированно произнесенных команд [120]. Успешно решена задача выявления грамматических и синтаксических ошибок в тексте [117].
Из психологических исследований известно, что до 85% новых знаний аналитики получают, изучая тексты, поэтому сначала сосредоточимся на вопросах извлечения ключевой информации из текстов [32]. К наиболее актуальным направлениям извлечения знаний из текста на сегодняшний день относятся: аннотирование документов, выполнение индексирования, построение и динамический анализ семантической структуры текстов, выделение ключевых тем и информационных объектов. К ним же можно отнести поиск в текстах объектов -фактов (атрибутивный анализ) и их взаимосвязей, что позволяет исследовать связи объектов из документов осуществлять навигацию к нужным объектам, для получения и анализа документов о связях этих объектов.
Источники информации не всегда являются текстами. Это могут быть фотографии, видеозаписи, а также речевая информация [78]. Растущий объем мультимедийной информации делает ее едва ли не самым важным объектом для обработки средствами реферирования. Соответствующие технологии должны 5 обрабатывать информацию из источников разного типа на этапе анализа, на этапе извлечения и на этапе синтеза, когда происходит интеграция информации разного типа. Это относится к выделению ключевых слов в потоке слитной речи, что позволяет вычленять из потока речевой информации нужные фрагменты, а также осуществлять контентный анализ речевой информации. Это относится также к обработке видеоряда с выявлением фрагментов, содержащих интересные события [129].
Более сложные задачи - распознавание изображений сцен, диктовка текстов с микрофона, автоматическая классификация текстов - далеки от решения. Существующие системы лишь демонстрируют уровень сложности этих задач. Трудности, возникающие при решении этих задач, определяются, в том числе, существенной неоднозначностью анализируемой информации, что приводит к формированию большого числа гипотез, проверка которых, в случае обработки больших объемов информации становится нетривиальной задачей, а иногда и не решаемой в рамках разрешения применяемых методов.
Естественным способом улучшить ситуацию является использование семантической и прагматической информации, которая является фильтром, позволяющим ограничить число гипотез, возникающих комбинаторно в системах распознавания на нижних уровнях принятия решений. Такими нижними уровнями для системы распознавания изображений являются уровень элементарных представлений, уровень элементов объектов, и уровень объектов. В задачах распознавания речи и анализа текстов это - морфологический, лексический и синтаксический уровни представления и обработки информации.
В настоящее время сложность методов представления семантической и прагматической информации как металингвистическими, так и образными средствами практически не позволяет эффективно использовать эту информацию для решения задач распознавания образов.
В рамках научного направления искусственный интеллект предпринимались и предпринимаются многочисленные попытки использования семантической и прагматической информации, в основном, для решения задачи человеко-машинного общения на естественном языке [55, 117]. Широко известна работа Попова Э.В. в этом направлении. Однако, по его мнению, успех работы был обусловлен исключительно тем, что семантическая картина мира была заменена жесткой структурой реляционной базы, данные из которой и интерпретировались на естественном языке. В настоящее время предпринимаются попытки интерпретации естественно-языковых высказываний в терминах понятий и их отношений [50]. Но большая неоднозначность этих интерпретаций, возникающая в силу многозначности языковой модели мира, не позволяет автоматически формировать модель мира на основе текстов.
Менее известны способы использования семантической информации для распознавания изображений. В качестве модели мира для анализа сцен использовалась квази-Зс! сцена, на которой отдельные объекты представляются обобщенными геометрическими формами: шариками, цилиндрами. С помощью этого представления осуществляется сегментация и идентификация объектов сцены, которые далее описываются метаязыковыми терминами, так же как и отношения между ними, и их динамика [28].
Разработка методов представления информации семантического и прагматического уровней, одинаково удобных для использования, как в задачах распознавания, так и в задачах выделения ключевой информации, является основным моментом и при улучшении качества, и при увеличении функциональности указанных систем, а также в переходе на следующий этап разработки интеллектуальных систем - этап создания интегрированных многомодальных систем обработки и хранения информации - интегральных роботов. Существование этих задач заставляет искать новые подходы к методам представления и обработки информации различных модальностей - речевой, зрительной, а также надмодальной (семантической, прагматической) информации.
Для решения задач данного типа необходим интегрированный подход, позволяющий объединять при решении задачи информацию различных типов, а также надмодальную - семантическую - информацию, при помощи которого можно построить общую методологию решения этой проблемы на основе единой математической модели. Она должна содержать методы: обработки и представления текстовой информации; обработки лингвистической и семантической информации; обработки изображений; математического описания обработки и представления информации различных типов; реализации выбранного типа представлений, в том числе с использованием аппарата искусственных нейронных сетей.
На основании этого, составными частями такого интегрированного подхода должны стать методы: обработки текстовой информации, обработки лингвистической информации, обработки изображений, извлечения ключевой информации различной природы, аппаратной поддержки таких представлений, в том числе с использованием ассоциативной памяти, эмулирующей искусственную нейронную сеть.
Для практического подтверждения правильности выбранных методов необходимо отработать их применение на обработке реальной информации, для чего необходимо разработать программные реализации систем распознавания речи и изображений, а также анализа текстов, включающих представление семантической и прагматической информации. Реальная интеграция представления информации различных модальностей, а также надмодальной информации может быть эффективно осуществлена на основе аппаратной реализации указанных методов.
Поскольку до настоящего времени ни один из этих вопросов не решался в совокупности со всеми остальными, при наложении ограничений на качество предоставляемой пользователю ключевой информации, можно считать, что решение такой проблемы весьма актуально.
Цель работы
Целью настоящей диссертационной работы является выявление эффективных способов представления многоуровневой структурированной информации различных модальностей (изображения, речь, текст) адекватных представляемой информации, позволяющих естественным образом воспроизводить структуру информации так, как это происходит в мозгу человека. Указанные способы должны позволить осуществлять эффективное представление, как информации различных модальностей, так и надмодальной информации, в том числе, семантической и прагматической.
Выбранные способы представления и обработки информации должны позволять осуществить единое интегрированное представление многомодальной и надмодальной информации, каковая, являясь многомодальной моделью мира, или ее частью - фреймом, сценарием - позволит фильтровать комбинаторные гипотезы, возникающие на разных уровнях в разных модальностях.
Задачи, решаемые в диссертационной работе
Достижение поставленной цели предполагает решение ряда задач теоретического, методического и практического характера. В том числе задач:
• разработки теоретических основ и формализации процесса нейросетевой обработки информации;
• формализации нейросетевого представления и обработки информации различных модальностей: речи, изображений, текстов, а также надмодальной информации: семантической и прагматической;
• разработки методов и алгоритмов для структурной нейросетевой обработки изображений, речи, текстов;
• разработки методов аппаратной реализации эффективного представления и нейросетевой обработки информации.
Для достижения поставленных задач необходимо провести следующие исследования:
• рассмотреть существующие подходы к обработке и распознаванию информации различных модальностей, а также надмодальной: семантической и прагматической информации, и на их основе разработать единое математическое описание для представления в наиболее общей форме технологии обработки информации, описания эталонов, методов распознавания;
• разработать обобщенный способ описания объектов (эталонов), включающий способы его получения и методы, по которым он может быть идентифицирован.
Методы исследований, применяемые в работе, основываются на использовании алгоритмов обработки изображений, алгоритмов распознавания речи, алгоритмов обработки текстовой информации, теории распознавания образов, теории графов.
Достоверность результатов теоретических исследований подтверждается данными, полученными при обработке реальной информации, с применением построенных системы распознавания изображений рукописных символов, системы распознавания речи, и системы анализа текстов.
Научная новизна работы заключается в следующем:
• разработаны теоретические основы и формализация процесса нейросетевой обработки информации с помощью одного класса искусственных нейронных сетей на основе нейроподобных элементов с временной суммацией сигналов;
• разработана формализация представления и нейросетевой обработки информации различных модальностей: речи, изображений, текстов, а также надмодальной информации: семантической и прагматической;
• разработаны методы и алгоритмы для структурной нейросетевой обработки изображений, речи, текстов;
• разработаны методы аппаратной реализации эффективного представления и нейросетевой обработки информации.
Практическая ценность диссертационной работы состоит в том, что ее результаты были использованы или могут быть использованы в разработке:
• систем распознавания слитной речи и систем понимания речи для построения источников знаний верхних уровней;
• систем распознавания изображений для структурного анализа, включая автоматическое формирование эталонов разных уровней;
• систем анализа текстовой информации, в том числе, информационных и информационно-поисковых систем;
• блоков ассоциативной памяти, позволяющей реализовать быстрый поиск на больших массивах данных.
Реализация результатов. Результаты исследований в виде готовых программных продуктов были использованы в организациях министерства обороны и других органах государственной власти, в учебном процессе Российского государственного социального университета, и на фирмах «Интеллектуальные системы безопасности», «ОАО Ангстрем-М», «Юникор микросистемы», в Hague Centre for Strategic Studies.
Апробация работы. Основные положения диссертации докладывались на Международном симпозиуме «Нейронные сети и нейрокомпьютинг» NEURONET'90, Прага 1990г.; на Всесоюзном семинаре «Автоматическое распознавание слуховых образов (АРСО-16)», Москва 1991г.; на Международном совещании «Нейрокомпьютеры и внимание», Москва 1991г.; на XI Международной конференции по нейрокибернетике, Ростов-на-Дону 1995г.; на Втором международном симпозиуме «Интеллектуальные системы», С.-Петербург 1996г.; на IV Всероссийской конференции «Нейрокомпьютеры и их применение (НКП-98)», Москва 1998г.; на Международной конференции «Информатизация правоохранительных систем», Москва 1998г.; на Третьем Международном симпозиуме «Интеллектуальные системы», Псков 1998г.; на IX сессии Российского акустического общества, Москва 1999г.; на международной конференции-совещании "Новые информационные технологии из России", Берлин 2002г.; на IV Международном социальном конгрессе, Москва 2004г.; на международной конференции-совещании "Новые информационные технологии из России", Белград 2004г.; на Международной научно-технической конференции «Интеллектуальные и многопроцессорные системы - 2005 (ИМС-2005)», Геленджик 2005г., на международной конференции-совещании "Новые информационные технологии из России", Будапешт 2005г.; на Третьем совещании Российской секции IEEE Computation Intelligence Society «Биометрические системы», Москва 2005г., на 5-х Годичных научных чтениях факультета иностранных языков РГСУ, Москва 2006г.; на конференции «Нейрокомпьютеры и их применение» (Нейро-2007), Геленджик 2005г., на конференции «Digital libraries and technology-enhanced learning: Call 3 information days», Люксембург 2007г.; на молодежной школе «Нейрокомпьютеры 2008», Таганрог 2008г., на семинаре кафедры Искусственного интеллекта Белорусского государственного университета информатики и радиоэлектроники, Минск 2008.
Публикации. Результаты работы опубликованы в 58 печатных научных трудах общим объемом 20 печатных листов, среди которых монографии, статьи в центральных журналах, труды и тезисы конференций.
Личный вклад. Лично автором получены следующие основные результаты.
• Разработаны теоретические основы и формализация процесса нейросетевой обработки информации.
• Формализованы нейросетевое представление и обработка информации различных модальностей: речи, изображений, текстов, а также надмодальной информации - семантической и прагматической.
• Разработаны методы и алгоритмы для структурной нейросетевой обработки изображений, речи, текстов.
• Разработаны методы аппаратной реализации эффективного нейросетевого представления и обработки информации.
Структура и объем диссертации. Диссертация состоит из введения, пяти глав, заключения и списка литературы, приложений. Работа содержит 269 страниц текста, список литературы включает 142 наименований.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Логико-лингвистический интегратор русскоязычных текстов для информационной системы в строительстве2004 год, кандидат технических наук Марлов, Александр Владимирович
Высокоточное нейросетевое распознавание в системах технического зрения2011 год, кандидат технических наук Руденко, Ольга Валентиновна
Проектирование математического обеспечения для автоматизированной системы распознавания печатных документов на вьетнамском языке2008 год, кандидат технических наук Хоанг Зянг
Разработка и исследование методов и средств распознавания текста факсимильных сообщений2003 год, кандидат технических наук Цопкало, Николай Николаевич
Методы и алгоритмы аудиовизуального распознавания эмоционального состояния типично и атипично развивающихся детей2023 год, кандидат наук Матвеев Антон Юрьевич
Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Харламов, Александр Александрович
Основные результаты диссертационной работы представляют собой решение научно-практической задачи эффективной интеграции представления и обработки информации различных модальностей, а также надмодальной семантической и прагматической информации, и заключаются в следующем:
1. На основе анализа существующих интеллектуальных систем предложено использование структурных нейросетевых методов для интеграции представления и обработки информации различных модальностей, а также надмодальной семантической и прагматической информации.
2. Проведен анализ современного состояния научной области, связанной с обработкой информации разных модальностей, а также семантической и прагматической информации. В результате этого анализа предложена замена моделей интеллектуальных процессов моделями интеллектуальных процессоров для обработки информации.
3. Для представления произвольной информации в многомерном сигнальном пространстве обосновано использование искусственных нейронных сетей на основе нейроподобных элементов с временной суммацией сигналов.
4. Реализован метод обработки информации, имеющей многоуровневую временную структуру, с помощью динамических искусственных нейронных сетей на основе нейроподобных элементов с временной суммацией сигналов.
5. Разработана архитектура системы источников знаний верхних уровней разных модальностей с использованием однородного нейросетевого представления информации, которая позволяет легко интегрировать информацию всех уровней в процессе принятия решения.
6. Разработана архитектура ассоциативного процессора с памятью на основе нейроподобных элементов с временной суммацией входных сигналов, в которой одним из основных свойств является ассоциативное воспроизведение с динамическим формированием адреса (динамическое ассоциативное запоминающее устройство). Динамическое ассоциативное запоминающее устройство моделирует n-мерный единичный гиперкуб.
7. Реализована интерпретация информационных процессов в нейросетевых структурах - динамических ассоциативных запоминающих устройствах - в виде операций на графах.
8. Разработан формализм динамических нейронных сетей на основе нейроподобных элементов с временной суммацией сигналов, интерпретирующий обработку и представление двоичной внутренне структурированной информации в сигнальном пространстве искусственной нейронной сети, в том числе, ее запоминание, статистическую обработку (с автоматическим структурированием внутреннего представления), воспроизведение и распознавание. Топология сигнального пространства, моделируемого искусственной нейронной сетью, устойчива к разрушению представленной в нем информации. Искусственная нейронная сеть реализует гетероассоциативное запоминание - запоминание информации в ассоциации с несущей последовательностью. В случае тождества информационной и несущей последовательностей реализуется автоассоциативное запоминание. Введение в искусственную нейронную сеть механизма учета статистических свойств информации наряду с нелинейным преобразованием позволяет восстанавливать с его помощью словарь элементов внутренней структуры информационной последовательности. Искусственная нейронная сеть со сформированным в ней словарем элементов позволяет фильтровать новую информацию в потоке старой, формируя, таким образом, информацию о связях слов словаря.
9. Разработан способ представления семантической и прагматической информации с помощью многоуровневой иерархии из динамических ассоциативных запоминающих устройств.
10. Предложено деление единого сетевого семантического представления на семантику и прагматику по динамическому принципу: все понятия модели мира объединяются в ассоциативную сеть - модель мира - на которой конкретные ситуации высвечивают им соответствующие прагматические конфигурации фреймовые структуры.
11. Реализована структура модели мира на основе текстового представления в виде ассоциативной сети, которая содержит основные понятия предметных областей и связи между ними, ранжированные числовыми значениями.
12. Разработана архитектура для представления семантической информации в виде иерархии ассоциативных сетей, в которой на самом верхнем уровне представлены объекты - события и ситуации - в их взаимосвязях, уровнем ниже представлены, также в сетевом виде, модели мира отдельных объектов, которые, в свою очередь, являются двухуровневыми сетями, связанными генетивными отношениями.
13. Предложена интерпретация состава и процесса обработки зрительной информации в зрительной системе человека.
14. Предложена методика формирования многоуровневого представления языковых знаний системы распознавания речи.
15. Теоретические разработки нашли свое воплощение в реализованных системах: системе TextAnalyst для структурного анализа текстов с целью извлечения ключевой информации; распознавания изолированно произносимых речевых команд ограниченного словаря; распознавания изображений символов.
16. Предложено унифицированное базовое аппаратное обеспечение нейронных сетей на базе реализованной автором интегральной схемы адресной части нейроподобного элемента.
17. Реализован аппаратный модуль ассоциативной памяти с использованием стандартных микросхем памяти, адресуемой по содержанию (Content Addressable Memory).
Заключение
Вопрос выбора способа представления информации является решающим при ее обработке. Ассоциативное обращение к информации, наряду с заранее заданной информационной структурой хранилища, является наиболее эффективным способом доступа к информации.
С целью выбора наиболее эффективного способа решения поставленных в диссертационной работе задач, автором рассмотрены вопросы анализа, представления и хранения информации человеком. Рассмотрены способы обработки информации речевой, текстовой и зрительной модальностей. Также рассмотрены способы представления надмодальной информации: семантической и прагматической. Любая информация, попадающая в мозг человека, после специфической, характерной для данной модальности, обработки в периферических отделах анализаторов, оказывается представленной в виде множества параллельно развертывающихся последовательностей электрических импульсов. Точно также выглядят управляющие последовательности в верхних отделах эффекторов.
Автором разработан тип искусственных нейронных сетей на основе нейроподобных элементов с временной суммацией сигналов, позволяющих эффективно обрабатывать, представлять и хранить такие последовательности. Единообразное представление информации в таких сетях позволяет интегрировать многомодальную и надмодальную информацию с формированием многомодальных семантических представлений.
Искусственные нейронные сети на основе нейроподобных элементов с временной суммацией сигналов моделируют многомерное (n-мерное) сигнальное пространство, в которое отображаются информационные последовательности, таким образом, что любые п символов последовательности являются координатами точки в этом пространстве, а последовательность таких п-членных фрагментов последовательности (координат), полученных сдвигом по последовательности на один символ, порождает последовательность точек в сигнальном пространстве - траекторию. Многомерное сигнальное пространство моделируется множеством нейронов - колонкой: один нейрон - одна точка. В силу физических ограничений колонка моделирует не все многомерное пространство, а только некоторую его часть. Поэтому адресные структуры нейронов, моделирующих сигнальное пространство, настраиваются на поступающую информацию. Это происходит до момента исчерпания пула свободных (не хранящих информацию) нейронов данной колонки. Дальнейшее заполнение в этой колонке возможно только информацией, близкой по содержанию к ранее запомненной информации.
Автором сформулирован формализм такого преобразования в многомерное пространство. Преобразование последовательности в траекторию в /7-мерном пространстве обладает фундаментальным свойством ассоциативности обращения к информации. Действительно, как только на входе появляются п символов входной последовательности - сразу же происходит адресация к соответствующей точке сигнального пространства. В этой точке (в нейроне ее моделирующем) запоминается переход к следующей точке траектории. Поэтому ранее записанная последовательность может быть воспроизведена переходом из одной ее точки в другую.
Ассоциативность обращения к информации п<?рождает другое фундаментальное свойство - свойство структурной обработки информации, которое реализуется в сигнальном пространстве (колонке нейронов коры). Если входная последовательность обладает внутренней структурой, например, является последовательностью букв текста на каком-либо языке, будучи отображенной в сигнальное пространство она формирует в нем структурированный граф. Действительно, если во входной последовательности появляется фрагмент, встречавшийся ранее, ему соответствующий фрагмент траектории в сигнальном пространстве пройдет по уже пройденному ранее участку траектории. Если такое «слово» встречается несколько раз, то с помощью порогового преобразования это «слово» выделяется автоматически. При этом убирается вся остальная, ненужная в данном случае информация.
Если какое-то множество элементов внутренней структуры входной последовательности появляется в ней приблизительно с одинаковой частотой (по сравнению с множествами других элементов, например, буквы и слова), то, задавая соответствующим образом значение порога порогового преобразования, можно выделять то или иное множество элементов: автоматически формировать словарь элементов заданной частоты встречаемости.
Сформированный таким образом словарь, при наличии забывания (наряду с обучением), динамически подстраивается под входную информацию. Если со временем меняется состав элементов данного уровня, составляющих множество входных последовательностей, меняется и состав сформированного в сигнальном пространстве словаря. Но этот процесс значительно медленнее процесса формирования словаря, и соотношение скоростей процессов зависит от соотношения скоростей обучения и забывания.
Сформированный в сигнальном пространстве словарь может быть использован как фильтр для входной информации. При его использовании во входных последовательностях отфильтровывается старая (содержащаяся в словаре) информация, и пропускается на выход новая информация. Например, если в речевом анализаторе был сформирован словарь корневых основ, после фильтрации этим словарем во входной последовательности сохраняется только ее флективная структура. Фильтруется лексическая информация и сохраняется синтаксическая информация. Другими словами, если множество входных последовательностей, отфильтрованное сформированным ранее словарем, обработать аналогичным образом в другом сигнальном пространстве, формируется словарь следующего уровня, являющийся грамматикой предыдущего уровня.
Таким образом, можно сформировать друг над другом столько пространств, сколько уровней повторяющихся событий имеется во входной информации.
Необходимо заметить, что вычленение поуровневых словарей позволяет компактно записывать информацию, но не нарушает непрерывности процессов анализа (и синтеза). В силу ассоциативности обращения к информации: как только во входной последовательности кончается слово словаря данного уровня, процесс переходит от траектории в пространстве данного уровня к траектории в пространстве (более высокого, или более низкого) уровня.
Уместно сказать, что вложение проекции входной последовательности в траекторию в сигнальном пространстве означает распознавание. Чем больше степень совпадения (в том числе, и на разных уровнях), тем больше узнавание.
Если на разных уровнях иерархии сигнальных пространств имеется множество сформированных словарей, то возможен процесс, обратный процессу анализа. Запустив воспроизведение слова словаря верхнего уровня (например, флективную структуру предложения в речевом анализаторе) и подавая ее на вход нижнего уровня, по ассоциации на его выходе мы получаем эту флективную структуру, наполненную нужными словами словаря нижнего уровня (корневыми основами) в нужных местах.
Для каждой рецепторной и эффекторной модальности (зрение, слух, управление манипулированием, перемещением) можно сформировать иерархию из сигнальных пространств, структура которой отражает структуру словарей и их отношений для данной модальности. Так для слуховой речевой модальности это будут, например, словари фонем на фонетическом уровне, корневых и флективных морфем, а также аффиксов и слогов - на морфологическом уровне, далее - корневых основ, слов и словоформ, также устойчивых сочетаний слов -на лексическом уровне, далее - синтаксем (флективных структур фрагментов предложений) - на синтаксическом, сочетаний корневых основ - на семантическом, и наконец фреймов ситуаций - на прагматическом уровне. Для зрительного анализатора это, в свою очередь, словари элементарных представлений, элементов объектов, объектов и сцен. Можно заметить, что на верхних уровнях естественно объединение в одном представлении (во фрейме) элементов словарей разных модальностей, в то время как на нижних уровнях -ассоциативная отсылка из одной модальности в другую (от слова одной модальности к слову другой модальности). Так фреймовое представление прагматического уровня может содержать как языковые компоненты лексического уровня, так и представления объектов и сцен зрительной модальности. И другие модальности могут участвовать в этом представлении тоже. За счет ассоциативной отсылки при инициировании слова одной модальности, например, при произнесении слова - имени некоторого объекта, по ассоциации инициируется представление другой модальности - представление названного объекта в зрительной модальности. И в другую сторону: при восприятии изображения объекта инициируется слово - имя объекта.
Так формируется единое многомодальное иерархическое представление, в котором по вертикали устанавливаются отношения внутри модальности, а по горизонтали - между модальностями. Верхние уровни сформированного таким образом представления являются семантической сетью, содержащей события разных модальностей различной степени сложности, а также связи этих событий. Причем, имея в виду частоты появления слов словарей разных уровней и модальностей, можно говорить как о весовых характеристиках представлений этих событий, так и о весовых характеристиках их связей.
Такая семантическая сеть содержит в себе все потенциально возможные события и ситуации с их связями. В ответ на текущую ситуацию на этой семантической сети высвечиваются цепочки разных уровней иерархий разных модальностей. Информационно они могут быть объединены в некую структуру, аналогичную фреймовой структуре. Каждая такая структура описывает отдельную ситуацию, и все вместе они составляют семантическую сеть.
Для корректной работы большого количества ассоциативно связанных сигнальных пространств необходима система управления, которая формирует мозаику возбужденных-заторможенных сигнальных пространств в ответ на входную ситуацию. Динамика возбужденных-заторможенных областей, соответствующая конкретной ситуации, возможно, замешанная специфической информацией соответствующих модальностей, запоминается (также как специфическая модальная информация в специфических иерархиях) в неспецифической иерархической структуре. Далее (как отклик на входную ситуацию) формируется некоторая динамика возбужденных-затрможенных областей, которая подстраивает специфические иерархии под воспроизведение этой ситуации. При прогнозировании некоторой активности - эта динамика подстраивает специфические иерархии под возможное восприятие.
Текущая, поступающая на вход информация, имеет максимальный вес по отношению к ранее запомненной информации, которая уже частично подверглась процессу забывания. Поэтому, для корректного включения новой информации в семантическую сеть необходим процесс переупорядочения семантической сети (пересчета весовых характеристик) включенных в сеть понятий. Для этого используется сеть Хопфилда моделирующая поле СА3 гиппокампа. В этом поле запоминаются связи событий, входящих в ситуации, которые появлялись на входе в период между переупорядочиваниями.
Использование предложенного автором представления обработки информации, и ее хранения позволяет содержательно интерпретировать обработку информации в анализаторах различных модальностей человека. А также, позволяет понять суть многомодального представления семантической информации. Такое многомодальное представление является семантической сетью - многомодальной моделью мира.
От такой интерпретации легко перейти к моделированию процессов обработки информации разных модальностей: речевой, зрительной, текстовой, что означает эффективную техническую реализацию систем выявления ключевой информации с цель ее компактного представления пользователю. Единый способ представления и обработки информации позволяет в будущем объединить эти системы обработки, что может привести к созданию, например, интегрального робота. Различаются в этом случае способы первичного описания входной информации.
На основе представленной технологии автором разработана настраиваемая на диктора система распознавания изолированно произносимых команд ограниченного словаря. В качестве первичной обработки было использовано так называемое перцептивное линейное предсказание. Линейное предсказание - это модель порождения речевой волны, в которой в качестве некоррелированных параметров используются коэффициенты уравнения линейной зависимости предсказанного отсчета речевой волны. Для улучшения качества модели (или для уменьшения порядка модели) речевая волна преобразуется в терминах обработки информации в ухе человека: частотная шкала нелинейно преобразуется в гребенку частотных полос (приведение к шкале барков), а интенсивность сигнала пересчитывается в психоакустически воспринимаемую громкость.
Далее реализуется акустико-фонетическое преобразование: первый этап, на котором порождается система гипотез, интерпретирующих непрерывную последовательность отсчетов векторов параметров в виде непрерывной же последовательности фонетических меток. В данной системе рассматривались два варианта словаря фонетических элементов, используемых для дальнейшего анализа: аллофонов и слогов. При сравнительно небольшом различии в объемах словарей (1500 и 5000 элементов, соответственно), слоги значительно лучше распознаются в силу их большей по сравнению с аллофонами длительностью.
Для анализа качества работы алгоритмов первичной обработки была реализована система покомандного распознавания ограниченного словаря с настройкой на диктора.
Применение априорной информации лингвистического и экстралингвистического характера позволяет отбросить лишние и оставить только те гипотезы, которые соответствуют последовательности слов, предположительно произнесенных диктором. Естественным образом был использован словарь системы как первый, фильтрующий гипотезы механизм.
К сожалению, источники знаний более высоких уровней не были использованы в системе. Однако в настоящее время проводятся работы по добавлению в систему в первую очередь прагматической информации. Описание ситуации является очень важным ограничением, существенно сужающим возможности выбора правильной интерпретации входных команд. Эта работа является важной, в том числе, потому, что позволяет синхронизировать акустическую и текстовую информацию, то есть является первой попыткой объединения в одной системе различных модальностей. Дело в том, что в традиционных работах по распознаванию речи все модели (в том числе и модель языка) строятся на основе только речевой акустической информации. В данном случае для построения прагматического источника знаний используется текстовая информация.
Далее будет построена модель языка (семантическая сеть). Она будет г построена как на основе речевой обучающей выборки, то есть традиционным методом, так и на основе корпуса текстов. И опять будет решаться вопрос синхронизации акустической и текстовой информации. Последним будет привлекаться к анализу синтаксический источник знаний. Синтаксическую информацию труднее всего использовать при распознавании, поскольку она, в основном, содержится в флективной структуре высказывания, которая при произнесении акцентируется слабо, а потому, распознается хуже всего. Кроме того, в спонтанной речи, в отличие от написанных текстов, обычно редко соблюдается литературный синтаксис. И, наконец, после объединения системы распознавания речи и системы распознавания изображений будут предприняты попытки построения бимодальной семантической сети, где словам речевой системы как означающим будут ставиться в соответствие, по крайней мере, некоторые образы зрительной системы.
На основе той же технологии автором была разработана система распознавания графических рукописных символов - букв и цифр русского языка. Введенное изображение подвергается предобработке, целью которой является получение бинарного контурного изображения набора символов. Набор программных средств на этапе предобработки стандартен - улучшение качества изображения, масштабирование, фильтрация, бинаризация, выделение контура, сглаживание.
Далее следует этап переописания, то есть представление исходного изображения символа в виде последовательности кодов, удобных для обработки в структуре из ДАЗУ. Переописание реализуется с помощью кодирования цепным кодом Фримена. В результате предобработки исходное градуальное изображение представляется в виде, удобном для обработки системой ДАЗУ.
В системе распознавания символов зрительный образ символа описывается в виде двух представлений: образного и структурного. Соответственно, имеется два канала обработки: грубый, обрабатывающий изображение образа целиком, и точный, обрабатывающий образы фрагментов и структурные описания символов.
Цепочки кодов, описывающие сжатое изображение, в режиме обучения подаются с выхода грубого канала на гребенку ДАЗУ грубого канала, где каждому символу предназначено свое ДАЗУ. С выхода точного канала цепочки кодов изображения, представленного с большим разрешением, поступают на блок структурной обработки, состоящий из гребенок ДАЗУ двух уровней, где осуществляется структурная обработка изображения. В результате обработки на нижнем уровне формируется словарь статистически достоверных фрагментов изображений символов, каждый из которых записан в отдельном ДАЗУ. При этом выделенные фрагменты принадлежат не какому-либо одному символу, а могут входить в описание нескольких из них. На верхнем уровне формируется словарь структурных описаний символов, характеризующих последовательность объединения фрагментов символов в их изображениях. Структурное описание каждого символа также записывается в отдельном ДАЗУ.
В режиме распознавания цепочка кодов сжатого изображения .поступает на гребенку ДАЗУ грубого канала. Если величина возбуждения в одном из ДАЗУ грубого канала превышает заданный порог по распознаванию, процесс распознавания считается успешно завершенным и символу присваивается индекс этого ДАЗУ. В противном случае осуществляется проверка соответствующих ДАЗУ точного канала как первого (по элементам), так и второго (по связям) уровня. Решение принимается по наибольшей величине совпадения структурных описаний предъявленного образа с запомненными (при этом сравнение проводится с ДАЗУ только тех образов, которые селектированы ДАЗУ грубого канала).
Необходимо заметить, что в реализованной системе представлен лишь нижний уровень распознавания - уровень распознавания символов. Уровень коррекции текста для системы распознавания букв имеет структуру такую же, как и у систем распознавания речи, и у систем анализа текста.
Представленная технология позволила автору создать эффективную систему для автоматического анализа текстовой информации, которая была разработана в фирме ООО НПИЦ «Микросистемы», г. Москва. Система реализована как инструмент для автоматического формирования баз знаний на основе множества естественно-языковых текстов. Ядро системы выполнено как программный компонент (inproc server), соответствующий спецификации Component Object Model (COM) фирмы Microsoft.
Ядро системы реализует следующие функции. Нормализацию грамматических форм слов и вариаций словосочетаний. Автоматическое выделение базовых понятий текста (слов и словосочетаний) и их взаимосвязей с вычислением их относительной значимости. Формирование представления семантики текста (множества текстов) в форме семантической сети.
На основе результатов работы модуля индексации реализованы следующие функции обработки текстовой информации. Функция формирования гипертекстовой структуры, навигации по базе знаний, формирования тематического дерева, реферирования текстов, автоматической кластеризации множества текстов, сравнения текстов (автоматической классификации текстов), и, наконец, функция формирования ответа на смысловой зарос пользователя -формирования тематического реферата.
Аппаратная реализация описанного способа представления информации позволяет подойти к созданию эффективных хранилищ информации , с автоматическим структурированием хранимой информации и с ассоциативным к ней доступом за один такт.
Автором предложено аппаратное решение задачи хранения, упорядочения и ассоциативного поиска информации на основе иерархии из ДАЗУ. Для этого автором реализован аппаратно модуль ассоциативной адресации (нейрочип) -гребенка нейроподобных элементов. Основная особенность аппаратной реализации нейронной сети заключается в том, что обработка информации в ней происходит параллельно и распределенно. Каждый нейроподобный элемент отдельно и независимо обрабатывает приходящую на него информацию. В отличие от существующих вычислительных средств такая аппаратная реализация является весьма простой и эффективной по управлению, поскольку ее модули являются систолическими массивами, то есть они управляются потоком информации. Управление сводится к одновременной подаче входной последовательности на общий для всех нейроподобных элементов ДАЗУ вход. Кроме того, такая вычислительная среда устойчива к повреждениям: выход из строя одного нейроподобного элемента не влияет на другие. И, наконец, - не требуется написания универсальной и специальной математики для симуляции обработки, или требуется значительно меньше.
На основе разработанного нейрочипа автором осуществлена разработка и создание модуля наращиваемой и каскадируемой ассоциативной памяти. Автором также предложена аппаратная реализация ассоциативной памяти с использованием стандартных микросхем памяти, адресуемой по содержанию (Content Addressable Memory). В отличие от ассоциативной памяти, реализованной с использованием описанного выше нейрочипа, реализация на основе стандартных САМ больше похожа на прототип: каждая ячейка САМ снабжена собственным регистром адреса. Размерность моделируемого пространства соответствует длине регистра адреса. При необходимости реализации нейроподобных элементов с временной суммацией для всех адресных регистров вводится единый регистр сдвига, заполняемый со входа. Запись в такую память осуществляется отдельными событиями, которые записываются в отдельные ячейки, как в случае записи информации в колонках коры - отдельное слово в отдельную колонку.
Предложенное автором использование аппаратно реализованного ДАЗУ позволяет при решении задачи полнотекстовой индексации выдать все документы по запросу за один такт. Для этого в качестве адреса нейроподобного элемента запоминается пара «слово-документ», и для каждой такой пары в регистре данных хранится адрес слова в данном документе. Это значит, что в ответ на фрагмент информационной последовательности, содержащей слово и номер документа, тут же выдается номер нейрона, хранящего информацию о паре, адресующий нас к памяти, содержащей адрес слова в документе и дополнительную информацию.
Список литературы диссертационного исследования доктор технических наук Харламов, Александр Александрович, 2008 год
1. А.С. N 1179389 (СССР) Устройство для моделирования нейрона. /Харламов А.А., Усманов А.Х. Заявка N 3751440 от 29 марта 1984г. Опубликовано 15 августа 1985г. МКИ G 06 g 7/60
2. А.С. N 1305732 (СССР) Устройство для моделирования нейронных сетей. /Харламов А.А., Усманов А.Х., Воронов И.В., Богомолов Г.В. Заявка N 3999328 от 27 декабря 1985г. Опубликовано 22 декабря 1986г. МКИ G 06 g 7/60
3. Анил К. Джейн, Жианчанг Мао, К.М. Моиудин Введение в искусственные нейронные сети. Открытые системы №4, 1997. С. 17-24
4. Анохин П.К. Очерки по физиологии функциональных систем. М.: Медицина, 1975
5. Бабминдра В.П., Брагина Т.А. Структурные основы межнейронной интеграции. Л.: Наука, 1982
6. Белоусов В.В., Минеев Г.Ю., Климова Л.М. Принципы формального описания предметной области, Материалы XXXII конференции «Информационные технологии в науке, образовании, телекоммуникации и бизнесе», Украина, Крым, Гурзуф, 20-30 мая 2005
7. Беритов И.С. Структура и функции коры большого мозга. М.: Наука, 1969
8. Беркинблит М.Б., Чернавский А.В. Интеллектуальные процессы и их моделирование. -М.: "Наука", 1992. 192с.
9. Берт П. Дж. Интеллектуальное восприятие в пирамидальной зрительной машине //ТИИЭР. Т. 76, № 8, 1988. Стр. 175-186
10. Ю.Бехтерева Н.П. Мозговые коды психической деятельности. -Л.: «Наука», 1978
11. И.Бианки В.Л. Морфофункциональная организация межполушарных связей.
12. Борзенко А. Биометрические системы распознавания внешности, 2005 http://www.bytemag.ru/Article.asp?ID=1369
13. Бурлакова В.В. Синтаксические структуры современного английского языка М.: Просвещение, 1984
14. Виноградова О. С. Гиппокамп и память. М.:, 1975
15. Волков В.И., Жаркой P.M., Харламов А.А. Модель ассоциативной системы машинного зрения. Приборостроение. Вестник Московского государственного технического университета, N 9-10. 1994. Стр. 31 33
16. Выготский Л.С. Мышление и речь. //Собрание сочинений. Т.2. М.: Педагогика, 1982
17. Гаврилей Ю.К., Самарин А.И., Шевченко М.А. Активный анализ изображений в системах с фовеальным зрением. Нейрокомпьютеры: разработка, применение, N 7 8, 2002г. С. 34 - 46
18. Гаек П., Гавранек Т. Авотматическое образование гипотез. -М.: "Наука", 1984. -278 с.
19. Гельбух А.Ф. Эффективно реализуемая модель морфологии флективного естественного языка. Диссертация на соискание ученой степени кандидата технических наук, 1994
20. Гладкий А.В. Синтаксические структуры естественного языка в автоматизированных системах общения. М.: Наука 1985
21. Глезер В.Д. Зрение и мышление. -Л.:, "Наука", 1985
22. Глезерман Т.Б. Психофизиологические основы нарушений мышления при афазии, -М.: Наука, 1986
23. Гончаренко В.В., Шингарева Е.А. Фреймы для распознавания смысла текста. -Кишинев: "Штиинца", 1984. -200 с.
24. Горбатов В.А. Интеллектуальные информационные технологии и стратегии (состояние и перспективы). Информационные технологии, N 5, 1996. -С. 35 -38
25. Джордж Ф. Мозг как вычислительная машина. М.: Издательство иностранной литературы, 1963
26. Дзугаева С.Б. Проводящие пути головного мозга человека (в онтогенезе). М.: Медицина, 1975
27. Егоров А.И., Дубровский В.В. Об алфавите элементарных слуховых образов русской речи Dialogue'99, 1999
28. Жаркой P.M. (из личного сообщения), 2002
29. Завалишин Н.В., Мучник И.Б. Модель зрительного восприятия и алгоритмы анализа изображений. М.: Наука, 1974
30. Золотова Г.А. Синтаксический словарь: Репертуар элементарных единиц русского синтаксиса. Изд. 2-е, исправленное. М.: Эдиториал УРСС, 2001
31. Иерархический рубрикатор интеллектуальных систем РИС2004-02.1-И, http://www.raai.org/razrabotki/rqupiim/ris2004i.html
32. Ильин Н., Киселев С., Рябышин В., Танков С. Технологии извлечения знаний из текста //Открытые системы № 06/2006. Ресурс: http://www.osp.ru/os/2006/06/2700556/p1.html
33. Крюкова О.П., Харламов А.А. Представление знаний в человеко-машинных системах для обучения языку. В сб. «Лингвистическая полифония». -М.: «Языки славянской культуры»
34. Кузнецов В.Б., Отт А.В. Автоматический синтез речи. Алгоритмы преобразования «Буква-звук» и управление длительностью речевых сегментов.-Таллинн: «Валгус», 1989
35. Кузнецов И.П. Семантические представления. М.: Наука, 1986
36. Ладенко И.С. Интеллектуальные системы и логика. -Новосибирск: "Наука", 1973.
37. Лингвистическая прагматика, 1989
38. Логика рассуждений и ее моделирование /Под ред. Д.А.Поспелова. -М.: Вопросы кибернетики, 1986. -180с.
39. ЗЭ.Лурия А.Р. Основные проблемы нейролингвистики. М.: Издательство Московского университета, 1975. - 254 с.
40. Маркел Дж.Д., Г рей А.Х. Линейное предсказание речи: Пер с англ. / Под ред. Ю.Х. Прохорова, B.C. Звездина. ~М.: Связь, 1980
41. Маккейб Э., Уркхарт Р. -М.: Радио и вязь, 1993
42. Марр Д. Зрение. Информационный подход к изучению представления и обработки зрительных образов. М.: Радио и связь, 1987
43. Мендельсон Э. Введение в математичекую логику. -М.: "Наука", 1971. -320с.
44. Минский М. Фреймы для представления знаний. Пер. с англ. -М.: "Энергия", 1979. -151с.
45. Митькин А.А. Системная организация зрительных функций. М.: Наука, 1988
46. Мурзин Л.Н., Штерн А.С. Текст и его восприятие. Свердловск, 1991
47. Никитин М.В. Курс лингвистической семантики, -С-Пб., 1996
48. Нильсон Н. Принципы искусственного интеллекта. Пер. с англ. -М.: "Радио и связь", 1985. -373с.
49. Новиков А.И. Семантика текста и ее формализация. -М., 1983
50. Осипов Г.С. Приобретение знаний интеллектуальными системами: Основы теории и технологии. М.: Наука. Физматлит, 1997
51. Плотников В.Н., Суханов В.А., Жигулевцев Ю.Н. Речевой диалог в системах управления. -М.: «Машиностроение», 1988
52. Подвигин Н.Ф., Макаров Ф.Н., Шелепин Ю.Е. Элементы структурно-функциональной организации зрительно-глазодвигательной системы. Л.: Наука, 1986
53. Поляков Г.И. Основы систематики нейронов новой коры большого мозга человека. М.: Медицина, 1973
54. Поляков И.В. Лингвистика и структурная семантика. -Новосибирск: "Наука", 1987. -191с.
55. Попов Э. В. Общение с ЭВМ на естественном языке. М.: Наука, 1982
56. Попов Э.В. Экспертные системы. -М.: "Наука", 1987. -285с.
57. Поспелов Г.С. Искусственный интеллект основа новой информационной технологиии. -М.: "Наука", 1988. -280с.
58. Потапов, А.С. Иерархические структурные методы автоматического анализа аэрокосмических изображений: Автореферат диссертации на соискание ученой степени канд. техн. наук :05.11.07 /А.С. Потапов. СПб., 2005.-22 с. ■
59. Прэтт У. Цифровая обработка изображений Кн. 2. -М.: «Мир», 1982
60. Пупков К.А. Приборостроение, N 9-10, 1994. Тематический выпуск "Интеллектуальные системы автоматического управления". С. 5-7
61. Р-система. Введение в экономический шпионаж. Практикум по экономической разведке в современном российском предпринимательстве. В 2-х книгах. М.: Изд-во «Хамтек Паблишер», 1997
62. Радченко А.Н. Моделирование основных механизмов мозга. Л.: Наука, 1969
63. Рахилина Е.В. Когнитивный анализ предметных имен: семантика и сочетаемость. М.: Русские словари, 2000
64. Рубашкин В. И. Представление и анализ смысла в интеллектуальных информационных системах. М.: Наука, 1989
65. Селиверстова. Контрастивная семантика. Попытка описания. М.: УРСС, 2003
66. Семенов В.В. Кибернетическая технология обучения. /Интеллектальные системы. Труды Второго международного симпозиума. Т. 1, -С.-Петербург:, 1996. С.50 55
67. Синельников Р.Д. Атлас анатомии человека. Т. 3. М.: Медицина, 1968
68. Система распознавания и учета автомобильных номеров Auto-TRASSIR, 2005, http://autotrassir.dssl.ru/products/
69. Системы распознавания речи http://www.agentura.ru/equipment/radio/sys/
70. Систолические структуры: пер. с англ. //Ред. У. Мур,
71. Уинстон П. Искусственный интеллект. М.: Мир, 1980
72. Филмор Ч. Фреймы и семантика понимания. //В кн.: Новое в зарубежной лингвистике. Вып. XXIII «Когнитивные аспекты языка». Ред. В.В. Петров, В.И. Герасимов М.: Прогресс, 1988. С. 52 92
73. Финн В.К. Индуктивные модели. //Представление знаний в человеко-машинных и робототехнических системах. -М.: ВИНИТИ, 1984. -с. 58 76
74. Фролов А.А., Муравьев И.П. Нейронные модели ассоциативной памяти. М.: Наука, 1987
75. Хан, Удо, Мани, Индерджиет Системы автоматического реферирования. «Открытые системы», 2000, № 12
76. Харламов А.А. Ассоциативный процессор на основе нейроподобных элементов для структурной обработки информации. Информационные технологии, N 8, 1997. Стр. 40-44
77. Харламов А. А. Нейроподобные элементы с временной суммацией входного сигнала и блоки ассоциативной памяти на основе этих элементов.
78. Вопросы кибернетики. Устройства и системы. Под ред. Н.Н. Евтихиева. -М.: МИРЭА, 1983. Стр.57-68
79. Харламов А.А. Нейросетевая технология представления и обработки информации (естественное представление знаний). М.: «Радиотехника», 2006. - 89 с.
80. Харламов А.А. Статические и динамические нейронные сети на примере задачи распознавания образов. Приборостроение. Интеллектуальные системы автоматического управления, N 1, 1991. Стр. 58 -66
81. Харламов А.А. Физически реализованное многомерное сигнальное пространство эффективная среда для структурированного хранения и ассоциативного поиска информации Искусственный интеллект, № 4, 2005. Стр. 393-402
82. Харламов А.А. TextAnalyst оболочка для электронного учебника //Обучение в компьютерной среде. - М.: Московский государственный открытый педагогический университет им. М.А. Шолохова. Институт информатизации образования, 2002. Стр. 55 - 62
83. Харламов А.А., Аллахвердов С.А., Самаев Е.С. Нейрочип нейроподобный элемент с временной суммацией входных сигналов - элемент нейронной сети для структурного анализа информации. «Нейрокомпьютеры: разработка, применение», N 2, 2003. С.
84. Харламов А.А., Ермаков А.Е. Динамическая нейронная сеть для распознавания речевых сигналов. Системы управления. Вестник Московского государственного технического университета, N 1. 1998г. Стр. 93-101
85. Харламов А.А., Ермаков А.Е., Кузнецов Д.М. TextAnalyst комплексный нейросетевой анализатор текстовой информации. Вестник МГТУ им. Н.Э. Баумана. N 1, 1998г. -С. 32-36
86. Харламов А.А., Жаркой P.M., Волков В.И., Мацаков Г.Н. Система распознавания изолированных рукописных символов на основе иерархической структуры из динамических ассоциативных запоминающих устройств. //Информационные технологии, N 5, 1998. Стр. 27 31
87. Харламов А.А., Кнеллер Э.Г. Распознавание ключевых слов в потоке слитной речи на основе нейросетевых технологий Нейрокомпьютеры. Разработка и применение. № 8-9, 2005г. -С. 88-97
88. Харламов А.А., Самаев Е.С., Рябов Г.Н. Многомодальные семантические представления на основе нейронных сетей. Информационные технологии, N4, 2001г.-С. 12-17
89. Чечкин А.В. Активирующая подсистема интеллектуального управления и теория функциональных систем П.К. Анохина. URL: http://www.insys.msu.ru
90. Шалютин С.М. Искусственный интеллект. -М.: "Мысль", 1985. 199 с.
91. Шапошников Д.Г. и др. Применение поведенческой модели зрения для инвариантного распознавания "лиц и дорожных знаков. Нейрокомпьютеры: разработка, применение, N 7 8, 2002г. С. 21 - 33
92. Шеннон К. Работы по теории информации и кибернетике. М.: ИЛ, 1963. Стр. 333 369
93. Школьник-Яррос Е.Г., Калинина А.В. Нейроны сетчатки. М.: Наука, 1986
94. Ющенко А.С., Михайлов Б.Б., Воротников С.А., Наджафи Ф. Концепция интеллектуальной робототехнической системы в мелкосерийном производстве. /Интеллектальные системы. Труды Второго международного симпозиума. Т. 1, -С.-Петербург:, 1996. -С.22
95. Якобсон P.O. Язык в отношении к другим системам коммуникации //Якобсон P.O. Избранные работы. -М.:, 1985. -С. 319-330
96. Ярбус А.Л. Движение глаз при восприятии сложных объектов // Хрестоматия по ощущению и восприятию. М., 1975
97. Alkon D.L. et al. Learning and memory. Brain research reviews 16, 1991. Pp. 193-220
98. Alwang G. Better (but Still Not Perfect) Speech Recognition. PC Magazine, December 3, 2002
99. Bengio Y., Symard P., Franchini P. Learning Long-Term Dependencies with Gradient Descent is Difficult, IEEE Transactions on neural networks, Vol. 5, No 2, 1994.-Pp. 157-166
100. Bianchini M, Gori M. On the Problem of Local Minima in Recurrent Neural Networks, IEEE Transactions on neural networks, Vol. 5, No 2, 1994. Pp. 167176
101. Bishop P.O., Kozak W., Levick W.R., Vakkur G.J. The determination of the projection of the visual field onto the lateral geniculate nucleus in the cat. J. Phisiol London., vol. 163, N 3, 1962. Pp. 503 539
102. Bourlard H., Wellekens C.J. Speech pattern recognition and multiplayer perseptrons Computer Speech and Language, No 3, 1989. -Pp. 1-19
103. Brown Т.Н., Zador A.M. Hippocampus. In G.M.Shepherd (Ed.), The synaptic organisation of the brain. New York, Oxford: Oxford University Press, 1990. Pp. 346-388
104. Calvin W.H. Synaptic Potential Summation and Repetitive Firing Mechanisms: Input-Output Theory for Recruitment of Neurons into Epileptic Bursting Firing Patterns. Brain Research, No. 39, 1972. Pp. 71 -94
105. Convera. URL: //www.convera.com, 2005
106. Dayhoff J.E. Neural Network Architectures. An Introduction. New York: Van Nostrand Reinhold, 1990
107. Dukrot O. Structuralissme, enonciation et semantique//Poetique. P., 1978, N 33. -109p.
108. Faber J. Isagoge to non-Linear Dynamics of Formators and Complexes in the CNS. Prague: The Karolinum Press, 2003, ISBN 80-246-0755-7
109. Feigenbaum E.A. The art of artificial intelligence. Themes and case studies of knowledge engineering.// The fifyh International Joint Conference on Artificial Intelligence. -Boston: MIT, 1977. -P. 1014-1029
110. Furui S. Speaker-independent isolated word recognition based on emphasized spectral dynamics //Int. Conf. on Acoustic, Speech and Signal Processing, Tokyo, 1986. Pp.1991-1994
111. Hansen R. Voice Recognition Software: Dragon Naturally Speaking. PC Magazine, January 22, 2003
112. Hebb D.O. The Organisation of Behavior. New York: Wiley, 1949
113. Hermansky H. Automatic speech recognition and human auditory perception // Eur. Conf. on Speech Technology, Edinburgh, 1987, Vol.1. Pp.7982
114. Hopfield, J.J. Neural networks and physical systems with emergent collective computational abilities. Proc. Natl. Acad. Sci. 79, 1982, Pp. 2554 -2558
115. Hubel D.H. Eye, brain and vision. //Scientific American Library. New York: A Division of HPHLP, 1988117. http://www.abbyy.ru/118. http://www.aot.ru/119. http://www.cognitec-systems.de/index.html120. http://www.sensory.com/
116. Kharlamov A.A. Attention Mechanism Ussage to Form Frame-Structure on a Semantic Net. /"Neurocomputers and Attention. Volume II: Connectionism and Neurocomputers". Eds. Arun V.Holden, Vitaly I. Kryukov. Manchester: Manchester University Press, 1991
117. Kohonen T. Self-organization and Associative Memory (Springer Series in Information Science 8). -Berlin: Springer, 1989
118. Lea Wane A., ed. Trends in speech recognition. -Englewood, Cliffs, New Jersey, Prentice Hall, Ink., 1980
119. Lippman R.P. Gold B. Neural-Net Classifiers Useful for Speech Recognition, IEEE 1-st International Conference on Neural Networks, Vol. 4, San Diego, Calif, 1984
120. Lienhart, R., Pfeiffer, S., and Effelsberg, W. «Video Abstracting» Comm. ACM, Vol. 40, No. 12, 1997, pp. 54-62
121. Marchiori Massimo The Quest for Correct Information on the Web: Hyper Search Engines. //In: The Sixth International WWW Conference (WWW 97). Santa Clara, USA, April 7-11, 1997
122. Midtgaard J. Processing of Information from Different Sources: Spatial Synaptic Integration in the Dendrites of Vertebrate CNS Neurons. TINS, Vol. 17, No. 4, 1994. Pp. 166 -173
123. Neural Information Processing: Research and Development, Jagath C. Rajapakse and Lipo Wang, Editors, Springer-Verlag, May, 2004, ISBN 3-54021123-3. Стр. 56-76
124. Rail W. Electrophysiology of a dendritic neuron model. Biophys. J., 2. (Suppl.), 1962. Pp. 145-167
125. Rail W. Theoretical significance of dendritic trees for neuronal input-output relations. In: Neural Theory and Modelling. (Proc. of the 1962 Ojai Symp.). Reiss R.F., ed., Stanford, Calif., Stanford University Press, 1964. Pp. 73 97
126. Robinson A.J., Fallside F. Static and dynamic error propagation networks with application to speech coding, in Neural Information Processing Systems D.Z. Anderson, Ed. American Institute of Physics, N.-Y.:1988, -Pp. 632-641
127. Rolls, E.T. Theoretical and Neurophysiological Analysis of the Functions of the Primate Hippocampus in Memory. In: Cold Spring Harbor Symposia on Quantitative Biology, Vol. LV, 1990, Cold Spring Harbor Laboratory Press. Pp. 995-1006
128. Rosenblatt F. Principles of Neurodynamics. New York, 1962
129. Rumelhart, D.E., Zipser D. Feature discovery by competitive learning. In: Parallel Distributed Processing, eds. D.E. Rumelhart and J.L. McClelland and PDP Group, 1986. Cambridge, Mass.: MIT Press. Pp. 151-193
130. Schwenk H. Efficient Training of Large Neural Networks for Language Modeling International Joint Conference on Neural Networks, 2004. Pp.: 3059 -3064
131. Shannon C.E. A Mathematical Theory of Communication, The Bell System Technical Journal, Vol. 27, pp. 379-423, 623-656, 1948
132. Sholl D.A. Dendritic organization in the neurons of the visual and motor cortices of the cat. J. Anat., 87, 1953. Pp. 387-406
133. Sullivan Dan Document Warehousing and Textmining. NY; Wiley publishing house, 2001
134. Taylor J.G., Alavi F.N. A global competitive network for attention. Neural Network World, 3, 1993. Pp. 477 502
135. Trends in Speech Recognition, W.A. LEA, (ed.), Prentice-Hall, 1980
136. Начальник отдела Начальник направления Ст. научный сотрудник
137. Г.В. Вавилов В.В. Ралдугин И.Ю. Травкинаавгуста 2007 г.1.HII
138. ОАО "Ангстрем М" 124460, I . Миски а, Зеленоград проезд 4806, дом 4, строение 8
139. Angstrcm-M OJSC Russia, 124460, Moscow Phone (095) 531 36 02 Fax (095) 531 32 70
140. Телефон (095) 531 36 02 Факс (095) 531 32 70 ИНН 7735028407
141. E-mail: generalffcangsti cm. ru
142. E-mail: genera Ifgianestrem. ru1. ЛЛ " QG 200 /* r. №1. На исх. №от
143. УТВЕРЖДАЮ» Генеральный директор1. Г"
144. ОАО «Ангстрем-М» ' Машевич П.Р.1. АКТо внедрении результатов научных исследований Харламова АЛ.
145. Полученные результаты были внедрены в проекте предприятия по созданию микросхемы памяти адресуемой по содержанию (Content Addressable Memory САМ).
146. Использование полученных результатов позволяет: реализовать нечеткий ассоциативный поиск информации в условиях появления в ней ошибок типа замен, вставок, пропусков и перекрестных замен.1. Председатель комиссии,
147. TELLIGENT SECURITY SYSTEMS 1 "9234, Москва, Ленинские Горы, Научный парк МГУ, владение 1, строение 77, офис 1027(495)930 88 60 / *7 (495) 930 80 64 / ♦7 (495) 930 88 61 / (495) 930 01 06 /www.iss.ruinfo@i5S.ru1. УТВЕРЖДАЮ
148. Директор ООО «Центр Нейросетевых Технологий -Интеллектуал! сист^мрг-ёйоласности»1. Жаркой P.M.1. АКТ О ВНЕДРЕНИИ
149. Научно обоснованы и решены актуальные прикладные задачи, расширена база математических и программно-технических средств разработок, что обеспечило возможность перехода на аппаратные решения этих прикладных задач.
150. Зам. директора по научной работеов. № Фаломкин И.И.^ Ч V1. X Юникор микрс системы
151. Общество с ограниченной ответственностью «Юникор микросистемы»
152. Адрес г Зеленоград, корп 317а а/я 61, Москва 124482
153. Телефон +7 (095) 739-0253, Факс +7 (095) 739-0254 E-mail office@unirore ru
154. Разработанная библиотека прикладных программ позволила упростить пользователю микроконтроллера его использование в разрабатываемых пользователем системах распознавания речи.
155. УТВЕРЖДАЮ» ТЕХНИЧЕСКИЙ ДИРЕКТОР ООО «Юникор микросистемы»арин С.А.1. АКТо внедрении1. Кг v ' VU.M»'•^«■UjV--^'1. Ливинцев А.Л.
156. The Hague Centre for Strategic Studiesи TNO initiative
157. О внедрении результатов работы «Нейросетевой подход к интегрированному представлению и обработке информации в интеллектуальных системах» Харламова А.А.
158. Chamber of Commerce number 272451481.nge Voorhout 16 2514 EE The Hague The Netherlands www.hcss.ti!
159. T +31 703184840 F +31 703184850 info@hcss.nl
160. Предполагается дальнейшее использование этих программ в различных проектах, а также их доработка с целью внесения дополнительней функциональности.1. Spiegeleireintolerance Transformation fagb^Centre for Strategic Studies1. Date: April 17, 2008
161. Re. Recommendation for Mr, A. Kharlamov1. Our Reference: avv/sds
162. The Standard Conditions for Research Instructions given to HCSS. as filed at the Registry of the District Court and the Chamber of Commerce in The Hague shall apply to all instructions given to HCSS;the Standard Conditions will be sent on request.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.