Компьютерная база данных "Языки мира" и ее возможные применения тема диссертации и автореферата по ВАК РФ 10.02.21, доктор филологических наук Ярославцева, Елена Игоревна
- Специальность ВАК РФ10.02.21
- Количество страниц 587
Оглавление диссертации доктор филологических наук Ярославцева, Елена Игоревна
Предисловие
• Введение
Часть I. Компьютерная база данных «Языки мира»
1.1 История вопроса
1.1.1 Задачи справочного аппарата энциклопедии «Языки мира»
1.1.2 Издание «Языки мира». Типовая схема статьи
1.1.3 Реферат как свернутое энциклопедическое описание
1.2 Компьютерный аналог энциклопедии «Языки мира»
1.2.1 Абстрактная схема реферата
1.2.2 Требования к реферату
1.3 Модель реферата 54 ^ 1.3.1 Детализация и конкретизация типовой схемы статьи о языке
1.3.2 Уровни иерархии элементов реферата
1.3.3 Классифицирующие и фактографические элементы
1.3.4 Способы задания характеристик
1.3.5 Языки, представленные в базе данных
1.3.6 Модель реферата в базе данных
1.4. Процесс реферирования
1.4.1 История создания программы
1.4.2 Инструкция к программе автоматического реферирования
1.4.3 Инспекция реферата 147 ® 1.4.4 Редактирование рефератов
1.4.5 Принципы адекватного реферирования
1.4.6 Примеры фрагментов статей и их рефератов
1.4.7 Отзывы на рефераты
1.4.8 Проблема синонимии в модели 170 ^ 1.5. Грамматикон (универсальный, конкретно-языковой и частные)
1.5.1 Тезаурус грамматических категорий и явлений
1.5.2 Определения тезауруса
1.5.3 Тезаурус как модель грамматикона
1.5.4 Схема словарной статьи тезауруса
1.5.5 Тезаурус как указатель
1.5.6 Фрагмент тезауруса, упорядоченного по алфавиту 194 Ф 1.6 Система указателей как справочный аппарат энциклопедии «Языки мира»
1.6.1 Географический указатель
1.6.2 Генетический указатель
1.6.3 Предметные указатели - систематический и алфавитный 231.
1.6.3.1 Алфавитный указатель
1.6.3.2 Систематический указатель 233 Часть II. Применение базы данных в лингвистических исследованиях 2.1 Применение базы данных для педагогов, переводчиков, студентов и лингвистов ф 2.2 Автоматизированный перевод базы данных
2.3 Автоматизированный поиск информации
Ь 2.4 Формальная типология языков
2.4.1 Возможные пути решения проблемы
2.4.2 Инструкция к программе сопоставления языков
2.4.3 Верификация традиционной типологии
2.4.4 Примеры проведенного сопоставления языков
2.4.5 Веса в зависимости от степени универсальности категории
2.4.6 Функционирование базы данных 258 2.5 Банк лингвотипологических данных
Ф 2.5.1 Определение основных понятий
2.5.2 Структура банка лингвотипологических данных
2.5.3 Поисковые запросы и поисковые предписания 273 Заключение 285 Выводы 292 Литература 294 ТОМ II. Приложения
Рекомендованный список диссертаций по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК
Тезаурусное представление терминов нефтегазовой отрасли в русском и персидском языках2010 год, кандидат филологических наук Фаал-Хамеданчи Марьям
Тезаурусное моделирование французской грамматической терминологии2004 год, доктор филологических наук Горбунов, Юрий Иванович
Русская и татарская лингвография: Научно-информационное обеспечение2000 год, доктор филологических наук Галиуллин, Камиль Рахимович
Информационные ресурсы в области лингвистики2000 год, кандидат педагогических наук Гончарова, Виктория Владимировна
Семасиологический и лексикографический аспекты таксономизации лингвистических терминов и терминопонятий2005 год, доктор филологических наук Шурыгин, Николай Александрович
Введение диссертации (часть автореферата) на тему «Компьютерная база данных "Языки мира" и ее возможные применения»
Прикладная лингвистика - довольно новое направление в языкознании, которое занимается разработкой методов решения практических задач, связанных с использованием языка.
Начиная со второй половины 20-го века, прикладной лингвистикой рассматриваются методы решения указанных задач не только человеком, но также и автоматами - электронными вычислительными машинами. В связи с этим стали употребляться также термины «вычислительная лингвистика», «инженерная лингвистика», «автоматическая лингвистика». Термин «прикладная лингвистика» появился в конце 20-х годов 20 века, когда была осознана необходимость строгого научного решения соответствующих задач с использованием методов формального лингвистического анализа письменных и акустико-лингвистического анализа устных сообщений. Общие методы решения задач прикладной лингвистики разрабатываются теоретическим языкознанием, прежде всего той его областью, которая изучает формальные алгоритмические процедуры анализа языка, а также «математической лингвистикой». Основные направления прикладной лингвистики: автоматическое распознавание и синтез речи, автоматические методы переработки текстовой информации, автоматизация информационных работ, создание автоматизированных систем информационного поиска, автоматических словарей, разработка методов автоматического аннотирования, реферирования и перевода, лингвистическое обеспечение автоматизированных систем управления (АСУ), стандартизация научно-технической терминологии. - Андрющенко В.М. «Прикладная # лингвистика» // Лингвистический Энциклопедический словарь. М., 1990.
ВВЕДЕНИЕ
В связи со сказанным, в Институте языкознания довольно давно (с начала 80-х гг.) ведется разработка базы данных (БД), которая включает в себя свернутые, формализованные и определенным образом структурированные описания языков мира. В настоящее время БД «Языки мира», несмотря на свою незавершенность, находится в такой стадии разработки, когда она вполне может уже использоваться и как инструмент лингвистического исследования, в чем и состоит ее основное назначение В связи с этим главной целью данной диссертации является краткое описание устройства этой БД и тех полезных для лингвистики функций, которые она способна выполнять на данном этапе ее создания.
У истоков создания энциклопедии и БД «Языки мира» стояла член-корреспондент РАН В.Н.Ярцева - автор и руководитель проекта «Энциклопедия «Языки мира». Ей принадлежала идея создания с помощью компьютера справочного аппарата к этой энциклопедии в виде системы указателей. Эта идея трансформировалась затем в проект по разработке базы данных, создаваемой на основе энциклопедии, но позволяющей в дальнейшем выдавать сведения лингвотипологического характера без непосредственного обращения к самому энциклопедическому изданию.
Первоначально в разработке проекта по созданию базы данных принимал участие Борис Владимирович Якушин, но к сожалению, недолго, так как он преждевременно скончался.
В работе по составлению рефератов статей энциклопедии «Языки мира» и введению их в базу данных, а также в составлении модели реферата принимали участие: О.И.Романова, Я.Г.Тестелец, А.К.Валентей, М.Е.Алексеев, Н.Б.Бахтин, В.А.Виноградов, А.В.Дыбо, В.П.Калыгин, И.Ш.Козинский, М.С.Полинская, Н.В.Рогова, Д.И.Эдельман, Н.К.Рябцева.
В начале 90-х годов работы по наполнению базы данных информацией из-за плохого финансирования велись недостаточными силами. Несмотря на это, в этот период старшим научным сотрудником отдела прикладного языкознания Ю.П.Скоканом был разработан комплекс программ, позволяющий осуществлять ввод, редактирование и корректировку информации. На основе данного программного продукта было введено и отредактировано около 200 описаний языков Евразии как на русском, так и на английском языках усилиями автора. В 2000 году к данному проекту присоединился Московский государственный лингвистический университет, где была создана Лаборатория типологических исследований (зав. лабораторией - А.И.Новиков). В соответствии с договором данная тема в настоящее время разрабатывается как совместная. (Виноградов В.А., Новиков А.И., Ярославцева Е.И. База данных «Языки мира» как инструмент лингвистического исследования. // Вопросы языкознания, 2003, №3, с.3-14).
Основной единицей энциклопедии «Языки мира» является статья. Объем статей колеблется от половины печатного листа до нескольких печатных листов. С одной стороны, в связи с большим объемом издания и разнородностью включаемого в него материала алфавитный принцип его организации является единственно приемлемым, поскольку он наиболее универсален. С другой стороны, он не является достаточным, поскольку назначение энциклопедии «Языки мира» не может быть сведено к одной задаче - обеспечить поиск отдельных статей по алфавиту. Энциклопедия должна обеспечить решение самых различных исследовательских задач, что связано с обращением не только к самим статьям, а и к тем сведениям, фактам, которые содержатся в различных местах одной статьи и в разных статьях, находящихся в разных алфавитных зонах энциклопедии. Другими словами, для решения исследовательских задач на базе энциклопедии «Языки мира» потребуется многоаспектный поиск, который не обеспечивается алфавитным расположением статей, вследствие чего этот поиск потребитель должен осуществлять сам. Учитывая значительный объем экциклопедии (она состоит из множества томов), следует предположить, что такой поиск будет связан со значительными трудностями, а в некоторых случаях будет и невозможен.
Все это делает необходимым создание специального справочного аппарата, дополняющего основное издание. Традиционной формой такого справочного аппарата являются различного рода указатели, отражающие тот или иной дополнительный аспект поиска и тем самым компенсирующие в некоторой степени недостатки алфавитного принципа организации словаря или энциклопедии. Но такой справочный аппарат имеет свои ограничения, связанные с тем, что он рассчитан на человека, а значит, не должен содержать в себе много указателей, указатели не должны быть большими по объему и т.д., поскольку в противном случае эффективность их использования значительно снижается. Не последнюю роль здесь играют и те соображения, что справочный аппарат не может приближаться к объему основного издания. Следовательно, справочный аппарат может отразить только какие-то отдельные аспекты, а не все необходимое, тем более, что в момент его создания невозможно предугадать все потребности науки, которые могут возникнуть в будущем.
В период широкого распространения компьютеров, электронной почты, надежных электронных носителей информации и т.п. появляется реальная альтернатива для получения, хранения и распространения научных знаний. С этой целью необходимо решить ряд проблем, связанных с обеспечением эффективного и комфортного использования электроники в повседневной практике научной деятельности ученого. В русле этих проблем и предлагается комплекс компьютерных программ, способствующих как облегчению кропотливых и трудоемких процессов изучения особенностей различных языков, так и расширению круга пользователей энциклопедии «Языки мира» - компьютерная база данных «Языки мира».
Такая база данных обеспечит:
1) эффективное обобщение знаний среди специалистов в области различных языков;
2) создание электронного варианта энциклопедии «Языки мира»;
3) удобное и экономное распространение энциклопедических знаний о языках как в нашей стране, так и за границей.
Хочется надеяться, что по своему научному уровню и практическому значению эта работа займет достойное место в ряду современных концепций баз данных по языкам мира, например таких, как Ethnologue, созданная в Summer Institute of linguistics (www, sil. org/ethnologue/maps), база данных лейпцигских исследователей в Мах
Planck Institute for Evolutionary Anthropology www.emeld.org/workshop/2004/bibiko/bibiko-original.html), база данных M. Драйера (wings, buffalo.edu/linguistics/dryer/database), см. также проект Autotyp Дж. Николз и Б. Бикеля (www.unileipzig.de/~autotyp), представляющий собой попытку объединения нескольких наиболее авторитетных баз. Большой интерес представляет недавно вышедшая монография О.С.Широкова «Языковедение: введение в науку о языке», М., «Добросвет», 2003. Создаваемая в нашем институте база данных «Языки России: социолингвистический портрет» является более частной по сравнению с базой данных «Языки мира» (www.iling.narod.ru) и имеет некоторые сходные с ней области применения.
Цель
Целью данной диссертации является создание компьютерной базы данных «Языки мира», включающей в себя свернутые, формализованные и определенным образом структурированные описания языков мира и описание ее возможных применений в лингвистике и других областях знания.
В связи с этим главной задачей данной работы является краткое описание устройства этой базы данных и тех функций, которые она способна выполнять на данном этапе ее создания и в будущем.
Объект исследования
Языки мира - языки народов, населяющих сейчас (и населявших ранее) земной шар. Общее число от 2500 до 5000 (точную цифру установить невозможно, потому что различие между разными языками и диалектами одного языка условно). (Иванов Вяч.Вс. «Языки мира». // Лингвистический Энциклопедический Словарь. М., 1990).
Предмет исследования
Компьютерная база данных «Языки мира», состоящая из свернутых, формализованных и определенным образом структурированных описаний языков мира.
Исследуемый материал
Статьи энциклопедии «Языки мира», работы языковедов-специалистов по отдельным языковым семьям, устные консультации упомянутых специалистов, статьи Лингвистического энциклопедического словаря.
Положения, вныносимые на защиту
1) Компьютерная база данных «Языки мира» является электронным аналогом создаваемой в Институте языкознания РАН энциклопедии.
2) Компьютерная база данных может предоставить широкие возможности для лингвистических исследований (составление различных указателей, автоматизированный перевод базы данных, автоматизированный поиск информации в базе данных, получение формальной типологии языков).
3) Итеративно пополняемая модель реферата является одновременно и моделью всех языков, содержащихся в базе данных, а значит, после введения в базу всех известных науке языков, может рассматриваться как структурная модель грамматики человеческого языка.
4) Составленные программы сопоставления языков, основанные на разных критериях соответствия, позволяют создать так называемый формальный аналог типологии языков - материал для верификации традиционной типологии.
5) Разработанный тезаурус грамматических категорий и явлений, составленный по оригинальной схеме словарной статьи, это словарь нового типа, т.к. он учитывает многие ранее не применявшиеся в словарных статьях зоны.
6) Географический и генетический указатели к базе данных позволяют без обращения к энциклопедическому изданию определять перечни языков, распространенных в пределах некой географической единицы, и находить генетические единицы, подчиняющие данную.
7) Созданная система автоматизированного перевода базы данных на английский (в принципе на любой другой) язык обеспечивает возможность широкого использования базы данных.
8) База данных даст возможность выявлять лакуны в описании языков и определять импликации языковых категорий и явлений.
9) Система составления поисковых предписаний по поисковым запросам потребителей даст возможность организовать многоаспектный поиск в базе данных.
10) Структура банка данных позволяет создать диалоговую вопросно-ответную систему по материалам базы данных.
Научная новизна
Разработаны принципы и методы компьютерного представления информации о языке - создан компьютерный вариант энциклопедии «Языки мира».
Впервые создана компьютерная база данных, в которой представлены сведения о 330 языках Евразии.
По предложенной методике в будущем возможно введение в базу данных языков других семей, групп и подгрупп. Составление первичной формы описания какого-либо языка значительно упростится и станет более эффективным при использовании модели реферата, которая формируется в базе данных (см. раздел 1.3).
Разработаны схемы словарных статей тезауруса грамматических категорий и явлений, географического и генетического указателей по имеющейся базе данных. По этим схемам составлены упомянутые тезаурус и указатели.
Начата и продолжается работа по созданию формальной типологии языков на основе формальных критериев.
Теоретическая значимость
Разработан нестандартный способ представления множества языковых фактов, относящихся к некоторому конкретному языку, которым является формализованный реферат описания данного языка. Он может быть вычленен из общей структуры базы данных. Содержимое всех строк реферата, как перечень языковых явлений и категорий, составляет так называемую модель реферата (МР). В отличие от рефератов, которые создаются в процессе функционирования базы данных, модель реферата, вернее, ее базовый компонент, создается предварительно на одном из первых этапов построения базы данных.
Реферат имеет идентичную модели структуру, поскольку является результатом включения в него из модели тех языковых фактов (строк), которые присущи данному конкретному языку. Поэтому реферат обычно не состоит из чего-то отличного от содержащегося в модели. Однако предусмотрено так называемое итеративное пополнение модели, т.е. включение в нее после ряда проверок и консультаций со специалистами тех строк, которых до этого в модели не было. Можно считать, что если реферат является основной единицей ввода, хранения и обработки в базе данных, то модель реферата - это инструмент формирования реферата, обеспечения его стандартности, унифицированности и тем самым формализованное™. Поэтому она может рассматриваться как язык внутреннего представления информации в базе данных.
Далее будут введены и объяснены этапы работы: написание статьи по типовой схеме в энциклопедию, составление по ней реферата, введение его в компьютер, составление программы по обработке данных и т.п.
Практическая ценность
Компьютерная база данных «Языки мира» может использоваться в разных областях знания, но в первую очередь в лингвистике. На ее основе уже созданы различные виды указателей к энциклопедии «Языки мира»: географический, генетический, предметный алфавитный и предметный систематический указатели.
Разрабатываются теоретические и методологические основы создания диалоговой вопросно-ответной системы. Указатели дают отсылки от каждой строки модели к статье энциклопедии «Языки мира», где читатель сможет найти более подробную информацию об интересующем его аспекте. Это сокращает затрачиваемое читателем время, и, кроме того, дает каждое явление в контексте (в иерархической структуре), указывает его синонимы и англоязычный эквивалент. В этом плане особый интерес представляет тезаурус грамматических категорий и явлений, составленный по базе данных.
Методы исследования
При создании базы данных применялись и опробовались различные языки программирования, первоначально комплекс программ для данной базы данных был разработан старшим научным сотрудником Ю.П.Скоканом. Они были написаны на языке Clipper и позволяли осуществлять ввод, хранение, инспекцию, редактирование и преобразование рефератов, а также ввод новых строк в модель реферата. Кроме того, этот программный продукт позволяет осуществлять автоматизированный перевод рефератов на английский язык. Программная реализация различных функций позволяет рассматривать процесс формирования базы данных как процесс ее постоянного расширения как по горизонтали (ввод новых языков), так и по вертикали (ввод новых строк в модель реферата).
В настоящее время первоначальное программное обеспечение было перепрограммировано на языке Delphi и адаптировано под Windows. В этой второй версии программного обеспечения была полностью сохранена идеология первой версии. Дополнительно были реализованы функции БД, связанные с информационным поиском.
Также применялись методы и формулы математической статистики, логики и языка исчисления предикатов, лингвистические методы денотативного анализа текста, сравнительно-исторического языкознания, социолингвистики и психолингвистики, метод опроса и анализа потенциальных пользователей базы данных.
Перспективность исследования
Возможности применения базы данных поистине безграничны. Кроме введения в нее всех известных на настоящее время языков мира, формируемая и итеративно пополняемая модель языка даст представление о формализованной структуре человеческого языка вообще. Представляется также возможность исследования с ее помощью психолингвистических, лингво-палеонтологических и лингво-антропологических закономерностей, структурных особенностей разных грамматических категорий, и многое другое.
Лингвистическая типология может с помощью базы данных верифицировать свои гипотезы и положения.
Студенты могут использовать базу данных при написании курсовых и дипломных работ, а также при подготовке к экзаменам. Ученым база данных дает возможность рассматривать исследуемые языковые явления или категории в широком контексте, а программа (пока еще не до конца разработанная), дает перечень языков, в которых присутствует задаваемый элемент модели. Это позволяет сэкономить усилия при обращении к печатному изданию энциклопедии "Языки мира" (не нужно будет просматривать всю энциклопедию с целью найти интересующее Вас явление, достаточно будет обратиться к тому языку из числа описанных в ней, в котором это явление имеется).
Преподавателям важно понять самим и довести до сведения своих учеников различия в структуре родного и изучаемого языка. Простое сопоставление конкретно-языковых грамматиконов родного и изучаемого языков - это первый шаг к осознанию данного различия.
А переводчику следует обратить внимание на адекватность передачи в языке - переводном эквиваленте всех упомянутых способов и видов словообразования. Кроме того, существенны и структурные различия построения единиц текста. Имеется в виду как структура простого, так и сложного предложения, а также порядок следования компонентов при построении дискурса.
Апробация и внедрение
Результаты работы по созданию и ведению базы данных были опубликованы в монографии, ряде статей в отечественных и зарубежных журналах, докладывались на конференциях и семинарах. (Институт языкознания РАН, МГЛУ, Пермский политехнический институт, Уфимский университет).
Используемая терминология
Реферат - сокращенный вариант статьи энциклопедии «Языки мира», содержащий все основные сведения об описываемом языке и представленный в виде специальной формализованной записи, другими словами, это последовательность наименований языковых явлений, записанных в отдельных строках и связанных между собой определенными отношениями (в основном отношениями подчинения .и соподчинения). Каждая позиция (раздел) типовой схемы статьи о языке содержательно соответствует в модели классу языковых явлений.
Модель - средство стандартизации процесса реферирования. Рефераты статей о языках представляют собой свернутые, формализованные и определенным образом структурированные описания языков, отличающиеся стадартизованностью и унифицированностью и составленные по определенному трафарету, в качестве которого выступает модель реферата. Поэтому референт должен составлять реферат путем включения в него строк модели реферата. Кроме того, референту предоставляется право дополнять список характеристик, задаваемый моделью. В этом случае предусмотрен режим добавления строки в модель. Модель сначала создавалась априорно, на основе знаний и опыта лингвистов в разных областях языкознания и при опоре на имеющиеся в энциклопедии описания языков.
Итеративное пополнение модели - добавление в модель тех строк, которых не было в ней на момент составления реферата о некотором языке, но которые необходимы для его описания.
Класс, аспект, подаспект и характеристика - это структурные единицы реферата разных уровней, соответствующие темам, подтемам, субподтемам и микротемам денотатной структуры, (см. А.И.Новиков. Семантика текста и ее формализация. М., 1983).
Тема, подтема, субподтема, микротема — единицы описания статьи о языке (тема - это конкретный язык), подтема, субподтема и микротема - дальнейшие градации описания этого языка.
Лакуна - отсутствие языкового явления или его описания, отмечается в рефератах языков специальными графическими знаками: - О - явление отсутствует, О - явление не описано.
Ведущие точки - способ отражения иерархии элементов, составляющих модель, специальная формализованная запись. Каждый следующий уровень иерархии имеет на одну "ведущую точку" больше, чем предшествующий.
Вес — или весовая категория - цифровое обозначение значимости некоторого элемента для решения конкретной задачи; чем больше вес, тем значимее элемент.
Грамматиком - универсальный, конкретно-языковой и частные — наборы грамматических категорий и явлений в модели языка, в рефератах конкретных языков и в отдельных классах модели.
Фонематикон, ономастикой, вербатикон, просодикой, нумерикон, птотикон, дейктикон, фонотактикон, фонотипикоп, морфотипикон, партикон, парадигматикой, слово-форматикон, дериватикон, сентенсикон, комплексикон, графикон и т.п. - названия частных таксонов грамматикона.
Кластер - «пучок» характеристик языка, группы языков, класса, аспекта модели.
Классифицирующие элементы реферата — элементы, подчиняющие себе другие, классы, аспекты, подаспекты.
Фактографические элементы реферата - элементы, стоящие на самых нижних уровнях иерархии, характеристики, редко подаспекты.
Поисковый запрос - интересующий пользователя базы данных вопрос, касающийся ее содержимого.
Поисковое предписание - формальная запись запроса специальными символами.
Дисплей, панель экрана, реперпые точки, мемо-поле, откатная копия - термины информатики и программирования.
Банк данных - система программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного использования данных.
Лингво-дистантно-метрика и лингво-палео-генезис — предполагаемые условные названия возможных направлений исследований с применением базы данных «Языки мира».
Похожие диссертационные работы по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК
Лингвистические основы создания двуязычного (русско-английского) тематического словаря устойчивых сравнений2010 год, кандидат филологических наук Элмасян, Анна Вартановна
Системно-аспектуальное функционирование компьютерной терминологии2009 год, доктор филологических наук Бабалова, Галина Григорьвна
Гармонизация глобального политического дискурса на сигнификативном уровне: на примере дискурса США и России2013 год, доктор филологических наук Павлова, Елена Касимовна
Деривационное функционирование русского текста: лингвоцентрический и персоноцентрический аспекты2011 год, доктор филологических наук Мельник, Наталья Владимировна
Функционирование терминов в отечественных лингвистических и юридических текстах второй половины XX - начала XXI века в свете данных дискурсивного анализа2009 год, кандидат филологических наук Босов, Артём Евгеньевич
Заключение диссертации по теме «Прикладная и математическая лингвистика», Ярославцева, Елена Игоревна
ВЫВОДЫ
Подводя итоги изложенному, можно сказать, что поставленные в диссертации цели достигнуты.
1) Доказано, что созданная в отделе прикладной лингвистики ф Института языкознания РАН компьютерная база данных «Языки мира» является электронным аналогом издания «Языки мира», его детализацией и конкретизацией типовой схемы статьи о языке, применяемой в этом издании.
Разработаны требования к реферату, к его структуре и единицам, составлены и опробованы программы автоматического реферирования статей энциклопедии (его общей и индивидуальной части). Получены отзывы на рефераты статей от их авторов, они в основном положительны.
2) В работе описано, как можно использовать базу данных для педагогов, переводчиков, студентов и лингвистов; предложен метод автоматизированного перевода базы данных на английский (уже осуществлено), а в принципе на любой другой иностранный язык; составлен вариант получения формальной типологии языков, с помощью которой можно верифицировать традиционную типологию. Предложено несколько вариантов сопоставления языков по формальным критериям.
3) Созданная общая схема универсального реферата, называемая «моделью реферата», выступает в роли шаблона при составлении рефератов. Такая модель была вначале составлена на основе консультаций со специалистами в разных языковедческих дисциплинах, но такая априорная модель не могла включать в себя то огромное количество параметров, которое может встретиться в разных конкретных языках. С этой целью было предусмотрено итеративное пополнение модели теми строками, которых не было в ее априорном варианте, что и было реализовано в программе автоматического реферирования. Это позволяет не потерять ни одной специфической характеристики описываемых языков и получить модель как отдельного языка, так и языковой подгруппы, группы и семьи языков, а в конечном счете, - при завершении (когда-нибудь) описания всех языков мира, - модель человеческого языка вообще.
4) Имеющиеся программы сопоставления языков, основанные на разных критериях соответствия, позволяют создать так называемую формальную типологию языков - материал для верификации традиционной типологии.
5) Составлен тезаурус грамматических категорий и явлений по 330 языкам базы данных. Он написан по принципиально новой схеме словарной статьи, содержащей 3 группы элементов: статусные, конкретизирующие и имплицированные.
6) Составлены географический и генетический указатели к базе данных. Географический указатель позволяет без обращения к энциклопедии определять, какие языки распространены в какой-либо географической единице, и в каком статусе она там употребляется. Генетический указатель дает отсылки от любых генетических единиц к подчиняющим ее более крупным единицам.
7) Разработана система автоматизированного перевода базы данных на английский (в принципе на любой другой) язык.
8) Намечены пути выявления лакун в описании языков и импликаций языковых категорий и явлений.
9) Разработанная система составления поисковых предписаний по поисковым запросам потребителей позволяет организовать многоаспектный поиск в базе данных.
10) Описан банк лингвотипологических данных - основные теоретические положения этой достаточно новой области компьютерной лингвистики, структура такого банка данных. Заложены некоторые теоретические основы создания диалоговой вопросно-ответной системы, позволяющей в автоматическом режиме получать ответы на вопросы специалистов, касающиеся содержания базы данных и характеристик (в том числе качественных и количественных) входящих в эту базу языков.
ЗАКЛЮЧЕНИЕ
Почему так важно изучать все существующие сейчас и существовавшие в прошлом естественные языки? Да потому, что они дают нам возможность понять быт, культуру и "менталитет" других народов. "Ботаники и зоологи, для того чтобы понять мир живых существ, вынуждены описывать разновидности, обитающие во всех частях света; даже вымершие виды подвергались изучению, без которого мы не овладели бы исторической перспективой в данной области. Ученые столкнулись также и с необходимостью сравнить и противопоставить друг другу эти разновидности, разделить их на семьи и классы, изучить различные стадии их развития, их морфологию и таксономию. В науке о языке происходит то же самое". (Б.Уорф. "Лингвистика и логика" // "Новое в лингвистике", вып.1, М., 1970, с. 191.).
Весьма интересным могут оказаться исследования, изучающие взаимообусловленность языковых категорий и способа мышления (условно можно сказать "менталикона"). Не случайно гипотеза лингвистической относительности Сепира-Уорфа до сих пор привлекает внимание лингвистов.
Деление системы языка на уровни помогает увидеть большую и меньшую консервативность его различных составляющих.
Лексикон, грамматикон, прагматикон, выделяемые Ю.Н.Карауловым и другими лингвистами, достаточно хорошо демонстрируют подвижность или ригидность тех или иных составляющих языка.
Самая подвижная и быстро изменяющаяся сфера - это прагматика, изучающая функционирование языковых знаков в речи, и связанная с говорящим субъектом, адресатом, их взаимодействием в коммуникации, с ситуацией общения.
Совершенно очевидно, что эта область никоим образом не может быть одинаковой не только для различных языков, но и для различных коммуникативных ситуаций.
В более жестко фиксированной лексике тоже, хотя и в меньшей степени, находят отражение открытость и динамизм языка. С одной стороны, старые слова отходят на второй план, а с другой, - идет пополнение словарного состава, стилистическая дифференциация слов и их значений, что обогащает выразительные средства языка. "Лексика прямо или косвенно отражает действительность, реагирует на изменения в общественной, материальной и культурной жизни народа, постоянно пополняется новыми словами для обозначения новых предметов, явлений, процессов, понятий» (ЛЭС, ст. "Лексика"). Вспомним широко известный пример о наличии более двадцати слов, обозначающих снег в различных его состояниях в чукотском языке. Для данного этноса подобное различие было актуально в связи с условиями жизни данного этноса. Вот как об этом пишет В.А.Звегинцев: "Сравните чрезвычайно подробную номенклатуру обозначений различных состояний льда, снега и мороза у северных народов или весьма дробное обозначение видов растительности и их стадий роста у южных народов, очень богатую синонимику, связанную у скандинавских народов с мореплаванием и рыболовством, а у арабских народов - с верблюдами, конями, водой и т.д. Эта категория языковых различий прямо и непосредственно обусловлена многообразием форм действительности и условий общественного опыта". (В.А.Звегинцев. Теоретико-лингвистические предпосылки гипотезы Сепира-Уорфа. // "Новое в лингвистике", вып.1, М., 1970, с.123-124.).
Язык отражает массовое мышление, он реагирует на все изменения и нововведения, но реагирует слабо и медленно, тогда как в сознании производящих изменения это происходит моментально" (Б.Уорф, "Отношение норм поведения к языку" // "Новое в лингвистике", вып.1, М., 1970, с.164.). Следовательно, изучая какой-либо язык, мы можем проникнуть в мир, в сознание и условия жизни того народа, который на нем говорит или говорил.
В кругу современных гуманитарных наук лингвистическая палеонтология обнаруживает особенно тесные связи с исследованиями в области архаичного сознания, социальной антропологии, этногенеза, истории первобытного общества, истории материальной и духовной культуры". (В.Н.Топоров. ЛЭС, ст. "Палеонтология лингвистическая", с. 361).
Изучение древних ("мертвых") языков важно со следующих точек зрения: дешифровка древних рукописей (вообще древних текстов в любой форме фиксации) позволяет локализовать и датировать памятники материальной культуры древних, проследить исторические периоды развития исследуемого языка, время выделения родственных языков-потомков и т.п.
Нет нужды говорить о необходимости изучения современных, функционирующих в настоящее время языков. Это связано с разработкой грамотной социальной политики в многоязычных регионах, с проблемами адекватного перевода, наконец, с попыткой понять психологию и культуру другого народа.
Неоднозначность лексических единиц и выражаемых ими понятий, наличие коннотативных значений и часто не осознаваемыми носителями языка внутренних форм слов ведет к трудностям при переводе текстов с одного языка на другой (этой проблеме посвящены многие отечественные и зарубежные публикации).
Грамматика более консервативна, т.к. возникает и функционирует в ходе длительного приспособления к коммуникативным потребностям членов общества. Это строевая основа языка, имеющая дело с абстракциями, обобщениями. Об этом, в частности, см.: Ярославцева. Грамматикон, его виды и аналоги. // Язык, сознание, коммуникация. Вып. 10. МГУ,М., 1999.
Поэтому одним из наиболее перспективных путей представляется изучение грамматики различных языков, сопоставление таких грамматик, создание исчерпывающего (по возможности) перечня грамматических категорий и явлений, выработанных человечеством в ходе его "лингвистического" развития.
Посмотрим, что же собственно изучает грамматика.
К грамматическому значению слова относятся: его значение как части речи, т.е. как единицы, принадлежащей к определенному лексико-грамматическому классу, его словообразовательное значение (в производном слове) и все его общие и частные грамматические значения (у имени - значения рода, числа, падежа, у глагола - значения вида, залога, времени, лица, числа, наклонения, в ряде форм также значение рода).
Кроме того, у многих знаменательных слов есть и более частные грамматические значения, принадлежащие отдельным их группам, а также так называемые лексико-грамматические значения".
Н.Ю.Шведова. ЛЭС, ст. "Грамматика", с.114).
Языки мира различаются: 1) по количеству и составу грамматических категорий (ср., например, специфическую для некоторых языков - славянских и др. - категорию глагольного вида; категорию грамматического класса - человека или вещи - в ряде иберийско-кавказских языков; категорию определенности/ неопределенности, присущую преимущественно языкам с артиклем; категорию вежливости, или респективности, характерную для ряда языков Азии, в частности японского и корейского, и связанную с грамматическим выражением отношения говорящего к собеседнику и лицам, о которых идет речь); 2) по количеству противопоставленных членов в рамках одной и той же категории (ср. шесть падежей в русском языке и до сорока - в некоторых дагестанских; 3) по тому, какие части речи содержат ту или иную категорию (так, в ненецком существительные обладают категориями лица и времени). Эти характеристики могут меняться в процессе исторического развития одного языка (ср., например, три формы числа в древнерусском, включая двойственное, и две - в современном русском языке). (В.В.Лопатин. ЛЭС, ст. "Грамматическая категория", с.115).
К сфере научной грамматики относятся сравнительно-исторические грамматики, изучающие строй родственных языков в их развитии или на отдельных прошлых ступенях этого развития, и грамматики сопоставительные (в том числе контрастивные), описывающие черты сходства и различия в строе родственных или неродственных языков в какой-либо определенный момент их существования.)". (Н.Ю.Шведова. ЛЭС, ст. "Грамматика", с. 115).
Создаваемая в Институте языкознания компьютерная база данных "Языки мира" основывается на т.н. "Модели реферата" (см. Журинская и др., 1986). Именно эта модель (итеративно пополняемая конкретными микротемами (значениями категорий), присущими каждому из добавляемых в базу данных языков), и представляет собой некий универсальный грамматикон, т.е. перечень всех наличествующих в языках мира грамматических значений, подчиненных той или иной грамматической категории.
Реализация проекта по созданию многоаспектной информационной системы стала возможной в результате интеграции опыта различных школ и направлений в лингвистике. Была проделана широкомасштабная работа по сбору и анализу конкретных материалов по языкам мира, найдены единые принципы описания языков различного типа - ключ к решению проблемы их сопоставимости. Для программной реализации разработанных алгоритмов был создан универсальный терминологический аппарат описания различных языковых явлений.
Подробнее об универсальном грамматиконе можно узнать из ст.: Ярославцева. Грамматикон, его виды и аналоги // Язык, сознание, коммуникация, МГУ, 1999, вып. 10.
И это только один пример возможных исследований в области языкознания, ставших возможными на современном этапе.
А сколько еще важного и полезного предстоит открыть в данной области! Поэтому особенно обидно то снисходительнопренебрежительное отношение к науке о языке, которое часто высказывают представители так называемых "технических" наук.
Полемизируя с ними, хочется подчеркнуть ту громадную роль, которую играет язык во всех сферах жизни и деятельности человека.
Вначале было слово", сказано в Библии, т.е. само появление человека как вида неразрывно связано с языком. А все существующие сейчас, прошлые и будущие аспекты деятельности людей возможны только потому, что существует язык, с помощью которого можно мыслить, а также фиксировать и передавать информацию. Даже, казалось бы, такая далекая от использования языка область, как балет, нуждается в либретто (т.е. в словесно-языковой фиксации сюжета), в словесных указаниях режиссера и балетмейстера, в соответствующих данному сюжетному замыслу исторических поисках (архивных и т.д.) костюмеров и гримеров и во многом другом.
Любая отрасль науки и искусства нуждается в передаче накопленного опыта, что возможно только в языковой форме. Без языка стало бы невозможно образование и обучение, т.е. передача опыта от поколения к поколению. Новая физическая теория или открытие становятся достоянием человечества только через посредство языка.
Что же говорить о тех сферах деятельности, в которых особую роль играет передача информации - в наш информационный век таких сфер становится все больше. Даже космическая индустрия нуждается, по меньшей мере (кроме фиксации своих достижений), в передаче команд с земли космонавтам, работающим в далеком космосе, и сведений от них в центр управления.
Передача же любой информации осуществляется через посредство языка.
Создаваемая в Институте языкознания компьютерная база данных "Языки мира" основывается на т.н. "Модели реферата" (см. Журинская и др., 1986). Именно эта модель (итеративно пополняемая конкретными микротемами (значениями категорий), присущими каждому из добавляемых в базу данных языков), и представляет собой некий ^ универсальный грамматикон, т.е. перечень всех наличествующих в языках £ мира грамматических значений, подчиненных той или иной грамматической категории.
Почему мы способны понять речь другого человека, говорящего на известном нам языке, и не можем понять речь на незнакомом языке? Каким образом осуществляется речевое воздействие (см. ЛЭС, ст. "Риторика"), суггестивное воздействие (заговоры, молитвы, формулы гипноза и аутотренинга) (см. И.Черепанова "Дом колдуньи", М.,1996), ^ вообще управление с помощью речи? На эти и другие вопросы поможет ответить компьютерный анализ языка и его отдельных аспектов. А в ^ языке таится столько еще непознанного, не до конца изученного!
Список литературы диссертационного исследования доктор филологических наук Ярославцева, Елена Игоревна, 2005 год
1. Большая Российская энциклопедия», 1997.
2. ЛЭС Лингвистический энциклопедический словарь. М., 1990.
3. Советская энциклопедия", 1990.
4. Словарь польского языка XVI в. (с 1966) ^Словарь русского языка» А.А.Шахматова, т.2, 1907, т.4, 1916.
5. Андреев Н.Д. Статистико-комбинаторные методы в теоретическом и прикладном языкознании. Л., 1067.
6. Андрющенко В.М. Лингвистический подход к изучению языков программирования и взаимодействия с ЭВМ. // Проблемы вычислительной лингвистики и автоматической обработки текста на естественном языке. М., Изд-во МГУ, 1980.
7. Апресян Ю.Д. Формальная модель языка и представление лексикографических знаний // Вопросы языкознания. 1990, №6.
8. Атаян Э.Р. Аспекты организации и функционирования языковой сферы. Ереван, 1976.
9. Баранов П.Н., Добровольскмй Д.О., Михайлов М.Н., Паршин П.Б., Романова О.И. Англо-Русский словарь по лингвистике и семиотике. М., 1996.
10. Баррон Д. Введение в языки программирования. М., 1980.
11. Белоногов Г.Г., Богатырев В.И. Автоматизированные информационные системы. М., 1973.
12. Белоногов Г.Г., Котов Р.Г. Автоматизированные информационно-поисковые системы. М., 1968.
13. Белоногов Г.Г., Кузнецов Б.А. Языковые средства автоматизированных информационных систем. М., 1983.
14. Белоногов Г.Г., Новоселов А.П. Автоматизация процессов накопления, поиска и обобщения информации. М., 1979.
15. Беляева Л.Н. Применение ЭВМ в лингвистических исследованиях и лингводидактике. Л., 1986.
16. Бенвенист Э. Общая лингвистика. М., 1974.
17. Березин Ф.М., Головин Б.Н. Общее языкознание. М., 1979.
18. Бойко И.М., Мартынов В.В. Семантическая интеллектуальная система и ее компьютерная реализация // Теория коммуникации. Языковые значения. Мн., 2000.
19. Бондарко A.B. Грамматическое значение и смысл. М., 1978.
20. Варга Д. Методика подготовки информационных тезаурусов // Сборник переводов по вопросам информационной теории и практики. № 17, М., 1970.
21. Вежбицкая А. Семантические универсалии и описание языков. М., 1999.
22. Вельбицкий Н.В. Технология программирования. Киев, 1984.
23. Виноград Т. Программа, понимающая естественный язык. М., 1976.
24. Виноградов В.А., Новиков А.И., Ярославцева Е.И. База данных «Языки мира» как инструмент лингвистического исследования // Вопросы языкознания, 2003, №3.
25. Вудс В. Сетевые грамматики для анализа естественных языков // Кибернетический сборник. М., 1976.
26. Выготский JI.C. Мышление и речь. // Избр. Психологические исследования. М., 1956.
27. Гвишиани Н.Б. Язык научного общения. М.,"Высшая шнола", 1986.
28. Гак В.Г. К проблеме соотношения языка и действительности // ВЯ, 1972, №5.
29. Герд A.C. Язык науки и техники как объект лингвистического изучения, //НДВШ. Филол. науки. 1986. №2.
30. Герд A.C., Богданов В.В., Буторов А.Д. и др. Информационно-поисковый тезаурус как объект лексикографии // Структурная и прикладная лингвистика, вып. 1, JL, 1978.
31. Гиляревский P.C., Шрейдер Ю.А. Семиотика научно-информационных процессов. НТИ, сер. 2, №1, 1979.
32. Глушков В.М. Основы безбумажной информатики. М., 1982.
33. Глушков В.М., Каныгин Ю.М. Новая отрасль народного хозяйства -индустрия переработки информации, // Кибернетика: дела практические. М., 1984.
34. Гринберг Дж. Некоторые грамматические универсалии, преимущественно касающиеся порядка значимых элементов // Новое в лингвистике. М., 1970. Вып. 5.
35. Гринберг Дж., Осгуд Ч., Дженкинс Дж. Меморандум о языковых универсалиях // Новое в лингвистике. М., 1970. Вып. 5.
36. Гумбольдт Вильгельм фон. Язык и философия культуры. М., 1985.
37. Гумбольдт Вильгельм фон. «Опыт анализа мексиканского языка» и «Об изучении языков, или план систематической энциклопедии всех языков» // Гумбольдт Вильгельм фон. Язык и философия культуры. М., 1985.
38. Даниленко В.П., Скворцов Л.И. Лингвистические проблемы упорядочения научно-технической терминологии.// В.Я. 1981, № 1.
39. Дешериев Ю.Д. Социальная лингвистика. М., 1977.
40. Длин A.M. Математическая статистика в технике. М., 1958.
41. Жданова Г.С., Колобродова Е.С., Полушкин В.А., Черный А.И. Словарь терминов по информатике на русском и английском языке. М., 1971.
42. Жинкин Н.И. Грамматика и смысл // Язык и человек. МГУ, 1970.
43. Жинкин Н.И. Речь как проводник информации. М., 1982.
44. Журинская М.А., Новиков А.И., Ярославцева.Е.И. Энциклопедическое описание языков. М., "Наука", 1986.
45. Звегинцев. В.А. "Теоретико-лингвистические предпосылки гипотезы Сепира-Уорфа. // "Новое в лингвистике", вып.1, М., 1970, с.123-124.
46. Звегинцев К.А. Язык как фактор компьютерной революции. // НТИ. Сер. 2. 1985. №9.
47. Иванов Вяч.Вс. Языки мира. // Лингвистический Энциклопедический Словарь. М., 1990
48. Ионесян Е.Р. Понятие ориентира в пространственном дейксисе. // Коммуникативные аспекты исследования языка. АН СССР, Ин-т языкознания, М., 1986.
49. Информационно-поисковый тезаурус по информатике. М., ВИНИТИ, 1973.
50. Караулов Ю.Н. Общая и русская идеография. М., 1976.
51. Караулов Ю.Н. Лингвистическое конструирование и тезаурус русского литературного языка. М., 1981.
52. Караулов Ю.Н. На уровне языковой личности,- // Сб. Караулов Ю.Н. и др. Между семантикой и гносеологией. М., 1985. Вып. 164, с.4-29.
53. Караулов Ю.Н. Русский язык и языковая личность // Отв. ред. чл.-корр. Д.М.Шмелев; АН СССР. Отд-ние лит. и яз. М.: Наука, 1987.
54. Керимов С.К., Гасанов P.A. ИПЯ и логическая организация информационной базы в интегрированной ИПС по нефтеобработке и нефтехимии, // НТИ. Сер. 2, Информ. Процессы и системы. 1978. №11.
55. Кирова Л.Г. Модульный подход к проектированию критерия семантического соответствия ИПС, // НТИ. Сер. 2, Информ. Процессы и системы. 1978. №2.
56. Кокарева Л.В., Милошилин И.И. Проектирование банков данных. М., 1984.
57. Королев Э.И. О некоторых системных требованиях к лингвистическому обеспечению автоматизированных информационно-поисковых систем // Техника средств связи. М., 1980, вып. 1.
58. Котов Р.Г. Лингвистические аспекты автоматизированных систем управления. М., 1977.
59. Котов Р.Г. Информационно-языковые проблемы современного общества,. // Лингвистические вопросы алгоритмической обработки сообщений. М., 1983.
60. Котов Р.Г., Новиков А.И., Скокан Ю.П. Прикладная лингвистика и информационная технология. М., 1988.
61. Котов Р.Г., Якушин Б.В. Языки информационных систем. М., 1979.
62. Кузин JI.Т. Интеллектуальные банки данных/^/Вопросы кибернетики. М., 1979.
63. Лебедев В.Н. Введение в языки программирования. М., 1975. Леонтьева H.H. Семантика связного текста и единицы информационного анализа //НТИ, сер. 2, 1981, № 1.
64. Леонтьева H.H. Информационная модель автоматического перевода //НТИ, сер. 2, 1985, № 10.
65. Лингвистические вопросы алгоритмической обработки сообщений. М., 1983.
66. Лопатин В.В. ЛЭС, ст. "Грамматическая категория", с. 115. Мариманова М.С. Проблемы тезауруса в психологии. Автореф. Дис.канд. психол. наук. М., 1984.
67. Мартин Дж. Организация баз данных в вычислительных системах. М., 1978.
68. Мартынов В.В. Кибернетика. Семиотика. Лингвистика. Мн., 1974. Мартынов В.В. Семиологические основы информатики. Мн., 1974. Мартынов В.В. Семиологические основы искусственного интеллекта //Известия АН СССР. Сер. ОЛЯ. 1978, №1.
69. Мартынов В.В. Функциональная грамматика и функции языка // Проблемы функциональной грамматики. М., 1985.
70. Марчук Ю.Н. Некоторые проблемы развития государственной системы научно-технической информации/^НТИ, сер. 2, 1980, № 11.
71. Мельников Г.П. Системология и языковые аспекты кибернетики. М., 1978.
72. Михайлов А.И., Черный А.И., Гиляревский P.C. Проблемы информатики в современной науке//НТИ, сер. 2, 1976, №1.
73. Мруэ Зейнаб Э.-Ш. X. Комбинаторика ассоциативных портретов. Дис.канд. филол. наук. М., 1998.
74. Нестерова Н.М. Реферативный перевод как смысловое преобразование текста. Дисс. .канд. филол. наук. М., 1984.
75. Нестерова Н.М. Реферативный текст и особенности его порождения. Коммуникативные аспекты исследования языка. АН СССР, Ин-т языкознания, М., 1986.
76. Никитина С.Е. Тезаурус по теоретической и прикладной лингвистике. М., 1978.
77. Никитина С.Е. Семантический анализ языка науки. М., 1987.
78. Никитина С.Е. Тезаурус языка фольклора в машинном ракурсе // Фольклор. Проблемы тезауруса. М., 1994.
79. Новиков А.И. Алгоритмическая модель смыслового преобразования текста. Канд. исс. М., 1973.
80. Новиков А.И. О соотношении лингвистической и семантической информации в тексте // Новиков А.И. Семантика текста и способы ее формализации. М., 1983.
81. Новиков А.И., Чистякова Г.Д. Текст, тема, денотат// Изв. АН СССР, СЛЯ, 1981, № 1.
82. Новиков А.И., Якушин Б.В. Алгоритм индексирования текстов взвешенными ключевыми словами по методу семантической фильтрации^ /НТИ, сер. 2, 1972, №6.
83. Новиков А.И., Ярославцева Е.И. База лингвотипологических данных и принципы ее функционирования // Вести АН СССР. 1985, № 3.
84. Новиков А.И., Ярославцева Е.И. Семантические расстояния в языке и тексте. М., 1990.
85. Орфеев Ю.В., Тюхтин B.C. Мышление человека и искусственный интеллект. М., 1978.
86. Павилёнис Р.И. Проблема смысла. М., 1983.
87. Пиотровский Р.Г. Текст, машина, человек. Л., 1975.
88. Пиотровский Р.Г. Инженерная лингвистика и теория языка. М., 1978.
89. Принципы описания языков мира. М., 1976.
90. Полинская М.С. Синтаксические конструкции предложения и их коммуникативный статус (на материале эргативных языков) // Коммуникативные аспекты исследования языка. АН СССР, Ин-т языкознания, М., 1986.
91. Поспелов Д.А. Логико-лингвистические модели в системах управления. М., 1981.
92. Пумпянский В.Н. Принципы описания языков мира. М., Наука. 1985.
93. Рубинштейн Л.С. Основы психологии. М., 1935.
94. Рябцева Н.К. Моделирование информационных процессов в прикладных лингвистических целях, // Вопросы моделирования перевода. М., 1987 (Деп.).
95. Семантика языковых единиц и текста. М., 1979.
96. Серебренников Б.А. Роль человеческого фактора в языке. М., Наука, 1988.
97. Соколов A.B. Некоторые проблемы типового проектирования информационно-поисковых тезаурусов. В кн.: Структурная и прикладная лингвистика, вып. 1, Л., 1978.
98. Соссюр Ф. Де. Труды по языкознанию. М., 1977.
99. Стандартизация научно-технической терминологии. М., 1970.
100. Степанов Ю.С. Методы и принципы современной лингвистики. М., 1975.
101. Степанов Ю.С. Основы общего языкознания. М., 1977.
102. Теоретические основы классификации языков мира. М., 1981, ч. 1; 1982,ч. 2.
103. Тестелец Я.Г. Материалы к синтаксической типологии картвельских языков (конструкции с одноместными глаголами), // Коммуникативные аспекты исследования языка. АН СССР, Ин-т языкознания, М., 1986.
104. Тихомиров О. Философско-психологические проблемы искусственного интеллекта // Труды IV Международной объединенной конференции по искусственному интеллекту. II. 115. Психологические аспекты искусственного интеллекта. М., 1975.
105. Толстой Н.И. О предмете этнолингвистики и ее роли в изучении языка и этноса // Ареальные исследования в этнографии: Язык и этнос. Д., 1983.
106. Уемов А.И. Вещи, свойства, отношения. М., 1963.
107. Уорф Б. "Лингвистика и логика", // "Новое в лингвистике", вып.1, М., 1970, с.191.
108. Успенский Б.А. Проблема универсалий в языкознании // "Новое в лингвистике", вып.5, М., 1970.
109. Федоров Е.Б. Алгоритм построения базисных отношений в дескрипторных ИПС // НТИ. Сер. 2, Информ. Процессы и системы. 1973, № 11.
110. Фролов A.C. Сочетаемость и совместная встречаемость полнозначных словесных знаков // Структурные аспекты слова и словосочетания. Калинин, 1988.
111. Черепанова И. "Дом колдуньи", М., 1996»
112. Черри К. Человек и информация. М., 1972.
113. Черный А.И. Словарь терминов по информатике на русском и английском языке. М., 1971.
114. Черный А.И. Введение в теорию информационного поиска. М., 1975.
115. Чижаковский В.А., Беляева Л.Н. Тезаурус в системах автоматической переработки текста. Кишинев, 1983.
116. Чулкина Н.Л. Модель лексикона носителя русского языка как способ представления лексической системы. Дис.канд. филол. наук. М., 1987.
117. Шаумян С.К. Аппликативная грамматика как семантическая теория естественных языков. М., 1974.
118. Шведова Н.Ю. ЛЭС, ст. "Грамматика", с.115.
119. Швейцер А.Д., Никольский Л.Б. Введение в социолингвистику. М., 1978.
120. Широков О.С. Языковедение: введение в науку о языке. М., «Добросвет», 2003.
121. Шрейдер Ю.А. Тезаурус в грамматике и теоретической семантике // НТИ, сер. 1, 1971, №3.
122. Шрейдер Ю.А. Естественные языки как основа информационных. М., 1974.
123. Щерба Л.В. О частях речи в русском языке. // Языковая система и речевая деятельность. Л., 1974.
124. ЭВМ пятого поколения: концепции, проблемы, перспективы. М., 1984.
125. Якобсон Р. Лингвистика в ее отношении к другим наукам // Избранные работы. М., 1983.
126. Якушин Б.В. Слово, понятие, информация. М., 1975.
127. Якушин Б.В. Алгоритмическое индексирование в информационных системах. М., 1978.
128. Якушин Б.В., Ярославцева Е.И. Критерий близости текстов по содержанию (умственный критерий). // Изв. АН СССР, ОЛЯ, 1980, т.20, т.6.
129. Ярославцева Е.И. Исследование смысловой близости текстов. Дисс. . канд. филол. наук. М., 1981.
130. Ярославцева Е.И. Методы определения семантической близости текстов, // Семантика языковых единиц и текста. М., 1978.
131. Ярославцева Е.И. Регламентация языковых средств в социальной сфере. // Естественный язык, искусственные языки и информационные процессы в современном обществе. М., 1988.
132. Ярославцева Е.И. Грамматикон, его виды и аналоги // Язык, сознание, коммуникация. Вып. 10. МГУ, М., 1999.
133. Ярославцева Е.И. Грамматикон и база данных "Языки мира",- // Проблемы прикладной лингвистики 2001. М. 2002.
134. Ярцева В.Н. Научно-техническая революция и развитие языка // Научно-техническая революция и функционирование языков мира. М., 1977.
135. Bar-Hillel Y. Theoretical aspects of the mechanization of literature searching // Digitale Informationswandler/ Braunschweig, 1962.
136. Greenberg Joseph H. A Quantitative Approach to the Morphological Typology of Language (Method and Perspective in Anthropology), ed. by Robert E. Spencer, University of Minnesota Press, 1954, 99J.
137. Gross.M. Mathematical models in linguistics. Prentice-Hall Inc., Engl wood Cliffs, New Jersy, 1972.
138. Harris Z.S. Methods in Structural Linguistics, 1951.
139. Hockett F. Information in the language sciences. New York, 1968.
140. Jones K.S. A statistical interpretation of terms specificity and its application to retrieval // J. Documentation. 1972, Vol. 28, #1.
141. Jones K.S., Kay M. Linguistics and information science. New York, 1973.1.ncaster F. Information science // Natural language and information science. Stockholm, 1977.
142. Nikitina S.E. Humaniterian scientific terms in explanatory dictionary // NTF Journal, 1992, vol.3, #1
143. Novikov A., Yaroslavtseva E. Linguotypological Data Bank // Social Sciences. USSR Academy of Sciences. Vol. XVII, No. 3, 1986.
144. Osgood C.E., Susi S.E., Tabbenbaum P.H. The measurement of Meaning. Urbana, 1957.
145. Roget's thesaurus of English words and phrases^. (1852). Roget's international thesaurus, ed. 3. London, 1957. Sager N. Syntactic formatting of science information // Sublanguage. 1982.
146. Salton G., Lesk M.E. Information analysis and Dictionary Construction in the SMART Retrieval System, // Experiments in Automatic Document Processing. N.Y., 1969.11:06 40/84 21. ИНСТИТУТ ЯЗЫКОЗНАНИЯ РАН
147. ЯРОСЛАВЦЕВА Елена Игоревна
148. КОМПЬЮТЕРНАЯ БАЗА ДАННЫХ «ЯЗЫКИ МИРА» И ЕЕ ВОЗМОЖНЫЕ ПРИМЕНЕНИЯ
149. Специальность: 10.02.21 прикладная лингвистика
150. ДИССЕРТАЦИЯ НА СОИСКАНИЕ УЧЕНОЙ СТЕПЕНИ ДОКТОРА ФИЛОЛОГИЧЕСКИХ НАУКт
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.