Роль и функции контекстологического словаря в алгоритмической обработке контрактов и международных соглашений: на материале английского языка тема диссертации и автореферата по ВАК РФ 10.02.21, кандидат филологических наук Сушилин, Алексей Анатольевич
- Специальность ВАК РФ10.02.21
- Количество страниц 248
Оглавление диссертации кандидат филологических наук Сушилин, Алексей Анатольевич
ВВЕДЕНИЕ.
ГЛАВА 1. КОРПУСНАЯ ЛИНГВИСТИКА, КОНТЕКСТОЛОГИЧЕСКИЙ СЛОВАРЬ И СОВРЕМЕННЫЕ ПРОБЛЕМЫ ОБРАБОТКИ ИНФОРМАЦИИ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ.
1.1. Корпусная лингвистика как развивающаяся область современного языкознания.
1.2. Опыт создания корпуса текстов и его использования в теоретической и прикладной лингвистике.
1.3. Корпусная лингвистика и основные проблемы современного машинного перевода.
1.4. Значение словарей - конкордансов в корпусной лингвистике при описании терминологии.
1.5. Значение контекста в идентификации значения многозначного слова и контекстологическое представление (нового) термина.
1.5.1. Автоматический контекстологический словарь и теория детерминант.
1.5.2. Толково-комбинаторный словарь и устойчивая сочетаемость слова.
1.5.3. Роль общеупотребительной лексики в терминологии. Неоднозначность языка и многозначность термина.
1.6. Методика исследования синхронного состояния общеупотребительной лексики (на материале экономических текстов на английском языке).
1.7. Роль диахронии в изучении словарного состава языка.
1.8. Методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря.
1.8.1. Сбор материала исследования: поиск, отбор и упорядочение корпуса текстов англоязычных контрактов и соглашений.
Их лингвистическая характеристика.
1.8.2. Систематизация материала исследования: разбиение на темы.
1.8.3. Отбор объекта исследования - ключевых понятий.
1.8.4. Выбор контекстов употребления ключевых понятий: предложений, содержащих искомый элемент.
1.8.5. Приведение контекста к пропозициональной форме.
1.8.6. Выделение детерминант.
1.8.7. Организация материала в виде таблицы. Разработка формата, содержания и способа представления данных.
1.8.8. Выбор инструмента исследования - словаря.
1.8.9. Возможности и достоинства разработанной методики интегрального представления данных.
1.9. Синхронический вектор слова.
Выводы
ГЛАВА 2. КОНТЕКСТОЛОГИЧЕСКИЙ СЛОВАРЬ И РАЗРЕШЕНИЕ ЛЕКСИЧЕСКОЙ МНОГОЗНАЧНОСТИ: НА ПРИМЕРЕ АНГЛОЯЗЫЧНЫХ КОНТРАКТОВ (ДОГОВОРОВ) И СОГЛАШЕНИЙ.
2.1. Контекстологические принципы распознавания значений многозначной общеупотребительной лексики и ее дистрибутивно-статистические характеристики в (новых) смежных предметных областях экономики.
2.1.1. Контекстологические принципы распознавания значений глагола to provide и его дистрибутивно-статистические характеристики.
2.1.2. Контекстологические принципы распознавания значений глагола to develop и его дистрибутивно-статистические характеристики.
2.1.3. Контекстологические принципы распознавания значений глагола to use и его дистрибутивно-статистические характеристики.
2.1.4. Контекстологические принципы распознавания значений существительного support и его дистрибутивно-статистические характеристики.
2.1.5. Контекстологические принципы распознавания значений существительного determination и его дистрибутивностатистические характеристики.
2.1.6. Контекстологические принципы распознавания значений существительного payment и его дистрибутивно-статистические характеристики.
2.1.7. Контекстологические принципы распознавания значений существительного application и его дистрибутивно-статистические характеристики.
2.1.8. Контекстологические принципы распознавания значений глагола to issue и его дистрибутивно-статистические характеристики.
2.1.9. Контекстологические принципы распознавания значений глагола to apply и его дистрибутивно-статистические характеристики.
2.1.10. Контекстологические принципы распознавания значений существительного conclusion и его дистрибутивно-статистические характеристики.
2.1.11. Контекстологические принципы распознавания значений глагола to reduce и его дистрибутивно-статистические характеристики.
2.1.12. Контекстологические принципы распознавания значений глагола to realize и его дистрибутивно-статистические характеристики. 155 2.2. Закономерности и особенности использования многозначной общеупотребительной лексики в (новых) смежных предметных областях экономики.
Выводы.
Рекомендованный список диссертаций по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК
Корпусная лингвистика и контекстное разрешение лексической многозначности слов2004 год, кандидат филологических наук Магомедова, Адигат Нурахмагаджиевна
Разрешение лексической многозначности в системе компьютерного обучения иностранным языкам: Англо-персидская лексика2006 год, кандидат филологических наук Бахарлуи Роя
Специфика дистрибутивности терминологического использования общеупотребительного многозначного слова2006 год, кандидат филологических наук Пигалева, Ирина Ростиславовна
Преобразование семантической информации в машинном переводе: на материале русско-арабского машинного перевода политических текстов2011 год, кандидат филологических наук Альотаиби Султан Маджед
Теоретические основы комбинаторной лингвистики: лексикологический и лексикографический аспекты: на материале русского и английского языков2013 год, доктор филологических наук Влавацкая, Марина Витальевна
Введение диссертации (часть автореферата) на тему «Роль и функции контекстологического словаря в алгоритмической обработке контрактов и международных соглашений: на материале английского языка»
Диссертация посвящена исследованию возможностей контекстологического словаря в разрешении многозначности общеупотребительной лексики в текстах на английском языке, относящихся к новым для российской экономики смежным предметным областям.
Актуальность темы исследования объясняется потребностью совершенствования процедур разрешения многозначности в алгоритмической обработке информации на иностранном языке, необходимостью настройки соответствующих систем на конкретную предметную область и важностью изучения особенностей использования общеупотребительной лексики в новых предметных областях.
Распознавание значений многозначной лексики в контексте ее реального употребления представляет собой одну из наиболее серьезных проблем в системах алгоритмической обработки текстов. Одним из наиболее эффективных средств ее решения выступает контекстологический словарь (КС). Идея использования контекстологического словаря в алгоритмическом переводе текстов была выдвинута, разработана и опробована на практике Ю.Н. Марчуком [1976].
Несмотря на конструктивность и эффективность использования КС в алгоритмической обработке текстов, он не получил широкого распространения в первую очередь потому, что его составление сопряжено с обработкой значительных объемов лингвистической информации, ее глубокой систематизацией и обязательной формализацией. Однако развитие методов корпусной лингвистики открывает в этом отношении новые перспективы в использовании КС в алгоритмизации разрешения лексической многозначности.
Исходными гипотезами исследования выступают предположения о том, что, во-первых, многозначная общеупотребительная лексика может приобретать в новых предметных областях терминологизированный характер, во-вторых, что в функционировании многозначной общеупотребительной лексики в смежных предметных областях экономики есть как сходные, так и отличительные черты, и, в-третьих, что КС может стать эффективным инструментом разработки методики интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики.
Соответственно, целью исследования является использование методов корпусной лингвистики в разработке методики интегрального исследования закономерностей и особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики, центральным компонентом которой выступает контекстологический словарь.
В соответствии с целью исследования были поставлены следующие конкретные задачи:
1) Проанализировать роль корпусной лингвистики в современных лингвистических исследованиях, в составлении контекстологических словарей и изучении синхронного состояния многозначной лексики, а также определить роль контекстологического словаря в алгоритмической обработке текста.
2) Сформировать материал исследования - представительный корпус экономических текстов новых предметных областей - контрактов и соглашений на английском языке, и разбить его на темы с тем, чтобы они образовали смежные предметные области: «Credit», «Business» и «Trade»;
3) Отобрать в качестве объекта исследования набор ключевых понятий -многозначных общеупотребительных слов, существительных и глаголов, которые способны воплощать характерные для данной предметной области понятия;
4) Разработать на основе принципов составления КС методику формального распознавания значений многозначной общеупотребительной лексики и исследования особенностей ее функционирования в специальном тексте;
5) Сравнить данные об использовании многозначной общеупотребительной лексики в смежных предметных областях и определить закономерности и особенности в ее функционировании;
6) На основе полученных результатов охарактеризовать роль и функции контектологического словаря в алгоритмической обработке специальных текстов.
Объектом исследования является многозначная общеупотребительная лексика (12 единиц) и контексты ее использования в корпусе текстов: свыше 900 единиц.
Предметом исследования является изучение синхронного состояния многозначной общеупотребительной лексики с помощью контекстологического словаря: выявление закономерностей и особенностей ее функционирования в текстах на английском языке, относящихся к новым для российской экономики смежным предметным областям.
Материалом исследования послужил корпус современных американских экономических текстов контрактов и соглашений, относящихся к наиболее важным для становления современной российской экономики новым областям знания, общим объемом 995 тыс. словоупотреблений.
Основные методы, применяемые в настоящей работе, определяются задачами исследования. В диссертации использовались следующие методы исследования: корпусный, алгоритмический, дистрибутивный, статистический, контекстологический, комбинаторный, компонентный, сопоставительный, трансформационный, семантический и лексикографический.
Основные результаты исследования, выносимые на защиту:
1. Разработанная в диссертации методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря позволяет:
1) уточнять и систематизировать контекстологические принципы идентификации значений многозначной общеупотребительной лексики в (специальном) тексте;
2) выявлять и систематизировать закономерности и особенности ее употребления в трех новых для российской экономики смежных предметных областях;
3) охарактеризовать общие и отличительные черты языка самих исследованных смежных предметных областей экономики;
4) описать и обосновать роль и функции контекстологического словаря в алгоритмической обработке специального текста;
5) сделать выводы относительно перспектив применения контекстологического словаря в алгоритмических и других прикладных разработках: дидактических, методических, лексикографических и др.
2. Наиболее показательными способами идентификации значений многозначной лексики в контексте выступают: (1) исходная сентенциальная формула, отражающая семантико-синтаксические особенности употребления многозначного слова в данном значении; (2) лексико-грамматическая модель, отражающая типичные синтагматические контексты его употребления; (3) семантические/ тематические классы слов, с которыми типично сочетается данное многозначное слово в данном значении.
3. Многозначная общеупотребительная лексика в специальном тексте служит для выражения важных общедисциплинарных и междисциплинарных понятий, для организации и развертывания текста, а также для упорядочения специальной, терминологической лексики. При этом она чаще всего используется не во всех своих словарных значениях, в основном сохраняет свои основные значения, отражает намечающиеся тенденции в изменениях в организации ее словарных значений и/ или ее «тонкую настройку» на конкретную предметную область.
В специальном тексте происходит «специализация» и терминологизация значений многозначной общеупотребительной лексики. Причем в экономическом тексте значения общеупотребительной лексики могут приобретать не только экономический, но и ярко выраженный юридический характер, а самой важной ее чертой оказывается ее сочетаемость с целыми классами тематически маркированных понятий и терминов, которые в содержательном отношении обозначают центральные для данной предметной области категории явлений и объектов.
4. Из трех исследованных массивов текстов, относящихся к смежным областям экономики, предметная область «Credit» более всего ориентирована на юридические отношения, «Business» - на финансовые отношения, а «Trade» - на экономические. При этом во всех трех смежных предметных областях наблюдается явная тенденция использования многозначной общеупотребительной лексики в юридически маркированных значениях, что свидетельствует об общей четкой ориентации экономических текстов на английском языке на следование букве закона и договора.
5. КС, как инструмент, разработанный для использования в прикладных целях, отличается наглядностью, эксплицитностью и формализованностью, и потому может получить широкое применение при решении большого круга новых прикладных задач. К ним относится не только совершенствование алгоритмической обработки текста и ее интеграция в новые компьютерные технологии, но и целый комплекс дидактических и программных приложений. Это разработка дидактических и компьютерных программ «активного типа» по обучению иностранному языку и переводу, составление комбинаторных и толково-комбинаторных словарей, тезаурусов-онтологий, учебных пособий и справочников и активного типа»: новой, активной, тематической и т.п. лексики, словарей сочетаемости, терминологизированных понятий, словосочетаний, оборотов и конструкций, и т.д.
КС открывает новые перспективы в дальнейшем изучении специальных текстов и особенностей функционирования в них многозначной лексики не только в прикладных, но и теоретических целях. Они предопределяются, в первую очередь, развитием корпусной лингвистики. Она предоставляет принципиально новые возможности в составлении контекстологического словаря, позволяет повысить его качество и эффективность в описании активной и специальной лексики, и тем самым способствовать его интеграции в разнообразные программные продукты и исследовательские технологии.
Научная новизна исследования заключается в изучении новых для российской экономики предметных областей, терминология которых на русском языке еще не устоялась, и которые испытывают поэтому потребность в лексикографических и алгоритмических описаниях: словарях различных типов (толковых, одноязычных, двуязычных, энциклопедических и т.д.), формальных процедур перевода на русский язык и др.
Разработанная в диссертации методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря, в этом отношении позволяет: 1) выделять новые значения у многозначной лексики; 2) уточнять значения многозначной лексики в специальном тексте; 3) фиксировать несвободную/ устойчивую сочетаемость многозначной лексики, причем в каждом из значений; 4) выявлять взаимосвязь между толкованием многозначной лексики, ее сочетаемостью и лексико-грамматическими моделями ее употребления; 5) изучать синхронное состояние многозначной общеупотребительной лексики: выявлять закономерности и особенности ее использования в новых для российской экономики смежных предметных областях.
Теоретическая значимость диссертации состоит в разработке принципов исследования синхронного состояния многозначной общеупотребительной лексики. Они заключаются в интегральном представлении семантической, лексикографической, контекстологической и статистической информации о многозначной общеупотребительной лексике и ее использовании в специальном тексте и позволяют: уточнять формальные процедуры распознавания ее значений в контексте, описывать особенности в ее функционировании в конкретной предметной области, выявлять лингвистические особенности языка самой предметной области и изучать синхронное состояние многозначной общеупотребительной лексики в новых предметных областях.
Практическая значимость работы определяется возможностью использования результатов проведенного исследования в таких прикладных направлениях, как: 1) разработка лингвистического обеспечения систем компьютерной обработки документов, в том числе в Интернете; систем класса «искусственный интеллект», особенно машинного перевода; создание новых ме-тапоисковых систем; 2) алгоритмическая обработка специальной информации на естественном языке: тематическая обработка специальных текстов и построение тематических словников, реляционных баз данных, процессоров по извлечению предметных знаний, создание «автоматизированного рабочего места эксперта» по составлению терминологических словарей, словарей словосочетаний конкретной предметной области и т.п.; 3) методика преподавания специального перевода и перевода контрактов и соглашений с английского языка на русский; компьютеризация методики преподавания иностранного языка и перевода; 4) лексикографическая практика: составление специальных одноязычных и двуязычных словарей, глоссариев, конкордансов и т. п., словарей нового, активного типа: частотных словарей словосочетаний и словарей терминологических словосочетаний конкретной предметной области, комбинаторных и толково-комбинаторных словарей, тезаурусов-онтоло-гий, учебных пособий и справочников «активного типа»: новой, активной, тематической и т.п. лексики, словарей сочетаемости, терминологизирован-ных оборотов и конструкций, и т.д. 5) чтение лекций по корпусной лингвистике и автоматической обработке текстов.
Достоверность результатов и выводов исследования обеспечивается большим объемом исследованного лингвистического материала, системным и наглядным представлением полученных лингвистических данных в виде таблиц и подтверждением высказываемых положений языковыми примерами.
Апробация работы. Основные положения диссертации обсуждались на различных Международных и региональных научных конференциях: на X Международной Юбилейной научной конференции студентов, аспирантов и молодых ученых "Ломоносов-2003", посвященной 250-летию МГУ (Москва, 15-18 апреля 2003 г.); на научных конференциях в МГОУ (Москва 17 апреля 2003 г.; 16 апреля 2004 г.; 18 апреля 2005 г.). Основные положения работы изложены в 6 публикациях.
Структура диссертации. Работа состоит из введения, двух глав, заключения, библиографии и приложений. Текст диссертации иллюстрируется рисунками и таблицами.
Похожие диссертационные работы по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК
Автоматизированные толковые словари и контекстное определение1999 год, кандидат филологических наук Меркулова, Светлана Вальдемаровна
Контекстологический словарь как элемент обучающих систем2005 год, кандидат филологических наук Варинская, Виктория Михайловна
Системная семантика термина: на материале англоязычных терминов интернета2010 год, кандидат филологических наук Ходакова, Анастасия Геннадьевна
Лингвистический и культурологический анализ текста оригинала для перевода2010 год, кандидат филологических наук Васильев, Сергей Константинович
Сопоставительное исследование русских и французских существительных с развитой многозначностью2000 год, кандидат филологических наук Белеева, Ирина Дамировна
Заключение диссертации по теме «Прикладная и математическая лингвистика», Сушилин, Алексей Анатольевич
ВЫВОДЫ
Для определения роли и функций контекстологического словаря (КС) в алгоритмической обработке информации в данной диссертации была разработана «Методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря». Она заключается в интегральном представлении семантической, лексикографической, контекстологической, синтагматической и статистической информации о многозначной лексике с целью идентификации и характеристики ее значений в контексте. В основу методики положена идея КС как инструмента алгоритмического распознавания значений многозначной лексики в контексте, и словаря-конкорданса как инструмента составления КС.
Применение разработанной методики к анализу функционирования многозначной общеупотребительной лексики в специально сформированном корпусе современных экономических текстов, относящихся к трем новым для отечественной экономики смежным предметным областям ("Credit",
Business" и "Trade"), позволяет: 1) уточнять и систематизировать контекстологические принципы идентификации значений многозначной общеупотребительной лексики в (специальном) тексте; 2) выявлять и систематизировать закономерности и особенности ее употребления в трех новых для российской экономики смежных предметных областях; 3) охарактеризовать общие и отличительные черты, языка самих исследованных смежных предметных областей экономики; 4) описать и обосновать роль и функции контекстологического словаря в алгоритмической обработке специального текста; 5) сделать выводы относительно перспектив применения контекстологического словаря в алгоритмических и других прикладных разработках: дидактических, методических, лексикографических и др.
Проведенное исследование показало, что возможности контекстологического словаря в алгоритмической обработке специальных текстов заключаются в том, что он является эффективным средством распознавания значений многозначной лексики, позволяет выявлять характерные контексты ее употребления и упорядочивать их, систематизировать закономерности и особенности ее употребления в специальном (экономическом) тексте, а также может быть использован в разработке методики интегрального исследования функционирования многозначной лексики в тексте. ^
1. Контекстологический словарь является эффективным средством распознавания значений многозначного слова в реальном контексте его употребления, в реальной коммуникативной ситуации. Это объясняется тем, что КС способен аккумулировать и представлять в систематизированном и явном/ формализированном виде такие типы информации, которых нет в традиционных словарях.
Как показало исследование, в большинстве традиционных одноязычных и двуязычных словарей отсутствуют сведения о формальных способах разграничения значений многозначной лексики. Они просто иллюстрируются наиболее типичными примерами, а в самых «продвинутых» типах словарей приводится минимальный и только самый типичный формально-грамматический контекст. В большинстве случаев такая информация оказывается недостаточной для формального распознавания значения многозначного слова в контексте. Это значительно затрудняет практическое использование традиционных словарей, особенно на начальных этапах изучения иностранного языка, при обучении переводу, при составлении автоматических словарей в системах алгоритмической обработки текста и т.д.
2. КС позволяет выявлять характерные для данного типа текстов контексты употребления многозначной лексики.
Как показало исследование, многозначная общеупотребительная лексика используется в специальном (экономическом) тексте чаще всего в контекстах, которые не отражены в традиционных словарях. Так, многозначная лексика, особенно глагольная, используется в реальных текстах чаще всего не в своей «словарной» форме и/ или в зафиксированной в словаре «исходной», «канонической», наиболее показательной формально-грамматической конструкции, а в «модифицированной», «производной», контекстно-зависимой (модализованной, диатезно преобразованной, оценочно маркированной и т.д.) форме. При этом формальные грамматические детерминанты значения многозначного слова находятся не в непосредственном его окружении, а в более широком контексте или же просто подразумеваются организацией текста. В результате для распознавания значения требуется дополнительная информация. Например, многозначное существительное payment в первом значении («paying») далеко не всегда употребляется в зафиксированной в словаре (Hornby Advance d) формуле «in payment , for», а используется в «производных» от нее лексико-грамматических моделях: payment to / by/ о if in ас cordance wit h и мн. др. Глагол to provide в третьем («пропозициональном») значении употребляется в исследованных массивах только в пассивной форме, в которой формально не просматривается связь с зафиксированной в словаре для этого значения грамматической конструкцией «to provide that».
3. КС позволяет упорядочивать лингвистическую информацию о контекстах употребления многозначной лексики и систематизировать способы идентификации ее значений в тексте.
Так, проведенное исследование показало, что наиболее показательными способами представления лингвистической информации, релевантной для идентификации значений многозначной лексики в контексте, выступают:
1) исходная сентенциальная формула, отражающая семантико-синтаксические особенности употребления многозначного слова в данном значении. Такая информация наиболее релевантна для распознавания значений многозначных глаголов, значение которых зависит не только от характера объекта, которым они управляют, но и от характера субъекта соответствующего действия: одушевленного или неодушевленного. Например, первое значение многозначного глагола to apply лучше всего представимо в виде сентенциальной формулы Smb applies for (a visa/ registration, etc.);
2) лексико-грамматическая модель, отражающая типичные синтагматические контексты его употребления. Так, второе значение многозначного глагола to provide лучше всего представимо в виде лексико-грамматической модели to provide smth/ smb (with/ for/ to);
3) семантические/ тематические классы слов, с которыми типично сочетается данное многозначное слово в данном значении. Так, наиболее важным контекстуальным маркером/ детерминантой употребления многозначного глагола to provide в третьем (весьма характерном для массива 3) «пропозициональном» значении «to stipulate that» выступает его сочетаемость с существительными, эксплицирующими его «пропозициональную» валентность «на текст» (придаточное изъяснительное). В качестве таковых в исследованных экономических текстах выступает лексика, обозначающая «документ», точнее, «юридический документ» или его вид/ тип/ часть и т.п.: document, agreement, obligation, notice, note, paragraph, etc.
4. КС позволяет выявлять и систематизировать лингвистическую информацию о закономерностях и особенностях употребления многозначной общеупотребительной лексики в специальном (экономическом) тексте и определять его лингвистическую специфику.
Так, в исследованном массиве экономических текстов наблюдается «специализация» многозначной общеупотребительной лексики и ее «тонкая настройка» на данную предметную область в целом и на входящие в нее смежные, более узкие предметные области. Кроме того, наблюдается «специализация» грамматических форм употребления многозначной общеупотребительной лексики в данных типах текстов.
В частности, специфика употребления многозначной общеупотребительной лексики в экономическом тексте заключается, с одной стороны, в сокращении количества ее значений по сравнению с количеством ее значений в общеупотребительном языке/ словаре, а с другой стороны, в «сужении» и «специфицикации» ее значений, которые уточняются и чаще всего терминологизируются (ср. support line/ staff/ period/ hours/ functions/ charges, etc.). При этом оказывается, что большинство из соответствующих значений приобретает не экономический, как можно было бы предположить, а «юридический» характер.
Например, глагол to issue используется в экономических текстах только в своем третьем значении «to publish/ put into circulation», и при этом сочетается с такими «объектами» и конструкциями, которые указывают на «официальность» (юридическую значимость) производимой при этом акции: to issue shares/ subsidiaries/ regulations/ updates/ quotas/ a credit card/ debt/ warrant/ letter of credit/ report/ press release/ certificate, etc.; to issue in accordance with/ in compliance with/ with respect to/ in violation of/ by way of dividend/ with a (greater) aggregate component/ in exchange/ in an amount/ under an indenture, etc. У существительного application два значения приобретают юридический характер; у determination первое значение приобретает ярко выраженный юридический характер, а второе - «количественный», и т.д.
Специализация» грамматических форм употребления многозначной общеупотребительной лексики при этом касается чаще всего ее числа и залога. Так, в исследованных экономических текстах многозначный глагол to use, во-первых, теряет свою многозначность, а во-вторых, чаще всего употребляется в пассивной форме. Многозначное существительное payment во втором значении («sum») используется только во мн. ч. и при этом входит в целый ряд устойчивых словосочетаний, ср. fixed/ contingent/ royalty/ bonus/ scheduled/ referral/ payments; to make/ receive/ remit, etc. payments.
В результате оказывается, что для каждой предметной области необходима «тонкая настройка» на нее словаря общеупотребительной лексики: учет наиболее характерных моделей и форм употребления, сочетаемости и т.п.
5. КС может быть использован в разработке методики интегрального исследования функционирования многозначной лексики в тексте. При этом КС выступает в качестве эвристического инструмента получения и организации формально-грамматической, семантической, лексикографической, синтагматической, «тематической», сочетаемостной и статистической информации о многозначной лексике и ее употреблении в реальных текстах. Так, разработанная в данном исследовании методика позволяет:
1) выделять новые значения у данного многозначного слова, в частности, показывать необходимость выделения из одного словарного значения слова двух автономных. Так, исследование показало, что глагол to develop в переходном и непереходном значении характеризуется непересекающимися контекстами употребления, находящимися в отношении дополнительной дистрибуции, что свидетельствует о несинонимичности соответствующих значений;
2) уточнять значения многозначного слова в специальном тексте. Так, исследование показало, что многозначность общеупотребительной лексики в специальном тексте сокращается и ограничивается, но вместе с тем еще и «преобразуется»: «реорганизуется», специализируется, унифицируется и «настраивается» на данную предметную область. Например, было установлено, что существительное determination в экономическом тексте в первом значении обозначает не просто «решение» (как в общеупотребительном языке), а «(официальное) решение/ постановление (официального лица/ органа)», поскольку окружающий его контекст содержит такие детерминанты, как court, company, counsel, committee, board of directors, etc., которые в целом составляют тематический класс «официальное лицо/ орган»;
3) фиксировать несвободную/ устойчивую сочетаемость многозначного слова, причем в каждом из значений. Так, исследование показало, что сочетаемость многозначной общеупотребительной лексики в специальном тексте «специализируется», «терминологизируется», расширяется и «переориентируется» на данную предметную область. В результате проявляется важность составления специальных («настроенных» на конкретную предметную область) словарей сочетаемости, комбинаторных и толково-комбинаторных словарей, словарей устойчивых (терминологических и тер-минологизированных) оборотов, словосочетаний и конструкций, тезаурусов-онтологий, словарей активной/ тематической лексики и т.п., и в целом -выявления особенностей несвободной сочетаемости многозначной общеупотребительной лексики в специальном тексте;
4) выявлять взаимосвязь между толкованием многозначной лексики, ее сочетаемостью и лексико-грамматическими моделями ее употребления. В результате появляется возможность показать, что толкование слова/ идентификация значения многозначного слова в контексте и его перевод на иностранный язык представляют собой хотя и тесно взаимосвязанные, но, тем не менее, достаточно автономные этапы и задачи не только при понимании (иноязычного) текста, но и в алгоритмической обработке информации.
Это объясняется тем, что в большинстве случаев одна и та же многозначная лексика, в зависимости от контекста, может выражать разные понятия, причем ее перевод на иностранный язык будет предопределяться, в первую очередь, внутриязыковыми правилами идиоматичности выражения заданного смысла в языке перевода и наличием соответствующего терминологизированного выражения в нем. Это подтверждается и тем, что, во-первых, почти все из проанализированных ключевых слов входят в устойчивые (и потому терминологизированные) словосочетания и обороты, и, во-вторых, тем, что при этом они сочетаются не с отдельными терминами, а с целыми тематическими классами слов, которые представляют собой открытый ряд. При этом проведенное исследование показывает, что качество перевода (в данном случае с английского на русский) будет в значительной степени зависеть не только от корректной идентификации значения многозначного слова в контексте, но и от качества его толкования;
5) изучать синхронное состояние многозначной общеупотребительной лексики. Так, исследование показало, что статистические данные об особенностях использования многозначной общеупотребительной лексики в специальном тексте свидетельствуют о несовпадении «активного словаря» даже у смежных предметных областей; о несовпадении количества употреблений в них конкретного многозначного слова в данном значении; о несовпадении «основного» и «периферийного» значений данного многозначного слова в общеупотребительном словаре и специальном тексте. Например, глагол to issue в исследованных массивах употребляется только в своем третьем, «последнем» значении, причем достаточно активно. Это может свидетельствовать о том, что и в общеупотребительном языке это значение причем весьма важное в современном мире: «издавать, публиковать») постепенно переходит из периферийного в основное, наиболее востребованное.
В целом проведенное исследование показывает, что контекстологический словарь как эффективный инструмент представления лингвистических данных о" многозначной лексике не исчерпал свои эвристические и прикладные возможности. В сочетании с дополнительными смежными способами представления лингвистической информации он может стать организующим компонентом в методике интегрального представления лингвистической информации для распознавания значений многозначной лексики в реальных контекстах ее употребления, для описания особенностей ее употребления в конкретной предметной области, для выявления лингвистических особенностей языка самой предметной области, для изучения синхронного состояния многозначной общеупотребительной лексики и т.п.
ЗАКЛЮЧЕНИЕ
Главное в исследовании языка - это выявление закономерностей и особенностей его устройства и использования в разнообразных ситуациях, с разнообразными целями и для выражения определенного/ заданного смысла. При этом проблема описания лексической многозначности остается одной из наиболее актуальных в теоретическом и прикладном отношении. Наиболее остро в настоящее время стоит вопрос о распознавании значений многозначной лексики в контексте/ речи. Особо заинтересованными в решении данного вопроса направлениями выступают алгоритмическая обработка текста в системах искусственного интеллекта, особенно при переводе с одного языка на другой, обучение иностранному языку и переводу, создание разнообразных глоссариев, справочников, пособий и словарей, особенно нового, активного типа, и мн. др.
Изучение возможностей контекстологического словаря в разрешении лексической многозначности в текстах на английском языке, относящихся к новым для российской экономики смежным предметным областям, и в выявлении закономерностей и особенностей ее функционирования в специальном тексте проводилось в данном исследовании методами корпусной лингвистики.
Корпусная лингвистика является одной из самых востребованных областей исследования в современном языкознании, причем не только в прикладном, но и теоретическом. Она обеспечивает технологизацию сбора и обработки лингвистической информации, ее репрезентативность, надежность и функциональность, так как отражает использование языковых средств в реальных текстах и коммуникативных ситуациях. Она повышает значение и валидность квантитативных методов в лингвистике, позволяет более эффективно исследовать разнообразные синхронные и диахронные варианты языка, сравнивать их и т.п. (ср. общеупотребительный, специальный, профессиональный и т.п. язык, язык печати, художественной литературы и т.п.).
В результате корпусная лингвистика формирует в лингвистике новую, «корпусную», «технологическую» идеологию в отношении к эмпирическому материалу и переориентирует теоретическую и прикладную лингвистику с исследования системы и структуры языка на изучение речи/ текста/ дискурса, т.е. на его реальное функционирование.
В прикладной лингвистике при этом значительно расширяются возможности составления разного рода словарей, в том числе принципиально нового, «активного» типа: комбинаторных, толково-комбинаторных, тезаурусов-онтологий, устойчивых оборотов и словосочетаний, в том числе и терминологических, и т.п. Значительно повышается также эффективность разработок по лингвистическому обеспечению разнообразных систем алгоритмической обработки информации на естественном языке, компьютерных обучающих и дидактических систем, систем класса ИИ, в особенности машинного перевода.
Важными инструментами представления лингвистической информации в прикладной лингвистике становятся словари-конкордансы и контекстологические словари. Они позволяют упорядочивать лингвистическую информацию о функционировании языковых средств в реальных коммуникативных ситуациях и использовать ее в алгоритмических процедурах. При этом открываются широкие возможности их совершенствования, совмещения со смежными прикладными и теоретическими разработками, а также их использования в качестве средства исследования языков для специальных целей, особенно новых предметных областей.
Так, проведенное исследование показало, что разработанная в диссертации «Методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря» позволяет:
1) уточнять и систематизировать контекстологические принципы идентификации значений многозначной общеупотребительной лексики в (специальном) тексте;
2) выявлять и систематизировать закономерности и особенности ее употребления в трех новых для российской экономики смежных предметных областях;
3) охарактеризовать общие и отличительные черты языка самих исследованных смежных предметных областей экономики;
4) описать и обосновать роль и функции контекстологического словаря в алгоритмической обработке специального текста;
5) сделать выводы относительно перспектив применения контекстологического словаря в алгоритмических и других прикладных разработках: дидактических, методических, лексикографических и др.
1. Возможности контекстологического словаря в алгоритмической обработке специальных текстов заключаются в том, что он является эффективным средством распознавания значений многозначной лексики, позволяет выявлять характерные контексты ее употребления и упорядочивать их, систематизировать закономерности и особенности ее употребления в специальном (экономическом) тексте, а также может быть использован в разработке методики интегрального исследования функционирования многозначной лексики в тексте. Это объясняется тем, что КС способен аккумулировать и представлять в систематизированном и явном/ формализированном виде такие типы информации, которых нет в традиционных словарях.
Так, проведенное исследование показало, что наиболее показательными способами представления лингвистической информации, релевантной для идентификации значения многозначной лексики в контексте, выступают: (1) исходная сентенциальная формула, отражающая семантико-синтаксические особенности употребления многозначного слова в данном значении; (2) лексико-грамматическая модель, отражающая типичные синтагматические контексты его употребления; (3) семантические/ тематические классы слов, с которыми типично сочетается данное многозначное слово в данном значении.
Использование КС в разработке методики интегрального исследования функционирования многозначной лексики в тексте показало, что он представляет собой важный эвристический инструмент получения и упорядочения формально-грамматической, семантической, лексикографической, синтагматической, «тематической», сочетаемостной и статистической информации о многозначной лексике и ее употреблении в реальных текстах.
Так, разработанная в данном исследовании методика позволяет: 1) выделять новые значения у данного многозначного слова; 2) уточнять значения многозначного слова в специальном тексте; 3) фиксировать несвободную/ устойчивую сочетаемость многозначного слова, причем в каждом из значений; 4) выявлять взаимосвязь между толкованием многозначной лексики, ее сочетаемостью и лексико-грамматическими моделями ее употребления; 5) изучать синхронное состояние многозначной общеупотребительной лексики: выявлять закономерности и особенности ее использования в современных специальных текстах.
2. Основные закономерности и особенности использования многозначной общеупотребительной лексики в новых (для российской экономики) смежных предметных областях («Credit», «Business», «Trade»), которые были установлены в ходе исследования, можно обобщить следующим образом.
Многозначная общеупотребительная лексика в большинстве случаев сохраняет свою многозначность в специальном (экономическом) тексте (на английском языке), однако при этом она используется чаще всего не во всех своих словарных значениях. Так, из 12 проанализированных слов {to provide, to develop, to use, support, determination, payment, application, to issue, to apply, conclusion, to reduce, to realize) 8 употребляются в двух и более значениях, и только два из них употребляются во всех массивах во всех своих словарных значениях: to provide, payment. Многозначная лексика, теряющая свою многозначность в специальном (экономическом) тексте, чаще всего используется в своих основных, исходных (первом и втором) значениях. При этом в любом случае значения многозначной общеупотребительной лексики в специальном (экономическом) тексте стремятся к терминологизации.
Использование в экономическом тексте общеупотребительной многозначной лексики в основных словарных значениях говорит о том, что она обозначает широкие общедисциплинарные понятия и потому играет в специальном тексте важную организующую и текстообразующую роль {to develop, determination, payment, application, to use, support, to reduce). Ее использование в специальном тексте не в основных словарных значениях свидетельствует о намечающейся тенденции к реорганизации ее словарных значений и/ или ее «тонкую настройку» на конкретную предметную область. Лексику, одинаково характерную для смежных областей знания, можно определить как выражающую важные для данной предметной области в целом междисциплинарные понятия {to use, determination, to apply, to realize, to reduce).
При этом использование многозначной общеупотребительной лексики преимущественно в одной и той же грамматической форме и/ или значении свидетельствует о важности передаваемого ими смысла для данной предметной области в целом и об устойчивости его выражения данной формой/ конструкцией. Лексику, более характерную для данной смежной предметной области, можно определить как обозначающую в ней ключевые специальные понятия, служащие для упорядочения терминологической лексики.
В целом многозначная общеупотребительная лексика в специальном тексте служит для выражения важных общедисциплинарных и междисциплинарных понятий, для организации и развертывания текста, а также для упорядочения специальной, терминологической лексики. При этом многозначная общеупотребительная лексика чаще всего используется не во всех своих словарных значениях, в основном сохраняет свои основные значения, отражает намечающиеся тенденции в изменениях в организации ее словарных значений и/ или ее «тонкую настройку» на конкретную предметную область.
3. В специальном тексте происходит «специализация» и терминологизация значений многозначной общеупотребительной лексики и лексики, теряющей свою многозначность. Причем в экономическом тексте значения общеупотребительной лексики могут приобретать не только экономический, но и ярко выраженный юридический характер, а самой важной ее чертой оказывается ее сочетаемость с целыми классами тематически маркированных понятий и терминов, которые в содержательном отношении обозначают центральные для данной предметной области категории явлений и объектов.
Исследование также показало, что из трех исследованных массивов текстов, относящихся к смежным областям экономики, предметная область «Credit» более всего ориентирована на юридические отношения, «Business» -на финансовые отношения, a «Trade» - на экономические. При этом во всех трех смежных предметных областях наблюдается явная тенденция использования многозначной общеупотребительной лексики в юридически маркированных значениях, что свидетельствует об общей четкой ориентации экономических текстов на следование букве закона и договора.
4. Контекстологический словарь как важный инструмент представления лингвистических данных о многозначной лексике не исчерпал свои эвристические и прикладные возможности. В сочетании с дополнительными смежными способами представления лингвистической информации он может стать организующим компонентом в методике интегрального представления лингвистической информации для распознавания значений многозначной лексики в реальных контекстах ее употребления, для описания особенностей ее употребления в конкретной предметной области, для выявления лингвистических особенностей языка самой предметной области, для изучения синхронного состояния многозначной общеупотребительной лексики и т.п.
КС, как инструмент, разработанный для использования в прикладных целях, отличается наглядностью, эксплицитностью и формализованностью, и потому может получить широкое применение при решении большого круга новых прикладных задач. К ним относится не только совершенствование алгоритмической обработки текста и ее интеграция в новые компьютерные технологии, но и целый комплекс дидактических и программных приложений. Это разработка дидактических и компьютерных программ «активного типа» по обучению иностранному языку и переводу, составление комбинаторных и толково-комбинаторных словарей, тезаурусов-онтологий, учебных пособий и справочников «активного типа»: новой, активной, тематической и т.п. лексики, словарей сочетаемости, терминологизированных понятий, словосочетаний, оборотов и конструкций, и т.д.
5. КС открывает новые перспективы в дальнейшем изучении специальных текстов и особенностей функционирования в них многозначной лексики не только в прикладных, но и теоретических целях. Они предопределяются, в первую очередь, развитием корпусной лингвистики. Она предоставляет принципиально новые возможности в составлении контекстологического словаря, позволяет значительно повысить его качество и эффективность в описании активной и специальной лексики, и тем самым способствовать его интеграции в разнообразные программные продукты и исследовательские технологии, и т.д.
Проведенное исследование также показало, что идея традиционного КС, опирающегося на понятие «общего выхода» (без детерминант) и на пословно-пооборотный перевод текста (с английского языка на русский) может быть уточнена в нескольких отношениях.
Так, разработанная в данном исследовании методика на основе КС свидетельствует, что, во-первых, все значения многозначной лексики имеют в тексте свои детерминанты. Во-вторых, выясняется, что общий выход КС, подразумевающий пословный перевод, в специальном тексте может привести к некорректному результату, поскольку в нем общеупотребительная лексика не только приобретает терминологизированное значение, но и входит в терминологизированные словосочетания, обороты и конструкции. Поэтому часто она не может быть переведена вне контекста, а требует «идиоматичного» перевода: в составе целого оборота и в соответствии с принятым способом выражения заданного смысла в языке перевода. (Ср. например, такие устойчивые обороты, как support line/ function/ staff/ charges/ period/ hours, etc.)
В-третьих, КС нуждается в «настройке» на предметную область. Это можно проиллюстрировать следующим примером. В контекстологическом словаре общеупотребительной лексики, созданном на материале газетных текстов [Марчук 1976] многозначное существительное determination (с. 42) в первом значении «решимость» имеет две детерминанты: «одушевленное существительное» и предлог «of» (ср. the determination of smb). Если сравнить этот алгоритм перевода с примером из исследованного экономического текста: in the determination of such person's parachute payment, то видно, что здесь ключевым словом для установления значения будет не одушевленное существительное (person), а экономическое понятие payment, которого, естественно, нет в указанном словаре. Причем соответствующее экономическое» (математическое) значение многозначного существительного determination («вычисление», которого, кстати, нет в указанном словаре) оказывается весьма актуальным в экономическом тексте, тогда как в значении «решимость» оно в нем не употребляется.
6. Эффективность использования КС на практике зависит от нескольких существенных обстоятельств. Это, во-первых, его «настройка» на конкретную предметную область; во-вторых, его постоянное пополнение новой лингвистической информацией, и, в-третьих, совершенствование его организации в соответствии с современным уровнем развития лингвистической науки.
7. Для того чтобы использовать КС как инструмент перевода, он должен составляться на очень большом массиве параллельных текстов. При этом возможности корпусной лингвистики позволяют включать в него значительное количество устойчивых / «идиоматичных» словосочетаний и их переводов. Это может значительно повысить эффективность использования КС в действующих системах алгоритмической обработки информации и во всех смежных разработках.
В целом можно заключить, что современные компьютерные технологии корпусной лингвистики значительно расширяют возможности использования контекстологического словаря не только в области алгоритмической обработки информации, но и в ряде смежных прикладных задач, особенно дидактических, методических и лексикографических, а также в теоретических исследованиях.
Список литературы диссертационного исследования кандидат филологических наук Сушилин, Алексей Анатольевич, 2007 год
1. Автоматический перевод: сб. ст. : пер. с англ., итал., нем., фр. / под ред. О.С. Кулагиной и И.А. Мельчука. - М. : Прогресс, 1971. - 368 с.
2. Апресян Ю.Д. Избранные труды. В 2 т. T. II. Интегральное описание языка и системная лексикография / Ю.Д. Апресян. М. : Школа «Языки русской культуры». - 1995. - 766 с.
3. Апресян Ю.Д. Об интегральном словаре русского языка / Ю.Д.Апресян// Семиотика и информатика. М., 1991.-Вып. 32.-С. 3-15.
4. Арапов М.В. Квантитативная лингвистика / М.В. Арапов; отв. ред. Ю.Н. Караулов. -М. : Наука, 1988. 185 с.
5. Баранов А.Н. Введение в прикладную лингвистику : учеб. пособие / А.Н. Баранов. М. : Эдиториал УРСС, 2001. - 360 с. : ил.
6. Баранов А.Н. Автоматизация лингвистических исследований: корпус текстов как лингвистическая проблема // Русистика сегодня. 1998. -№ 1-2.-С. 179-191.
7. Бахарлуи Роя. Разрешение лексической многозначности в системе компьютерного обучения иностранным языкам : англо-персидская лексика : автореф. дис. . канд. филол. наук / Бахарлуи Роя. М., 2006. - 25 с.
8. Бахарлуи Роя. Разрешение лексической многозначности в системе компьютерного обучения иностранным языкам : англо-персидская лексика : дис. канд. филол. наук / Бахарлуи Роя. -М., 2006. 145 с.
9. Борисова Л.И. Ложные друзья переводчика: Общенаучная лексика: Английский язык: учеб. пособие по науч.-техн. пер. / Л.И. Борисова. М. : НВИ-ТЕЗАУРУС, 2005. - 212 с.
10. Варинская В.М. Контекстологический словарь как элемент обучающих систем: дис. . канд. филол. наук / В.М. Варинская. М., 2005. -182 с. : ил. -Прил. (130 е.).
11. Головин Б. Н. Введение в языкознание / Головин Б. H. М. : Высш. шк., 1966.-332 с.
12. Гоциридзе Д.З. Очерки по истории западноевропейского и русского перевода / Д.З. Гоциридзе, Г.Т. Хухуни. Тбилиси : Изд-во Тбил. ун-та, 1986. -252 с.
13. Гринев С. В. Введение в терминографию / C.B. Гринев. М. : МПУ, 1995.- 158 с.
14. Гринев С. В. Введение в терминоведение / C.B. Гринев. М. : Моск. Лицей, 1993.-310 с.
15. Денисов П. Н. Лексика русского языка и принципы ее описания / П.Н. Денисов. М.: Рус. яз., 1993. - 245 с.
16. Естественный язык, искусственные языки и информационные процессы в современном обществе / под ред. Р. Г Котова. М. : Наука, 1988. - 174 с.
17. Жданов А. А. Деловые письма и контракты / A.A. Жданов, И.Ф. Жданова. М.: Филоматис, 2002. - 288 с.
18. Ивлева Г. Г. Тенденции развития слова и словарного состава / Г.Г. Ивлева. -М.: Наука, 1986. 135 с.
19. Искусственный интеллект : справочник. В 3 кн. / Под ред.
20. B.Н. Захарова, В.Ф. Хорошевского. М.: Радио и связь, 1990—
21. Кн. 1: Системы общения и экспертные системы / Э.В. Попов и др.. -461 с.: ил.
22. Кн. 2: Модели и методы / Д.А. Поспелов и др.. 304 с.: ил. Кн. 3: Программные и аппаратные средства / [В.Н. Захаров и др.]. -363 с.: ил.
23. Кобозева ИМ. Лингвистическая семантика / И.М. Кобозева ; Моск. гос. ун-т им. М.В. Ломоносова, Филол. фак. М. : Эдиториал УРСС, 2000. -352 с.
24. Корпусная лингвистика в России / Сост. Е.В. Рахилина, С. А. Шаров // Научно-техническая информация: ежемес. науч.-техн. сб. Сер.2, Информационные процессы и системы / ВИНИТИ. М., 2003. - №6. - 35 с.
25. Корреляционная типология глагольных систем индоевропейских и иноструктурных языков : монография. / [Г.Г. Сильницкий, М.В. Ерзенкина,
26. C.А. Сергутин ; отв. ред. Г.Г. Сильницкий. ; Рос. акад. наук, Ин-т лингвист, исслед. [и др.]. Смоленск : СГПУ, 1999. - 320 с.
27. Красивова А.Н. Деловой русский язык: учеб.-практ. пособие / А.Н. Красивова. М.: Изд-во МФА, 2001.- 80 с.
28. Крылов С. А. Обучаемость системы АП как основа осуществимости безошибочного автоматического перевода, или О переходе количества в качество / С.А. Крылов. М., 2004. - 220 с.
29. Крюкова О.П. Самостоятельное изучение иностранного языка в компьютерной среде / О.П. Крюкова. М.: Логос, 1998. - 127 с.
30. Культура русской речи : учеб. для вузов / под ред. JI. К. Граудиной и проф. Е. Н. Ширяева. М. : Норма : ИНФРА-М, 1998. - 550 с.
31. Леонтьева H.H. Автоматическое понимание текстов : системы, модули, ресурсы : учеб. пособие для студентов, лингвист, фак. вузов / H.H. Леонтьева. М. : ACADEMIA, 2006. - 304 с. - (Учебное пособие) (Высшее профессиональное образование. Языкознание).
32. Леонтьева H.H. К теории автоматического понимания естественных текстов. Ч. 2. Семантические словари: состав, структура, методика создания / H.H. Леонтьева. М.: Изд-во Моск. ун-та, 2000. - 40 с.
33. Леонтьева H.H. Система ФРАП и проблема оценки качества автоматического перевода / H.H. Леонтьева, С.Л. Никогосов // Машинный перевод и прикладная лингвистика. М., 1980. - Вып. 20. - С. 57-78.
34. Лингвистическое обеспечение системы ЭТАП-2 / Ю.Д. Апресян и др. ; отв. ред. Р. Л. Добру шин. -М. : Наука, 1989. 295 с. : ил.
35. Литвин Ф. А. Многозначность слова в языке и речи : учеб. пособие для студентов пед. ин-тов / Ф.А. Литвин. -2-е изд., стер. Москва : URSS : КомКнига, 2005.- 118 с.
36. Лукашевич Н.В. Тезаурус для автоматического концептуального индексирования как особый вид лингвистического ресурса / Н.В. Лукашевич,
37. Б.В. Добров // Труды Международного семинара «Диалог-2002» по компьютерной лингвистике и ее приложениям (Протвино, 2002 г.). В 2 т. Т. 2. Прикладные проблемы. М.: Наука, 2002. - С. 273 - 279.
38. Магомедова А. Н. Корпусная лингвистика и контекстное разрешение лексической многозначности слов (на материале английского языка) : дис. . канд. филол. наук / А.Н. Магомедова. Махачкала, 2004. -135 с.
39. Макарова Н. В. Статистика в Excel / H.B. Макарова, В.Я. Трофимец. М.: Финансы и статистика, 2003. - 386 с.
40. Максименко О.И. Система автоматической классификации текстовой информации / О.И. Максименко, Э.И. Королев // Техника средств связи. 1989. - № 3. - С. 56-60.
41. Максименко О.И. Формальные методы в современной прикладной лингвистике / О.И. Максименко. М.: Нар. учитель, 2002. - 255 с.
42. Мартыненко Г.Я. Методы статистического моделирования в языкознании // Прикладное языкознание : учебник / отв. ред. A.C. Герд. -СПб.: Изд-во С.-Петербург, ун-та, 1996. С. 201-223.
43. Марчук Ю.Н. Вычислительная лексикография / Ю.Н. Марчук. М. : ВЦП, 1976.- 183 с.
44. Марчук М. В. Динамика лексических значений многозначных слов (лексика основного терминологического слоя): дис. в форме науч. докл. д-ра филол. наук / М.В. Марчук. М.: МГПУ, 1996. - 59 с.
45. Марчук М. В. К развитию лексических значений многозначных слов : дис. канд. филол. наук / М.В. Марчук. JI.: ЛГУ, 1988. - 125 с.
46. Марчук Ю. Н. Корпусная лингвистика и контекст / Ю.Н. Марчук, А.Н. Магомедова // Теоретические и практические аспекты лингвистики и лингводидактики : межвуз. сб. науч. тр. Сургут : Изд-во СурГУ, 2002. -С. 123-128.
47. Марчук Ю. Н. Модель «текст-текст» и переводные соответствия в теории машинного перевода / Ю.Н. Марчук // Проблемы компьютерной лингвистики. Минск, 1997. - С. 21-29.
48. Марчук Ю.Н. О статье Д. Радо «Принципы систематической транслятологии» / Ю.Н. Марчук // Babel. Budapest, 1982. - XXVIII, N 2. - P. 82-87.
49. Марчук Ю.Н. Основы компьютерной лингвистики : учеб. пособие / Ю.Н. Марчук. -2-е изд., доп. М.: Нар. учитель, 2000. - 226 с.
50. Марчук Ю.Н. Основы терминографии / Ю.Н. Марчук. М. : НИИ МГУ, 1992.-75 с.
51. Марчук Ю.Н. Проблемы машинного перевода / Ю.Н. Марчук. М.: Наука, 1983.-232 с.
52. Марчук Ю. Н. Терминологическая работа Всероссийского Центра переводов / Ю.Н. Марчук // Терминоведение. М. : Моск. Лицей, 1996. -Вып. 1-3.-С. 14-18.
53. Марчук Ю.Н. Уроки начального периода развития машинного перевода в СССР : докл. на III Науч. конф. Воен. ун-та «Теория перевода и практика подготовки переводчиков» (18 февр. 1999 г.) / Ю.Н. Марчук. М., 1999.-С. 201-212.
54. Маслов Ю. С. Введение в языкознание / Ю.С. Маслов. М. : Высш. шк., 1987.-272 с.
55. Машинный перевод и прикладная лингвистика : сб. статей. М., 1958-1985.-280 с.
56. Мельников Г.И Системология и языковые аспекты кибернетики / Г.И. Мельников. М.: Сов. радио, 1978. - 367 с.
57. Мельчук И.А. Опыт теории лингвистических моделей «Смысл <=> Текст». Семантика, синтаксис / И.А. Мельчук. М.: Наука, 1974. - 314 с.
58. Мински М. Фреймы для представления знаний : пер. с англ. / М. Мински. М.: Энергия, 1979. - 149 с.
59. Михайлов М.Н. Компьютерное обеспечение корпуса тексов (взгляд пользователя) / М.Н.Михайлов // Русистика сегодня. 1998. - №1-2. -С. 192-201.
60. Моторин Ю.А. Реализация автоматического перевода на современных серийных ЭВМ общего назначения / Ю.А. Моторин, Ю.Н. Марчук // Вопросы радиоэлектроники. 1970. - (Серия ЭВТ, вып. 7). -С. 20-39.
61. Нариньяни A.C. Проблема понимания ЕЯ-запросов к базам данных решена / A.C. Нариньяни // Компьютерная лингвистика и интеллектуальные технологии : тр. междунар. конф. «Диалог-2005» (Звенигород, 1-6 июня 2005 г.). М.: Наука, 2005. - С. 382-387.
62. Нелюбин J1.J1. Инженерно-лингвистическое моделирование и компьютерная лингвистика / J1.J1. Нелюбин // Проблемы компьютерной лингвистики. Минск, 1997.-С. 18-21.
63. Нелюбин J1.JL История и теория перевода в России : учебник / J1.J1. Нелюбин, Г.Т. Хухуни ; М-во образования РФ, Мое. пед. ин-т. М. : Нар. учитель, 1999.- 138 с.
64. Нелюбин J1.J1. Компьютерная лингвистика и машинный перевод / Л .Л. Нелюбин. М.: ВЦП, 1991. - 151 с.
65. Нелюбин Л.Л. Перевод и прикладная лингвистика / Л.Л. Нелюбин. -М.: Наука, 1983.-241 с.
66. Персикова Т.Н. Межкультурная коммуникация и корпоративная культура : учеб. пособие для студентов вузов / Т.Н. Персикова. М. : Логос, 2002. - 224 с. - (Учебник XXI века).
67. Пинкер С. Язык как инстинкт / Стивен Линкер ; пер. с англ. Е.В. Кайдаловой ; общ. ред. В.Д. Мазо. М.: УРСС, 2004. - 455 с.: ил.
68. Пиотровский Р.Г. Инженерная лингвистика и теория языка / Р.Г. Пиотровский. Л. : Наука, 1979. - 111 с.
69. Пиотровский Р.Г. Лингвистический автомат и его речемыслительное обоснование / Р.Г. Пиотровский. Минск : МГЛУ, 1999. -196 с.
70. Пиотровский Р.Г. Математическая лингвистика / Р.Г. Пиотровский, К.Б. Бектаев, А.А. Пиотровская. М. : Высш. шк., 1977. - 383 с.
71. Пиотровский Р.Г. Методы автоматического анализа и синтеза текста : Учеб. пособие для ин-тов и фак. иностр. яз. / Р.Г. Пиотровский [и др.]. Минск : Вышэйш. шк.а, 1985. - 222 с.
72. Поляков В.Н. Интеллектуальная поисковая машина. Концептуальный проект / В.Н. Поляков // Труды Казанской школы по компьютерной и когнитивной лингвистике TEL-2000 (Казань, 17-20 окт.2000 г.). Казань. Изд-во Сэлэт, 2000. - Вып. 5. - С. 172-176.
73. Поляков В.Н. Частотный метод выявления устойчивых словосочетаний / В.Н. Поляков, O.A. Павлов // Труды Казанской школы по компьютерной и когнитивной лингвистике TEL-2001 (Казань. 22-28 окт.2001 г.). -Казань, 2001. -Вып. 6. С.148-153.
74. Рейхман У.Дж. Применение статистики / У.Дж. Рейхман. М. : Статистика, 1969. - 295 с.
75. Реформатский A.A. Введение в языкознание : учеб. для филол. специальностей высш. пед. учеб. заведений. / A.A. Реформатский ; предисл.
76. B.А. Виноградова. -М.: Аспект Пресс, 1996. 536 е., портр.
77. Рождественский Ю.В. Введение в прикладную филологию : Яз. семиотика / Ю.В. Рождественский, A.A. Волков, Ю.Н. Марчук ; МГУ им. М.В. Ломоносова, Филол. фак., Каф. сравнит.-ист., общ. и прикл. языкознания. М.: МГУ, 1988. - 116 с.
78. Рождественский Ю.В. Типология слова / Ю.В. Рождественский. -М.: Высш. шк., 1969.-321 с.
79. Рубашкин В.Ш. Корпусная поддержка в процедурах обработки текста и семантического описания лекции / В.Ш. Рубашкин // Доклады научной конференции «Корпусная лингвистика и лингвистические базы данных». СПб., 2002. - С. 139-145.
80. Рябцева H.K. Язык и естественный интеллект / Н.К. Рябцева. М. : Academia, 2005.-639 с.
81. Сидоров Е.В. Основы коммуникативной лингвистики / Е.В. Сидоров. М. : ВКИ, 1986. - 167 с.
82. Сичинава Д.В. К задаче создания корпусов русского языка в Интернете / Д.В. Сичинава // Научно-техническая информация: ежемес. науч.-техн. сб. Сер.2, Информационные процессы и системы / ВИНИТИ. -М, 2002.-№8.-С. 25-31.
83. Степанов Ю.С. Методы и принципы современной лингвистики / Ю.С. Степанов. -М. : Эдиториал УРСС, 2005. 312 с.
84. Столяров A.M. EXCEL 2000 для себя / А.М.Столяров, Е.С. Столярова. М.: ДМК Пресс, 2002. - 336 с.
85. Сушилин A.A. Вопросы типологии компьютерных словарей /
86. A.A. Сушилин // Проблемы теории языка и переводоведения : сб. ст. М., 2003.-№ 15.-С. 54-64.
87. Сушилин A.A. Лексика языка англоязычных контрактов (договоров) и соглашений / A.A. Сушилин // Проблемы теории языка и переводоведения: сб. ст. М., 2005. - № 28. - С. 69-74.
88. Сушилин A.A. Многоязычный электронный словарь (ABBY LINGVO 9.0) для PC и POCKET PC / A.A. Сушилин II Проблемы теории языка и переводоведения : сб. статей. М., 2004. - № 22. - С. 55-63.
89. Сушилин A.A. Разработка контекстологического словаря по международным соглашениям и контрактам / A.A. Сушилин II Перевод и переводоведение: сб. тез. М.: МГОУ, 2005. - С. 53.
90. Сушилин A.A. Контекстологический словарь и разрешение лексической многозначности на примере англоязычных контрактов и международных соглашений / А. А. Сушилин; МГОУ. М., 2006. — 16 с.— Деп. в ВИНИТИ Рос. акад. наук 29.12.06, № 1142В06.
91. Сушилин A.A. Роль и функции контекстологического словаря в алгоритмической обработке контрактов и международных соглашений (на материале английского языка) / A.A. Сушилин // Вестн. МГОУ. Сер. «Лингвистика», №2. -М.: Изд-во МГОУ, 2007. С. 201-208.
92. Татаринов В.А. История отечественного терминоведения : В 3 т. /
93. B.А. Татаринов. М.: Моск. Лицей.
94. Т. 1 : Классики терминоведения. 1994. - 407 с. Т. 2 : Направления и методы терминологических исследований. - 1995. -333 с.
95. Татаринов В.А. Теория терминоведения. В 3 т. Т. 1. Теория термина: история и современное состояние / В.А. Татаринов. М.: Моск. Лицей, 1996.-311 с.
96. Телегин J1.A. Метафоризация в языке и лингводидактике / JI.A. Телегин // Язык и мир его носителя : Материалы междунар. конф. MAAL'95. -М., 1995.
97. Теория и практика английской научной речи / Г.И. Ахманова и др.; под ред. М.М. Глушко. М.: МГУ, 1987. - 240 с.
98. ТулдаваЮ. Проблемы и методы квантитативно-системного исследования лексики / Ю. Тулдава. Таллин : Валгус, 1987. - 204 с.
99. Убин И.И. ЭВМ и словарь : метод, пособие / И.И. Убин. М. : ВЦП, 1992.-179 с.
100. Уфимцева A.A. Лексическое значение : Принцип семиол. описания лексики / A.A. Уфимцева. М.: Наука, 1986. - 239 с.
101. Фрэнсис У.Н. Проблемы формирования и машинного представления большого корпуса текстов / У.Н. Фрэнсис // Новое в зарубежной лингвистике. М., 1983. - Вып. XIV : Проблемы и методы лексикографии. - С. 334-353.
102. Чалкова Е.Г. Системно-коммуникативный метод обучения языку // Психол. журн. 1983. - №5. - С. 83-91.
103. Шаров С.А. Параметры описания текстов корпуса, а также Корпусная лингвистика в России / С.А. Шаров // Научно-техническая информация: ежемес. науч.-техн. сб. Сер.2, Информационные процессы и системы / ВИНИТИ. М., 2003. - №5-6.
104. Шубик С.А. Статистические методы в лингвистике / С.А. Шубик // Статистика речи и автоматический анализ текста 1980. Л., 1980. - С. 52-63.
105. Barlow M. Corpora for Theory and Practice / M. Barlow // IJCL. -Amsterdam, 1996. 1/1. - P. 3-37.
106. Brown R. Adding Linguistic Knowledge to a Lexical Example-Based Translation System / R. Brown // Proceedings of the Eighth Intern. Conf. on Theoret. and Methodol. Issues in Machine Translation (TMI-99) (Chester, UK, August 23-25, 1999. P. 22-32
107. Bybee J.L. Back to the Future / J.L. Bybee, W. Pagliuca, P. Perkins // Approaches to Grammaticalization. Amsterdam, 1991. - Voll. II. - P. 17-58.
108. Caraballo S.A. Automatic Construction of a Hypemym-labeled Noun Hierarchy from Text / S.A. Caraballo // Proceedings of the 37th Annual Meeting of the ACL.-1999.-P. 120-126.
109. Ciaramita M. Explaining away Ambiguity: Learning verb selectional preference with Bayesian networks / M. Ciaramita , M. Johnson // Proceedings of the 18th Intern. Conf. on Computational Linguistics. 2000. - Vol. 1. - P. 124130.
110. Dahl Osten. Tense and Aspect Systems / Osten Dahl. Oxford Oxfordshire. ; New York, NY : B. Blackwell, 1985. - 213 p.
111. Dagan I. Similarity-Based Methods For Word Sense Disambiguation / I. Dagan, L. Lee, F. Pereira // Proceedings of ACL-EACL, 1997. P. 56-63.
112. Dear Sirs!: Деловая переписка по-английски. M.: Изд. об-ние «Культура», 1993.-328 с.
113. Extending a Thesaurus by Classifying Words / Т. Tokunaga et. al. // Proceedings of the ACL-EACL Workshop on Automatic Information Extraction and Building of Lexical Semantic Resources. 1997. - P. 16-21.
114. Harris B. El-Text: A New Concept in Translation Theory / B. Harris // Language Monthly. 1988. - 54, March. - P. 34-40.
115. Hearst M. Customizing a Lexicon to Better Suit a Computational Task / M. Hearst, H. Schiitze // Proceedings of the SIGLEX Workshop on Acquisition of Lexical Knowledge from Text. Columbus, Ohio. - 1993. - P. 55-69.
116. Herdan G. Language as Choice and Chance / G. Herdan. Groningen : P. Noordhoff N. V., 1956. - 356 p.
117. Hwee Tou Ng. Integrating Multiple Knowledge Sources to Disambiguate Word Sense: an examplar-based approach / Tou Ng Hwee, B.H. Lee // Proceedings of the 34th Annual Meeting of the ACL. 1996. - P. 40-47.
118. Jager G. Translation und Translationslinguistik / G. Jager. Halle (Saale): VEB Max Niemeyer Verlag, 1975. - 214 p.
119. Lee L. Measures of Distributional Similarity / L. Lee // Proceedings of the 37th Annual Meeting of the ACL. 1999. - P. 25-32.
120. Madche A. Discovering Conceptual Relations from Text / A. Madche, S. Staab // Proceedings of ECAI, 2000. 2000. - P. 321-324.
121. Marchuk Yu. N. Basic Trends in Modern Machine Translation Research / Yu. N. Marchuk // SPECOM' 2001 : Intern. Workshop Speech and Computer (Moscow, Oct. 29-31, 2001): Proceedings. P. 8-11.
122. Marcus Mitchell P. Building a Large Annotated Corpus of English: The Penn Treebank / Mitchell P. Marcus, Beatrice Santorini, Mary Ann Marcinkiewicz. S. 1., 2004. - P.313-330.
123. Masterman M. Semantic Message Detection for Machine Translation, Using an Interlingua / M. Masterman // Semantic Problems in Language: Colloquium report. Cambridge (England), 1962. - P.438- 475.
124. Miram G.E. Translation Algorithms / G.E. Miram. Kyiv : «Twin inter», 1998.- 175 p.
125. Pawley A. Grammarian's Lexicon, Lexicographer's Lexicon: Worlds apart / A. Pawley // Words: Konferenzer 36: Proceedings of an Intern. Symposium / Jan Svartvik (ed.).- Stockholm, 1996.-P. 189-211.
126. Pereira F. Distributional Clustering of English Words / F. Pereira, N. Tishby , L. Lee // In Proceedings of the «Meeting of the Association for Computational Linguistics». 1993. - P. 183-190
127. Pinker S. The Language Instinct / Steven Pinker. New York: William Monro w, 1994.-494 p.
128. Procter P. A Revolution in Lexicography for the Learner / P. Procter // Words: Konferenzer 36: Proceedings of an Intern. Symposium / Jan Svartvik (ed.). Stockholm, 1996. - P. 243-249.
129. Resnik, P. Selectional Preference and Sense Disambiguation, In Proceedings of the ACL SIGLEX Workshop on Tagging Text with Lexical Semantics, 1997.- p. 52-57.
130. Sinclair J. Corpus, Concordance, Collocation / J. Sinclair. 2 ed. -Oxf.: OUP, 1992.- 179 p.
131. A Statistical Approach to Machine Translation / P.Brown et. al. // Computational Linguistics. 1990. - 16 (2). - P. 79-85.
132. Teubert W. Corpus Linguistics and Lexicography / W. Teubert // IJCL. -Philadelphia, 2001.- P. 125-153.
133. Wilks. Y. The Application of CLRU's Method of Semantic Analysis to Information retrieval / Y. Wilks. Cambridge : Cambridge Language Research Unit Memo. - ML. 173, 1965. - 173 p.
134. Yarowsky D. Hierarchical Decision Lists for Word Sense Disambiguation. Computers and the Humanities, 2000, 34(2). P. 179-186.
135. Years in Machine Translation / Hutchins W.J. (ed). Amsterdam ; Philadelphia : John Benjamin Publ.Co., 2000. - 415 p.1. СПИСОК СЛОВАРЕЙ:
136. Долганов И.Г. Англо-русский и русско-английский словарь международных соглашений и контрактов / И.Г. Долганов. М. : ACT, 2002. - 224 с.
137. Лингвистический энциклопедический словарь / гл. ред. В.Н. Ярцева. М.: Сов. энцикл., 1990. - 685 с.
138. Марчук Ю.Н. Контекстологический словарь для машинного перевода многозначных слов с английского языка на русский : в 2 ч. / Ю.Н. Марчук. -М.: ВЦП, 1976. -Ч. 1.-264 е.; Ч. 2-256 с.
139. Меркулова С.В. Толковый словарь страховых терминов = Dictionary of Insurance Terms / С.В. Меркулова. М. : Изд-во МАИ, 2000. -136 с.
140. Новый объяснительный словарь синонимов русского языка / под ред. Ю.Д. Апресяна. М.: Языки рус. культуры, 1997. - 512 с.
141. Пивовар А.Г. Большой англо-русский финансово-экономический словарь / А.Г. Пивовар ; под ред. В.И. Осипова. 2-е изд., испр. - М.: Изд-во. «Экзамен», 2003-960 с.
142. Русский семантический словарь / ред. Н.Ю. Шведова. М. : Азбуковник, 2000. - 800 с.
143. Семенов А.Л. Контекстологический словарь основных терминов маркетинга / А.Л. Семенов. М.: ВЦП, 1994. - 122 с.
144. Толково-комбинаторный словарь современного русского языка : Опыты семантико-синтакс. описания рус. лексики / И.А. Мельчук и др. -Wien : Wiener Slavistischer Almanach, 1984. 992 p.
145. Benson M. The BBI Combinatory Dictionary of English / M. Benson, E. Benson, R. Ilson. John Benjamins Publ. Сотр., 1986 - 286 P.
146. Hornby A.S. Oxford Advanced Learner's Dictionary of Current English / A.S. Hornby. Oxford : Oxford Univ. Press,1988. - 1580 p.
147. Longman Dictionary of English Idioms. Harlow ; London, 1979.353 p.
148. Longman Register of New Words. Harlow; London, 1990. - 434 p.
149. Marchuk Y.N. The Contextological Dictionary: Use in Programmed Language Teaching. In Computers and the Humanities / Y.N. Marchuk // Computers & Humanities. North-Holland Publ., Fla., US, 1979. - P. 277-281.
150. Webster's New World Dictionary. D.B.Guralnik (Ed.). New Delhi: Oxford and IBH, 1975. -882 p. (WNWD).
151. Список источников на английском языке:
152. Вид контракта «CREDIT». Материал из контрактов и соглашений взят, начиная с 25 апреля 1997 21 февраля 2001г. г.
153. Вид контракта «BUSINESS». Материал из контрактов и соглашений взят, начиная с 21 января 1997 15 июля 2003 г. г.
154. Вид контракта «TRADE». Материал из контрактов и соглашений взят, начиная с 8 октября 1998 27 июня 2000г. г.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.