Формализация естественного языка в машинном переводе с опорой на дополнительный корпус родственного языка тема диссертации и автореферата по ВАК РФ 10.02.20, кандидат наук Мифтахова, Рамиля Габдулхаевна

  • Мифтахова, Рамиля Габдулхаевна
  • кандидат науккандидат наук
  • 2017, Уфа
  • Специальность ВАК РФ10.02.20
  • Количество страниц 187
Мифтахова, Рамиля Габдулхаевна. Формализация естественного языка в машинном переводе с опорой на дополнительный корпус родственного языка: дис. кандидат наук: 10.02.20 - Сравнительно-историческое, типологическое и сопоставительное языкознание. Уфа. 2017. 187 с.

Оглавление диссертации кандидат наук Мифтахова, Рамиля Габдулхаевна

Оглавление

Введение

Глава 1. Моделирование перевода как область сопоставительного языкознания

1.1. Квантитативная лингвистика: машинный перевод и автоматическая обработка естественных языков

1.2. Основы современных систем машинного перевода

1.3. Модели классического машинного перевода и статистического машинного перевода

1.4. Статистический машинный перевод

1.5. Параллельный корпус

1.6. Факторы, влияющие на качество машинного перевода

Выводы по Главе 1

Глава 2. Формализация естественного языка в машинном переводе

2.1. Проблемы обработки естественного языка

2.2. Алгоритмы автоматической обработки текстов в машинном переводе

2.3. Информационные технологии и развитие лингвистических норм

2.4. Метод универсальной семантической иерархии в машинном переводе

Выводы по Главе 2

Глава 3. Обработка родственных языков в машинном переводе

3.1. Классические источники формирования корпусных данных в машинном переводе

3.2. Исследования в области СМП с применением родственных связей между языками

3.3 «Раскручивание» как один из методов решения проблемы недостающих данных

3.4. Экспериментальные данные и интерпретация результатов

Выводы по главе 3

Заключение

Список литературы

173

Рекомендованный список диссертаций по специальности «Сравнительно-историческое, типологическое и сопоставительное языкознание», 10.02.20 шифр ВАК

Введение диссертации (часть автореферата) на тему «Формализация естественного языка в машинном переводе с опорой на дополнительный корпус родственного языка»

Введение

В связи с заметным увеличением объема и расширением спектра переводимых трудов чаще возникает потребность в немедленном переводе информации, тогда как классические методы перевода требуют больших издержек, времени и специфическую подготовку. С целью решения данной проблемы во второй половине 20-го века начались активные разработки систем машинного перевода. Большой вклад в теоретическую базу автоматической обработки естественного языка внесли работы Ю.Н. Марчука, А.Л. Семенова и Е.П. Сосниной по компьютерной лингвистике и теории перевода, а также исследования профессоров Стэндфордского университета Д. Джаравски и К. Маннинга. Практическое применение в приложениях машинного перевода нашли модели, предложенные А. Марковым (модель n-грамной цепи Маркова), А. Тьюрингом (сглаживание1 по Тьюрингу), П. Брауном, который в своей работе (Brown, P. F., Pietra, S. A. D., Pietra, V. J. D., and Mercer, R. L. The mathematics of statistical machine translation. Computational Linguistics. 1993. С263-313.) ввел понятие «выравнивание» (alignment). Значительный вклад в моделирование машинного перевода внесли такие крупные IT компании, как Microsoft, Google, ABBYY и др. Между тем практически все предложенные модели эффективно работают только при наличии большого объема корпусных данных. Этим объясняется высокое качество статистических переводчиков, работающих с английским, французским, испанским, чешским и японским языками. Тогда как для языков, не обладающих большими объемами электронных текстов, применение качественного машинного перевода откладывается в далекую перспективу.

Актуальность исследования. В основе предлагаемого подхода лежит идея пополнения недостающей текстовой информации для систем статистического машинного перевода путем вовлечения в обработку корпусных данных тривиально- и заметно родственных языков. В рамках данного исследования разработаны поэтапные приемы машинного перевода, позволяющие системе

1 Сглаживание - метод обработки лексических единиц, отсутствующих в корпусе.

статистического машинного перевода обработать единицу перевода естественного языка, выявить сегменты с нулевой вероятностью и применить для них недостающую текстовую информацию родственного языка, выбрать из многообразия смыслов наиболее адекватный и, таким образом, существенно улучшить качество перевода, что определяет актуальность настоящего исследования.

Объектом исследования становится обработка естественного языка в машинном переводе с опорой на дополнительный корпус родственного языка, а также статистические модели поиска наиболее вероятных соответствий лексических единиц в трехязычном параллельном корпусе..

Предметом исследования выступают белорусско-английский и русско-английский параллельные корпуса, обработанные в системе статистического машинного переводчика Moses с целью выявления результативности применения предложенных алгоритмов.

Цель диссертационного исследования связана с выявлением способов улучшения качества статистического машинного перевода, основанного на фразах, при переводе с белорусского на английский язык через использование двуязычного русско-английского корпуса, в предположении, что белорусско-английский корпус недостаточно полный для качественного машинного перевода; исследованием методов раскручивания, конкатенации и транслитерации при обработке естественного языка в системах машинного перевода, их сопоставлением в ходе эксперимента.

В основу качественного показателя результатов легли не только лингвистические, но и квантитативные показатели перевода.

Для реализации поставленной цели исследования необходимо решение следующих задач:

- выявить современные методы и модели, нашедшие применение в действующих системах машинного перевода;

- дать типологическое описание современных систем машинного перевода и выявить доминирующие модели;

- разработать алгоритм, при котором лексические единицы с нулевой вероятностью обрабатываются не методом сглаживания, а путем применения наиболее вероятностного эквивалента из корпуса тривиально или заметно родственного языка;

- апробировать совместное использование метода раскручивания и метода конкатенации на инструменте моделирования машинного перевода Moses;

- разработать правила конкатенации двух параллельных корпусов родственных языков;

- установить взаимосвязь между развитием технологий обработки естественного языка и развитием языка в целом;

Цель и задачи, поставленные в настоящей работе, обусловили применение следующих методов исследования: для построения прототипа системы машинного перевода был применен инструмент с открытым исходным кодом Moses toolkit и методы статистического моделирования естественного языка; метод сопоставительного анализа моделей машинного перевода, метод исследования семантики на основе корпусной лингвистики, метод количественного подсчета.

Материалом исследования послужили научные публикации и лекции Мичиганского университета, русский национальный корпус, содержащий белорусско-русский параллельный корпус, корпус современного американского английского.

Научная новизна диссертационного исследования заключается в следующем:

• в рамках данного исследования обоснована целесообразность использования лингвистических корпусов для сравнительного и типологического анализа изменений параметров выравнивания при использовании дополнительных опосредованных корпусов;

• выявлено, что существующие в статистическом машинном переводе модели сглаживания не всегда эффективны для языков с небольшой базой данных;

• выявлено, что алгоритм, при котором единицы перевода с нулевой вероятностью будут обрабатываться с использованием дополнительного корпуса тривиально или заметно родственного языка, положительно влияет на выравнивание строк в статистическом машинном переводе;

• предложен способ перевода с белорусского языка на английский язык путем пропорциональной конкатенации белорусско-английского и русско-английского корпусов (при условии, что объем белорусско-английского корпуса недостаточно полный для статистического машинного перевода)

• выявлено, что метод «раскручивания» и метод конкатенации родственных языков могут применяться совместно;

• проведен сопоставительный анализ отдельных лингвистических форм и их употреблений с целью исследования влияния информационных технологий на развитие лингвистических норм;

Рабочая гипотеза

Качество машинного перевода для языков с недостаточной базой одноязычных и параллельных корпусных данных может быть повышено через использование того преимущества, которое обеспечивает их аналогия с языками, обладающими значительными лингвистическими ресурсами.

Теоретическая значимость исследования определяется модификацией существующих моделей сглаживания; предложенным алгоритмом обработки единиц перевода с нулевой вероятностью; исследованием методов обработки естественного языка в статистическом машинном переводе и подборе наиболее оптимального алгоритма обработки данных. Диссертационное исследование вносит вклад в развитие теоретических подходов к обработке параллельных корпусов и теории перевода.

Практическая ценность данной работы заключается в том, что полученные результаты исследования могут быть использованы в системах статистического машинного перевода для частичного решения проблемы недостатка корпусных данных и, следовательно, улучшения качества статистического машинного перевода. Данная работа может быть также использована в переводческой и

редакторской деятельности, в преподавании теории и практики статистического машинного перевода, спецкурсов по моделям машинного перевода и обработке естественного языка.

Теоретической и методологической основой исследования послужили труды отечественных и зарубежных ученых в области:

компьютерной лингвистики и теории перевода, таких как Арапов А.Н., Джаравски Д., Далмиера Д., Змитрович А.А., Зубов А.В., Зубова И.И., Карпов В.А., Лекомцев Ю.К., М. В., Морозкина Е.А., Мальковский М.Г., Ю.Н. Марчук, Маннинг К., А.Л. Семенов, Е.П. Соснина, Энджи Н.;

машинного перевода и его практического применения: Борисевич А.Д., Белоногов Г. Г., Браун П., Козеренко Е.Б., Марков А., Мамедова М.Т., Нелюбин Л.Л., Панич Ю. В., Степанова Д.В., Шаляпина З.М.;

моделирования перевода: В.Г. Гак, Ю.И. Гурова, В.В. Гусев, С.В. Евтеев, О. Каде, В.Н. Комиссаров, А.Н. Крюков, Дж. Кэтфорд, Л.К. Латышев, М. Ледерер, А.Г. Минченков, Р.К. Миньяр-Белоручев, Ю. Найда, К. Норд, И.И. Ревзин, Я.И. Рецкер, В.Ю. Розенцвейг, А.П. Седых, Д. Селескович, Е.А. Селиванова, С.В. Тюленев, А.В. Федоров, Л.Г. Федюченко, А.Д. Швейцер, А.Ф. Ширяев; а также научные разработки крупных ИТ компаний: Microsoft, Google, Yandex, ABBYY. Основные положения исследования, выносимые на защиту:

1. Предложенный в данной работе алгоритм восполнения лексических единиц с нулевой вероятностью через использование текстовых данных тривиально и заметно родственных языков позволяет увеличить смещение оценки вероятностей в сторону более вероятных исходов и, в результате, улучшить качество машинного перевода языков с недостающим объемом корпусных данных.

2. При наличии систематической разницы в орфографии между двумя родственными языками, обосновано применение метода транслитерации, состоящего в поиске выровненной пары слов, со схожей орфографией в параллельных предложениях двуязычного корпуса, исключая специфические символы.

3. Предложен метод конкатенации параллельных корпусов, принадлежащих тривиально родственным языкам, который в сравнении с уже разработанным и применяемым методом «раскручивания», дополняет базу не только исходного языка, но и целевого.

4. Предложен метод конкатенации родственных языков с использованием дополнительных меток, который требует лишь один дополнительный корпус. Метод раскручивания предполагает использование не менее двух дополнительных корпусов.

5. Конкатенация небольшого по объему белорусско-английского корпуса с объемным русско-английским корпусом приводит к доминированию последнего при выравнивании слов и извлечении фраз, что отрицательно влияет на значения вероятности при переводе с белорусского на английский, в связи с чем, была произведена конкатенация нескольких копий оригинального белорусско-английского корпуса и одной копии дополнительного русско-английского корпуса с целью количественного выравнивания этих корпусов по объему и сформирован новый обучающий корпус, использованный в машинном переводе.

Апробация работы. Основные положения диссертационного исследования были представлены на Международной научно-практической конференции, посвященной 75-летию д-ра филол. наук, проф. Р.З. Мурясова (г. Уфа, 3-4 февраля, 2015.); Международном электронном симпозиуме «Образование и наука: проблемы и перспективы развития» (Махачкала, 2014); Международной научно-методической конференции «Межкультурная-Интеркультурная коммуникация: теория и практика обучения перевода (Уфа, 17 декабря 2014.); Всероссийской научно-методической конференции «Интеркультурная коммуникация: теория и практика обучения». (Уфа, 2012.); II Международном фестивале языков в Башкортостане. (Уфа, 2012.); Республиканской научно-практической конференции «Индустрия перевода и ее перспективы» (Уфа, 2011), Материалах Международного фестиваля языков «Языки мира» (Уфа, 2011); Материалах научной конференции. под ред. Р.З. Мурясов (Уфа, 2011);

Диссертационное исследование обсуждалось на расширенном заседании кафедры лингводидактики и переводоведения факультета романо-германской филологии Башкирского государственного университета. По материалам настоящего исследования опубликовано 14 печатных работ, из них 3 работы - в журналах, рекомендованных ВАК.

Структура работы определяется целями и задачами, поставленными в исследовании. Диссертация состоит из введения, трех глав, заключения и списка литературы (193 наименований).

Глава 1. Моделирование перевода как область сопоставительного

языкознания

1.1. Квантитативная лингвистика: машинный перевод и автоматическая обработка естественных языков

Историческая или сравнительная лингвистика изучает историю языков методом взаимного сравнения, т.е. исследуя историю их сходства и различия. Сравнение является основным методом исследования в этой области лингвистики. Есть предположение, что сравнительное языкознание возникло раньше общего языкознания, и берет свое начало от восемнадцатого века. Многие понятия в общей лингвистике были заимствованы непосредственно из сравнительного языкознания. Так, методом сравнительно-исторического анализа было выявлено, что все романские языки (испанский, итальянский, французский, португальский, румынский и некоторые другие) являются потомками латинского языка. Все языки германской группы (немецкий, голландский, английский, шведский, и некоторые другие) также имеют общие корни. Было обнаружено, что подобную историю имеет европейское семейство языков - русский, польский, чешский, хорватский, болгарский. Сравнительное исследование выявляет много общих слов и конструкций как внутри упомянутых групп - романской, германской и славянской - так и между ними, из чего можно предположить, что все эти группы исходят из еще более обширного семейства индоевропейских языков.

Сравнительная лингвистика позволяет предугадать элементы одного языка, основываясь на знаниях другого родственного языка. Например, в следующей таблице аналогов, легко угадать неизвестное слово

Spanish English

constitución constitution

revolución revolution

investigación ?

Если же основываться на еще более сложных законах фонологии можно предугадать произношение слова на родственном языке. Как уже упоминалось выше, объема корпусных данных значительно влияет на качество машинного перевода. Из этого следует, что для многих языков применение статистического машинного перевода не доступно. Автор данного исследования полагает, что частично эта проблема может быть решена путем использования корпусных данных тривиально и заметно родственных языков. Некоторые родственные языки настолько тесно связаны, что используют до 90% однокоренных слов. Если для конкретной пары тривиально родственных языков разработать алгоритм автоматического извлечения однокоренных слов, то полученный словарь может быть использован статистическим машинным переводчиком не только для языков с недостаточной базой данных, но и для тех, у которых она совсем отсутствует. Так, при наличии корпуса для татарского языка, система, используя алгоритм извлечения однокоренных слов для этой языковой пары, может переводить в направлениях английский ^ башкирский. Полученный таким образом словарь работает двунапрвленно. Статистические модели разпознавания однокоренных слов могут быть «обучаемы». Предлагаемый подход к извлечению однокоренных пар слов из двух родственных или тривиально родственных языков основывается на методах определения минимального расстояния редактирования по Левенштейну. В данной работе однокоренная пара рассматривается как переводная пара, где слова из двух языков имеют одинаковое значение и схожие формы, напр., ^Ьет [Баш.] - сет [Тат.], учитель [Рус.] - вчитель [Укр.]. Некоторые языки настолько тесно связаны и обладают большим количеством однокоренных пар, что большая их часть может быть извлечена с высокой точностью. Расстояние Левенштейна - это минимальное количество операций, которое требуется для преобразования одной строки в другую. Операции включают вставку, удаление и замену. Каждая операция оценивается как единица, но можно принимать ее за любое положительное число. Для однокоренных слов это расстояние должно быть низким, менее 3. На самом деле расстояние между однокоренными словами может быть больше 3, но для их распознавания

потребуются более сложные алгоритмы, анализирующие историческую взаимосвязь двух языков. Определив дистанцию Р(и,ц) < Рл(и,ц), где Рл-расстояние Левенштейна, и-источник перевода, ц - однокоренная цель перевода, ц - неоднокоренная цель перевода, можно составить вокабуляр, соотнеся каждое исходное слово с целевым и выбрав самое минимальное.

В качестве эксперимента была рассмотрена база из 1000 пар слов русского и белорусского языков. Из общей базы были извлечены однокоренные пары для проверки результатов. Для каждого слова на языке источника было рассчитано по Левенштейну самое близкое слово из целевого языка. Гипотетическая переводная пара считалась правильной, если совпадала с лексиконом однокоренных пар.

Бел-русск. Точность по Общее содержание

вокабуляру однокоренных однокоренных пар

пар

91 47

Табл.1

В табл.1 представлены результаты, полученные путем применения метода нахождения минимального расстояния по Левенштейну.

Проведенные в рамках данного исследования экперименты показали заметное улучшение качества машинного перевода в результате применения алгоритмов, позволяющих анализировать родственный или тривиально родственный язык для невыровненных слов.

Требования к формализации вытекают из предположения, что практически любая обработка языка должна учитывать специфические особенности той области, в которой она используется. Если набор всех предложений и выражений одного естественного языка взять за L, а набор всех формальных выражений, которые поддаются квантитативной обработке за F, то можно предположить, что объекты в наборе F представляют значения, обозначающие предложения. В таком контексте любая формализация языка будет стремиться к определению F и выдаст такую карту значений м, при которой Vs ^ L3m ^ F м^;т), т.е. каждому предложению или фразе будет соответствовать хотя бы одно значение, которому,

в свою очередь, соответствует его формальное выражение. Подходы к формализации естественного языка глобально подразделяются на Монтегюнский - последователей Ричарда Монтегю и Теорию репрезентации дискурса DRT. Монтегюнский подход стремится дать формальную оценку возможным значениям (набору значений F) различных выражений естественного языка и как они соотносятся с синтаксисом этих выражений L. Недостатком монтегюнского подхода является отсутствие унифицированной оценки, формальной или неформальной, различных когнитивных процессов, имеющих место в языке; отсутствует обоснованная теоретическая методика формализации, что усложняет создание квантитативных методов. Более того, видится проблематичным использование теории моделирования для описания когнитивных концепций: как разработать логику для моделирования знания, веры, обязанностей. Теория репрезентации дискурса (DRT) (Kamp, H. & Reyle, U. From Discourse to Logic: Introduction to Modeltheoretic Semantics of Natural Language, Formal Logic and Discourse Representation Theory. Dordrecht: Kluwer Academic Publishers, 1993.) возникла, чтобы решить один из важнейших недостатков Монтегюнского подхода: присвоение значения лингвистическим выражениям в предложении, учитывая другие предложения. Позже эта теория была расширена до cегментированной теории репрезентации дискурса SDRT (Asher, N. & Lascarides, A. Logics of conversation. Cambridge etc.: Cambridge university press, 2003.).

Несмотря на то, что DRT удалось успешно смоделировать некоторые прагматические аспекты, в отличие от Монтегюнской формальной семантики, в нем отсутствует унифицированная формальная платформа. (Naveen S. G. On Deep Computational Formalization of Natural Language - Computer Science1,2,3 & Lally School of Management & Technology2 Rensselaer Polytechnic Institute (RPI), Troy NY 121S0 USA.).

В основе статистического машинного перевода лежит принцип формализации естественного языка. Опираясь на словарь Нелюбина Л.Л., можно определить формализацию как сведение сущности вещи, явления к их форме, формальным признакам (Нелюбин Л.Л. Перевод и прикладная лингвистика. М.:

Высшая школа, 1998. C. 207.). Другими словами, формализация (от лат. forma -вид, образ) - отображение объектов некоторой предметной области с помощью символов какого-либо языка (АКАДЕМИК - Словари и энциклопедии: http://dic.academic.ru/dic.nsf/enc_philosophy /1309/ ФОРМАЛИЗАЦИЯ.Мш1). Преобразуя текстовую информацию к определенному формату или модели, можно судить о ее свойствах. Как в своей книге о теории перевода пишет А.С. Семенов, модели перевода позволяют раскрыть сущность перевода «на основе критериев соответствия текстов перевода оригиналу» (Семенов А.Л., Современные информационные технологии и перевод М.: Издательский центр «академия», 2008. 224 с.)

Так как компьютерная лингвистика относится к лингвистике как таковой, можно утверждать, что компьютерная лингвистика относится к языкознанию, то есть к науке о языке. Компьютерная лингвистика представляет собой обобщенное понятие. Было бы неправильно утверждать, что она относится к информатике, так как имеет дело с лингводидактикой, и ошибочно полагать, что компьютерная лингвистика это и есть прикладная лингвистика, так как любую отрасль теоретической лингвистики можно отнести к прикладной лингвистике, а понятие «компьютерная лингвистика» уже, чем понятие «прикладная лингвистика».

В понятие «компьютерная лингвистика» входят: машинный перевод; компьютерная лексикография или подготовка электронных словарей; компьютерная лингводидактика; автоматическая обработка естественных языков NLP (Соснина Е.П. Параллельные корпусы в обучении языку и переводу. Доступ: http://ling.ulstu.ru/linguistics/resourses/literature/articles/corpus. Безусловно, каждое направление компьютерной лингвистики представляет собой широкую область исследований, но в данной работе рассматриваются такие понятия, как машинный перевод и автоматическая обработка естественных языков.

Идея машинного перевода возникла очень давно. В 1933 году П.П. Смирнов - Троянский запатентовал механизированное переводное устройство. По мнению Марчука Ю.Н., это устройство не несло никакого влияния, так как по отношению к самой сущности переводческого процесса оно было примитивным. Сам процесс

перевода начинался с обработки текстов оригинала с помощью электронных вычислительных машин. Изначально ЭВМ применялись для решения криптографических задач. Основываясь на исследовании Марчука Ю.Н., с помощью таких устройств можно было расшифровать секретные коды противника. И машинный перевод рассматривался как область, где применима техника дешифровки (Марчук Ю.Н. Проблемы машинного перевода. - М.: Наука, 1983. С. 17). А.В. Луканин в своей книге отмечает, что эффективность работы системы машинного перевода во многом зависит от ее настройки на конкретный подъязык естественного языка, на определенную лексику и набор грамматических средств. Под подъязыком понимается некоторый исходный набор текстов. Большую роль играют параллельные тексты и словари. Согласно А.В. Луканину, в любом из современных видов машинного перевода необходимо участие человека-редактора (Луканин. А.В. Автоматическая обработка естественного языка // учебное пособие Челябинск: Издательский центр ЮУрГУ, 2011. 70 с.). Современные системы машинного перевода, такие как «Сократ», «Промт», «Стилус в большинстве случаев требуют постредактирование переводов. «Тем не менее, принимая во внимание общую ситуацию с переводами в мире, можно смело утверждать, что альтернативы машинному переводу нет» (Марчук Ю.Н. Модели перевода : учеб. пособие для студ. учреждений высш. проф. Образования М.: Издательский центр «Академия», 2010. С. 92.). Перевод, как один из видов языковой деятельности, представляет собой процесс адекватной и полноценной передачи мыслей, высказанных на одном языке, средствами другого языка. К началу XX века переводческий материал стал настолько разнообразен, что встал вопрос о создании общей лингвистической теории перевода, которая охватила бы разные типы текстов и вывела закономерности в процессе перевода как межъязыковой коммуникации. В данной связи необходимо отметить таких исследователей, как Л.С. Бархударов, В.С. Виноградов, В.Г. Гак, Н.К. Гарбовский, В.Н. Комиссаров, З.Д. Львовская, Я.И. Рецкер, А.Д. Швейцер и других, которые внесли большой вклад в науку о переводе. При переводе следует уделять внимание на языковую многозначность, которая зачастую не отображена в

словарях. Не стоит полагаться лишь на знание языка, поскольку по некоторым подсчетам на одно английское слово в среднем приходится до двадцати пяти значений, и в речевом акте актуализуется, как правило, лишь одно из этих значений (Елисеева В. В. Лексикология английского языка. СПб.: Филологический факультет СПбГУ, 2003. С. 28). Проблема неоднозначности синтаксических структур также решается при помощи обращения к контексту и ситуации, однако, как отмечает ученый, не всегда оказывается легко установить функцию, выполняемую данной конструкцией (Рецкер Я. И. Теория перевода и переводческая практика. Очерки лингвистической теории перевода. М.: Р.Валент, 2007. С. 92). Полагаем, что при сопоставлении английского и русского языков, синтаксические конструкции, в которых в значительной степени различаются, контекст играет ключевую роль при определении значения переводимой конструкции. Адекватный и полноценный перевод обуславливает правильную, точную и полную передачу особенностей и содержания подлинника и его языковой формы (Нелюбин Л.Л., Толковый переводоведческий словарь. М.: Флинта: Наука, 2003. С.139).

Машинный перевод - выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. В основе его лежит обработка естественного языка. Что подразумевается под понятием «язык»? А.С. Семенов определяет язык как знаковую систему, которая является основным средством общения членов данного языкового сообщества. Им выделяются две основные функции языка: коммуникативная (средство общения) и когнитивная (средство накопления, передачи и восприятия знаний) (Семенов А.Л., Современные информационные технологии и перевод М.: Издательский центр «академия», 2008. С. 11). Существует и другое определение этого понятия, которое предлагает рассматривать язык как знаковую систему, предназначенную для порождения, передачи и хранения информации. Основной элемент системы -знак, который служит средством отражения того или иного элемента действительности (Большакова Е.И., Клышинский Э.С, Ландэ Д.В., Носков А.А.,

Похожие диссертационные работы по специальности «Сравнительно-историческое, типологическое и сопоставительное языкознание», 10.02.20 шифр ВАК

Список литературы диссертационного исследования кандидат наук Мифтахова, Рамиля Габдулхаевна, 2017 год

Список литературы

1. АКАДЕМИК - Словари и энциклопедии: - [Электронный ресурс] -Режим доступа: http://dic.academic.ru/dic.nsf/enc_philosophy /1309/ ФОРМАЛИЗАЦИЯ. Ы:т1

2. Баранов А. Н. Лингвистическая экспертиза текста / теоретические основания и практика // учебное пособие для вузов. - М.: Флинта : Наука, 2007. - 592 с.

3. Бузаджи Д.М. , Ланчиков В.К. Буквализм и языковое разнообразие. Об использовании одного метода корпусной лингвистики в переводоведении. [Электронный ресурс] - Режим доступа: http://www.thinkaloud.ru/feature/buz-lan-brog.pdf

4. Бузаджи М., Гусев В. В., Ланчиков В. К.. Новый взгляд на классификацию переводческих ошибок. - М.: Высш. шк., 2009. - 12 с.

5. Белоногов Г.Г., Зеленков Ю.Г., Новоселов А.П., Хорошилов Ал-др А., Хорошилов Ал-сей А. Метод аналогии в компьютерной лингвистике. Сб. «Научно-техническая информация» сер. 2, N 1, ВИНИТИ, 2000 г. С. 10-13.

6. Белоногов Г.Г. Об использовании принципа аналогии при автоматической обработке текстовой информации. - Сб. «Проблемы кибернетики», № 28, 1974.

7. Белоногов Г.Г. Калинин Ю.П. Хорошилов А.А. Компьютерная лингвистика и перспективные информационные технологии. - М., 2004.

- 248 с.

8. Белоногов Г.Г., Зеленков Ю.Г., Новоселов А.П., Хорошилов Ал-др А., Хорошилов Ал-сей А. Системы фразеологического машинного перевода. Состояние и перспективы развития. Сб. «Нанотехническая информация» сер. 2, N 12, ВИНИТИ, 1998 г. С. 26-28.

9. Большакова Е.И., Клышинский Э.С, Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. 2011 Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учебное пособие. - М.: МИЭМ, 2011. -272 с.

10. Бузикашвили Н.Е. Стохастические грамматики с отсечением. //

[Электронный ресурс] - Режим доступа: http: //www. co gnitive. ru/assets

/docs/scienwork/sbornic2/buzikash.doc

11. Бузикашвили Н. Е., Самойлов Д. В., Бродский Л. И., Усков А. В. Задача поиска в неструктурированном тексте и лингвистический анализ // Интеллектуальные технологии ввода и обработки информации // Сборник трудов ИСА РАН / Под ред. д. т. н. проф. Арлазарова В. Л. и д. т. н. проф. Емель янова Н. Е - М.: УРСС, 1998. С. 141-150.

12. Белоногов, Г. Г. Автоматизированная обработка научно-технической информации. Лингвистические аспекты. - М.: ВИНИТИ, 1984.

13. Бархударов Л. С.Б 24 Язык и перевод. Вопросы общей и частной теории перевода. М., «Междунар. отношения», 1975. - 240 с.

14. Бузикашвили Н. Е., Оберляйтнер М. С., Усков А. В. Выявление частеречевых N-грамм русского языка по неразмеченным текстам // Методы и средства Arl-Em.tex 48 В. Л. Арлазаров, Н. Е. Емельянов работы с документами: Сборник трудов ИСА РАН / Под ред. д. т. н. проф. Арлазарова В. Л. и д. т. н. проф. Емельянова Н. Е. - М.: УРСС, 2000. - С. 154-166.

15. Бабин Д.Н. О перспективах создания системы автоматического распознавания слитной устной русской речи // Интеллектуальные системы. 2004. Т. 8. Вып. 1-4. - С.45-70.

16. Борисевич А.Д. Автоматический перевод английских строительных текстов. // В кн.: ЛААТ. С. 279-285.

17. Большакова Е. И., Клышинский Э. С., Ландэ Д. В., Носков А. А., Пескова О. В., Ягунова Е. В. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учебное пособие. М.: МГОМ, 2011. - 272 с.

18. Багриновская Г. П., Кулагина О. С., Ляпунов А. А. О некоторых методологических вопросах, относящихся к машинному переводу. В сб.: О некоторых вопросах теоретической кибернетики и алгоритмах программирования. - Новосибирск, Изд. СО АН СССР, 1971.

19. Вертель В.А., Вертель Е.В., Крисевич B.C. и др. Автоматические словари в системе бинарного вероятностного МП. В кн.: Инженерная лингвистика. Уч. зап. ЛГПИ им. А.И. Герцена. Т. 458, чЛ, Л., 1971, - С. 4-16.

20. Вертель В.А. Выбор типа выходного автоматического словаря. // В кн.: ЛААТ. С.383-392.

21. Виноградов В. С. Перевод: Общие и лексические вопросы: Учебное пособие. - 3-е изд. - М.: КДУ, 2006, - 203 с.

22. Виноградов В.С. Введение в переводоведение (общие и лексические вопросы). — М.: Издательство института общего среднего образования РАО, 2001, — 224 с.

23. Галина И.В., Козеренко Е.Б., Морозова Ю.И., Сомин Н.В., Шарнин М. М. Ассоциативные портреты предметной области - инструмент автоматизированного построения систем Big Data для извлечения знаний: теория, методика, визуализация, возможное применение // Информатика и ее применения. - Т. 9, Вып. 2. - М.: ИПИ РАН, 2015. - С. 93-110.

24. Герасимов В.Н., Марчук Ю.Н. Машинный перевод в системе научно-технического перевода. В кн.: МСМП. С. 4.

25. Грязнухина Т.А. Исследование семантических отношений между компонентами словосочетаний с помощью трансформационного анализа. (На основе аппликативной порождающей модели). - М. : Просвещение, 1983. -174 с. 24.

26. Гак В. Г Языковые преобразования. Некоторые аспекты лингвистической науки в конце XX века. От ситуации к высказыванию, -Издание Либроком, 2009. - 167 с.

27. Гурова Ю.И. Фразеологизмы античного происхождения. - Санкт-Петербургский Гуманитарный университет профсоюзов. - Innovative views of young scientists '2015. - 5 с.

28. Гарбовский Н.К. Теория перевода. - М.: Изд-во Моск. ун-та. 2004. - 544 с.

29. Добровольский Д.О. Корпус параллельных текстов как инструмент анализа литературного перевода// Компьютерная лингвистика и интеллектуальные технологии. Труды международной конференции Диалог 2003, - М., 2003. URL: http://www.dialog-21 .ru/Archive/2003/Dobrovolskii.pdf

30. Евтеев С.В. Лингвокультурологическая модель перевода. // Вестник Брянского государственного университета. №2. 2014. С. 3.

31. Елисеева В. В. Лексикология английского языка. - СПб.: Филологический факультет СПбГУ, 2003. - С. 28

32. Зубов А.В., Зубова И.И. Информационные технологии в лингвистике: учеб. пособие для студ. вузов. - М.: Академия, 2004. 208с.

33. Зубов А.В. Автоматический словарь с нежесткими связями. // В кн.: МСМП. С.138.

34. Златоустова Л. В. Фонетические единицы русской речи. - М., 1981. - В кн.: Звучащий текст. М., 1983. С. 76-87.

35. Зализняк А. А. Грамматический словарь русского языка: Словоизменение. 4-е изд., испр. и доп. - М.,2003.

36. Звегинцев В.А. Мысли о лингвистике. // УРСС, 2008 - Журнал Language and languages. - 333 с.

37. Ингве В.Г. Синтаксис и проблема многозначности. // В кн.: Машинный перевод. - М., 1957, С. 281-304.

38. Карпилович Т.П. Автоматический анализ технического текста путем построения семантических моделей. // В кн.: МСМП. С. 94.

39. Карпилович Т.П. Автоматическое порождение предложений на основе детерминированных и вероятностных правил. // В кн.: СТОПИЛ. С. 76.

40. Кипяткова И.С. Применение синтаксического анализа при создании n-граммной модели языка для систем распознавания русской речи / И.С. Кипяткова // Труды 5 междисциплинарного семинара Анализ разговорной русской речи. - СПб., 2011. - С. 13-18.

41. Козеренко Е.Б., Лунева Н.В., Галина И.В., Морозова Ю.И. Лингвистические и металингвистические представления в интеллектуальных

многоязычных системах // Журнал «Искусственный интеллект». - НАН Украины, 2011. - Том 3. - С. 123-135.

42. Комиссаров В.Н. К 63 Теория перевода (лингвистические аспекты): Учеб. для ин-тов и фак. иностр. яз. - М.: Высш. шк., 1990. - 253 с.

43. Козеренко Е.Б., Лунева Н.В., Морозова Ю.И., Ермаков П.В. Проектирование многоязычного лингвистического ресурса для систем машинного перевода и обработки знаний // Системы и средства информатики. - Вып. 19. - М.: «Наука», 2009. - С. 119-141.

44. Кузнецов П. С., Ляпунов А. А., Реформатский А. А. Основные проблемы машинного перевода. - М.: Вопросы языкознания, 1956, № 5.

45. Кулагина О. С. О роли А. А. Ляпунова в развитии работ по машинному переводу в СССР. Проблемы кибернетики, 1977, вып. 32 (в переработанном и дополненном варианте - в книге "Очерки истории информатики в России". Новосибирск, ОИГГМ СО РАН, 1998)

46. Катфорд Дж. К. Лингвистическая теория перевода: Об одном аспекте прикладной лингвистики. - УРСС Эдиториал. 2004. - 208 с.

47. Кулагина О. С. Исследования по машинному переводу. М., Наука,

1979.

48. Карпов В.А. Язык как система. - Изд.3 АН СССР. 2009. 304 с.

49. Королев Э. И. Об автоматическом распознавании логических предикатов // Машинный перевод и прикладная лингвистика. М., 1972. Вып. 15. С. 172-186.

50. Каде О. Проблемы перевода в свете теории коммуникации // Вопросы теории перевода в зарубежной лингвистике. - М: Международные отношения, 1978. С. 69-90.

51. Кондрашова Д.С. «Теория сегментной репрезентации дискурса для решения задач судебной лингвистической экспертизы при извлечении из текста имплицитной информации» Труды международной конференции «Диалог 2006». - С. 95.

52. Лекомцев, Ю.К. Введение в формальный язык лингвистики. -Изд.3 АН СССР. 1983. 264 с.

53. Ляпунов А. А., Кулагина О. С. Использование вычислительных машин для перевода с одного языка на другой. Природа, 1955, № 8.

54. Латышев Л. К. Технология перевода // Учеб. пособие для студ. лингв, вузов и фак. — 2-е изд., перераб. И доп. — М.: Издательский центр «Академия», 2005. — 320 с.

55. Ледерер М. Актуальные аспекты переводческой деятельности в свете интерпретативной теории перевода / [пер. с фр. Н. А. Фененко, Е. А. Алексеевой] ; Российский гос. пед. ун-т им. А. И. Герцена. - Санкт-Петербург : Изд-во РГПУ им. А. И. Герцена, 2007. - 223 с.

56. Луканин А.В. Искусственная нейронная сеть для генерации форм прошедшего времени в современном английском языке // Научная сессия НИЯУ МИФИ - 2010. XII Всероссийская научно-техническая конференция "Нейроинформатика-2010": Сборник научных трудов. В 2-х частях. Ч.2. М.: НИЯУ МИФИ, 2010. С. 287-297.

57. Луканин. А.В. Автоматическая обработка естественного языка // учебное пособие — Челябинск: Издательский центр ЮУрГУ, 2011. — 70 с.

58. Львовская З.Д. Современные проблемы перевода. - М.: изд-во URSS, 2007. - 220 стр. - Перевод с испанского языка В.А.Иовенко.

59. Морозкина, Е. А. Вопросы психологии бессознательного в творчестве Теодора Драйзера и Шервуда Андерсона / Е. А. Морозкина // Вестник ВЭГУ. - 2008. - №1 (33). - С. 131-145.

60. Морозкина, Е. А. Герменевтика в филологии, лингвистике и переводоведении / Е. А. Морозкина // Вестник Башкирского университета. -2012. - Т.17. - №1. - С. 154-157.

61. Морозкина, Е. А. Роль лингвистики в развитии научных знаний / Е. А. Морозкина // Успехи современного естествознания. - 2009. - №6. - С. 87 -88.

62. Морозкина, Е. А. Творчество Теодора Драйзера и литературное развитие США на рубеже XIX-XX веков / Е. А. Морозкина. - Уфа: Изд-во Башкирск. ун-та, 1994. - 160 с.

63. Морозкина, Е. А., Насанбаева, Э. Р. Герменевтический «круг» и «сфера» модальности в герменевтической модели перевода // Вестник Башкирского университета. - 2013. - Т.18. - №4. - С. 1191-1194.

64. Морозкина, Е. А., Насанбаева, Э. Р. Герменевтический «круг» модальности в художественном переводе // Проблемы многоязычия в полиэтническом пространстве: материалы международной научно-практической конференции, посвященной 75-летию факультета романо-германской филологии Башкирского государственного университета. Ч. II. / отв. ред. Р. З. Мурясов. - Уфа: РИЦ БашГУ, 2013. - С. 245-253.

65. Морозкина, Е. А., Насанбаева, Э. Р. Смысловая интерпретация художественного текста в герменевтической модели перевода // Вестник Башкирского университета. - 2013. - Т.18. - №1. - С. 86-89.

66. Морозкина, Е. А., Филиппова, Ю. А. Лингвистическая система Вильгельма фон Гумбольдта у истоков герменевтической модели перевода // Вестник Башкирского университета. 2014. Т.19. № 1. С. 110-114.

67. Морозкина, Е. А., Филиппова, Ю. А. Антиномии В. фон Гумбольдта в герменевтической модели перевода (на материале анализа русскоязычной версии перевода новеллы Э. А. По «Поместье Арнгейм») // European Social Science Journal (Европейский журнал социальных наук). 2014. № 4. Том 1. - С. 201-206.

68. Морозкина, Е. А., Филиппова, Ю. А. Репрезентация антиномии В. фон Гумбольдта о неразрывном единстве и внутренней противоречивости языка и мышления в национальной языковой картине мира // Современные проблемы науки и образования. - 2015. - № 2-1; URL: http://www.science-education.ru/122-20569.

69. Марчук Ю.Н. Проблемы машинного перевода. - М.: Наука, 1983. -

233 с.

70. Марчук Ю.Н. Компьютерная лингвистика. Издательство: АСТ, Восток-Запад ISBN: 5-17-039480-2,5-478-00383-2. 2007. - С 319.

71. Марчук Ю.Н. Модели перевода : учеб. пособие для студ. учреждений высш. проф. Образования - М.: Издательский центр «Академия»,

2010. - 176 с.

72. Мифтахова Р.Г Морозкина Е.А., Информационные технологии и их влияние на развитие лингвистических норм // Вестник Башкирского университета. 2012. № 1. - С. 162-164.

73. Мифтахова Р.Г Основные факторы улучшения машинного перевода // Вестник Башкирского университета. 2014. № 4. - С. 182-184.

74. Мифтахова Р.Г Метод универсальной семантической иерархии в машинном переводе. // ВАК «Инновации в образовании» 2015. №12. - С. 122

Статьи в сборниках научных трудов и материалы конференций:

75. Мифтахова Р.Г. Современные системы автоматизированного перевода // Материалы Международного фестиваля языков «Языки мира».

2011. Уфа: РИЦ БашГУ. - С.101-105.

76. Мифтахова Р.Г. Инновационные модели машинного перевода// Материалы Республиканской научно-практической конференции «Индустрия перевода и ее перспективы». - Уфа: РИЦ БашГУ, 2011. С. 120-124.

77. Мифтахова Р.Г Основы моделирования классического машинного перевода и статистического машинного перевода // Материалы научной конференции. Ч. II / отв. ред. Р.З. Мурясов. - Уфа: РИЦ БашГУ, 2011. -С.252-258

78. Мифтахова Р.Г Информационные технологии в лингвистике // Межкультурная - Интеркультурная коммуникация: теория и практика обучения: материалы Всероссийской научно-методической конференции. - г. Уфа / отв. ред.Н.П. Пешкова. - Уфа: РИЦ БашГУ, 2012. - С.201-205

79. Мифтахова Р.Г Проблемы формализации естественного языка // Homoloquens в языке, культуре, познании: Материалы Международной научно-практической конференции, посвященной 75-летию доктора

филологических. наук, профессора Р.З. Мурясова / отв. ред. З.З. Чанышева. -Уфа: РИЦ БашГУ, 2014. - С. 161-167.

80. Мифтахова Р.Г. Вопросы локализации приложений // Актуальные проблемы современной лингвистики глазами молодых ученых: Материалы II регионального научного семинара /отв. ред. Е. В. Шпар. - Уфа: РИЦ БашГУ, 2012. - С. 140-142.

81. Мифтахова Р.Г. Морозкина Е.А. Прикладные возможности парсеров в системах машинного перевода и автоматической обработки текстов. Материалы Международной научно-методической конференции «Межкультурная-Интеркультурная коммуникация: теория и практика обучения перевода,Уфа, 17 декабря 2014 г. /отв. ред. Пешкова. - Уфа: РИЦ БашГУ, 2014. - С. 16-20

82. Мифтахова Р.Г Проблемы обработки естественного языка// РИНЦ Махачкала. Образование и наука: проблемы и перспективы развития, 2014. -С. 22-32.

83. Мифтахова Р.Г Тривиально родственные языки в машинном переводе// Материалы Международной научно-практической конференции (с элементами научной школы для молодых ученых и студентов) 10-11 ноября 2015 г. - С. 337-342

84. Мифтахова Р.Г Контекстный вектор как способ улучшения качества смп с использованием родственного языка// II Международной научно-практической конференции «Языки в диалоге культур», посвященной 100-летию со дня рождения первого ректора БашГУ Шайхуллы Хабибулловича Чанбарисова (1916-1996), 19-20 мая 2016 г. - С. 28-32

85. Мифтахова Р.Г. Методы пополнения корпусных данных в статистическом машинном переводе // Доклады БашГУ 2017 /отв. ред. Мурясов Р.З.. - Уфа: БашГУ. 2017. №1. - Статья 16-0164.

86. Молошная Т. Н. Алгоритм перевода с английского языка на русский. - М.: Проблемы кибернетики, 1960, вып. 3.

87. Михеев М.Ю., Сомин Н.В., Галина И. В., Золотарев О. В., Козеренко Е. Б., Ю. И. Морозова, Шарнин М.М. Фальштексты: классификация и методы опознания текстовых имитаций и документов с подменой авторства // Информатика и ее применения. - Т. 8. Вып. 4. - М.: ИПИ РАН, 2014. - С. 70-77.

88. Мельников Г.П. Системная типология языков: принципы, методы, модели. М., 2003.

89. Морозова Ю.И. Построение семантических векторных пространств различных предметных областей // Информатика и ее применения. - Т. 7, Вып. 1. - М.: ИПИ РАН, 2013. - С. 90-93.

90. Монографии, изданные в Российской Академии Естествознания -Лекция 12. Языки представления знаний (восприятие и формализация) [http://www.rae.ru/monographs/189-5958.

91. Морозова Ю. И. Извлечение переводного словаря значимых словосочетаний из параллельных текстов с использованием методов дистрибутивной семантики // Новые информационные технологии в автоматизированных системах: материалы шестнадцатого научно-практического семинара. - М.: Моск. ин-т. электроники и математики национального исследовательского университета «Высшая школа экономики», 2013. - С. 268-272.

92. Морозова Ю.И. Извлечение переводных соответствий из корпуса параллельных текстов с использованием методов дистрибутивной семантики // Материалы трудов международной конференции «Корпусная лингвистика-2013». - Спб.: С.-Петербургский гос.университет, Филологический факультет, 2013. - С.379-386.

93. Морозова Ю. И. Моделирование трансформаций предикативных структур при французско-русском и русско-французском машинном переводе // Новые информационные технологии в автоматизированных системах: материалы пятнадцатого научно-

практического семинара. - М.: Моск. гос. ин-т. электроники и математики. -2012. - С. 170 - 175.

94. Миньяр-Белоручев Р. К. Общая теория перевода и устный перевод. — М.: Воениздат, 1980. — 237 с.

95. Нелюбин Л.Л., Толковый переводоведческий словарь. - М.: Флинта: Наука, 2003. - 320 с.

96. Нелюбин Л.Л. Лингвостилистика современного английского языка (учебное пособие). - М.: МОПИ им. Н.К.Крупской, 2000. - 110 с.

97. Нелюбин Л.Л. Перевод и прикладная лингвистика. - М.: Высшая школа, 1998. - 207 с.

98. Налимов В.В. Вероятностная Модель Языка. О соотношении естественных и искусственных языков - М.: Наука, 1979. - 304 с.

99. Найда Ю.Я. К науке переводить // Вопросы теории перевода в зарубежной лингвистике. Сборник статей. - М.: «Международные отношения», 1978.

100. Панов Д.Ю. Автоматический перевод. - М: Изд. АН СССР, 1958 (первое издание - 1956.)

101. Панов Д.Ю., Ляпунов А.А., Мухин И.С. Автоматизация перевода с одного языка на другой: Сессия по научным проблемам автоматизации производства.- М.: изд. АН СССР, 1956. С. 19-21.

102. Пиотровский Р. Г. Текст. Машина. Человек. - Л.: Наука, 1975. -

244 с.

103. Рецкер Я.И. Теория перевода и переводческая практика. - М.: Международные отношения», 1974.

104. Рецкер Я. И. Теория перевода и переводческая практика. Очерки лингвистической теории перевода. - М.: Р.Валент, 2007. - С. 92

105. Ревзин И.И., Розенцвейг В.Ю. Основы общего и машинного перево-да. - М., 1964. Некоторые положения этой работы выли ранее изложены авторами в статье: К обоснованию лингвистической теории перевода // В Я. 1962.- № 1.

106. Рыбаков М.А. Задачи, методы и актуальные проблемы типологической лингвистики // Вестник РУДН, серия "Лингвистика", № 8, 2006, С. 37-46.

107. Рецкер Я.И. Теория перевода и переводческая практика. - М.: Международные отношения, 1974. - 216 с.

108. Ревзин И.Н., Розенцвейг В.Ю. Основы общего и машинного перевода. - М., 1964.

109. Роганов В.Р., Роганова С.М., Новосельцева М.Е. Обработка экспериментальных данных: Учебное пособие. - Пенза: Пенз. гос. ун-т, 2007. - 171 с.

110. Сущанская Н.Ф. Программный препроцессор для естественноязыковых. интерфейсов. Автореф. дисс. к.т.н. - Киев: РИО ИК, 1989.

111. Седых А.П. Лингвокультурология и модели перевода // Вестник Нижегородского государственного лингвистического университета им. Н. А. Добролюбова. Вып. 5. Лингвистика и межкультурная коммуникация. С. 7.

112. Стеблин-Каменский М. И. Значение машинного перевода для языкознания. // В сб.: Материалы по машинному переводу. - Сб. 1. Л., Изд. ЛГУ, 1958.

113. Семенов А.Л., Современные информационные технологии и перевод - М.: Издательский центр «академия», 2008. - 224 с.

114. Соснина Е.П. Параллельные корпусы в обучении языку и переводу. - Режим доступа: http://ling.ulstu.ru/linguistics/resourses/literature/articles/corpus

115. Соснина, Е. П. Введение в прикладную лингвистику : учебное пособие / Е. П. Соснина. - 2-е изд., испр. и доп. - Ульяновск : УлГТУ, 2012. -110 с.

116. Сегаран Т., Программируем коллективный разум. — М.: Символ-Плюс, 2008. - 368 с.

117. Селиванова Е.А. Основы лингвистической теории текста и коммуникации - Монографическое учебное пособие. - К. - ЦУЛ, «Фитосоциоцентр», 2002. - 336 с.

118. Соколов А. Н. Способы перевода метонимии / А. Н. Соколов // Language and Literature. - Вып. 18. С. 13.

119. Тарануха В.Ю. Метод построения n-граммной модели адаптированной для славянских языков // Инновации в науке: сб. ст. по матер. XXXIII Междунар. науч.-практ. конф. № 5(30). - Новосибирск: СибАК. 2014. С.102.

120. Тюленев С. Что перевод системе? Что ему она? - Логос. 2012. - № 3 (87). С. 105-130.

121. Тутубалин В.Н. Теория вероятностей и случайных процесов. - М.: МГУ, 1992. - 398 с.

122. Успенский В. А. Серебряный век структурной, прикладной и математической лингвистики в СССР и В. Ю. Розенцвейг, Как это начиналось (заметки очевидца) в кн.: Очерки истории информатики в России. Новосибирск, НИЦ ОИГГМ СО РАН, 1998. Компьютерра, 2002, № 21. Тема номера: "Ты меня понимаешь?" Проблемы машинного перевода. С. 26-37.

123. Убин И.И. Современные средства автоматизации перевода: надежды, разочарования и реальность. Сб. «Перевод в современном мире». ВЦП, 2001. С. 60-68

124. Успенский В. А. Серебряный век структурной, прикладной и математической лингвистики в СССР и В. Ю. Розенцвейг, Как это начиналось (заметки очевидца) в кн.: Очерки истории информатики в России. Новосибирск, НИЦ ОИГГМ СО РАН, 1998.

125. Федоров А. В. Основы общей теории перевода (лингвистические проблемы): Для институтов и факультетов иностр. языков. Учеб. пособие. / 5-е изд. - СПб.: Филологический факультет СПбГУ; М.: ООО "Издательский Дом "ФИЛОЛОГИЯ ТРИ". 2002. - 416 с.

126. Федюченко Л. Г. Терминологические цепочки в текстовом и словарном определении понятия "менеджмент" / Л. Г. Федюченко // Language and Literature. - Вып. 17. С. 11.

127. Фролов Н. К. Научные стили речи в компьютерном дискурсе // Language and Literature. - Вып. 17. С. 6.

128. Хомский Н. Аспекты теории синтаксиса - М.: Издательство МГУ, 1872. - 227 с.

129. Шарнин М.М., Сомин Н.В., Кузнецов И.П., Морозова Ю.И., Галина И.В., Козеренко Е.Б. Статистические механизмы формирования ассоциативных портретов предметных областей на основе естественноязыковых текстов больших объемов для систем извлечения знаний // Информатика и ее применения/ - Т.7, Вып.2. - М.: ИПИ РАН, 2013. - С. 9299.

130. Швейцер А.Д. Теория перевода: Статус, проблемы, аспекты. — М.: Наука, 1988. — 215с.

131. Швейцер А.Д. Перевод и лингвистика. - М., 1973. - С. 29-31.

132. Юсупова Н.И. Алгоритмическое и программное обучение для анализа тональности текстовых сообщений с использованием машинного обучения. // Вестник УГАТУ, 2012.

133. Якобсон Р. Типологические исследования и их вклад в сравнительно-историческое языкознание // Новое в лингвистике. - М, 1963. C. 98.

Список иностранной литературы:

134. Asher, N. & Lascarides, A. Logics of conversation. Cambridge etc.: Cambridge university press, 2003.

135. Asher, N. Lexical Meaning in Context: A Web of Words. - Cambridge University Press, 2011.

136. Asher, N. Reference to Abstract Objects in Discourse. - A Philosophical Semantics for Natural Language Metaphysics, Kluwer Academic Publishers, Studies in Linguistics and Philosophy series Vol. 50, 1993.

137. Al-Emran, M., S. Zaza, and K. Shaalan, "Parsing Modern Standard Arabic using Treebank Resources", The International Conference on Information and Communication Technology Research (ICTRC), UAE, 18 May, 2015.

138. Bodomo, A. B. 2016. Afriphone literature as a prototypical form of African literature: Insights from prototype theory. - Advances in Language and Literary Studies. 7, 5, pp. 262-267.

139. Bing Liu. Sentiment Analysis and Opinion Mining. - Morgan & Claypool Publishers, May 2012.

140. Brown P. Levinson S. Some universals in language usage [chapter 1, reprint]. In N. Coupland, & A. Jaworski (Eds.), Sociolinguistics: critical concepts [volume III: Interactional sociolinguistics]. London. 2009. pp. 311-323.

141. Brown, P. F., Pietra, S. A. D., Pietra, V. J. D., and Mercer, R. L. The mathematics of statistical machine translation. Computational Linguistics. 1993. С263-313.

142. Brants T., Popat A. C., P. Xu, F. J. Och, J. Dean, "Large language models in machine translation", Proceedings of the EMNLP-CoNLL, 2007, pp. 858-867.

143. Collins. M. Three generative, lexicalized models for statistical parsing. //In Proceedings of ACL 35, 1997.

144. Cannon S, Daymude J.. A Markov Chain Algorithm for Compression in Self-Organizing Particle Systems. [Электронный ресурс]. - Режим доступа: https://arxiv.org/abs/1603.07991 ?context=cs

145. Chen S. F. Joshua G., "An Empirical Study of Smoothing Techniques for Language Modeling," Computer Speech and Language, Vol. 13, 1999, pp. 359394. [Электронный ресурс]. - Режим доступа: http://dx.doi.org/10.1006/csla. 1999.0128

146. Church K. W. Gale W. A., "A Comparison of the Enhanced Good-Turing and Deleted Estimation Methods for Estimating Probabilies of English Bigrams," Computer Speech and Language, Vol. 5, 1991, pp. 19-54. [Электронный ресурс]. - Режим доступа: http://dx.doi.org/10.1016/0885-2308(91)90016-J

147. Dorr B.J. Klavans J. Building lexicons for machine transaltion - I. Machine translation №9. pp. 221-250.

148. Elman, J.L. Distributed representations, simple recurrent networks, and grammatical structure / J.L. Elman // Machine Learning. 1991. pp. 195-224.

149. Elman, J. L. On the meaning of words and dionosaur bones: Lexical knowledge without a lexicon / J. L. Elman // Cognitive Science. — 2009. — 33. — P. 1-36.

150. Finch A. Using machine translation evaluation techniques to determine sentence-level semantic equivalence, YS Hwang, E Sumita - Proceedings of the Third International Workshop on Paraphrasing (IWP2005), pp. 17-24

151. Germann, U., Jahr, M., Knight, K., Marcu, D., and Yamada, K. Fast decoding and optimal decoding for machine translation. In Proceedings of ACL 39.2001.

152. Gale, William A. & Kenneth W. Church. "A Program for Aligning Sentences in Parallel Corpora". Proceedings of the 29th Annual Meeting on Association for Computational Linguistics (ACL'91). 1991.177-184.

153. Ghaffari A. Masoudi R. Software defined networks: A survey Journal of Network and Computer Applications 67, pp 1-25.

154. Habash N. Combination of Arabic preprocessing schemes for statistical machine translation - Proceedings of the 21st International Conference on Computational Linguistics and the 44th annual meeting of the Association for Computational Linguistics. Sydney, Australia - 2006. pp. 1-8

155. Jurafsky D, Manning Ch. Sentence Segmentation - Stanford NLP 2008: [Электронный ресурс] - Режим доступа: http: //www.youtube.com/watch?v=di0N3kXfGYg

156. Jurafsky D, Manning Ch. Estimating N-gram Probabilities - Stanford NLP - [Электронный ресурс] - Режим доступа: http: //www.youtube.com/watch?v=o-CvoOkVrnY

157. Jurafsky D. Martin J. H., "Speech and Language Processing," Prentice Hall, Chapter 6, 2000.

158. Crystal D. The Cambridge Encyclopedia of Language - Cambridge University Press. - 509 pp.

159. Koehn Ph., Och F. J., Marcu D. Statistical Phrase-Based Translation // Information Sciences Institute Department of Computer Science University of Southern California, pp 17-24 с.

160. Kress. G. The Encyclopedia of Applied Linguistics, Oxford: Blackwell.

2010.

161. Kondrak G, Jiampojamarn S. Applying Many-to-Many Alignments and Hidden Markov Models to Letter-to-Phoneme Conversion. - T Sherif HLT-NAACL 7, pp. 372-379.

162. Kondrak G , Beek P Van A theoretical evaluation of selected backtracking algorithms - Artificial Intelligence 89 (1-2), рр. 365-387.

163. Kondrak G. Cherry С, Integrating joint n-gram features into a discriminative training framework. // Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics - Association for Computational Linguistics. 2010. -pp. 697-700.

164. Kupusinac A., M. Secujsk, "An algorithm for part-of-speech tagging in Serbian language", 9. ISIRR, Novi Sad, Serbia, 21-22 June, 2007, p. 43.

165. Kamp, H. & Reyle, U. From Discourse to Logic: Introduction to Modeltheoretic Semantics of Natural Language, Formal Logic and Discourse Representation Theory. Dordrecht: Kluwer Academic Publishers, 1993.

166. Marcu, D. and Wong, W.. A phrase-based, joint probability model for statistical machine translation. // In Proceedings of the Conference on Empirical Methods in Natural Language Processing, EMNLP. 2002.

167. Minchenkov A.G. Kognitivno-evristicheskaia model' perevoda [Cognitiveheuristic model of translation]. Saar-brucken: Lambert Academic Publishing, 2011.

168. Melamed D. Speech Analytics, in G. Tur and R. De Mori, Eds., Spoken Language Understanding. Systems for Extracting Semantic Information from Speech. 2011. - https: //www.cs.nyu.edu/~melamed/pubs.html

169. Meselhi, M., H. Abo Bakr, I. Ziedan, and K. Shaalan, "Hybrid Named Entity Recognition - Application to Arabic Language", The International Conference on Computer Engineering & Systems (ICCES), Egypt, 23 December, 2015.

170. Morifuji, D. Connectionist Approach to Stage-Like Syntactic Development / Daichi Morifuji, Toshio Innui // Обработка текста и когнитивные технологии: Сборник статей. №11 / Редакторы: В. Соловьев, В. Гольдберг, В. Поляков — Казань: Казанский государственный университет им. В.И. Ульянова-Ленина, 2006. — С. 41—50.

171. Naptali W., "Masatoshi Tsuchiya, and Seiichi Nakagawa," ACM Transactions on Asian Language Information Processing, Vol. 9, No. 2, Article 7, Pub., 2010.

172. Nord C. Text Analysis in Translation: theory, Methodology, and Didactic Application of a Model for Translation-Oriented Text Analysis / C. Nord. - Amsterdam: Rodopy, 2005. - 274 p.

173. Nakov S. Automatic Identification of False Friends in Parallel Corpora: Statistical and Semantic Approach. Serdica Journal of Computing, volume 3, pp. 133-158, ISSN 1312-6555, Sofia, Bulgaria, 2009

174. Ostrogonac S. Language model reduction for practical implementation in LVCSR systems /S. Ostrogonac, B. Popovic, M. Secujski, et al. // Infoteh-Jahori-na Vol. 12, March 2013.

175. Och, F. J. and Ney, H. Improved statistical alignment models. In Proceedings of ACL 38. 2000, pp. 44-56

176. Och, F. J., Tillmann, C., and Ney, H. Improved alignment models for statistical machine translation.// In Proc. of the Joint Conf. of Empirical Methods in Natural Language Processing and Very Large Corpora, pp 20-28. 1999.

177. Och, F. J., Ueffing, N., and Ney, H. An efficient A* search algorithm for statistical machine translation. In DataDriven MT Workshop. 2001.

178. Och. F. Minimum Error Rate Training in Statistical Machine Translation. // Information Sciences Institute University of Southern California 4676 Admiralty Way, Suite 1001 Marina del Rey, CA 90292.

179. Ostrogonac S., D. Miskovic, M. Secujski, D. Pekar, V. Delic, "A language model for highly inflective non-agglutinatve languages," SISY, Subotica, 2012.

180. Ostrogonac S., D. Miskovic, M. Secujski, D. Pekar, "Discriminative potential of a language model based on the class n-gram concept," in Serbian ("Diskriminativne mogucnosti modela jezika zasnovanog na konceptu klasnog n -grama"), DOGS, Kovacica, 2012.

181. Pang B., Lee L. Sentiment Classification using Machine Learning Techniques. Proceedings of the Conference on Empirical Methods in Natural. Language Processing (EMNLP). Philadelphia. 2002. P. 79-86.

182. Papineni, K., Roukos, S., Ward, T., and Zhu, W.-J. BLEU: a method for automatic evaluation of machine translation. // Technical Report RC22176(W0109-022), IBM Research Report.2001.

183. Popovic M, H Ney Statistical machine translation with a small amount of bilingual training data//5th LREC SALTMIL Workshop on Minority Languages, 2006, pp. 25-29

184. Suresh B. Inclusion of large input corpora in statistical machine translation. // Technical report, Stanford University. 2010. 6p.

185. Seleskovitch D., lederer M. Interpréter pour traduire, 3-e édition. -Paris: Didier Erudition. 1993.

186. Stolcke A. "SRILM - an extensible language modeling toolkit," Proceedings of ICSLP, vol. 2, Denver, USA, 2002, pp. 901-904.

187. Thorsten Brants, Ashok C. Popat, Peng Xu, Franz J. Och, Jeffrey Dean // Google, Inc. 1600 Amphitheatre Parkway Mountain View, CA 94303, USA.

188. Vilar D, M Popovic, H Ney. Do we need to" improve" our alignments? // WSLT, 2006. С.205-212. [Электронный ресурс]. - Режим доступа: https://pdfs.semanticscholar.org/8265

189. William A. Gale and Kenneth W. Church. A program for aligning sentences in bilingual corpora. In Proceedings of 29th Meeting of Association for Computational Linguistics - Berkeley, California, June 1991. Pp. 177-184.

190. Wu, D. Stochastic inversion transduction grammars and bilingual parsing of parallel corpora. Computational Linguistics, 23(3). 1997. [Электронный ресурс]. - Режим доступа: http://dx.doi.org/10.1109/18.87034

191. Witten L. H., Bell T. C., "The Zero-Frequency Problem: Estimating the Probabilities of Novel Events in Adaptive Text Compression," IEEE Transactions on Information Theory, Vol. 37, No. 4, 1991, pp. 1085-1094. [Электронный ресурс]. - Режим доступа: http://dx.doi.org/10.1109/18.87000

192. Wettler M. A Freely Available Morphological Analyzer, Disambiguator and Context Sensitive Lemmatizer for German. - Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics (COLLING-ACL). Monral. Canada. 1998. [Электронный ресурс]. - Режим доступа: http://dl.acm.org/citation.cfm?id=980691

193. Yamada, K. and Knight, K.. A syntax-based statistical translation model. In Proceedings of ACL 39. 2001. [Электронный ресурс]. - Режим доступа: http://dl.acm.org/citation.cfm?doid=1073012.1073079

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.