Моделирование порождающих семантико-синтаксических структур в языках различного грамматического строя тема диссертации и автореферата по ВАК РФ 10.02.19, кандидат филологических наук Силантьев, Аркадий Николаевич

  • Силантьев, Аркадий Николаевич
  • кандидат филологических науккандидат филологических наук
  • 2004, Ставрополь
  • Специальность ВАК РФ10.02.19
  • Количество страниц 156
Силантьев, Аркадий Николаевич. Моделирование порождающих семантико-синтаксических структур в языках различного грамматического строя: дис. кандидат филологических наук: 10.02.19 - Теория языка. Ставрополь. 2004. 156 с.

Оглавление диссертации кандидат филологических наук Силантьев, Аркадий Николаевич

Введение страница

Глава 1. Модельный формализм описания языковой структуры

§ 1. Основные постулаты базового компонента модели языкового отображения смысла

§ 2. Определение матроида и связь с модельной интерпретацией

§ 3. Базисные структуры языковых матроидов

§ 4. Сопоставительный анализ эргативной и номинативной конструкций предложения

Выводы к гл.

Глава 2. Применение базисной модели фразовой структуры к анализу развернутого предложения

§ 1. Формализация фрагмента описательной грамматики адыгских языков: согласование в именных и глагольных синтагмах

§ 2. Расширение области приложения модели: некоторые возможности сопоставительного изучения индоевропейских и абхазо-адыгских языков

§ 3. Расширение инструментальных средств модели: привлечение концептуальных основ теории интерпретации текста

Выводы к гл.

Глава 3. Некоторые приложения модельных концепций к типологической проблематике с точки зрения общей теории языка

§ 1. Использование модели в практике сопоставительного анализа и интерпретации: аустронезийские структурные схемы

§2. Моделирование основных структур и процессов лингвистики текста на материале ограниченного корпуса текстов

Выводы к гл.

Рекомендованный список диссертаций по специальности «Теория языка», 10.02.19 шифр ВАК

Введение диссертации (часть автореферата) на тему «Моделирование порождающих семантико-синтаксических структур в языках различного грамматического строя»

В диссертационной работе сделана попытка обобщить определенный опыт в области построения моделей связи семантики естественного языка, представляемой в терминах глубинной структуры, и системы формообразования, описанной в грамматике нормативного типа, так, чтобы модель обладала свойством универсальности по отношению к языковой типологии. Такая программно-целевая установка определила необходимость рассмотрения на начальном этапе работы общей проблематики теории языка в поиске тех формулировок основных концепций, которые позволили бы выдержать разделение контенсивного и функционального аспектов содержания языковых конструкций на всех уровнях языкового отображения. Смешение этих аспектов выглядит совершенно неизбежным в концепциях классической парадигмы: влияние постулата произвольности языкового знака и постулата коммуникативной направленности речевого акта сказывается в том, что специфика выражения не объясняется из трансформаций - напротив, сами они формулируются, исходя из этой наблюдаемой специфики. Примером может быть сопоставительный анализ номинативной и эргативной конструкций предложения, при котором наблюдаемое различие в поверхностном уровне последовательно транслируется в глубинные репрезентации семантики и в порождающие механизмы вывода на их основе тех же поверхностных структур. Последние оказываются, действительно, моделируемыми, но унификация двух типологий не достигается. Возможность таковой обнаруживается в опоре на известные концепции Т.П. Ломтева, Н. Хомского, А. Вежбицкой и И.А. Мельчука, в которых используется моделирование семантики фразы множеством элементарных предикаций. Такой набор предикаций свободен от формы поверхностной структуры, так как трансформации описываются не в терминах значений, а в некоторых, свободных от значений, но обязательных для языкового механизма, понятиях. Но как раз в роли механизма язык обладает таким обязательным свойством, как линейность, одномерность его образований; следовательно, индуктивные универсалии в порядке значимых компонент, рассмотренные в свое время Дж. Гринбергом в качестве важнейшего комплекса фактов для лингвистической теории, должны быть руководящим материалом в построении модели предположенного типа. В свою очередь, этот вывод помогает избегнуть неадекватной по отношению к естественному языку логизации - исходные элементарные предикации являются таковыми только в анализе, будучи по образованию констатациями совместного наличия, называниями комплексов черт языковой ситуации. Линейность формы выражения ведет к необходимости упорядочивания монем поверхностной структуры в результирующей цепочке. Предположением модели является условие повторяемости правил относительного упорядочения на основе наследования выбранного в начальном уровне принципа выбора двух позиций бинома характеризации, являющегося ядром как атрибутивной, так и предикативной группы, г Встраивание третьей компоненты, в частности, объекта в предикативной группе, ведет к конфликту приоритетов, но не на основе значений, а только в силу ограничений линейной структуры. Конфликт разрешается добавлением новых значимых элементов, осмыслясмых в описании как контенсивные; но унифицирующая установка модели помогает предположить в них исходные диахронически экстенсивные ситуационные признаки актантов. Подтверждение этой гипотезы достигается сопоставлением моделей синтаксических структур языков адыгской и индоевропейской семей с привлечением данных диахронии египетского языка.

В недавнем прошлом лингвист-теоретик вынужден был ограничиваться тщательным анализом языкового материала, не имея средств непосредственного наблюдения динамики глубинного уровня. Но теперь теоретическая лингвистика может обратиться к инструментальным средствам прикладной лингвистики, в частности к имитационному моделированию на базе компьютерных технологий и материалов корпусов текстов. При этом принципиальной основой в описанном выше круге проблем может быть принцип становления морфологических структур в результате закрепления синтаксических групп, эксплицитную формулировку которого дал, например, выдающийся теоретик и историк языка П.С. Кузнецов [55; 56]. Предполагая подобие динамики слов в корпусе динамике элементов смысла в индивидуальной речи, удается построить модельное представление динамики элементов смысла по отношению к выполнению условия линейности и стохастически определяемой организованности.

Актуальность работы. Бурное развитие прикладной и компьютерной лингвистики в наши дни является уже общеизвестным фактом: достаточно взглянуть в программы обязательных учебных курсов студентов специальностей, связанных с обработкой информации, управлением, принятием решений, построением экспертных систем и т.п. В методической практике этих курсов преподавателю приходится иметь дело в первую очередь не столько с традиционным предметом классической лингвистической теории, сколько с непосредственной данностью объекта новой технологии - корпуса текстов. Этот объект легко становится предметом формального описания, представления и обработки в системах, располагающих достаточными техническими возможностями для того, чтобы корпус текстов рассматривать в качестве популяции его составляющих -текстов, фраз, словосочетаний, словоформ и т.д. Популяционный подход охватывает гораздо больший спектр явлений языковой структуры, чем традиционная лингвостатистика — на материале своего объекта, то есть корпуса текстов, данный подход дает возможность полностью включить в наблюдение динамику наблюдаемой структуры. Сегодняшний уровень технической вооруженности не только научной лаборатории, но и учебной аудитории вполне позволяют применить соответствующий подход в исследовании и практических разработках в области компьютерной лингвистики. Количество основополагающих работ, посвященных этой теме, на сегодняшний день уже достаточно велико; упомянем прежде всего обзорную работу «Современная американская лингвистика: фундаментальные направления» [113], монографию А.Е. Кибрика [46], учебники А.Н. Баранова [7], В.А. Плунгяна [90], Р.К.Потаповой [92]. В опоре на методологические и теоретические концепции этой линии развития современной теории языка вполне возможно рассчитывать на научную состоятельность предпринимаемой здесь попытки решения некоторой частной задачи.

Особо следует отметить актуальность сформулированных выше проблем в региональных условиях Северного Кавказа, с его общеизвестным богатством разноязыковых и разносистемных устных и письменных традиций и средств внутри- и межкультурной коммуникации. Контактные и ареальные тенденции в диахронии, понимание которых существенно для адекватной реконструкции исторических грамматик языков региона, находят естественное представление в рамках предлагаемых моделей. Научная новизна работы заключается в том, что:

1. Систематически на основе строгих формальных посылок рассмотрен структурный аспект проблемы описания и моделирования в области теоретических проблем типологической специфики языковых систем с помощью инструментальных средств прикладной лингвистики.

2. Предложены новые системы формальных грамматик для конкретного языкового материала языков абхазо-адыгской группы, ранее еще не бывших объектом изучения в рамках подобных систем.

3. Средствами моделирования решена проблема интерпретации различения типологических структур языков при единстве смысла; в частности, теория эргативной конструкции в адыгских языках представлена в виде эксплицитной порождающей схемы, основанной на одном порождающем правиле, в отличие от традиционного описательного варианта, где наличие двух независимых правил необходимо.

4. Сформулированы принципы соответствий, позволяющие использовать материал типологического сопоставления различных языковых систем в качестве модели диахронического сравнения этапов развития одной и той же либо родственных систем. В частности, проблема эргативного либо активного строя праиндоевропейского языка (по данным реконструкции) получает новую трактовку и модельное разрешение: на основе уравнивания функциональных значений в схемах порождающих глубинных семантико-синтаксических структур диахронически снимается различие морфемы *-т в роли показателя субъекта среднего рода и в роли объекта прямопереходного действия.

5. В экспериментальной части работы на материале представительных корпусов текстов показана выполнимость выдвинутых предпосылок, служащих методологической основой формальных постулатов, введенных в качестве аксиоматического базиса модели.

Объектом диссертационного исследования, таким образом, явились компоненты структуры смысла и структуры содержания высказывания в их инвариантном относительно языковой системы представлении, а также системы соответствий между специфическими для сопоставляемых языков реализациями этих представлений.

Предметом исследования явилась модель универсализирующей системы соответствий в терминах языковой прагматики, прослеживаемая на материале корпусов текстов языков различного строя и взаимодействие семантико-синтаксических структур различных типов в этом материале как в синхроническом аспекте - в тексте, так и в диахронии - в типологических системах различного строя по данным реконструкции.

Цель диссертационной работы. Цель настоящей работы состоит в формулировке основных положений модели порождающего типа, дающей возможность унифицированного описания порождения определенных структур поверхностного уровня фразы в различных системах языковой типологии на базе единой семантико-прагматической глубинной структуры. Для получения достоверного и адекватного предмету исследования первичного материала потребовалось прежде всего исследование стохастической динамики составляющих корпусов текстов средствами современной компьютерной и прикладной лингвистики и ее математического обеспечения в аспекте основных предпосылок конструируемой модели. Эта подцель определила первую задачу работы - формализацию описания и преобразований структур данных, получаемых в качестве первичного материала корпусной лингвистики — массивов текстов. Наблюдаемая в такой модели динамика объектов фиксируется в терминах формальной системы, которая, в свою очередь, дает возможность формулировки определенных гипотез, следствия из которых могут быть проверены в дальнейшей обработке исследуемого корпуса текстов. Рассмотрение таких гипотез с точки зрения их интерпретируемости в терминах традиционной лингвистики является следующей задачей исследования в связи с тем, как была в свое время определена профессором А.Н. Савченко (РГУ) исходная постановка научной проблемы, в контексте решения которой проводились работы, положенные в основу диссертации. Он предположил, что типологический анализ двух различных систем грамматического строя — эргативной в абхазо-адыгских языках и номинативной в языках индоевропейской семьи -обнаружит единую систему глубинных характеристик структурирования линейной последовательности речевых единиц, вариации которой в связи со значением определенного «скрытого» параметра и дают различия наблюдаемого синтаксического аппарата. Естественной средой для типологического сравнения является узус языка, то есть практика речи; но фиксированная речь - корпус текстов - не может быть корректно обработана по отношению к так сформулированной задаче в опоре на описательную грамматику, индивидуализирующую язык. Фрейм типологического сопоставления обнаруживается только при рассмотрении массовой проблемы, которой в лингвистике является общая задача передачи инварианта ситуационно-обусловленного смысла сообщения при варьировании используемой типологии языка. Переход к массовой проблеме и означает принятие популяционной трактовки данных наблюдения. Таким образом, исходная теоретическая задача конкретной области языкознания приводит к необходимости разработки средств модельного представления ее объектов и процессов для применимости соответствующего инструментария прикладной лингвистики, вооруженной современными средствами информатики и статистики.

Итак, достижение поставленной цели предполагает решение определенных частных задач. В их числе:

1. Сформулировать систему основных постулатов модели глубинной семантической структуры языка, лежащей в основе всякой наблюдаемой языковой формы.

2. Построить интерпретирующий морфизм - отображение постулированной глубинной структуры семантики языка в синтаксическую структуру поверхностного уровня языка, регулярное по отношению к возможным вариациям правил упорядочения промежуточных результатов, что позволяет охватить единым алгоритмом различные языковые типологии и задать их в виде параметров отображения.

3. Построить формальную грамматику, описывающую фрагмент порождающей грамматики адыгских языков: формообразование глагола в области личного согласования его с другими членами предложения, а также интерпретировать с помощью этой системы порождающих выводов другие грамматические конструкции так, чтобы в результате получить модельную верификацию положений, сформулированных в п. 2 выше.

4. Построить типологический морфизм - отображение, связывающее интерпретированные в п.З на уровне глубинных структур схемы адыгской языковой системы и наблюдаемые (поверхностные) структуры индоевропейского синтаксиса по данным реконструкции.

5. Продолжить (расширить) типологический морфизм п. 4 на материале подсистемы среднеегипетского синтаксиса предложных конструкций, переходящей в диахронии в подсистему префиксального словоизменения (в коптском языке).

6. Проиллюстрировать применимость модельных концепций в достаточно широкой области, для чего дать обзор возможных приложений ее в виде дальнейшего расширения типологического морфизма п. 5 на данные аустронезийских языков.

Методы " исследования. Для моделирования объекта исследования применялись концепты теории формальных грамматик, а для моделирования его поведения как популяции - методы стохастического анализа. Конкретные значения тех параметров, которые оказались введенными в качестве единиц описания, были получены в экспериментах с образцами корпусов текстов. Для этих экспериментов использовалось программное обеспечение известных пакетов «MathLab 6.0», «STATISTICA 6.0» и «Maple 7». Все подготовительные операции с массивами текстов производились с помощью оперативного набора служебных программ, составлявшихся автором работы применительно к используемым данным в среде системы баз данных «MAPINFO». С помощью этих инструментальных средств решались следующие задачи: a. вычисление статистических характеристик составляющих корпуса текстов; b. кластеризация составляющих на основе вычисленных значений параметров; c. моделирование языковой динамики на основе анализа последовательности кластеров в тексте как марковской цепи; d. моделирование формообразования и морфогенеза посредством рассмотрения относительных величин переходных вероятностей марковской цепи и экстраполяции обнаруживаемых тенденций. Теоретико-методологической основой диссертационного исследования явились положения сравнительно-исторической грамматики в их обобщении применительно к сопоставительному изучению языков различного строя, как они развивались в трудах школы проф. А.Н. Савченко, теория логической структуры фразы и смысловой структуры предложения, созданная профессором РГУ П. В. Чесноковым, типологические и теоретико-грамматические концепции И.А. Мельчука и А.Е. Кибрика, теория структуры и организации текста, начало которой положили труды проф. Вяч. В с. Иванова, и разрабатываемая в работах проф. К.Э. Штайн и сотрудников кафедр русского языка и общего и славяно-русского языкознания СГУ. Достоверность и обоснованность результатов. Для исследований был использован материал аутентичных корпусов авторских текстов на различных языках, подготовленных в независимых авторитетных организациях - издательствах и центрах электронных публикаций. В качестве основных были использованы корпусы текстов поэта, члена группы ОБЭРИУ А.И. Введенского (русский язык, объем около 350 Кб); Ш. Бодлера, «Les Fleur du Mal» («Цветы зла», французский язык, около 170 Кб); JT. Кэрролла: стихи из книги «Сильвия и Бруно» и книги «Алиса в Стране чудес» и «Алиса в Зазеркалье» (английский язык; а также переводы на русский язык Н. Демуровой и В. Набокова, в целом около 550 Кб); P.M. Рильке, «Сонеты к Орфею» (немецкий язык, около 120 Кб); К. Мхце, Сочинения (абазинский язык, около 600 Кб); У. Шекспира: «Сонеты» (английский язык, около 100 Кб).

Статистические процедуры и процедуры моделирования, применяющиеся в работе, входят в комплексы программ научного назначения, вошедших в мировую практику: универсальный математический пакет «MathLab» (использовалась версия 6.0), пакет прикладного статистического анализа «STATISTICA» (версия 6.0), средства символьной алгебры и графики математического пакета «Maple» (версия 7), и средства работы с данными системы баз данных «MAPINFO» (версия 5).

Конкретные результаты расчетов процедур стохастического анализа и моделирования сопровождаются нормативными характеристиками степени достоверности, предусмотренными в соответствующих программных средствах. Постулаты, образующие основу строящегося в работе модельного представления, обосновываются результативностью модели в решении сформулированных выше целей и задач ее разработки.

На защиту выносятся следующие основные положения:

1. Глубинной семантико-синтаксической структурой является частичный порядок множества элементарных номинаций, связанных в парные комплексы локальной — глобальной составляющей так, что глобальная составляющая оказывается локальной на следующем уровне включений.

2. Языковое отображение смысла в поверхностную структуру рекурсивно независимо от языковой типологии: если окрестностная структура подцепочки текста заданного языка, переданная в категориальных единицах одного уровня, гомоморфна окрестностной структуре другой подцепочки, возможно представленной в категориальных единицах другого уровня, то вычисляющие эти цепочки программы в модели грамматики представимы графами, изоморфными одному и тому же графу.

3. Формальная грамматика, описывающая морфологию спряжения адыгского глагола в области личного согласования и основообразования, задается одной аксиомой и одним правилом вывода:

Лок — Дет0 — Дет(А) — Пред (аксиома)

Дет0-> Дет0 — Дет(А) (правило вывода)

Наполнение позиций в этих схемах происходит подстановкой элементарных единиц из конечного множества морфем, известных из описательной грамматики адыгских языков, которые в контексте предлагаемой модели получают новые спектры значений.

4. Схема (модель) эволюции глубинных семантико-синтаксических структур в диахронии, которая для случая сопоставления адыгских и египетских форм имеет вид

Субъект М* Объект Р* ИмяДействия => Субъект а Объект р Глагол.

5. Переформулировка схем пп. 3 и 4 применительно к фактам сравнительной грамматики индоевропейских языков (по данным реконструкции) позволяет утверждать действие той же модели синтаксически обусловленного закрепления соположенных единиц в составе переосмысляемой словоформы; в этом случае различение степени удаленности в алломорфах единой основной семантики в позиции Р* (см. схему выше), как это наблюдается в адыгских формах с 3-им лицом косвенного объекта, привело к внешней омонимии конструкций с именами «неактивного» класса в позиции субъекта и конструкций с прямым объектом.

Практическое применение результаты работы находят в дальнейшем развитии методик описания (с помощью порождающих грамматик предложенного типа) оригинальных и специфических конструкций разносистемных языков, что позволяет установить новые связи и факты, не обнаруживаемые без их использования. Реальное поле приложений в этой области действительно весьма обширно ввиду возросшего во всем мире с развитием компьютерной лингвистики интереса к конкретным особенностям типологии отдельных языков с точки зрения универсализирующих принципов интерпретации. Отметим, что и факты хорошо изученных и описанных языков, таких как греческий и латинский, получают новую интерпретацию в таком аспекте. Параллели классических и новых младописьменных языков в области глубинных порождающих структур имеют большое значение в практической методике преподавания лингвистических курсов как прикладной, так и традиционной тематики. Реализация результатов. Методические установки и формальные средства описания и моделирования, развиваемые в работе, применялись в учебных и научных проектах, выполняемых на переводческом факультете СК ГТУ как автором работы, так и студентами, работающими под его руководством; результаты этих работ были предметом публикаций в сборниках материалов ежегодных региональных научных конференций профессорско-преподавательского состава, студентов и аспирантов СК ГТУ в 2001-2004 гг., в «Вестнике С К ГТУ», № 1 (7) за 2003 г.

Апробация работы. Результаты работы докладывались в форме докладов и выступлений на международных конференциях в Институте языкознания АН СССР в 1977 г., в Институте языка и истории АН Абхазской АССР в 1977 г., в Пятигорском лингвистическом университете в 1998 г., на международных конференции в Майкопе, Нальчике, Черкесске в 1997-1998 гг., в Ростове-на-Дону, в СГУ в 2003 г., на ежегодных региональных научных конференциях в СК ГТУ в 1999-2004 гг.

Публикации. Методика и результаты диссертации составили предмет 10 статей в сборниках научных трудов и 10 тезисов выступлений на научных конференциях.

Структура и объем диссертации. Работа состоит из введения, трёх глав и заключения. Список литературы включает 154 названия.

Похожие диссертационные работы по специальности «Теория языка», 10.02.19 шифр ВАК

Заключение диссертации по теме «Теория языка», Силантьев, Аркадий Николаевич

Выводы к главе 3.

Третья глава диссертационной работы посвящена дальнейшему развитию модельных концепций и выяснению перспектив применения разработанного в ней подхода к вопросам типологии в рамках общей теории языка.

В первом параграфе третьей главы подробно рассмотрен фактический материал нового для отечественной науки содержания -описательная грамматика языка киривина (Ктм?та), относящегося к аустронезийской семье и распространенного на островах Тробриана, входящих в состав Республики Папуа-Новая Гвинея. С точки зрения типологии слова это язык агглютинативный; первый исследователь его, знаменитый польский этнолог Бронислав Малиновский, пишет об этом так: «различия в формах имен и глаголов выражаются просто посредством соответственно значащих частиц. Подлинная трудность этого языка не в сложности грамматического аппарата, но скорее как раз в чрезвычайной простоте его». Это последнее замечание объясняется фактом исключительно устного бытования языка, когда большая, если не большая, часть семантики фразы определяется через ее прагматику (контекст). Ввиду этого структура киривинского языка является хорошей иллюстрацией применимости основных положений модельного подхода, развитого выше. Так, в области морфологии глагола в киривинском языке формообразование лиц происходит префиксально, а множественное число отмечается суффиксом, что сразу делает эту систему важной сопоставительной единицей при изучении, например, абхазо-адыгских языков. С другой стороны, глагольный префикс Ь- / Ьа- / Ьи- является модификатором, вносящим значение несовершенности действия, и, возможно, сравним с суффиксальными показателями инфекта в индоевропейских языках (напр., в латинском). К выводу о близости киривинской типологии с индоевропейской приходит и современный исследователь этого языка Т. Щербовский. В то же время только применение модельного подхода, развиваемого в диссертации, позволяет провести комплексное сопоставление многофакторного характера.

Во втором параграфе третьей главы диссертации рассмотрены задачи включения методов и результатов диссертации в парадигму современной компьютерной лингвистики, в первую очередь - корпусной лингвистики (или лингвистики корпусов текстов, Corpus Linguistes). После обзора основных положений этой области на материале актуальной научной литературы в работе впервые в качестве меры различия двух индивидуальных текстов одного и того же корпуса введена величина d(A,B) = 0.5*[N(P(A))+N(P(B))J/[(N(A)+N(B))-N(U(A,B)J, где А, В — два текста пары, взятой для сравнения, N(S) - число элементов в некотором множестве S, U(S1, S2) — теоретико-множественное пересечение множеств S1 и S2, а символ Р(Т) означает множество слов, принадлежащих тексту Т, но не входящих больше ни в какой другой текст рассматриваемого корпуса (т. н. hapax legomena). Эта мера увязана по конструкции с основными комбинаторными определениями первой главы работы и позволяет сочетать методы моделирования второй главы, ориентированные на задачи теоретической лингвистики в традиционной постановке, с новой парадигмой компьютерной и корпусной лингвистики. Соответствующей обработке в ходе выполнения практических и экспериментальных разделов исследования были подвергнуты несколько корпусов авторских текстов на различных языках. В третьей главе диссертации приведены данные для двух из них - сборника сонетов У.Шекспира (154 текста) и сборника «Сонеты к Орфею» Р.М.Рильке (55 текстов).

На заключительном этапе работы по описываемой методике был применен специальный прием кластеризации, выбор которого мотивирован соображениями семантического плана. Если линейная мера различий d(*, *) связана с лексическим составом текста, то ее квадрат связан с количеством сочетании лексем, что может быть принято в качестве «внешней», чисто количественной меры потенциала текста в образовании сложных понятий.

Значит, площадь фигуры, образуемой несколькими текстами корпуса, явится мерой их совместного концептообразующего потенциала. Таким образом, прослеживание эволюции семантических структур в корпусе может быть опосредовано процедурой кластеризации, начинающейся с минимума площади, образованной тремя текстами, поскольку три - наименьшее число вершин в прямолинейной фигуре, обладающей площадью. Затем последовательно к получаемой на каждом шаге цепочке присоединяются следующие тройки, каждый раз минимальной возможной площади.

Поскольку, как было отмечено выше, пространство, задаваемое нашей мерой различий, может быть искривлено, то есть неравенство треугольника в нем может не выполняться, то намечаемый алгоритм должен быть дополнен промежуточным шагом предварительной минимизации периметра фигуры, образуемой тремя следующими представителями корпуса. Это обеспечивает использование на каждом шаге только ограниченной окрестности расширения подразумеваемой семантики контекста. В эксперименте с описанными корпусами текстов оказалось, что полученные меры различий обладают свойствами почти полноценного расстояния: только девять троек из общего числа их 51 на пути кластеризации по описанному алгоритму для сонетов Шекспира, и семь троек из общего числа их 18 для «Сонетов к Орфею» оказываются «закрученными» в семантическом пространстве. Несомненно, этот эмпирический факт связан с реальной семантической полноценностью сонетов и должен рассматриваться как индуктивное обоснование практической значимости предложенных методик.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.