Типы экспериментальных методов в лингвистике

 

Экспериментальные методы в лингвистикеэто методы , позволяющие изучать факты языка в условиях. управляемых и контролируемых исследователем. Философской основой применения экспериментальных методов в лингвистике является тезис о единстве теоретического и эмпирического уровней познания.

 

В современной лингвистике термин “экспериментальный метод” не является четким; лингвисты часто говорят об эксперименте там, где имеет место наблюдение, прежде всего наблюдение над текстами (письменными и устными).  Существенно. что текст как таковой, будучи данностью не может быть объектом ЭМ; именно поэтому ЭМ не применимы к изучению истории языка, особенностей стиля автора и т.п. в этих случаях следует говорить о наблюдении. Объектом ЭМ является человек – носитель языка, порождающий текст, воспринимающий тексты и выступающий как информант для исследователя. в лингвистическом эксперименте исследователь может иметь в качестве подобного объекта самого себя или других носителей языка; в первом случае следует говорить об интроспекции, во втором – об объективном эксперименте.

 

Экспериментальная работа с информантами (нередко в сочетании с наблюдением) непосредственно в среде носителей языка называется обычно полевой лингвистикой.

 

Историю применения ЭМ в лингвистике можно разделить на три периода:

 

  1. Активное освоение ЭМ в фонетике, акцент на сходстве ЭМ в лингвистике и точных науках (труды Богородицкого, Щербы, Матусевича)

 

  1. Осознание ЭМ в лингвистике как важнейшего способа получения данных о живом языке вообще , включая его морфологию. синтаксис, семантику, а также проблемы языковой нормы, языкового общения, патологий речевого развития и т.д. эта научная программа была впервые сформулирована Щербой (“О трояком аспекте языковых явлений и об эксперименте в языкознании”)

 

  1. Реализация указанной научной программы, и как следствие углублении методологических разработок (Апресян, Фрумкина). В социолингвистике и психолигвистике ЭМ занимают доминирующие место.

 

Последовательное применение ЭМ в исследовании языка и речевых процессов сделало необходимым использование статистических методов при планировании эксперимента и обработке результатов (лингв. статистика).  существенно. что лигвист, изучающий речевое поведение человека, имеет дело с объектом, равным ему самому по сложности.  В силу этого отношение исследователь – объект в лингвистике превращается в симметричное отношение между двумя исследователями: информант может иметь свою теорию об экспериментаторе и соответственно изменять свое поведение в процессе эксперимента, что может негативно повлиять на результаты Э.  Особой сферой использования ЭМ являются машинные эксперименты, проверяющие адекватность формализованных действующих моделей языка.

 

Процесс Э:

общая задача

рабочая гипотеза

формальные выводы, изменения

новые гипотезы

Цель Э – проверка гипотез. Человек не должен знать целевую установку экспериментатора.

 

Типы экспериментов:

моделирующие эксперименты (в социолингвистике): порождается ряд гипотез, отбираются социальные параметры, которые варьируются

имитационные эксперименты (лабораторные) – имитация усеченной действительности

натурные эксперименты включают условия, позволяющие демонстрировать поведение, максимально похожее на реакцию в аналогичной естественной ситуации.

 

Типы методов (по количеству информантов):

индивидуальный

межгрупповой

многоуровневый, многофакторный

 

(Хофман) Экспериментальные методы в семантике:

 

ассоциативный эксперимент – испытуемому дается слово-стимул и предлагается реагировать на это слово первым пришедшим в голову словом или словосочетанием

 

метод семантического дифференциала (экспер. семантика) – один из методов построения субъективных сем. пространств ( градуированные оценочные шкалы)

 

метод классификации (в психолигвистике – испытуемым предлагается разбить материал на произвольное количество классов.)

 

эксперимент п членению денотативного континуума (Фрумкина: смысловые отношения в группе слов цветообозначений + Лабов “Структура денотативных значений” – сосуды – cup, bowl, glass -> размытость и взаимозависимость денотативных границ; модели, основанные на компонентном анализе, не объясняют вышеназваного свойства, вывод – более адекватна теория прототипов, которая только начинает применяться в семантике).

 

  1. Эволюция систем автоматизированного перевода.

 

 

 

1947 г.   – Memorandum by Warren Weaver об автоматическом переводе

1954 г.   – Джорджтаунский эксперимент (Массачусетс)

Типы систем:

системы машинного перевода (СМП)

системы человеко машинного перевода (АС)

ТБД

 

Три поколения СМП (условная классификация, Марчук не признавал деления на поколения):

 

I поколение:

содержали полный алгоритм морфологического анализа

имели имели алгоритм снтаксического анализа, но всегда одновариантный

синтез – блок морфологического синтеза, болк синтаксического синтеза

в словарной статье – только переводной эквивалент, остальная информация – в алгоритмах

работа только в пакетном режиме

 

II поколение (SYSTRAN, АМПАК, Georgetown System, ):

мощный блок синтаксическогоанализа и синтеза

многовариантный синтаксический анализ

увеличение числа и объема словарных статей: ПЭ + синтаксические модели управления и сочетаемости (информация об управлении должна находится в словаре, а не в алгоритме)

недостаточное внимание семантике ( нет сем. дефиниций, моделей упраления в терминах сем. классов)

работа и пакетном и в интерактивном режимах

 

III поколение (ЭТАП-1 (350 слов), ЭТАП-2 (4000 слов), модель “Смысл-текст”, Апресян):

широкое использование семантики на всех уровнях: в словаре, алгоритме

только исследовательские системы, нет ни одной промышленной

 

Марчук “Проблемы МП” – 3 периода, Слокум “Обзор разработок по МП”:

  1. 1946 – 1957

выдвинута концепция языка как кода

созданы первые машинные словаридля МП

разработана общая концепция МП (алгоритмы наализа и синтеза, рпограммное обеспечение)

опробованы первые СМП

повышенный интерес к проблеме, связанный с надеждами на возможность скоростного высококачественного перевода текстов любого типа, щедрое финансирование

  1. 1957 – 1967

доклад консультативного Комитета по автоматизированной обработке ЕЯ (ALPAC) при Национального Академии Наук США – доказана невозможность полностью автоматизированного высококачественного перевода -> свертывание разработок, сокращение финансирования текущих исследований (но не долгосрочных)

успешные попытки промышленной эксплуатации СМП

широкие теоретические исследования: возникла идея языка-посредника, методика контекстного анализа для рзрешения основных лигв. проблем.

  1. 1967 – настоящее время

возрождение интереса к МП

Люксембург, конференция “Преодоление языковых барьеров”

активная промышленная эксплуатация СМП

 

Развитие МП происходило согласно гегелевской триаде – тезис, антитезис, синтез.

 

СМП АС ТБД
SYSTRAN (1070, автор -Peter Toma, 15 пром. пар языков, пакетный режим работы, язык посредник Interlingua, 200.000 – 300.000 )

 

АНРАП (ВЦП), СПРИНТ  PC, ЭТАП-1 (Апресян, модель “Смысл-текст”, словарь -350 слов), ЭТАП-2, словарь -4000 слов

EURODICAUTOM (1.200.000 заголовков)

LEXIS   (1.500.000)

SIEMENS  (1.500.000)

 

TERMIUM (> 2 млн.)

 

 

Join Us On Telegram @rubyskynews

Apply any time of year for Internships/ Scholarships