Типы экспериментальных методов в лингвистике
Экспериментальные методы в лингвистике – это методы , позволяющие изучать факты языка в условиях. управляемых и контролируемых исследователем. Философской основой применения экспериментальных методов в лингвистике является тезис о единстве теоретического и эмпирического уровней познания.
В современной лингвистике термин “экспериментальный метод” не является четким; лингвисты часто говорят об эксперименте там, где имеет место наблюдение, прежде всего наблюдение над текстами (письменными и устными). Существенно. что текст как таковой, будучи данностью не может быть объектом ЭМ; именно поэтому ЭМ не применимы к изучению истории языка, особенностей стиля автора и т.п. в этих случаях следует говорить о наблюдении. Объектом ЭМ является человек – носитель языка, порождающий текст, воспринимающий тексты и выступающий как информант для исследователя. в лингвистическом эксперименте исследователь может иметь в качестве подобного объекта самого себя или других носителей языка; в первом случае следует говорить об интроспекции, во втором – об объективном эксперименте.
Экспериментальная работа с информантами (нередко в сочетании с наблюдением) непосредственно в среде носителей языка называется обычно полевой лингвистикой.
Историю применения ЭМ в лингвистике можно разделить на три периода:
- Активное освоение ЭМ в фонетике, акцент на сходстве ЭМ в лингвистике и точных науках (труды Богородицкого, Щербы, Матусевича)
- Осознание ЭМ в лингвистике как важнейшего способа получения данных о живом языке вообще , включая его морфологию. синтаксис, семантику, а также проблемы языковой нормы, языкового общения, патологий речевого развития и т.д. эта научная программа была впервые сформулирована Щербой (“О трояком аспекте языковых явлений и об эксперименте в языкознании”)
- Реализация указанной научной программы, и как следствие углублении методологических разработок (Апресян, Фрумкина). В социолингвистике и психолигвистике ЭМ занимают доминирующие место.
Последовательное применение ЭМ в исследовании языка и речевых процессов сделало необходимым использование статистических методов при планировании эксперимента и обработке результатов (лингв. статистика). существенно. что лигвист, изучающий речевое поведение человека, имеет дело с объектом, равным ему самому по сложности. В силу этого отношение исследователь – объект в лингвистике превращается в симметричное отношение между двумя исследователями: информант может иметь свою теорию об экспериментаторе и соответственно изменять свое поведение в процессе эксперимента, что может негативно повлиять на результаты Э. Особой сферой использования ЭМ являются машинные эксперименты, проверяющие адекватность формализованных действующих моделей языка.
Процесс Э:
общая задача
рабочая гипотеза
формальные выводы, изменения
новые гипотезы
Цель Э – проверка гипотез. Человек не должен знать целевую установку экспериментатора.
Типы экспериментов:
моделирующие эксперименты (в социолингвистике): порождается ряд гипотез, отбираются социальные параметры, которые варьируются
имитационные эксперименты (лабораторные) – имитация усеченной действительности
натурные эксперименты включают условия, позволяющие демонстрировать поведение, максимально похожее на реакцию в аналогичной естественной ситуации.
Типы методов (по количеству информантов):
индивидуальный
межгрупповой
многоуровневый, многофакторный
(Хофман) Экспериментальные методы в семантике:
ассоциативный эксперимент – испытуемому дается слово-стимул и предлагается реагировать на это слово первым пришедшим в голову словом или словосочетанием
метод семантического дифференциала (экспер. семантика) – один из методов построения субъективных сем. пространств ( градуированные оценочные шкалы)
метод классификации (в психолигвистике – испытуемым предлагается разбить материал на произвольное количество классов.)
эксперимент п членению денотативного континуума (Фрумкина: смысловые отношения в группе слов цветообозначений + Лабов “Структура денотативных значений” – сосуды – cup, bowl, glass -> размытость и взаимозависимость денотативных границ; модели, основанные на компонентном анализе, не объясняют вышеназваного свойства, вывод – более адекватна теория прототипов, которая только начинает применяться в семантике).
- Эволюция систем автоматизированного перевода.
1947 г. – Memorandum by Warren Weaver об автоматическом переводе
1954 г. – Джорджтаунский эксперимент (Массачусетс)
Типы систем:
системы машинного перевода (СМП)
системы человеко машинного перевода (АС)
ТБД
Три поколения СМП (условная классификация, Марчук не признавал деления на поколения):
I поколение:
содержали полный алгоритм морфологического анализа
имели имели алгоритм снтаксического анализа, но всегда одновариантный
синтез – блок морфологического синтеза, болк синтаксического синтеза
в словарной статье – только переводной эквивалент, остальная информация – в алгоритмах
работа только в пакетном режиме
II поколение (SYSTRAN, АМПАК, Georgetown System, ):
мощный блок синтаксическогоанализа и синтеза
многовариантный синтаксический анализ
увеличение числа и объема словарных статей: ПЭ + синтаксические модели управления и сочетаемости (информация об управлении должна находится в словаре, а не в алгоритме)
недостаточное внимание семантике ( нет сем. дефиниций, моделей упраления в терминах сем. классов)
работа и пакетном и в интерактивном режимах
III поколение (ЭТАП-1 (350 слов), ЭТАП-2 (4000 слов), модель “Смысл-текст”, Апресян):
широкое использование семантики на всех уровнях: в словаре, алгоритме
только исследовательские системы, нет ни одной промышленной
Марчук “Проблемы МП” – 3 периода, Слокум “Обзор разработок по МП”:
- 1946 – 1957
выдвинута концепция языка как кода
созданы первые машинные словаридля МП
разработана общая концепция МП (алгоритмы наализа и синтеза, рпограммное обеспечение)
опробованы первые СМП
повышенный интерес к проблеме, связанный с надеждами на возможность скоростного высококачественного перевода текстов любого типа, щедрое финансирование
- 1957 – 1967
доклад консультативного Комитета по автоматизированной обработке ЕЯ (ALPAC) при Национального Академии Наук США – доказана невозможность полностью автоматизированного высококачественного перевода -> свертывание разработок, сокращение финансирования текущих исследований (но не долгосрочных)
успешные попытки промышленной эксплуатации СМП
широкие теоретические исследования: возникла идея языка-посредника, методика контекстного анализа для рзрешения основных лигв. проблем.
- 1967 – настоящее время
возрождение интереса к МП
Люксембург, конференция “Преодоление языковых барьеров”
активная промышленная эксплуатация СМП
Развитие МП происходило согласно гегелевской триаде – тезис, антитезис, синтез.
СМП | АС | ТБД |
SYSTRAN (1070, автор -Peter Toma, 15 пром. пар языков, пакетный режим работы, язык посредник Interlingua, 200.000 – 300.000 )
АНРАП (ВЦП), СПРИНТ PC, ЭТАП-1 (Апресян, модель “Смысл-текст”, словарь -350 слов), ЭТАП-2, словарь -4000 слов |
EURODICAUTOM (1.200.000 заголовков)
LEXIS (1.500.000) SIEMENS (1.500.000)
|
TERMIUM (> 2 млн.)
|