Метаязыки формального описания семантических структур.
Семантические метаязыки различаются:
по объекту, который они описывают (морфема, лексема, словосочетание, предложение, текст в целом).
по аспекту языковой структуры, который они отражают: (парадигматический аспект
синтагматический аспект)
Сходимость МЯ – возможность переводить с одного МЯ на другой.
По описываемому объекту:
- значение морфем МЯ
МЯ компонентного анализа (Найда, Апресян, Катс)
МЯ пресуппазиционного анализа (прототипический анализ): если высказывание подвергнуть отрицанию, то отрицается только имплицитно выраженная часть, то, что не отрицается – ассерция
- значение лексем исследуется
в синтагматичсеком аспекте – сочетаемость лексем:
теория семантической валентности, понятие модели управления (Апресян)
в парадигматическом аспекте:
глубинные падежи (агенс, интсрументалис …), падежная рамка Филлмора
- значение словосочетаний исследуется
в парадигматическом аспекте при помощи тех же МЯ описания, что и лексемы,
в синтагматическом плане:
язык лексических параметров и функций (Апресян), понятие лекс. параметра связано с понятием устойчивой сочетаемости слов в словосочетании
- значение предложения
в парадигматическом аспекте:
семантическая сеть (Скрэгг: “Семантическая сеть как модель памяти”)
язык исчисления предикатов (Дж. Лакофф “Постулаты речевого общения”, импликация, пресуппозиция, пропозиция, условия искренности. условия мотивированности)
- значение текста в целом
в парадигматическом аспекте используются такие макроструктуры, как сценарии. фреймы, планы, сцены,
фрейм – базовая структура представления знаний
сценарий динамический – набор фреймов, развертывающийся во времени.
семантическая сеть ()
Чейф: – теория организации памяти
три вида памяти:
поверхностная (surface)
кратковременная (shallow)
долговременная (deep)
иерархия событий -> иерархия событий различной личностной значимости
личностная зависимость
понятие текущего сознания (consciousness)
язык концептуальных зависимостей (Шенк)
язык шаблонов (templates, Уилкс:)
- процессы
понимания (Шенк)
вербализации (Маккьюин)
Роджер Шенк: знания не могут быть истолкованы в лингвистических терминах -> язык концептуальных зависимостей: P-Trans (физическое перемещение), M-Trans (интеллектуальное перемещение).
Шенком была постулирована независимость языкового представления от ЕЯ, тем не менее язык КЗ оказался привязан к поверхностному синтаксису английского языка. Каждое высказывание запускает цепочку концептуальных выводов (inferences), позволяющих правильно понимать ситуацию (Мила была голодна, она взяла путеводитель Митчелина).
Модель SAM (Script Applying Mechanism) является компьютерной программой, которая позволяет понимать связность текста за счет применения сценариев:
POLITICS (ведет диалог, моделирует политическую идеологию)
PAM -> TALE-SPIN – порождение сказок
FRUMP – машинное реферирование сообщений на нескольких языках, чтение , опирающееся на понятие интереса (Integral Partial Parser)
Категории, встречающиеся у Шенка:
интерес
объяснение
память (организация концептуальной памяти)
ожидание
понимание движимого ошибками
Уилкс, “Анализ предложений английского языка”: вводит единую форму представления – шаблон (template), интуитивным соответствием которого можно считать базисную форму представления “агенс – действие – объект. Шаблоны строятся из более мелких блоков – формул, соответствующих толкованиям отдельных лексем. Для того, чтобы построить полное сем. представление текста (сем. блок), шаблоны объединяются с помощью структур более высокого уровня – надшаблонов (paraplates) и правил вывода умозаключений;
каждая из готовых структур построена на базе 80 атомарных сем. элементов, а также функций и предикатов, задаваемых на этом множестве.
система на LISPe, переводит тексты с англ. на фр.
для разрешения неоднозначности используется цепь умозаключений
нет синтаксического анализа в обычном понимании, сразу переходит к сем. представлениям; не содержит в явном виде никакой синт. информации, только формула (Ф), которая имеет вид ДЗ; главным считается самый правый элемент Ф, который задает фундаментальную категорию для всей Ф.
содержит глубинные падежные элементы
большая гибкость при описании смысла, чем у метода Фодора и Катса, в которых нет глубинных падежных элементов
шаблоны имеют вид сети, состоящей из Ф
шаблон состоит из 3 узлов: агенс, действие. объект.
- Гипертекстовые системы
Гипертекст – это текст. смысловые элементы которого могут читаться в разной последовательности.
Последовательность чтения – произвольная. Между текстовыми фрагментами указаны разрешенные переходы. Как правило, от одного фрагмента можно перейти к нескольким другим. Читать можно с любого элемента в разных направлениях. Компьютеры позволяют мгновенно переходить от одного фрагмента текста к другому, что позволяет читать нелинейные так же легко, как линейные.
Гипертекст – компьютаризованный нелинейный текст. Нельсон и Энгельбарт впервые реализовали ГТ в конце 60 гг.
Особенности ГТ по сравнению с традиционными нелинейными текстами (текст с комментариями, ссылками, энциклопедия):
- явная выраженность сетевой структуры: узлы (текстовые фрагменты) и связи (возможность перехода от одного ТФ к другому -> навигация). Связь может быть однонаправленной от фрагмента к комментарию или двунаправленной между двумя фрагментами. Связь может носить иерархический характер – от общего к целому.
Пользовательский интерфейс:
переход – не более двух клавиш
пользователь должен иметь средства ориентации: При каждом узле дается оглавление – локальная ориентация. Глобальная ориентация – наглядное изображение структуры гипертекстов ой сети, в которой помечается путь, пройденный пользователем
многооконная система позволяет видеть одновременно несколько ФТ на экране.
- открытость гипертекста (для включения новых ФТ, читатель может выступать соавтором)
Пример ГТ: изобразительная и звуковая система Гипермедиа (комплексное использование информации разной природы, синтез разных искусств)
Динамический ГТ постоянно дополняется новыми текстовыми фрагментами (необходимо находить связи для поступающих извне ФТ)
ГТ – сама форма организации материала и технология, без которой невозможна его организация. Гт – накопление информации в БД, доступ к данным – через запросы. связь важна для пользователя, поэтому в БД ГТ системы нет заранее установленных связей. Выдача информации – воспроизведение фрагментов сетей, сформированных к этому моменту в БД. выдаются отд. узлы и участки сети в графической форме вместе с маршрутами движения. В ГТ сети можно легко отражать идеи участников проекта, для дальнейшего изучения их в интерактивном режиме сразу несколькими участниками.
4 вида ГТС (обзор Конилина):
- библиотечные макросистемы (шире, чем поиск литературы) XANADU, Нельсон система хранения и актуализации информации), TEXTNET (принцип динамического упорядочения, перечень узлов)
- средства исследования проблем: IBIS, Риштель (аспекты, позиции, аргументы); ; JOG (изучение справочной энциклопедической литературы, выведение страниц)
- системы для просмотра БД (подобны библиотечным. но меньше, служат для получения справочных данных) Browsing Systems, WE среда нужна для описания системы просмотра, легкость доступа, добавление новой информации не разрешено
- системы широкого назначения (экспериментирование в разл. направлениях): INTERMEDIA фирмы XEROX