Формальные модели синтаксической структуры предложения.
Динамические и статистические модели
- Дескриптивная модель Задача – описание структуры языка
нормирование (определение всех правил синтаксических структур)
исчисление
1) Грамматика зависимостей (европейская традиция, близка к НС, один из авторов – Гладкий) – указание для каждого слова тех слов, которые ему непосредственно подчинены.
Дерево синтаксических зависимостей есть дерево, множество узлов которого служит множеством вхождений слов в предложение. Деревом называется множество, между элементами которого – узлами – установлено бинарное отношение – отношение подчинения и графически изображают стрелками. идущими от подчиняющих узлов к подчиненным,- такое, что:
среди узлов имеется один – корень – неподчиненный никакому другому узлу
каждый из остальных узлов подчинен точно одному узлу
нельзя, отправившись из к.л. узла вдоль стрелок вернутся в тот же узел.
ДЗ (дерево зависимостей) обычно используется в описаниях языков со свободным порядком слов (в частности, русского). Стрелки ДЗ обычно помечаются символами синтаксических отношений (предикативное, определительное и т.п.).
2) Метод НС составляющие – Для описания синтаксической структуры предложения выделяются группы слов, функционирующие как отдельные синт. единицы – составляющие.
Система составляющих – это множество отрезков предложения которое обладает тем свойством, что каждые два входящих в него отрезка либо не пересекаются либо один из них содержится в другом.
Одна из НС – ядро конструкции, остальные – маргинальные элементы.
При графическом изображении система составляющих тоже приобретает вид дерева (дерева непосредственных составляющих – ДНС).
ДНС используются преим. в описаниях языков с жестким порядком слов.
Составляющие обычно помечаются символами грамм. категорий (именная группа, группа переходного глагола и т.п.)
- Трансформационная грамматика (Харрис, 50-е гг.) (грамматика деревьев) служит не для порождения предложений, а для преобразования деревьев, интерпретируемых как деревья подчинения или деревья составляющих, например грамматика – система правил преобразования деревьев, интерпретируемых как “чистые” деревья подчинения предложений (без линейного порядка слов).
три уровня описания
1) правила НС
2) трансформационные правила
3) морфологические правила
Допущения:
синт. система может быть разбита на ряд подсистем, одна из которых – исходная (ядерная), остальные – производные. Ядерная Т – набор предложений (утвердительных, простых, с глаголом в изъяв. форме, активного залога, наст. времени.)
ядерное предложение описывает элементарные ситуации, а класс ЯП – все множество элем. ситуаций.
любой сложный синт. тип можно получить при применении упорядоченного набора обязательных и факультативных трансформаций к ядерному предложению.
Представление синт. структуры предложения – указание ядерного типа, лежащего в основе предложения и трансформаций, которые к нему применялись, а также их последовательности.
Метод явился основой порождающей грамматики Хомского.
- Порождающая грамматика Хомского, представляющая собой упорядоченную систему Г =(V,W,П,R), где V и W – непересекающиеся конечные множества – основное (терминальное) и вспомогательное (нетерминальное), П – элемент W, называемый начальным символом и R – конечное множество правил вида , где цепочки (конечные последовательности) из основных и вспомогательных символов. Множество тех цепочек из основных символов, которые выводимы в Г из ее начального символа, называют языком, порождаемым грамматикой Г и обозначают L(Г). Если все правила Г имеют вид , где – правый и левый контексты, то Г называется грамматикой составляющих или грамматикой непосредственно составляющих (ГНС). Чаще всего основные символы интерпретируются как слова, вспомогательные – как символы грамматических категорий, начальный символ – как символ категории “предложение”.
- Реляционная модель
- Аппликационная модель (Шаумяна?)
Доминационная грамматика, которая порождает множество цепочек, интерпретируемых обычно как предложения и вместе с их синтакс. структурами в виде ДЗ.
Грамматики Монтегю служат одновременно для описания синтакс. и семант. структуры предложения. В них используется сложный математико-логический аппарат (так называемая интенциональная логика).
- Экспертные системы и их архитектура. Функции основных компонентов.
Экспертная система – это компьютерная программа, которая моделирует рассуждение человека-эксперта в определенной области, используя для этого БЗ, содержащую факты и правила об этой области и некоторую процедуру логического вывода.
Разработка ЭС – сравнительно новое направление в системах ИИ; второе название – инженерия знаний (термин ввел в 1977 Фегенбаум), сформировалась в середине 70 гг.
Раньше была цепочка: аналитик – программист – оператор – пользователь; теперь пользователь может обращаться прямо к ЭВМ (либо только через инженера по знаниям).
Структура ЭС:
раньше:
входные данные программ |
теперь:
входные данные интерпретатор БЗ БЗ |
Обычные программы имеют фиксированную последовательность шагов, строго определенную программистом, ЭС пользуются нахождением удовлетворительного решения методом проб и ошибок.
ЭС решают трудно формализуемые задачи. не имеющие алгоритмического решения () медицина, геология, управление, юридические науки).
Попов: три причины появления ЭС:
ориентированы на решение задач в неформализованных областях
предназначены для пользователей, не имеющих спец. навыков программирования
ЭС решают задачи лучше, чем человек.
3 принципа разработки ЭС:
- мощность ЭС определяется мощностью БЗ и процедурами ее пополнения, т.о. компонент приобретения знаний важнее компонента логического вывода. (Раньше большее внимание уделялось лог. выводу).
- Знание. используемое ЭС, является в основном эвристическим, экспериментальным, поэтому используется коэффициент достоверности.
- ЭС реализуется в форме диалоговой системы.
ЭС должна обладать способностью приобретать знания.
2 источника приобретения знаний:
1) от эксперта
2) из текстов (не разработано)
ЭС решают практические задачи. а не экспериментальные; решения ЭС могут быть объяснены пользователю, т.е обладают свойством прозрачности, для этого существует специальный компонент – объяснительный.
Формальная основа ЭС: базовое понятие – правило продукции или формальные процедуры системы: правила вида условие -> действие если -> то (если была разлита горючая жидкостью то вызовите пожарных).
Термин продукция ввел Пост (1943)
Свойство продукции – всякая формальная система. оперирующая символами, может быть реализована одной из продукционных систем.
Архитектура ЭС
Пользователь ЭС
Общение на ЕЯ
|
Лигвитсический компонент анализа с синтеза входных сообщений | рабочая память
текущее состояние проведения экспертизы |
объяснительный компонент
|
|||
интерпретатор
|
||||||
компонент приобретения знаний | ||||||
БЗ
|
БЗ имеет динамический характер, содержит факты и правила в форме продукций
интерпретатор (решатель) имеет дело с процедурами логического вывода, на основе имеющихся данных решает задачу
лингвистический процессор осуществляет диалог с пользователем
рабочая память хранит данные
компонент приобретения знаний – с его помощью знания извлекаются из эксперта или текста и заносятся в БЗ
объяснительный компонент отвечает на вопрос, почему принято данное решение и чем мотивирован выбор.
2 режима работы ЭС:
приобретение знаний: участвует эксперт и инженер по знаниям (посредник)ручные и автоматизированные методы (brainstorm)
режим решения задач: главный участник – пользователь, заинтересованный в результате.
Типы ЭС:
демонстрационные прототипы (56)
исследовательские (92)
действующие (12)
промышленные (4)
коммерческие (9)
Примеры ЭС
две старейшие ЭС:
DENDRAL (химическая тематика, определяет структуру хим. элементов)
MAXIMA (решение мат. задач)
Система FOBS
Санджай, Чадна и др., “Использование известных ситуаций (cases) для построения” ЭС MEDIA (выбор оптимального СМИ для маркетинга на материале Harvard Business School) на основе оболочки ADVISOR. Система задает вопросы и анализирует все факторы, связанные с продуктом (поведение покупателя, ориентация на конкретного покупателя, конъюнктура), рекомендует средство рекламы, перечисляет возможные альтернативы и аргументирует свой выбор.