Лексикография как прикладная дисциплина. Внутренняя и внешняя типология словарей.
Лексикография – прикладная лингвистическая дисциплина, занимающаяся практикой и теорией составления словарей.
Словарь – способ организации и представления знаний. Чем полнее и адекватнее в словаре представлены знания, тем лучше словарь выполняет свою функцию.
Лексикография как научная дисциплина носит комплексный характер, но определяющей чертой лексикографии является ее прикладная направленность. Все многообразие различных типов словарей (нормативные, учебные, переводные, терминологические, идеологические, этимологические … ) получает практическую ориентацию исходя из целевой установки словаря.
Лексикография разрабатывает оптимальные средства выявления и фиксации семантических фактов определенных практических целях. Главная проблема в разработке оптимальной стратегии новых словарей – проблема обоснованности словарей как с точки зрения их состава, так и в плане адекватности подаваемой в них информации. Лексикография в широком смысле охватывает все множество инвентарей языковых единиц с приписанной им информацией того или иного рода. Наиболее богата и сложна для отражения семантическая информация.
Лексикографическая деятельность распадается на ряд этапов:
- разработка системы требований, касающихся внешних параметров словаря (назначения, круга пользователей, инф. области …)
- разработка системы требований, касающихся внутренней параметров словаря (единиц описания, основных свойств метаязыка. объема, структуры, видов словарной информации …)
- формальная инвентаризация выбранных подъязыков (отбор текстов, расписывание контекстов, характеристика грамм. форм, составление предварительных словников …)
- экспериментальные исследования семантики описываемых единиц (дистрибутивный анализ текстов, тесты с носителями языка …)
- обобщение экспериментальных данных
- построение дефиниций на соответствующем метаязыке и их проверка в ходе новых экспериментов
- сбор и систематизация дополнительной информации о каждой языковой единице
- оформление словарных статей
- системный анализ и упорядочение словарных статей
- оформление словаря в целом, включая вспомогательные указатели.
Аспекты лексикографии:
историко-филологический – изучение истории словарей как части истории культуры общества
гносеологический (когнитивный) – изучение словарей как сокровищниц знаний. накопленных обществом
семантико-лексикологический – использование словарей для лексико-семантического описания языка
прикладной (самый важный) – прикладная лексикография направлена на совершенствование словарей с точки зрения тех или иных практических требований к словарям
Виды информации подаваемой в словаре определяют внутреннюю типологию словарей:
- Объекты описания:
1) формальные/ семантические
2) природа объектов (лекс.-семантический или морфо-семантический уровень; в парадигматическом или в синтагматическом аспекте)
3) статус объекта (является ли словарь нормативным или описательным)
4) хронологический период
5) по сфере общения (подъязык)
6) степень охвата языка
- Системные свойства
1) какая грамматическая информация дается об описываемых единицах?
2) какие стилистические пометы используются?
3) какой тип определения (дефиниции) дается?
4) включается ли экстралингвистическая информация?
5) в какой мере учитываются семантические отношения?
6) объясняется ли мотивированность описываемой единицы?
III. Актуализация в языковой жизни
1) указывается ли происхождение единиц?
2) указывается ли активность единицы в языковой жизни (частотность)?
3) показывается ли реализация единиц в контексте
- Прагматика пользователя
1) количество входов в словарь
2) каков порядок расположения единиц в словаре (по формальному или семантическому признаку?
3) имеются ли в словаре указатели?
4) даются ли металингвитсические сведения (история изучения, разные трактовки)?
- Связь с другими языками
1) производится ли генетическое сопоставление единиц и их значений с родственными языками?
2) производится ли типологическое сопоставление материала неродственных языков?
Цели словаря задают внешнюю (функциональную) типологию словарей:
Типы словарей | Цель |
учебные словари | обучение |
переводные словари | перевод |
нормативные словари | нормирование |
терминологические словари | систематизация, уточнение научных понятий |
Типология словарей по Ожегову:
большой (представляет совр. русский язык в широкой ист. перспективе)
средний (с детальной разработкой исторически оправданного стилистического многообразия лит. РЯ)
краткий (популярного типа, стремящийся к активной нормализации совр. лит. речи)
Типология словарей по Щербе:
словарь-справочник – словарь академического типа
энциклопедический – общий словарь
тезаурус – обычный толковый или переводной словарь
обычный толковый или переводной словарь – идеологический словарь
толковый словарь – переводной словарь
- Автоматизированные информационно-поисковые системы: их структуры, функции, критерии оценки. Информационные языки.
АИПС предназначены для инф. обслуживания пользователей информации в заданной тематической области.
2 основные задачи АИПС:
хранение информации
поиск и выдача информации
Из сведений о ТО. поступающих на хранение в систему формируется информационный массив (ИМ). От потребителя поступают запросы, и система ищет сведения в ИМ, Соответствующие данному запросу. Всякая поисковая операция в системе сводится к сравнению поступившего запроса с имеющимися в системе сведениями. в современных ИПС все это происходит автоматически. Для этого и запрос и сведения должны быть представлены на таком языке, который обладает смысловой однозначностью – ИПЯ.
Индексирование – перевод содержания текста, хранящегося в ИМ на ИПЯ. в результате индексирования образуется поисковый образ, у документа – ПОД, у запроса – ПОЗ.
Критерий смыслового соответствия – мера соответствия между содержанием запроса и документа, достаточная для признания данного документа релевантным данному запросу. Вводится совокупность признаков, на основании которых устанавливается степень необходимого и достаточного соответствия между поисковым предписанием и поисковым образом документа, выраженными на одном и том же ИПЯ.
Результатом поисковой операции является выборка релевантных ПОДов.
Абстрактная ИПС – некий логико-семантический аппарат, состоящий из ИПС, правил индексирования и критерия выдачи.
В зависимости от характера сведений и запроса различаются документальная и фактографическая ИПС. Фактографическая ИПС не хранит документы, а только факты. Документальная хранит документы. Но существует прием, позволяющий в процессе поиска определенного документа извлекать факт: В документальной системе хранится информация о содержании документа + документографическая информация (автор, год …)
выделение нужной пользователю информации осложняется двумя обстоятельствами:
несоответствие между формулировкой запроса и реальной информацией нужной потребителю
перевод запроса в ПОЗ
Мера соответствия документа информационной потребности называется пертенетностью.
Соответствие документа запросу называется релевантностью:
смысловая (соответствие запроса поисковому предписанию) – просто релевантность, зависит от ИПЯ (его семантической силы, глубины индексирования, совершенства логико-сем. аппарата)
формальная (соответствие документа поисковому предписанию)
ИПЯ – специализированный ИЯ, предназначенный для эксплицитной записи содержания документов и запросов в форме, удобной для автоматического поиска.
Классификация ИПЯ:
предкоординированные ИПЯ
присутствует заранее заданная классификационная схема |
посткоординируемые ИПЯ
отсутствует заранее заданная классификационная схема |
Типы классификаций
иерархическая
задает дерево знаний, например всей литературы по лингвистике |
алфавитно-предметная
например, телефонный справочник |
фасетная
опирается на разные аспекты описания, задается так называемая фасетная формула (Ж1 Ц2 Ф1), представляющая собой шаблон, рассматривается класс, аспект предмета |
Фасетная классификация: фильмы:
жанр | цвет | формат |
Ж1
Ж2 |
Ц1 цветной
Ц2 черно-белый |
Ф1 широкоформатный |
фасетная формула: Ж1 Ц2 Ф1
Общие недостатки предкоординированных ИПЯ:
не позволяют вести поиск по заранее непредусмотренному сочетанию признаков
все классификации имеют недостаточную глубину
процесс индексирования принципиально не автоматизирован, т. е ручное индексирование
Посткоординируемые ИПЯ:
семантические коды
в ЛЕ в явном виде заданы парадигматические отношения |
дескрипторы
оперируют монолитными СЕ, в основу положен принцип координированного индексирования, который выражается в том. что основная тема документа выражается в виде набора слов или СС, т. о документ помещается в n-мерное пространство |
|||||
Семантические коды Перри и Кента (США) м.б простыми и составными, простая ЛЕ – сем. множитель;
RX коды ручное индексирование |
грамматики мешочного типа
(теоретико-множественные грамматики) задаются отношением совместного вхождения в класс, ПОД составляется вручную, ПОД -перечень ключевых слов. |
позиционно-скобочные грамматики
сохранение всего исходного текста документа с явным указанием порядка следования, деления на абзацы, предложения:
|
сетевые грамматики
в явном виде задается смысл связи между элементами текста (Скрэгг) |
|||
ИПЯ с ПСГ:
индексирование без лексического контроля, до индексирования могут не иметь словаря, словарь формируется в результате индексирования.
индексирование с лексическим контролем – все словоформы приводятся к стандартному виду