Loe raamatut: «Компьютерная лексикография»
Введение
Современная языковая ситуация, и в частности потребности записи человеческого знания в память компьютера, в огромной степени изменили лексический мир языка. Можно считать, что здесь уже сложилась и развивается целая лингвистическая наука.
Компьютерная техника широко проникает в традиционную сферу лексикографии, то есть, в составление словарей, заменяя собой традиционную ручную картотеку и привнося новые методы и возможности в веками устанавливавшуюся технологию.
В области компьютерной лексикографии выделяют две основных проблемы, тесно связанных друг с другом: создание словарей, предназначенных для человека, и использование в интеллектуальных системах специальных машинных словарей естественных языков. Роль словаря в таких системах огромна – начиная с распознавания лексических единиц на уровне ввода и морфологического анализа и заканчивая моделированием элементов понимания и мышления.
Таким образом, в методологических целях следует разграничить вычислительную (компьютерную) лексикографию как часть обычной лексикографии, занимающуюся составлением обычных, бумажных словарей для использования их человеком и вычислительную лексикографию как науку о машинных словарях естественных языков, используемых в памяти компьютера для решения задач, требующих искусственного интеллекта.
Возможности компьютера в традиционной лексикографии чрезвычайно велики, поскольку они избавляют лексикографа от огромного многолетнего труда по сбору, расписыванию на карточки и анализу лексического материала. Например, можно создать справочник, в котором все словники наиболее значительных словарей были бы объединены. Таким справочником является Сводный словник словарей русского языка (Рогожникова 1986: 58-67). С помощью такого словника можно решать большое количество разного рода теоретических и практических задач. Так, можно выявить наиболее употребительную лексику современного русского языка и отобрать ее в словари различных объемов. Это важно при составлении толковых словарей, общего и учебного типа, для отбора лексики в русскоязычные словари других типов и т.д.
Применение интерактивных методов позволяет исследователю-лингвисту использовать компьютер даже в тех случаях, когда какие-то языковые факты трудно или невозможно формализовать: при помощи диалога с компьютером появляется возможность найти достаточно обоснованные и приемлемые приблизительные решения.
Ю.Н. Марчук в своей работе «Вычислительная лексикография» (Марчук 1976: 83) определил основные отличия машинных словарей от обычных. Кратко говоря, эти отличия заключаются в следующем: если обычный, традиционный, «бумажный» словарь комплементарен к знаниям, имеющимся у человека-пользователя, т.е. он дает некоторую дополнительную информацию к той, которая у человека уже есть, то машинный словарь в функции информирования автономен, т.е. он должен содержать всю необходимую для «искусственного интеллекта» машины информацию. Машинный словарь в применении в автоматизированных системах не может рассчитывать на то, что компьютер располагает «фоновым» знанием, необходимым для пользования словарем.