코퍼스의 어휘-의미적 정보에 대하여
RNC는 단순한 형태·통사 정보뿐 아니라, 어휘의 의미적 특성에 따른 검색이 가능하도록 의미 주석을 제공합니다. 이러한 검색 기능은 텍스트에 부여된 의미적 마크업에 기반합니다. RNC의 의미 주석은 자동 프로그램 Semmarkup을 통해 수행됩니다. 이 과정에서 의미적 중의성은 해소되지 않으며, 하나의 어휘소가 다의적인 경우 해당 어휘소에는 가능한 모든 의미 주석이 함께 부여됩니다. RNC의 의미 주석 체계는 빠두체바(Е. В. Падучева)와 라힐리나(Е. В. Рахилина)가 개발한 의미 데이터베이스「Лексикограф」의 러시아어 어휘 분류 시스템에 기반합니다. 이 분류 체계는 어휘를 단순한 사전적 정의가 아니라, 주제 부류, 의미 기능, 파생 관계 등의 관점에서 체계적으로 분류하는 것을 목표로 합니다.
RNC의 의미 주석은 여러 권위 있는 러시아어 사전을 종합적으로 참고하여 구축되었습니다. 이러한 사전적 기반은 RNC의 의미 주석이 개별 연구자의 직관이 아니라, 러시아 어휘 의미 연구의 전통 위에 구축되었음을 보여 줍니다. 참고한 주요 사전은 다음과 같습니다:
- Словарь русского языка под ред. С. И. Ожегова
- Словарь русского языка под ред. С. И. Ожегова и Н. Ю. Шведовой
- Словарь русского языка в 4-х тт. под ред. А. П. Евгеньевой (МАС)
- Словарь русского языка в 17-ти тт. (БАС)
- Толковый словарь русского языка Д. Н. Ушакова
- Русский семантический словарь под ред. Н. Ю. Шведовой, тт. 1-3
- Толковый словарь русских глаголов под ред. Л. Г. Бабенко
- Системный семантический словарь русского языка Л. М. Васильева
- Новый объяснительный словарь синонимов русского языка под общим рук. акад. Ю. Д. Апресяна (НОСС)
어휘-의미적 정보의 구조
개별 단어에 주어지는 어휘-의미적 정보는 다음과 같이 3개의 주석 그룹으로 나뉘어집니다:
- 부류 (고유명사, 재귀대명사 등)
- 어휘-의미적 주석 (어휘소의 주제 부류, 사역성, 평가성 등)