마크업(разметка) 혹은 주석(аннотация)이란 코퍼스에 수록된 텍스트의 각 단어, 구, 문장, 담화 단위에 대해 형태, 통사, 의미, 사용 맥락과 같은 언어적 속성을 체계적으로 부여한 추가 정보를 말합니다. 이러한 주석은 텍스트를 단순히 읽는 대상으로 사용하는 것이 아니라, 언어적 특징을 기준으로 검색하고 비교하며 분석할 수 있도록 만드는 핵심적인 장치입니다. 따라서 마크업의 존재는 코퍼스를 개별 텍스트의 집합과 구별 짓는 가장 중요한 특성입니다.
러시아국립코퍼스(RNC)의 주석 체계는 언어 현상을 다층적으로 분석할 수 있도록 설계되어 있으며, 하나의 텍스트에 여러 종류의 주석이 동시에 부여됩니다. 이를 통해 사용자는 단어의 표면형뿐 아니라 기본형, 문법적 범주, 문장 내 기능, 의미적 특성, 담화적 역할 등을 기준으로 검색할 수 있습니다. 즉, 코퍼스 주석은 언어 자료를 정적인 텍스트에서 분석 가능한 데이터로 전환하는 역할을 합니다. 이러한 이유로 주석은 러시아어 연구뿐 아니라 교육 현장에서 문법 규칙 설명, 용례 탐색, 언어 현상 비교를 가능하게 하는 핵심 요소입니다.
현재 러시아국립코퍼스에서는 언어의 여러 층위를 반영한 다양한 유형의 주석이 사용되고 있으며, 이를 통해 형태·통사·의미·화용적 분석뿐 아니라 통시적·공시적 연구와 교육적 활용이 가능합니다.
형태 주석(Морфологическая разметка)
단어형성/조어 주석(Словообразовательная разметка)