RNC는 독립적인 하위 코퍼스의 모음이며 각 코퍼스는 특정 과제를 해결하기 위해 만들어졌습니다. RNC는 규모가 크고 대표성을 띠므로 질적, 양적 연구의 귀중한 자료가 됩니다. 코퍼스의 구성과 그에 사용되는 주석은 각 코퍼스의 세부 과제에 따라 결정됩니다.

  1. **주요 코퍼스(Основной корпус)**는 1700년 이후 작성된 산문 텍스트의 모음으로, 근현대 러시아어를 대표하는 핵심 코퍼스입니다. 주요 코퍼스의 텍스트는 문학어 규범을 지향하지만, 규범적 텍스트로만 구성된 것은 아니며, 문예체, 학술체, 평론체, 기술 텍스트, 개인 서신 등 다양한 사용역(register)의 텍스트를 포함하고 있습니다. 각 장르와 문체의 비율은 해당 시기에 이들이 러시아어에서 차지하는 사회적·문화적 위상을 고려하여 결정되었습니다. RNC의 모든 단어는 자동 형태 분석기를 통해 태깅되는데, 형태적으로 발달한 러시아어에서는 문법적 중의성이 중요한 문제가 됩니다. 이에 따라 주요 코퍼스의 일부 텍스트는 전문가의 수작업을 통해 형태적 중의성이 제거되어, 보다 신뢰도 높은 형태·통사 연구가 가능하도록 구성되어 있습니다. 이러한 특성으로 인해 주요 코퍼스는 어휘 의미 변화, 문법 범주의 사용 양상, 문체 및 사용역 간 차이를 분석하는 질적·양적 연구의 기본 자료로 활용되며, 동시에 현대 러시아어의 표준적 용법과 실제 사용을 함께 제시할 수 있어 러시아어 교육에서도 중요한 참고 자료로 사용됩니다. ➡️바로가기
  2. **통사 코퍼스(Синтаксический корпус, СинТагРус)**는 심층 주석 코퍼스(глубокоаннотированный корпус)로도 불리며, 러시아어 문장의 통사 구조를 정밀하게 분석할 수 있도록 설계된 하위 코퍼스입니다. 이 코퍼스는 멜축(Mel’čuk)의 <의미–텍스트 이론>에 기반하고 있으며, 의미에서 텍스트로의 대응을 설명하기 위해 어형의 형태표상과 문장의 통사표상을 다층적으로 구현합니다. 이에 따라 통사 코퍼스에서는 각 어형의 형태 정보와 함께 문장 전체의 통사 구조가 수형도 형태로 제시되며, 수형도에서 각 단어는 절점(node)에 해당하고 의존적 통사 관계의 명칭이 부여됩니다. 통사 코퍼스의 모든 텍스트는 형태적·통사적 중의성이 제거된 상태로 주석되어 있으므로, 자동 분석 결과의 오류를 최소화한 신뢰도 높은 자료를 제공합니다. 이러한 특성으로 인해 통사 코퍼스는 러시아어 통사론, 의존 문법, 의미–통사 인터페이스 연구 등에서 핵심적인 연구 자료로 활용되며, 복잡한 문장 구조와 통사 관계를 시각적으로 제시할 수 있다는 점에서 고급 러시아어 문법 교육과 통사 분석 훈련에서도 중요한 교육 자료로 활용될 수 있습니다. ➡️바로가기
  3. **신문 코퍼스(Газетный корпус)**는 1940년부터 현재까지의 정기 출판물 및 인터넷 대중매체 텍스트로 구성된 하위 코퍼스로, RNC에서 가장 큰 규모를 갖는 코퍼스입니다. 정기 출판물과 인터넷 대중매체 텍스트는 주제와 시기에 따른 편향성이 강하기 때문에 주요 코퍼스에는 포함되지 않으며, 이러한 이유로 신문 코퍼스는 독립적인 하위 코퍼스로 구축되었습니다. 이 코퍼스에는 중앙 언론뿐 아니라 지역 및 외국 언론 코퍼스(корпус региональной и зарубежной прессы)도 포함되어 있어, 지역적 현실과 사회적 맥락을 반영하는 어휘와 표현을 폭넓게 관찰할 수 있습니다. 현대 대중매체 언어는 사회적 변화와 새로운 개념을 신속하게 반영하고 동시에 대중의 언어 사용에 직접적인 영향을 미치므로, 신문 코퍼스는 신어의 출현과 확산, 어휘 의미 변화, 특정 문법 형식의 사용 증가나 감소와 같은 언어 변화 양상을 추적하는 데 중요한 자료입니다. 예를 들어, 신문 코퍼스를 통해 어휘 смартфон의 최초 출현 시기나 전치사 по의 사용 빈도 변화와 같은 현상을 통시적으로 분석할 수 있습니다. ➡️바로가기
  4. **병렬 코퍼스(Параллельный корпус)**는 러시아어 텍스트와 영어, 불가리아어, 스페인어, 이탈리아어, 한국어, 중국어 등 여러 외국어로 번역된 텍스트를 병렬 수집한 하위 코퍼스입니다. 이 코퍼스의 각 문서 쌍은 문장 단위로 정렬되어 있어, 하나의 원문 문장이 번역 과정에서 다른 언어로 어떻게 대응되는지를 비교할 수 있도록 구성되어 있습니다. 병렬 코퍼스는 동일한 의미 내용이 언어별로 어떤 어휘 선택과 문법 구조, 담화 전략을 통해 실현되는지를 보여주므로, 번역 전략과 의미 대응 방식 연구에서 활용될 수 있습니다. 특히 직역과 의역, 생략과 첨가, 문장 분할과 결합 등 번역 과정에서 발생하는 구조적 변화 양상을 관찰할 수 있다는 점에서 번역학 연구에 중요한 기반을 제공합니다. 또한 러시아어와 다른 언어 간의 어순, 격 지배, 시제·상 체계의 차이를 분석할 수 있어 대조언어학 연구에서도 활용도가 높습니다. 이밖에 학습자가 원문과 번역문을 비교하며 의미 전달 방식의 차이를 인식할 수 있으므로, 번역 교육뿐 아니라 고급 읽기·쓰기 교육에서도 효과적인 자료로 활용될 수 있습니다. ➡️바로가기
  5. **방언 코퍼스(Диалектный корпус)**는 러시아의 여러 지역에서 실제로 녹음된 방언 발화를 전사한 텍스트로 구성됩니다. 이 코퍼스에는 방언 어휘에 대한 해석과 함께 음운적, 형태적, 통사적 특성이 주석으로 보존되어 있어, 표준어와 구별되는 방언의 구조적 특징을 체계적으로 분석할 수 있습니다. 방언 코퍼스는 지역별 언어 변이를 잘 보여주므로, 방언학과 사회언어학, 언어 지리학 연구에서 핵심적인 자료로 활용됩니다. 특히 특정 어휘나 형태가 어느 지역에서 사용되는지, 그리고 이러한 분포가 지리적·사회적 요인과 어떻게 연관되는지를 분석하는 언어 지형(linguistic topography) 연구에 적합한 자료입니다. ➡️바로가기
  6. **운문 코퍼스(Поэтический корпус)**는 18세기부터 현대에 이르기까지의 러시아어 운문 텍스트로 구성됩니다. 이 코퍼스는 형태적·의미적 주석 외에도 운문 텍스트에 특화된 운율, 강세, 리듬, 각운에 대한 주석이 추가되어 있어, 시 언어의 형식적 특성을 정밀하게 분석할 수 있도록 설계되었습니다. 이를 통해 시에서 어휘와 문법 요소가 운율적 제약 속에서 어떻게 선택되고 배열되는지를 체계적으로 관찰할 수 있습니다. 운문 코퍼스는 시적 언어의 문법적 일탈, 의미 압축, 반복과 대조와 같은 표현 기법을 실증적으로 분석할 수 있게 하므로, 문체론, 시학, 의미론 연구에서 중요한 자료로 활용됩니다. ➡️바로가기
  7. **학습 코퍼스(Обучающий корпус)**는 러시아어 수업에 활용될 목적으로 만들어졌으므로 주로 교과서에 포함된 문학 작품들로 구성되었습니다. 이 코퍼스는 규모는 작지만, 형태적 중의성이 해소된 텍스트로만 구성되며, 다른 코퍼스에 비해 명사류의 격변화 유형, 동사의 인칭변화 유형, 명사, 형용사, 대명사, 부사의 어휘문법적 부류와 같은 형태적 주석이 추가되었습니다. ➡️바로가기
  8. **구어 코퍼스(Устный корпус)**는 20세기에 이루어진 사적 및 공적 구어 발화를 녹음한 자료를 전사하여 구축한 하위 코퍼스입니다. 이 코퍼스에는 일상 대화, 인터뷰, 토론, 공식 발언 등 다양한 구어 상황이 포함되어 있으며, 문자 언어와 구별되는 음성 언어의 특성이 주석을 통해 반영되어 있습니다. 구어 코퍼스의 주석은 억양, 강세, 휴지, 말 끊김, 반복과 같은 음성 언어의 특징을 드러내는 데 중점을 두고 있어, 실제 발화에서 문장이 어떻게 구성되고 실현되는지를 분석할 수 있도록 합니다. 이러한 특성으로 인해 구어 코퍼스는 구어체 문법, 담화 구조, 상호작용 양상을 분석하는 구어 담화 연구와 화용론, 언어문화 연구에서 중요한 자료로 활용됩니다. 또한 문자화된 텍스트와 달리, 발화의 즉흥성과 불완전성이 그대로 반영되어 있어, 실제 언어 사용에서 나타나는 규범과 일탈의 관계를 관찰하는 데에도 적합합니다. ➡️바로가기
  9. **강세 코퍼스(Акцентологический корпус)**는 시와 같이 강세의 위치와 역할이 의미 형성에 중요한 텍스트를 중심으로 구성된 하위 코퍼스입니다. 강세 코퍼스는 강세의 위치와 운율에 따른 검색이 가능하므로 러시아어 음운론과 운율 연구, 특히 강세가 의미 구별과 리듬 형성에 미치는 영향을 분석하는 연구에서 중요한 자료로 활용됩니다. ➡️바로가기
  10. **멀티미디어 코퍼스(Мультимедийный корпус, МУРКО)**는 다양한 화행 상황을 묘사하는 영화 장면을 포함하며, 각 장면은 비디오 영상, 배우의 음성 녹음, 이를 전사한 텍스트로 구성되어 있습니다. 이 코퍼스의 가장 큰 특성은 RNC에 공통적인 형태·어휘·문법 중심의 검색 방식 외에도, 영상에서 관찰되는 몸짓(жесты)과 발화가 수행하는 화행 유형(речевые действия)을 기준으로 검색이 가능하다는 점입니다. 이를 통해 발화의 언어적 표현뿐 아니라 억양, 발화 속도, 침묵, 제스처, 시선 처리 등 다양한 비언어적 요소가 실제 담화 상황에서 화행 의미를 어떻게 구성하는지를 종합적으로 분석할 수 있습니다. 이러한 특성으로 인해 멀티미디어 코퍼스는 구어체 담화 연구와 화용론, 사회언어학 연구에 유용한 자료가 되며, 최근에는 언어·음성·영상 정보를 함께 다루는 멀티모달 언어 연구의 기초 자료로도 활용되고 있습니다. 또한 외국어 교육의 측면에서는 문법적으로 올바른 문장을 제시하는 데 그치지 않고, 실제 의사소통 상황에서 발화가 어떤 방식으로 수행되는지를 시각적·청각적으로 제시할 수 있어, 화행 교육과 말하기·듣기 능력 향상을 목표로 하는 교육 자료로서의 활용 가치가 큽니다. ➡️바로가기
  11. **멀티파크 코퍼스(Мультипарк)**는 멀티미디어 코퍼스와 병렬 코퍼스의 특성을 혼합한 것으로 주로 비교 연구에서 활용됩니다. 이 코퍼스는 러시아어 멀티파크와 러시아어–영어 멀티파크로 구성됩니다. 러시아어 멀티파크는 하나의 희곡이나 대본이 영화, 텔레비전, 라디오 등 서로 다른 매체를 통해 구현된 사례를 포함하며, 각 자료는 비디오 영상, 음성 녹음, 전사 텍스트로 제시됩니다. 이를 통해 동일한 언어적 내용과 화행이 매체의 특성, 연출 방식, 화자의 개성에 따라 억양, 발화 속도, 강세, 제스처 측면에서 어떻게 다르게 실현되는지를 분석할 수 있습니다. 러시아어 멀티파크는 구어 담화 연구와 화용론, 멀티모달 담화 분석에서 활용될 수 있습니다. 러시아어–영어 멀티파크는 러시아어 멀티파크에 포함된 영상 자료를 영어로 번역한 더빙 음성과 자막을 함께 제공하는 형태로 구성됩니다. 검색어를 입력하면 동일한 영상 장면에 대해 원본 음성과 자막, 그리고 번역된 더빙 음성과 자막이 한쌍으로 제시되며, 시각적·상황적 맥락과 비언어적 행위는 동일한 상태로 유지됩니다. 이러한 특성으로 인해 러시아어–영어 멀티파크는 번역 연구와 대조언어학, 멀티모달 화용 연구에서 활용 가치가 높습니다. ➡️바로가기
  12. **역사 코퍼스(Исторические корпусы)**는 러시아어의 통시적 변화를 연구하기 위해 구축된 하위 코퍼스군으로, 11~14세기의 고대러시아어 코퍼스(древнерусский корпус), 15~17세기의 구러시아어 코퍼스(старорусский корпус), 자작나무문서 코퍼스, 교회슬라브어 코퍼스로 구성됩니다. 이 코퍼스에는 키예프 루시 시기에 남슬라브어와 그리스어로부터 번역된 문헌을 포함한 다양한 역사 문헌이 수록되어 있어, 러시아어 초기 문어 전통과 외부 언어의 영향을 함께 살펴볼 수 있습니다. 역사 코퍼스의 검색에서는 단순화된 정자법(упрощённая орфография), 정확한 정자법(точная орфография), 현대화된 정자법(модернизированная орфография)을 선택할 수 있어, 서로 다른 시기의 텍스트를 비교하거나 현대 연구자의 접근성을 높이는 데 유용합니다. 이러한 구성은 음운, 형태, 어휘, 통사 구조가 시대에 따라 어떻게 변화했는지를 체계적으로 추적할 수 있게 하므로, 역사언어학과 러시아어사 연구에서 핵심적인 자료로 활용됩니다. ➡️바로가기
  13. **범시 코퍼스(Панхронический корпус)**는 주요 코퍼스와 역사 코퍼스를 통합하여 구축된 하위 코퍼스입니다. 이 코퍼스는 공시적(synchronic, 특정 시점의 언어 현상 연구) 관점과 통시적(diachronic, 시간의 흐름에 따른 언어 변화 연구) 관점을 통합하는 범시적(panchronic) 관점을 기반으로 합니다. 이를 통해 개별 시기의 언어 현상을 단절적으로 살펴보는 것이 아니라, 언어 변화가 장기간에 걸쳐 점진적이고 연속적으로 이루어지는 과정을 하나의 체계 속에서 분석할 수 있습니다. 범시 코퍼스에서는 동일한 어휘, 형태, 통사 구조가 서로 다른 시대의 텍스트에서 어떻게 유지되거나 변형되는지를 비교할 수 있어, 언어 변화의 방향성과 지속성을 실증적으로 확인할 수 있습니다. 이러한 특성으로 인해 범시 코퍼스는 역사언어학과 문법 범주의 변화 연구, 어휘 의미 변화 연구에서 중요한 자료로 활용됩니다. ➡️바로가기
  14. **소셜 네트워크 코퍼스(Корпус социальных сетей)**는 온라인 소셜 네트워크와 인터넷 커뮤니케이션 환경에서 생성된 텍스트로 구성된 하위 코퍼스입니다. 이 코퍼스의 텍스트는 전통적인 문어체 규범에 덜 얽매여 있으며, 축약형, 구어적 표현, 비표준 철자, 이모티콘과 같은 특수 기호 체계를 적극적으로 사용한다는 특징을 지닙니다. 이러한 특성으로 인해 소셜 네트워크 코퍼스에서는 문어체와 구어체의 경계에 위치한 현대 러시아어의 새로운 사용 양상을 관찰할 수 있습니다. 특히 온라인 환경에서 나타나는 담화 전략, 정체성 표현, 감정 표출 방식이 언어적으로 어떻게 실현되는지를 분석하는 데 적합합니다. 연구적 측면에서는 디지털 담화 분석에서 활용 가치가 높으며, 신조어의 형성과 확산, 비표준 표현의 정착 과정, 온라인 상호작용을 실증적으로 분석할 수 있습니다. ➡️바로가기
  15. **“2세부터 15세까지” 코퍼스(Корпус «от 2 до 15»)**는 어린이, 청소년, 교사, 학부모를 대상으로 한 대규모 설문조사 결과를 바탕으로 선정된 러시아 및 러시아 외 작가의 문학 작품이 포함되었습니다. 이 코퍼스의 각 텍스트는 가장 적합한 독서 연령대가 제시되어 있으며, 추후 러시아 철자법의 어려운 부분에 대한 주석이 추가될 계획입니다. ➡️바로가기
  16. **문어체 텍스트의 주요 코퍼스(Основной корпус письменных текстов)**는 주요 코퍼스(основной корпус)에서도 현대 러시아 표준어의 형성에 큰 영향을 미친 푸쉬킨(А. С. Пушкин) 시대 이전에 쓰여진 18세기 텍스트의 모음입니다. ➡️바로가기
  17. **러시아 고전 코퍼스(Корпус «Русская классика»)**는 현대 러시아 표준어를 창시한 19세기와 20세기 초 작가들의 작품 텍스트로 구성됩니다. ➡️바로가기