통사코퍼스는 형태적, 통사적 중의성이 제거되었으므로, 모든 단어는 하나의 형태적, 통사적 주석을부여받습니다. 이외에 통사코퍼스는 100개 이사의 어휘함수 주석을 갖고 있습니다. 어휘 함수는 일정한 의미관계로 연결된 관용적 어결합을 기술합니다.

통사코퍼스는 의존문법의 일환인 <의미⇔텍스트(Смысл ⇔ Текст)> 이론에 기반합니다. 따라서 문장의 통사적 정보 및 구문 분석 결과는 의존수형도로 제시되는데, 이 수형도에서 각 단어는 절점에 해당하고, 가지는 의존적 통사관계의 명칭을 부여 받습니다.

아래는 문장 "К людям врожденную любовь слон испытывает, особенно к красивым женщинам, но еще большую - к маленьким детям."을 분석한 결과입니다.

Untitled

<의미⇔텍스트> 이론의 다층적 언어모델에는 의미에서 텍스트로의 대응을 위해 문장의 통사표상과 어형의 형태표상이 필요합니다. 이 이론에 기반하는 통사코퍼스에서도 각 어형의 형태표상과 문장의 통사표상을 수형도 안에 구현합니다.

위의 그림에서 각 어형과 연결된 네모 칸에는 원형이 명시되고, 그 옆에는 품사와 문법범주별 특성이 명시됩니다. 예컨대, испытывает(절점 8)의 형태표상(ИСПЫТЫВАТЬ, V НЕСОВ ИЗЬЯВ НЕПРОШ ЕД 3-Л.)은 원형, 품사, 상, 법, 시제, 수, 인칭의 정보를 줍니다. большую(절점 15)의 형태표상(БОЛЬШИЙ, А ЕД ЖЕН ВИН)도 원형, 품사, 수, 성, 격 정보를 제공합니다. 반면, 명사 женщинам의 형태표상(ЖЕНЩИНА, S МН ЖЕН ДАТ ОД)은 원형, 품사, 수, 격, 활성성 정보를 표시합니다.

통사코퍼스의 구성

통사코퍼스는 2가지 부류의 텍스트로 구성됩니다:

❔어형 검색(Поиск точных форм)

Untitled