워드리스트(Wordlist) 기능은 코퍼스에 포함된 텍스트를 토큰 단위로 분절한 뒤, 각 단어 형태가 얼마나 자주 등장하는지를 계산하여 빈도 목록으로 제시하는 기본 분석 도구입니다. 이 기능은 단어를 의미 단위나 레마 단위로 추상화하지 않고, 실제 텍스트에 나타난 표면형(word)을 기준으로 빈도를 산출한다는 점에서 특징적입니다. 따라서 시제, 인칭, 수, 태 등에 따른 형태적 차이가 그대로 빈도 차이로 반영되며, 이를 통해 코퍼스 전반의 형태 분포와 문법적 사용 경향을 정량적으로 파악할 수 있습니다.
워드리스트에는 각 항목에 대해 단어 형태, 대응하는 기본형(lemma), 품사 태그(tag), 그리고 출현 빈도가 함께 제공되며, 이는 단순한 어휘 목록을 넘어 형태·통사적 분석의 기초 자료로 활용될 수 있습니다. 또한 최소·최대 빈도 설정을 통해 분석 대상 어휘를 제한할 수 있어, 매우 빈번한 기능어 중심의 목록부터 저빈도 어휘 중심의 목록까지 분석 목적에 따라 유연하게 구성할 수 있습니다.

더 자세한 설명은 홈페이지 설명과 아래의 동영상을 참조하세요.
https://youtu.be/nqpCIICCEdw?si=QrQ26lWNV4IL5JsW
대시보드 상단의 돋보기(🔍) 아이콘을 클릭하여 코퍼스를 선택합니다.
Wordlist를 선택합니다.

검색하고자 하는 검색조건을 설정합니다. 여기서는 검색 조건으로 동사(verb)를 설정하고, 접두사 ‘пере’로 시작하는 러시아어 동사의 빈도수를 추출하겠습니다.

아래와 같이 결과물을 확인합니다.

ruTenTen11 코퍼스에서 접두사 ‘пере-’가 붙은 동사는 23,915개이며, 등장 빈도는 21,426,935회 입니다.
워드리스트에서는 절대 빈도수(absolute frequency)를 제공합니다.

동사 ‘передавать’의 시소러스로 이동한 모습은 아래와 같습니다.
