단어 목록(Wordlist)

워드리스트(Wordlist) 기능은 코퍼스에 포함된 텍스트를 토큰 단위로 분절한 뒤, 각 단어 형태가 얼마나 자주 등장하는지를 계산하여 빈도 목록으로 제시하는 기본 분석 도구입니다. 이 기능은 단어를 의미 단위나 레마 단위로 추상화하지 않고, 실제 텍스트에 나타난 표면형(word)을 기준으로 빈도를 산출한다는 점에서 특징적입니다. 따라서 시제, 인칭, 수, 태 등에 따른 형태적 차이가 그대로 빈도 차이로 반영되며, 이를 통해 코퍼스 전반의 형태 분포와 문법적 사용 경향을 정량적으로 파악할 수 있습니다.

워드리스트에는 각 항목에 대해 단어 형태, 대응하는 기본형(lemma), 품사 태그(tag), 그리고 출현 빈도가 함께 제공되며, 이는 단순한 어휘 목록을 넘어 형태·통사적 분석의 기초 자료로 활용될 수 있습니다. 또한 최소·최대 빈도 설정을 통해 분석 대상 어휘를 제한할 수 있어, 매우 빈번한 기능어 중심의 목록부터 저빈도 어휘 중심의 목록까지 분석 목적에 따라 유연하게 구성할 수 있습니다.

Untitled

더 자세한 설명은 홈페이지 설명과 아래의 동영상을 참조하세요.


https://youtu.be/nqpCIICCEdw?si=QrQ26lWNV4IL5JsW


워드 리스트 사용 방법

  1. 대시보드 상단의 돋보기(🔍) 아이콘을 클릭하여 코퍼스를 선택합니다.

  2. Wordlist를 선택합니다.

    WL.png

  3. 검색하고자 하는 검색조건을 설정합니다. 여기서는 검색 조건으로 동사(verb)를 설정하고, 접두사 ‘пере’로 시작하는 러시아어 동사의 빈도수를 추출하겠습니다.

    Screenshot 2024-02-26 at 7.41.56 PM.png

  4. 아래와 같이 결과물을 확인합니다.

    Screenshot 2024-02-26 at 7.42.58 PM.png

Screenshot 2024-02-26 at 7.50.16 PM.png