시소러스란 단어들 사이의 의미적 관계를 체계적으로 정리한 어휘 목록 또는 도구입니다. 일반적으로 시소러스는 특정 단어와 의미적으로 가까운 단어들, 즉 동의어·유의어를 중심으로 어휘 간의 관계를 보여주는 역할을 합니다.

그림 출처: https://bhplnjbookgroup.blogspot.com/2009/11/visual-thesaurus.html
코퍼스 기반 시소러스는 전통적인 사전형 시소러스와 달리, 실제 언어 자료에 나타난 사용 양상을 바탕으로 단어 간 의미적 유사성을 계산합니다. 이때 사용되는 이론적 기반은 분포 의미론(distributional semantics)으로, 의미가 유사한 단어는 유사한 문맥에서 사용된다는 가설에 근거합니다.
스케치엔진에서 시소러스 기능은 검색어와 유사한 맥락에서 출현하는 단어들을 자동으로 식별하여 목록으로 제시합니다. 따라서 시소러스에 제시되는 단어들은 반드시 완전한 동의어라기보다는, 통계적으로 유사한 사용 환경을 공유하는 단어들이라고 이해하는 것이 적절합니다. 이 기능은 대부분의 코퍼스에서 명사, 형용사, 동사, 부사에 대해 제공됩니다. 검색어가 코퍼스 내에서 충분한 수의 용례를 가지고 있다면, 비교적 사용 빈도가 낮은 단어라도 그와 의미적으로 가까운 단어들의 목록이 생성될 수 있습니다. 또한 각 단어 옆에 제시되는 빈도 정보는 해당 단어가 코퍼스에서 얼마나 자주 사용되는지를 보여주며, 이를 통해 학습자는 의미적으로 유사한 표현들 가운데 실제 사용에서 더 일반적인 표현과 덜 일반적인 표현을 구분할 수 있습니다.

더 자세한 설명은 홈페이지 설명과 아래의 동영상을 참조하세요.
https://youtu.be/kLsNUdTrTLk?si=1O_814O9On_jphVK
대시보드 상단의 돋보기(🔍) 아이콘을 클릭하여 코퍼스를 선택합니다.
Thesaurus를 선택합니다.

검색창에 단어의 기본형(lemma)을 입력합니다. 여기서는 러시아어 명사 ‘решение’를 입력했습니다.

아래와 같이 결과물을 확인합니다.