랭스박스 엑스는 다양한 태그셋을 사용하고 있습니다. 태그의 종류에는 크게 품사(part-of-speech, POS), 의존관계(dependency), 의미적(semantic) 태그가 있습니다. 이 가운데 품사 태그와 의존관계 태그는 spaCy 분석기를 기반으로 부여된 주석입니다. spaCy는 자연어 처리를 위한 오픈소스 NLP 라이브러리로, 형태 분석, 품사 태깅, 의존구문 분석 등 핵심적인 언어 분석 기능을 제공합니다.
spaCy는 Universal POS 태그를 기반으로 하며, 여기에는 아래와 같은 핵심 품사 태그들이 포함됩니다.
spaCy의 품사 태깅은 Universal POS 태그셋(UPOS)을 기반으로 합니다. Universal POS 태그셋은 개별 언어의 세부 품사 체계를 단순화하여, 명사, 동사, 형용사, 부사 등과 같은 언어 보편적 품사 범주를 공통된 기준으로 표현한 태그 체계입니다.