랭스박스 엑스는 다양한 태그셋을 사용하고 있습니다. 태그의 종류에는 크게 품사(part-of-speech, POS), 의존관계(dependency), 의미적(semantic) 태그가 있습니다. 아래에서 품사 태그와 의존관계 태그를 자세히 살펴보겠습니다.
spaCy 품사 태그셋
spaCy는 Universal POS 태그를 기반으로 하며, 여기에는 아래와 같은 핵심 품사 태그들이 포함됩니다.
- ADJ (adjective): 형용사
- ADP (adposition): 부치사
- ADV (adverb): 부사
- AUX (auxiliary): 보조사
- CCONJ (coordinating conjunction): 등위 접속사
- DET (determiner): 한정사
- INTJ (interjection): 감탄사
- NOUN (noun): 명사
- NUM (numeral): 수사
- PART (particle): 불변화사 혹은 소사
- PRON (pronoun): 대명사
- PROPN (proper noun): 고유명사
- PUNCT (punctuation): 구두점
- SCONJ (subordinating conjunction): 종속 접속사