텍스트 데이터는 단순한 문자들의 나열이 아니라, 사람들의 감정, 감성, 그리고 의견을 담고 있는 중요한 정보입니다. 하지만 이러한 것들을 정량적으로 분석하는 것은 쉽지 않습니다. 센티멘트 분석(Sentiment Analysis)은 이런 문제를 해결하기 위해 개발된 기법으로, 대량의 텍스트 데이터를 분석하여 문서의 긍정적, 부정적, 또는 중립적 감성을 판단하는 데 도움을 줍니다.

11.1 감성/센티멘트 분석의 개념

센티멘트 분석(Sentiment Analysis)은 텍스트 데이터를 분석하여 그 속에 담긴 의견의 극성(polarity) — 즉, 긍정적인지, 부정적인지, 중립적인지를 판단하는 자연어 처리(NLP) 기술입니다. 이 분석은 기업의 고객 피드백, 소셜미디어의 여론 파악, 금융 뉴스 기반 투자 분석 등 다양한 분야에서 활용됩니다.

<aside> 📌

여기서 잠깐, 용어 정리가 필요합니다!

Sentiment Analysis를 한국어로 번역할 때 ‘감성 분석’, ‘감정 분석’, ‘긍부정 분석’ 등이 혼용됩니다.

그러나 여기에서는 혼란을 피하기 위해 'Sentiment Analysis'를 ‘센티멘트 분석'으로 음역하여 사용하겠습니다.

</aside>

11.2 센티멘트 분석 모델

센티멘트 분석을 수행하는 방법은 크게 세 가지로 나눌 수 있습니다.

11.2.1 사전 기반 센티멘트 분석

11.2.2 기계 학습 기반 센티멘트 분석

11.2.3 딥러닝 기반 센티멘트 분석