앞서 기본적인 전처리 과정을 모두 살펴보았습니다. 이제 전처리된 데이터를 바탕으로 데이터 분석 실습을 진행하겠습니다.

【실습1】 형태소 분석을 통해 전처리된 tagged_words.txt 데이터를 활용해 특정 품사를 추출하고, 빈도수를 계산하여 그 결과를 시각화하세요.

특정 품사 추출하기

빈도 구하기

시각화 (막대그래프, 파이차트, 워드클라우드)

【실습2】 정규화를 통해 전처리된 lemmatized_words.txt 데이터를 활용해 바이그램을 생성하세요.

바이그램

【실습3】 토큰화를 통해 전처리된 sentences.txt 데이터를 활용해 네트워크 분석을 수행하고, 그 결과를 시각화하세요.

네트워크 분석