N-그램(N-grams)

N-그램(N-grams)이란 연속적으로 등장하는 N개의 단어로 이루어진 단위를 의미합니다. 여기서 N은 단어의 개수를 가리키며, N=2인 경우를 2-그램(bigram), N=3인 경우를 3-그램(trigram)이라 합니다. 이처럼 여러 단어가 일정한 순서로 반복되어 나타나는 표현은 다단어 표현(multi-word expressions) 또는 어휘 다발(lexical bundles)**이라고도 불립니다.

N-그램은 개별 단어의 의미를 분석하는 데 그치지 않고, 언어 사용에서 실제로 자주 함께 쓰이는 표현의 패턴을 파악하는 데 중요한 도구입니다. 특히 학술 텍스트, 뉴스 기사, 구어 자료 등에서 관습적으로 반복되는 표현 구조를 확인할 수 있다는 점에서 의미가 큽니다.

예를 들어,

N-그램 도구를 활용하면 특정 코퍼스에서 어떤 표현이 얼마나 자주 사용되는지(빈도)를 목록 형태로 확인할 수 있습니다. 이를 통해 해당 언어 자료의 담화적 특성, 문체적 특징, 또는 전형적인 표현 방식을 분석할 수 있습니다. 또한 N-그램 분석에서는 정규식(regular expressions)을 포함한 다양한 필터링 옵션을 설정할 수 있습니다.

이러한 기능은 학습자가 자연스러운 표현, 전형적인 문장 구조, 그리고 빈번히 사용되는 어휘 결합을 데이터 기반으로 이해하는 데 도움을 줍니다. 특히 작문 교육이나 학술 영어·외국어 교육에서 자주 쓰이는 표현을 실증적으로 제시할 수 있다는 점에서 교육적 활용 가치가 높습니다.

Untitled

더 자세한 설명은 홈페이지 설명을 참조하세요.


N-그램 사용 방법

  1. 대시보드 상단의 돋보기(🔍) 아이콘을 클릭하여 코퍼스를 선택합니다.

  2. Word Sketch를 선택합니다.

    NG.png

  3. 검색하고자 하는 N-gram의 길이를 선택합니다.

    Screenshot 2024-02-26 at 8.05.11 PM.png

  4. 아래와 같이 6-grams의 결과물을 확인합니다.

    Screenshot 2024-02-26 at 8.09.24 PM.png