13.1 기계 번역의 원리
13.1.1. 기계 번역(Machine Translation)이란?
기계 번역(MT, Machine Translation)은 컴퓨터 프로그램을 사용하여 한 언어의 텍스트를 다른 언어로 자동 변환하는 기술입니다. 번역가가 직접 개입하지 않아도 컴퓨터가 문장을 분석하고, 적절한 대응 표현을 찾아 번역 결과를 생성합니다.
기계 번역 기술은 꾸준히 발전해왔으며, 그 접근 방식에 따라 다음 세 가지 주요 유형으로 나눌 수 있습니다:
🔹 규칙 기반 기계 번역 (Rule-Based Machine Translation)
🔧 작동 원리:
- 언어학적 규칙(문법, 구문 구조)과 이중언어 사전(양방향 어휘 대응)을 사용하여 문장을 분석하고 번역합니다.
- 번역 과정은 보통 세 단계로 이루어집니다:
- 분석: 원문 언어(예: 영어)를 형태소 단위로 분석하고 구문 구조를 파악합니다.
- 전이(transfer): 분석한 구조를 목표 언어(예: 한국어)로 변환합니다.
- 생성(generation): 목표 언어의 문법에 맞게 문장을 재구성합니다.
✅ 장점:
- 언어학적 설명력이 뛰어나고, 정제된 번역 결과를 생성할 수 있습니다.
- 문법 오류가 적고, 의미의 왜곡 가능성이 상대적으로 낮습니다.
❌ 단점:
- 언어별로 규칙과 사전을 수작업으로 구축해야 하므로 시간과 비용이 많이 듭니다.
- 새로운 언어나 표현에 대한 확장성이 떨어집니다.
- 자연스러운 표현 생성이 어려운 경우가 있습니다.
💡 대표 예시:
- 일본의 기계 번역 시스템 ALT-J/E (규칙 기반으로 일본어-영어 번역을 수행합니다).
- 한국에서는 초기의 전자정부 번역 시스템이나 KAIST의 KORTERM이 대표적 규칙 기반 시스템이었습니다.
🔹 통계적 기계 번역 (Statistical Machine Translation)