워드 스케치(Word sketch)
코퍼스의 메타데이터 통계를 보여줍니다. 예를 들어, 특정 웹 사이트에서 다운로드한 텍스트로 구성된 코퍼스에 문서, 토큰 또는 단어가 얼마나 있는지 확인할 수 있습니다.
- 스케치 엔진의 텍스트 유형 분석 도구는 메타데이터별로 분류를 보여줍니다.
- 각 웹사이트에서 다운로드한 텍스트, 각 저자가 쓴 텍스트, 각 연도에 출판된 텍스트에 있는 문서, 토큰 또는 단어의 수를 확인할 수 있습니다.
- 옵션 선택은 코퍼스에서 사용 가능한 메타데이터에 따라 달라집니다.
더 자세한 설명은 홈페이지 설명을 참조하세요.
텍스트 유형 분석 도구 사용 방법
-
대시보드 상단의 돋보기(🔍) 아이콘을 클릭하여 코퍼스를 선택합니다.
-
Text type analysis를 선택합니다.
-
아래와 같이 결과물을 확인합니다.
- Russian Trends 코퍼스에서 가장 많은 도메인은 .ru 이며, 두 번째로 많은 도메인은 .com입니다.
차트 옵션 변경 방법
- 차트 우측 상단의 설정(⚙️) 아이콘을 클릭하여 보기 옵션을 변경합니다.
- 차트에 표시될 텍스트 유형 개수의 기본값은 10개입니다.