사용하는 것이 중요하다.
이를 위해 대용량 언어 데이터인 코퍼스라는 구축되었다. 우선, 코퍼스가 무엇인지 알아보고, 이를 이용하여 한국어에서 여러 가지 의미로 쓰이고 있는 ‘들다’의 의미 사용 빈도에 대해서 연구해보도록 하겠다. 이를 통해 다의어의 학습 방안에 대해 생각해보겠다.
4대 비극과 5대 희극으로 분류했고, 그 후로 여러 사람들이 이를 인용하기 시작함.
비극 (주 corpus)
King Lear 25,230
Othello 25,742
Macbeth 20,236
Hamlet 30,740
희극 (참조 코퍼스)
As You Like It 25,288
The Taming of the Shrew 20,502
The Merchant of Venice 21,075
Twelfth Night 19,418
A Midsummer Night's Dream 17,571
Ⅰ. 서 론
언어가 인간 정신 활동의 중심축이기 때문에 언어의 문제는 언어 자체에만 국한되지 않으며, 여러 다른 학문의 대상이기도 한다. 즉 언어학적 연구 분야는 다음과 같이 여러 학문과 관련이 되어 진다. 먼저, 언어의 의미 문제로서 논리학, 철학, 심리학과 직접적인 관련이 있으며, 언어가 하나
코퍼스(annotated corpus)
텍스트를 어떤 목적을 위하여 가공하고 표지를 붙여 놓은 것
주석의 목적
어떤 목적을 위하여 텍스트를 해석하고 그 해석한 결과를 표시해
놓음으로써 코퍼스의 이용 가치를 높이는 것
연구 목적에 따른 주석의 다양한 형태
역사 연구의 관점
연대 혹은 시
연구의 기반이 될 뿐 아니라 사전 편찬과 언어 교육의 응용 분야에서 없어서는 안 될 중요한 자원으로 인식되고 있다. 아울러 자연언어처리, 정보검색, 기계번역 등 컴퓨터의 언어 처리에서 말뭉치에 기반한 통계적 정보가 점점 더 중요시되고 있다. 두 언어의 문장들을 병치시켜 만든 병렬코퍼스는 기