연구의 기반이 될 뿐 아니라 사전 편찬과 언어 교육의 응용 분야에서 없어서는 안 될 중요한 자원으로 인식되고 있다. 아울러 자연언어처리, 정보검색, 기계번역 등 컴퓨터의 언어 처리에서 말뭉치에 기반한 통계적 정보가 점점 더 중요시되고 있다. 두 언어의 문장들을 병치시켜 만든 병렬코퍼스는 기
가지는 각종의 통계 데이터를 수집 분석할 수가 있다.
둘째는 컴퓨터에 자연어를 이해시켜 주는 자연어 이해 시스템 (natural language understanding system)의 연구다. 자연어 이해 시스템은 컴퓨터와 인간 사이에 존재하는 사용 언어가 서로 다름으로써 생기는 불편함의 해소를 목적으로 하는 시도이다.
연구, 문장 혹은 작자의 스타일 연구 등 여러 분야에 광범위하게 사용되고 있기 때문이다
예를 들면, 사전 편찬시 등재한 해당 단어 아래의 용법 및 용례는 편집자가 임의로 삽입하는 것이 아니고, 대규모의 코퍼스에서 추출한 것이다. 그런데 이러한 코퍼스의 텍스트는 모두가 語料를 분리하여, 품사
기반 이미지 검색을 위해 기존의 다차원 공간 인덱스 기법에 대해 많은 연구가 진행되어 왔다. R-트리 계열 인덱스들은 최소 경계영역을 사각형 모양으로 표현하여 최근접 질의 등의 공간 질의에는 적합하지 않다. 이러한 문제점을 해결하기 위해 구(sphere) 모양으로 최소 경계영역을 표현하는 SS-트리가
Ⅰ. 서 론
언어가 인간 정신 활동의 중심축이기 때문에 언어의 문제는 언어 자체에만 국한되지 않으며, 여러 다른 학문의 대상이기도 한다. 즉 언어학적 연구 분야는 다음과 같이 여러 학문과 관련이 되어 진다. 먼저, 언어의 의미 문제로서 논리학, 철학, 심리학과 직접적인 관련이 있으며, 언어가 하나