위와 같이 수집된 희곡 대본을 지문 및 기타 요소들을 모두 제거하고 대사만 말뭉치로 선정하여 연구를 진행하였다.
희곡 텍스트에 대사 이외의 요소들은 수작업으로 삭제하여 원시말뭉치를 구축했다. 원시말뭉치를 지능형 형태소 분석기를 사용하여 형태소 분석을 하고, 빈도분석기를 활용하여 빈
2. 말뭉치 자료와 띄어쓰기
1) 계량 단위로써의 띄어쓰기
띄어쓰기의 대원칙이 되는 한글 맞춤법 제2항은, "각 단어는 띄어 씀을 원칙으로 한다."이다. 여기서 단어란 인식의 기본 단위를 말하는데, 이러한 막연한 기준만으로는 단어를 규정할 수 없고, 또 통일된 표기를 이끌어낼 수 없게 된다. 따라
구어말뭉치’가 있다.
‘말뭉치’란 주로 언어 현실을 드러내는 자료를 전자 자료로 만들어 데이터베이스화 한 것을 일컫는데, 언어 중에서 구어를 대상으로 추출한 자료를 ‘구어말뭉치’라고 한다. 비록 구어말뭉치는 그에 대한 연구의 역사가 짧고 학계에서도 풍부한 자료 구축이나 그 활용에
구어 문법’ 두 분야로 이루어진다. 외국인이 한국어를 잘 구사하기 위해서는 한국어만이 가지고 있는 규칙들을 잘 깨우치고 연습하여 그것을 적재적소에 쓸 줄 알아야 한다. 구어 문법으로서 한국어 구어 규칙은 외국인 학습자가 더 자연스럽고 자신감 있게, 정확하고 풍부하게 한국어를 사용하기 위
3) 70, 80년대 음악보다 90, 00, 10년대 음악이 단순한 여흥어의 반복이 많을 것이다.
70, 80년대의 음악에서는 우리말을 이용해서 단순 명료하게 자신의 감정을 표현했지만, 90년대 이후의 음악에서는 자신의 감정을 표현하는 것 이외에 노래를 듣는 사람들의 흥을 돋우기 위한 의미없는 음절의 반복이 많다