사용자 도구

사이트 도구


guide:glossing_rules

**문서의 이전 판입니다!**

주석 규칙

개요

우리 프로젝트에서는 기본적으로 라이프치히 주석 규칙과 위키백과에 제시된 문법 범주 표지 목록을 따른다.

라이프치히 주석 규칙(Leipzing Glossing Rules)은 행간 주석(interlinear glosses)에 대한 열 가지 규칙으로 구성되어 있으며 부록으로 축약형 범주 표지의 목록을 제시하고 있다.

  • 행간 형태소 대응 주석(interlinear morpheme-by-morpheme glosses)
  • 목적에 따라 얼마나 상세하게 주석할지 달라질 수 있다
  • 형태론적 패턴의 분석에는 여러가지 방법이 있을 수 있다. 주석 규칙이 어떻게 분석할지에 대한 지침을 주지는 않는다. 단지 분석 결과를 주석하는 방법만 제시한다.
  • 주석은 자료의 일부가 아니라 분석의 일부이다. 인용할 경우에 분석과 주석은 달라질 수 있다.

행간 주석 텍스트

행간 주석(interlinear gloss)이란 원문 행과 번역문 행의 사이에 일련의 설명을 단 것을 말한다. 전사를 하거나 언어학적 분석 정보를 추가할 수 있으며 이렇게 주석으로 달린 행을 행간 주석 텍스트(IGT, interlinear glossed text)라고 한다.

텍스트에 앞서 언어명과 출처를 제시한다. 다음과 같이 5단계의 행으로 이루어질 수 있다. 원문(1)과 번역문(5)은 아래 위 정렬을 하지 않고 한 덩어리로 제시한다. 분석과 주석에 해당하는 행은 아래 위 단어 단위로 짝을 맞춘다.

  1. 원문: (original text) 대상 언어의 예문을 있는 그대로 제시. 원래 언어의 문자를 사용하여 제시하기도 한다.
  2. 예비적 분석: 띄어쓰기가 없는 언어에서 단어 단위로 분절, 라틴문자로 전사, 전사하지 않고 대상 언어의 문자를 이용하여 형태소 기본형을 제시하는 등. 여러 행이 제시될 수도 있다.
  3. 분석: (analysis) 형태론적 분석이 이루어진 예문. 일반적으로 라틴문자 또는 IPA를 이용하여 전사한 형태로 제시.
  4. 주석: (gloss) 어휘 요소는 메타언어(주로 영어)를 이용하여, 문법 요소는 약속된 표지를 이용하여 주석.
  5. 번역: (free translation) 메타언어(주로 영어)를 이용하여 의미를 잘 전달할 수 있도록 번역.

일반적으로 분석(3), 주석(4), 번역(5)만 제시하며 원문(1)과 예비(2) 단계는 생략한다.

Korean (Author 2015:99)

1. 학생들에게만 주셨는데
2. 학생-들-에게-만               주-시-었-는데
2. hak.sayng.tul.ey.key.man     cwu.syess.nun.te
3. haksayng-tul-eykey-man       cwu-si-ess-nunte
4. student-PL-DAT-only          give-HON-PST-while
5. 'while (he/she) gave (it) only to the students'
yrk,nene1249 (Tereshchenko 1966:382)

Небяв       мякӑнанда       яӈгу 
nʹebʹa-w    mʹa-k°nanda     jaŋgu
mother-1SG  tent-LOC.3SG    be:NEG
'My mother is not in her tent.' (rus. Моей матери нет дома.)

주석 규칙

  1. word-by-word alignment
  2. morpheme-by-morpheme correspondence
  3. grammatical category labels
  4. one-to-many correspondences
  5. person and number labels
  6. non-overt elements
  7. bi-partite elements
  8. infixes
  9. inherent categories
  10. reduplication

1. 단어 대응 정렬

행간 주석은 왼쪽 정렬을 하고 단어 대 단어로 대응되도록 한다.

Achang (Author 2015:999)

lA<31>NAu<33>  mA_0?<55>n`_0it<31>  n`_0a?<31>
남편           과                  아내 
'남편과 아내'

단순하게 생각하면 공백으로 구분된 단위가 대응되도록 하면 된다.

lA<31>NAu<33> mA_0?<55>n`_0it<31> n`_0a?<31>
남편 아내

2. 형태소 대응

분절 가능한 형태소는 예문과 주석 모두 하이픈으로 구분하여 표시한다. 예문과 주석에서 하이픈의 개수는 정확히 일치해야 한다.

ts`MN31thA?31 Ei?55 s`Mk55 ts\E~31 kuAN33 x@u33
산위          의    나무 베다    없다   조사
'산위의 나무가 (모두) 베어 없어졌다.'
Achang (Author 2015:999)

nAN33-xA33 kAi33-Ei?55-ts`Au33 p_jE~31 nEi?55
너-PREH    말하다-의-말        맞다    着
'너가 한 말이 맞다.'

하이픈은 단어 내부에서만 사용하는 것이 원칙이며 단어는 띄어쓰기를 단위이다. 예외적으로 형태론적으로 종속적 요소이지만 독립적인 단어처럼 행동할 때 분석 행에서 하이픈 앞에 공백을 하나 두고 주석 행에서는 공백없이 처리한다. 이 경우 띄어쓰기 단위가 일치하지 않게 된다.

Hakha Lai

a-nii -láay
3SG-laugh-FUT
's/he will laugh'

3. 문법 범주 표지

문법 형태소는 문법 범주 표지로 주석한다. 문법 범주 표지는 대문자로 표시한다. 문법 범주 표지 축약형의 목록은 부록에 있다.

4. 일대다 대응

대상언어에서 단일한 요소가 메타언어에서 여러 개의 요소에 대응될 때 마침표를 이용하여 구분한다.

xA55 k_huN31 ts@31 kAN31 uN33~35    wAN33  lA?31~35
이   문      좁다  매우  할.수.없다 들어   가다
'이 문은 매우 좁아 들어갈 수 없다.'

메타언어에서 기본적으로 마침표로 여러 요소를 하나로 묶는다. 기타 필요에 따라 다른 기호를 사용하여 묶을 수 있다. 이것은 메타언어에서만 사용한다.

기호 사용법
마침표 . 기본
밑줄 _ 대상언어의 요소가 형식적, 의미적 분절 불가능
세미콜론 ; 대상언어의 요소가 형식적으로 분절이 불가능하나 의미/문법적으로 구분 가능
콜론 : 대상언어의 요소가 분절 가능하나 표시하고 싶지 않음
백슬래시 \ 대상언어의 요소가 형태 변화가 일어나는 경우
크다 > 인칭-수 접사가 agent>patient를 동시 표현할 때

5. 인칭과 수 표지

  • 인칭과 수 표지는 점으로 구분하지 않고 표시한다. 예를 들어, 1인칭 복수는 1PL로 한다. 1.PL로 표시하지 않는다.
  • 성, 수 표지가 빈번한 언어의 경우 간편 표기를 쓸 수도 있다. 예를 들어 중성 3인칭 단수는 3NSG 대신에 3ns로 간략하게 표기할 수 있다.

6. 비명시적 요소

형태소 대응 주석을 할 경우 명시적으로 나타나지 않는 요소가 문제가 된다. 주석에 대괄호로 둘러싸서 표기한다.

Latin
puer
boy[NOM.SG]

대상언어 예문에 Ø로 빈 자리를 표시할 수도 있다.

Latin

puer-Ø
boy-NOM.SG

7. 내재 범주

내재적인 비명시적 범주는 괄호 안에 넣어 주석한다.

Hunzib (van den Berg 1995:46)

oz#-di-g     xõxe       m-uq'e-r
boy-OBL-AD   tree(G4)   G4-bend-PRET
'Because of the boy the tree bent.' (G4 = 4th gender, AD = adessive, PRET = preterite)

8. 두 부분으로 구성된 요소

하나의 문법 또는 어휘 요소가 두 조각으로 나뉘어 있는 경우에 나누어 반복하여 표기한다. 다음은 라코타어의 na-xʔu̧ 'hear'의 경우의 예이다. 두 가지 방식이 있다.

Lakhota

na-wíčha-wa-xʔu̧
hear-3PL.UND-1SG.ACT-hear
'I hear them' (UND = undergoer, ACT = actor)
na-wíčha-wa-xʔu̧
hear-3PL.UND-1SG.ACT- STEM
'I hear them'

9. 접요사

접요사(infix)는 화살괄호로 묶어 표시한다.

Latin

reli<n>qu-ere (stem: reliqu-)
leave<PRS>-INF
'to leave'

10. 중첩

중첩(reduplication)은 접사처럼 다루되 물결 ~ 기호를 이용하여 연결한다.

Tagalog

bi~bili
IPFV~buy
'is buying'

기호

대상언어 분석 행과 메타언어를 이용한 주석 행에서 동일하게 짝을 맞추어 사용하는 기호는 다음과 같은 것들이 있다.

하이픈 - 단어 내의 형태소 경계.
등호 = clitic 경계를 표시
화살괄호 <> infix
물결 ~ reduplication
  • 이 기호들은 단어 단위의 내부 요소를 구분할 때 사용하는 것이다.
  • 단어 단위는 공백으로 구분한다.
  • 예외적으로 형태론적으로 종속적 요소이지만 독립적인 단어처럼 행동할 때 분석 행에서 하이픈 앞에 공백을 하나 두고 주석 행에서는 공백없이 처리한다.

주석에만 사용하는 기호

마침표 . 일대다 대응. 대상언어의 한 단어가 메타언어에서 여러 단어에 대응할 때.
밑줄 _ 일대다 대응. 대상언어의 한 단어가 형식적으로나 의미적으로나 분리되지 않을 때.
세미콜론 ; 일대다 대응. 대상언어의 한 단어가 형식저으로는 구분 불가 둘 이상의 의미/문법적 속성 가질 때.
콜론 : 일대다 대응. 대상언어가 분석 가능하나 표지하지 않았을 때.
백슬래시 \ 일대다 대응. 형태변화가 있을 때 관련있는 것\관련없는 것.
크다 > 일대다 대응. 인칭-수 표지를 agent>patient 형식으로.
소괄호 () 비명시적 요소. 내재적 범주를 주석에 표시할 때. gender같은 경우.
대괄호 [] 비명시적 요소. 참조) 대상언어에서 무표(Ø)로 표시할 수도 있음.
  • 문법 범주 표지는 대문자로. 목록은 부록으로 제시.

문법 표지

guide/glossing_rules.1453046170.txt.gz · 마지막으로 수정됨: 2016/01/18 00:56 저자 유현조