우리 프로젝트에서는 기본적으로 라이프치히 주석 규칙과 위키백과에 제시된 문법 범주 표지 목록을 따른다.
라이프치히 주석 규칙(Leipzing Glossing Rules)은 행간 주석(interlinear glosses)에 대한 열 가지 규칙으로 구성되어 있으며 부록으로 축약형 범주 표지의 목록을 제시하고 있다.
행간 주석(interlinear gloss)이란 원문 행과 번역문 행의 사이에 일련의 설명을 단 것을 말한다. 전사를 하거나 언어학적 분석 정보를 추가할 수 있으며 이렇게 주석으로 달린 행을 행간 주석 텍스트(IGT, interlinear glossed text)라고 한다.
텍스트에 앞서 언어명과 출처를 제시한다. 다음과 같이 5단계의 행으로 이루어질 수 있다. 원문(1)과 번역문(5)은 아래 위 정렬을 하지 않고 한 덩어리로 제시한다. 분석과 주석에 해당하는 행은 아래 위 단어 단위로 짝을 맞춘다.
일반적으로 분석(3), 주석(4), 번역(5)만 제시하며 원문(1)과 예비(2) 단계는 생략한다.
Korean (Author 2015:99) 1. 학생들에게만 주셨는데 2. 학생-들-에게-만 주-시-었-는데 2. hak.sayng.tul.ey.key.man cwu.syess.nun.te 3. haksayng-tul-eykey-man cwu-si-ess-nunte 4. student-PL-DAT-only give-HON-PST-while 5. 'while (he/she) gave (it) only to the students'
yrk,nene1249 (Tereshchenko 1966:382) Небяв мякӑнанда яӈгу nʹebʹa-w mʹa-k°nanda jaŋgu mother-1SG tent-LOC.3SG be:NEG 'My mother is not in her tent.' (rus. Моей матери нет дома.)
행간 주석은 왼쪽 정렬을 하고 단어 대 단어로 대응되도록 한다.
Achang (Author 2015:999) lA<31>NAu<33> mA_0?<55>n`_0it<31> n`_0a?<31> 남편 과 아내 '남편과 아내'
단순하게 생각하면 공백으로 구분된 단위가 대응되도록 하면 된다.
lA<31>NAu<33> | mA_0?<55>n`_0it<31> | n`_0a?<31> |
남편 | 과 | 아내 |
분절 가능한 형태소는 예문과 주석 모두 하이픈으로 구분하여 표시한다. 예문과 주석에서 하이픈의 개수는 정확히 일치해야 한다.
ts`MN31thA?31 Ei?55 s`Mk55 ts\E~31 kuAN33 x@u33 산위 의 나무 베다 없다 조사 '산위의 나무가 (모두) 베어 없어졌다.'
Achang (Author 2015:999) nAN33-xA33 kAi33-Ei?55-ts`Au33 p_jE~31 nEi?55 너-PREH 말하다-의-말 맞다 着 '너가 한 말이 맞다.'
하이픈은 단어 내부에서만 사용하는 것이 원칙이며 단어는 띄어쓰기를 단위이다. 예외적으로 형태론적으로 종속적 요소이지만 독립적인 단어처럼 행동할 때 분석 행에서 하이픈 앞에 공백을 하나 두고 주석 행에서는 공백없이 처리한다. 이 경우 띄어쓰기 단위가 일치하지 않게 된다.
Hakha Lai a-nii -láay 3SG-laugh-FUT 's/he will laugh'
문법 형태소는 문법 범주 표지로 주석한다. 문법 범주 표지는 대문자로 표시한다. 문법 범주 표지 축약형의 목록은 부록에 있다.
대상언어에서 단일한 요소가 메타언어에서 여러 개의 요소에 대응될 때 마침표를 이용하여 구분한다.
xA55 k_huN31 ts@31 kAN31 uN33~35 wAN33 lA?31~35 이 문 좁다 매우 할.수.없다 들어 가다 '이 문은 매우 좁아 들어갈 수 없다.'
메타언어에서 기본적으로 마침표로 여러 요소를 하나로 묶는다. 기타 필요에 따라 다른 기호를 사용하여 묶을 수 있다. 이것은 메타언어에서만 사용한다.
기호 | 사용법 | |
마침표 | . | 기본 |
밑줄 | _ | 대상언어의 요소가 형식적, 의미적 분절 불가능 |
세미콜론 | ; | 대상언어의 요소가 형식적으로 분절이 불가능하나 의미/문법적으로 구분 가능 |
콜론 | : | 대상언어의 요소가 분절 가능하나 표시하고 싶지 않음 |
백슬래시 | \ | 대상언어의 요소가 형태 변화가 일어나는 경우 |
크다 | > | 인칭-수 접사가 agent>patient를 동시 표현할 때 |
1PL
로 한다. 1.PL
로 표시하지 않는다.3NSG
대신에 3ns
로 간략하게 표기할 수 있다.형태소 대응 주석을 할 경우 명시적으로 나타나지 않는 요소가 문제가 된다. 주석에 대괄호로 둘러싸서 표기한다.
Latin puer boy[NOM.SG]
대상언어 예문에 Ø로 빈 자리를 표시할 수도 있다.
Latin puer-Ø boy-NOM.SG
내재적인 비명시적 범주는 괄호 안에 넣어 주석한다.
Hunzib (van den Berg 1995:46) oz#-di-g xõxe m-uq'e-r boy-OBL-AD tree(G4) G4-bend-PRET 'Because of the boy the tree bent.' (G4 = 4th gender, AD = adessive, PRET = preterite)
하나의 문법 또는 어휘 요소가 두 조각으로 나뉘어 있는 경우에 나누어 반복하여 표기한다. 다음은 라코타어의 na-xʔu̧ 'hear'의 경우의 예이다. 두 가지 방식이 있다.
Lakhota na-wíčha-wa-xʔu̧ hear-3PL.UND-1SG.ACT-hear 'I hear them' (UND = undergoer, ACT = actor)
na-wíčha-wa-xʔu̧ hear-3PL.UND-1SG.ACT- STEM 'I hear them'
접요사(infix)는 화살괄호로 묶어 표시한다.
Latin reli<n>qu-ere (stem: reliqu-) leave<PRS>-INF 'to leave'
중첩(reduplication)은 접사처럼 다루되 물결 ~
기호를 이용하여 연결한다.
Tagalog bi~bili IPFV~buy 'is buying'
대상언어 분석 행과 메타언어를 이용한 주석 행에서 동일하게 짝을 맞추어 사용하는 기호는 다음과 같은 것들이 있다.
하이픈 | - | 단어 내의 형태소 경계. |
등호 | = | clitic 경계를 표시 |
화살괄호 | <> | infix |
물결 | ~ | reduplication |
마침표 | . | 일대다 대응. 대상언어의 한 단어가 메타언어에서 여러 단어에 대응할 때. |
밑줄 | _ | 일대다 대응. 대상언어의 한 단어가 형식적으로나 의미적으로나 분리되지 않을 때. |
세미콜론 | ; | 일대다 대응. 대상언어의 한 단어가 형식저으로는 구분 불가 둘 이상의 의미/문법적 속성 가질 때. |
콜론 | : | 일대다 대응. 대상언어가 분석 가능하나 표지하지 않았을 때. |
백슬래시 | \ | 일대다 대응. 형태변화가 있을 때 관련있는 것\관련없는 것. |
크다 | > | 일대다 대응. 인칭-수 표지를 agent>patient 형식으로. |
소괄호 | () | 비명시적 요소. 내재적 범주를 주석에 표시할 때. gender같은 경우. |
대괄호 | [] | 비명시적 요소. 참조) 대상언어에서 무표(Ø)로 표시할 수도 있음. |