이번 포스팅에서는 인도·유럽어족의 나머지 두 어파를 소개합니다. 순서가 마지막인 이유는 두 어파 모두 현재는 사멸한 언어들로 구성되어 있고, 또 비교적 늦게 발견되었으면서 인도·유럽어족에 대한 기존의 생각들을 무너뜨리는 데 중요한 증거가 되었기 때문입니다.
히타이트어의 발견
구조주의의 창시자로 잘 알려진 스위스의 위대한 언어학자 페르디낭 드 소쉬르Ferdinand de Saussure는 어린 시절부터 천재성을 드러냈습니다. 현대 언어학의 고전 <일반언어학 강의Cours de Linguistique Générale>에서 소쉬르는 언어학이 시간의 흐름에 따른 변화인 ‘통시태’diachrony보다는 특정 시점의 체계 전체인 ‘공시태’synchrony에 집중해야 한다고 주장하면서 역사비교언어학의 전성시대를 끝냈습니다. 그렇지만 이전에는 그 역시 인도·유럽어족 역사언어학 분야에서 여러 연구 성과를 남겼습니다. 그 중 백미는 단연 후두음 이론laryngeal theory일 것입니다.
후두음 이론을 자세히 설명하려면 인도·유럽 조어의 형태음운론에 대해 너무 깊게 들어가게 되므로, 간단하게 소개만 하겠습니다. 인도·유럽 조어에는 *e, o, a와 각각에 해당하는 장모음이 재구됩니다. 기존에는 장모음이 들어가는 어근의 형태 변화가 불규칙적이라고 생각했었지만, 소쉬르는 어떤 미지의 자음(‘후두음’)이 모음 *e와 결합하여 장모음이 되었다는 식의 설명으로 규칙적 어근 형태를 일반화합니다. 마치 영국 영어에서 r 자음이 앞의 모음을 장모음으로 만들듯이 말이죠. 또한 라틴어 nōmen, stēlla나 영어 name, star가 그리스어에서 ὄνομα /ónoma/, ἀστήρ /astḗr/와 같이 어두에 모음이 있는 형태로 대응되는 것 역시 후두음이 모음처럼 기능하기 때문이라고 설명했습니다. 물론 이는 순전히 언어 내적인 구조를 토대로 추측한 것이므로, 문헌 비교를 통한 재구성만을 이용하던 당시의 학계는 이 주장을 별로 신뢰하지 않았습니다.
*sed- | *sd- | ‘앉다’ > sit |
*dō- < **deO- | *də- < **dO- | ‘주다’ > donate |
*stā- < **steA- | *stə- < **dA- | ‘서다’ > stand |
위의 표처럼 O, A라는 자음이 e의 음가를 변화시키거나, 단독으로는 약한 모음 ə가 되는 것입니다. 이후 e와 결합하여 장모음 ē를 만드는 자음 h₁가 추가되었고 A는 h₂, O는 h₃이라 이름붙었습니다. 그러나 이 소리들이 실제로 존재했는지는 여전히 검증할 길이 없었습니다. 1876년의 이 번뜩이는 통찰은 그렇게 묻히는 듯 했습니다. 고대 히타이트 제국의 수도였던 터키의 보아즈칼레에서 20세기 초 대량의 쐐기 문자 점토판이 출토되기 전까지는요. 이 점토판들은 이미 해독된 아카드 문자로 쓰여 있었지만, 기록한 언어 자체는 기존에 알려지지 않은 것이었습니다. 이 언어를 면밀히 분석한 결과, 인도·유럽어족에 속하는 새로운 언어임이 밝혀졌습니다. 그리고 이 언어는, 소쉬르가 h₂가 있을 것으로 예측한 바로 그 위치에 ḫ라는 자음을 간직하고 있었습니다.
히타이트어Hittite와 유사한 다른 언어들의 기록도 터키의 옛 유적들에서 발굴되었습니다. 그 중에서 자료가 가장 풍부한 것은 루위어Luwian입니다. 루위어는 히타이트어처럼 쐐기 문자로 적힌 점토판 기록도 있고, 독자적인 상형문자 체계인 아나톨리아 성각문자Anatolian hieroglyphs로 새겨지기도 했습니다. 그리스 알파벳을 모방한 리키아 문자로 기록된 리키아어Lycian 역시 히타이트어와 같은 계통으로 분류됩니다. 루위어와 리키아어에도 후두음이 발견됩니다. 기록이 적거나 파편적인 다른 언어 몇 개를 더해 이들을 아나톨리아어파Anatolian languages라고 부릅니다.
아나톨리아어파는 후두음을 보존하고 있다는 점 외에도 다른 인도·유럽어족 어파들과 좀 다른 모습을 보입니다. 히타이트어는 문법적으로도 남·여·중성 체계 대신 생물 대 무생물의 생물성animacy 부류 체계를 가지고 있으며, 동사가 주어의 인칭과 수, 능동태와 중간·수동태, 직설법과 명령법, 현재와 과거 시제 범주로만 굴절하는 상당히 단순화된 변화가 나타납니다. 한편 명사는 산스크리트어의 8격에서 여격과 처격이 합쳐지고 능격ergative case과 향격이 추가된 9격 체계로 곡용하며, 어순은 한국어와 거의 같습니다. (주어를 문법적 환경에 따라 주격 또는 능격으로 표시하는 분열 능격split ergativity 체계였을 것으로 추정됩니다.) 그래서 아나톨리아어파는 인도·유럽어족 언어들 중에서 가장 먼저 떨어져 나온 것으로 보기도 합니다.
토카르어의 발견
그러나 히타이트어가 가져온 변화의 바람에도 아직 켄툼과 사템 계열 분류법은 완전히 무너지지 않았습니다. 히타이트어에 k와 g 그리고 kʷ와 gʷ가 나타나기 때문에 켄툼어로 분류하기도 하지만, 라틴어 equus /ekʷus/와 산스크리트어 अश्व /áśva/의 어원인 *h₁éḱwos ‘말(馬)’이 성각문자 루위어에서는 ásùwa, 리키아어에서는 ???????????????? /esbe/로 나타납니다. 이 때문에 학자들은 아나톨리아어파가 켄툼어와 사템어가 갈라지기 전 시기에 형성된 것으로 추측하기도 했습니다. 그러나 20세기 초의 또 다른 발견이 인도·유럽어학계를 기다리고 있었습니다.
중앙아시아의 타림 분지에서 미지의 언어 자료가 발굴되었습니다. 6세기에서 8세기 사이의 것으로 추정되는 야자잎, 목판, 종이에 적힌 기록들이 건조한 기후 덕에 보존된 것이었습니다. 아무도 이곳에서 새로운 언어를 발견할 것이라고는 생각하지 못했기 때문에, 그리스 역사가의 기록에 나오는 토카르인들의 언어로 일단 추정되었습니다. 그리고 이 ‘토카르어’는 그간 알려지지 않았던 인도·유럽어족의 또 다른 일파로 밝혀졌습니다.
토카르어 자료는 사실 두 가지 서로 다른 언어로 기록되어 있었습니다. 이를 각각 토카르어 A(동부)와 토카르어 B(서부)라 부릅니다. 주변 지역 문헌에 등장하는 비슷한 형태의 차용어나 고유명사들을 토카르어 C로 부르기도 합니다. A와 B의 모습이 꽤 다르기 때문에, 이 두 언어를 비교해 토카르어파의 조어를 재구하는 것도 가능합니다. 한편 문법적으로는 인도·유럽 조어의 격 체계 중 주격, 속격, 대격(과 호격)만을 유지하고, 나머지 7가지 격을 새로 만들었습니다. 그에 비해 동사는 인도·유럽 조어의 거의 모든 활용 방식들을 유지하여 복잡한 체계를 보입니다. 그러나 더 놀라운 지점은 소리의 대응입니다.
토카르어파는 알려진 인도·유럽어족의 어파들 중 가장 동쪽에 위치하고 있지만, 당시로서는 충격적이게도 사템 계열이 아닌 켄툼 언어에 속했습니다. 앞서 예시로 든 *h₁éḱwos ‘말(馬)’이 토카르어 A에서는 yakwe, B에서는 yuk으로 나타납니다. 이전까지 서쪽의 인도·유럽어는 켄툼어, 동쪽의 인도·유럽어는 사템어라는 큰 가지로 갈라졌다고 믿던 학자들은 s로 마찰음화되지 않은 이 k를 설명해야만 했습니다. 결국 켄툼과 사템의 구분이 나무의 가지처럼 갈라져 나온 것이라는 이론tree model 대신, 사템 계열의 변화가 인도·유럽어족의 중앙부에서 시작되어 파도처럼 퍼져나갔다는 이론wave model이 등장하게 됩니다. 서쪽과 동쪽 끝에 위치한 유럽의 언어들과 토카르어는 이 사템의 파도가 도달하지 못했다는 것이죠. 오늘날에는 켄툼과 사템의 구별을 비롯해 인도·유럽어족을 둘로 묶을 수 있는 많은 차이점들이, 계통상의 한 지점에서 갈라진 것이 아니라 이렇게 점차 확산된 것이라는 설명이 일반적입니다.
인도·유럽 조어는 어디에서 왔을까
인도·유럽어족의 알려진 주요 어파가 다 소개되었습니다. 그런데 의문이 남습니다. 이 많은 언어들이 하나의 공통 조어에서 갈라져 나왔다면, 그 조어는 어디에서 쓰였던 것일까요? 물론 우리가 보는 인도·유럽 조어는 현대에 와서 재구성한 가상의 언어입니다. 그래도 그 모든 어파가 갈라지기 전 실제로 쓰였을 언어는 존재해야만 합니다. 인도·유럽 조어를 실제로 누가 어디서 언제 썼는지에 관해서는 여러 설이 있습니다.
가장 널리 지지를 받는 학설은 쿠르간 가설Kurgan hypothesis입니다. 쿠르간은 러시아어로 무덤, 봉분을 뜻하는 말인데, 무덤이 인도·유럽어족과 무슨 관련이 있다는 걸까요? 인도·유럽 조어는 기록된 적이 없는 언어이기 때문에, 역사학이 아닌 고고학의 도움을 받을 수 있었습니다. 쿠르간식 무덤은 러시아 남부에서 나타나는데, 이와 유사한 형태의 무덤들이 퍼져나간 지역이 인도·유럽어족의 영역과 상당히 겹칩니다. 1950년대에 쿠르간식 무덤을 비롯한 여러 고고학적 증거를 가지고 제안된 이 가설에 따르면 인도·유럽 조어 화자들은 기원전 4천년경 흑해와 카스피해 사이의 초원 지대에서 살았던 유목민족이었을 것으로 추정됩니다.
고고학과 더불어 유전학도 인도·유럽 조어의 실체를 밝히는 데 일조하고 있습니다. 유럽인에서 가장 흔한 R1b와 R1a 하플로그룹이 러시아와 우크라이나의 초원지대에서 유래했을 가능성이 높다는 것이죠. 언어 집단이 항상 단일 민족으로 구성되는 것은 아니지만, 적어도 인도·유럽 조어를 사용하던 집단이 유럽과 남아시아로 퍼져나간 민족 집단일 개연성은 충분합니다. 한편 이 가설에 동의하지 않는 학자들도 있는데, 이들이 제시하는 인도·유럽어족의 원주지urheimat은 각각 아나톨리아 반도 동부 – 캅카스 산맥 이남 – 메소포타미아 북부(1985년), 신석기 시대의 아나톨리아 반도(1987년) 등입니다.
재구된 인도·유럽 조어 자체에도 특이한 지점들이 있고, 이런 지점을 파고들면 소쉬르의 후두음 이론처럼 기록되지 않은 더 옛날의 상태를 엿볼 수 있습니다. 앞서 히타이트어에는 일반적인 인도·유럽어의 남·여·중성이 아니라 생물과 무생물 명사를 구분한다고 했는데, 사실 이것은 히타이트어에서 새로 생긴 현상이 아닐 수도 있습니다. 인도·유럽 조어에는 몇몇 의미들이 두 가지 서로 다른 명사 어근으로 재구되는 경우가 있습니다. 예를 들어 ‘물’은 영어로 water, 고대 그리스어로 ὕδωρ /hýdɔːr/, 러시아어로 вода /vodá/이고, 히타이트어로는 ???????????? /wa-a-tar/입니다(이 유사성은 히타이트어가 인도·유럽어라는 것을 밝히는 데에 결정적 단서가 되었습니다). 이로부터 *wed- ‘물’이라는 어근을 재구할 수 있습니다. 토카르어도 비슷하겠죠?
아닙니다. 토카르어로 물은 āp이고, *h₂ep-이라는 전혀 다른 어근에서 나왔습니다. 주목할 만한 점은 *wed-와 *h₂ep- 둘 다 여러 인도·유럽어에서, 심지어 한 언어 안에서도 나타난다는 것입니다. 비슷한 현상이 ‘불’에도 나타납니다. 영어의 fire의 어원이 되는 *péh₂wr̥와 ignite의 어원이 되는 *h₁n̥gʷnis 두 가지 어근이 존재합니다. 이 두 쌍의 차이는 무엇이었을까요? 라틴어로 *wed-에서 나온 unda는 ‘파도’를 의미하고, *h₂ep-에서 나온 amnis는 ‘강’을 뜻합니다. 잘 모르겠다면, 인도 신화에서 불의 신은 अग्नि /agní/입니다. *wed-와 *h₁n̥gʷnis는 능동적이고 ‘살아 있는’ 것, *h₂ep-과 *péh₂wr̥는 수동적인 물질로서의 물과 불이라는 차이가 있다는 것입니다. 또 인도·유럽 조어의 명사 변화 패턴을 보면, 그 이전 시기에는 남성과 여성 명사가 생물 명사라는 한 그룹을 이루어 중성/무생물 명사와 대립했을 것으로 추정됩니다.
이제 인도·유럽어족에 대해 모두 살펴보았으니, 인도·유럽 언어들과 오랜 세월 이웃해 살아오면서 서로 많은 영향을 주고받은 어족과 언어에 대한 포스팅들로 돌아오겠습니다.
댓글이 없습니다