지난 글에서 같은 언어로 분류될 수 있을 만큼 서로 유사한 언어들이 존재한다고 했었습니다. 언어가 유사하다는 것은 무슨 뜻일까요? 일본어를 공부해 본 사람이라면 한국어와 조금 비슷하다는 인상을 받았을 수도 있겠습니다. 문법적으로는 체언에 붙는 여러 가지 조사와 용언의 다양한 활용형이 존재한다는 점과, 가장 흔한 어순이 ‘주어가 목적어를 동사한다’라는 점이 유사합니다. 어휘적으로는 두 언어 모두 한자어를 정말 많이 사용하고요. 비록 지금은 한국어와 일본어가 상호 의사소통 가능하다고 말하는 사람은 거의 없을 정도로 다르지만, 예전에는 하나의 언어였을 수도 있지 않을까요?
언어의 뿌리를 찾아서 : 역사비교언어학
이런 생각을 한 사람들은 먼 옛날부터 자주 있었습니다. 고대 로마 사람들은 당대의 교양있는 언어였던 그리스어를 공부하면서, 자신들의 언어인 라틴어와 꽤 비슷하다는 사실을 알아냈습니다. 중동 지역에서도 중세에 이미 아랍어와 히브리어, 아람어Aramaic 세 언어가 서로 상당히 유사함을 밝혀냈습니다. 하지만 본격적으로 언어를 ‘비교’하는 연구가 활발해진 것은 대항해시대 이후입니다. 유럽 사람들은 아메리카와 아시아 등지의 완전히 새로운 언어들을 접하게 되었는데, 인도의 전례 언어인 산스크리트어Sanskrit도 그 중의 하나입니다.
영국의 문헌학자(옛날의 언어학자라고 생각하면 됩니다) 윌리엄 존즈 경Sir William Jones은 당시 영국의 식민지였던 인도에 가게 되었는데, 그곳에서 라틴어 정도의 위상을 지닌 산스크리트어를 공부하던 중 이 언어가 라틴어와 실제로 유사한 언어라는 것을 깨닫게 됩니다. 물론 존즈 이전에도 여러 사람들이 산스크리트어가 라틴어나 그리스어와 비슷하다고 생각했었지만, 존즈는 한 발짝 더 나아가 이 언어들이, 그리고 어쩌면 고트어Gothic, 켈트어Celtic languages, 페르시아어Persian까지도 하나의 언어에서 모두 갈라져 나온 것 같다고 주장했습니다. 서로 멀리 떨어져 단절된 채로 지금껏 지내왔던 언어들이 사실은 같은 조상 언어를 공유한다는 획기적인 생각이죠.
1789년의 이 발표는 큰 반향을 몰고왔습니다. 19세기의 문헌학자들은 서로 관련 있을 법한 여러 언어들의 문법과 어휘를 비교해서 원래의 조상 언어가 어떤 모습이었을지 재구reconstruction하는 데 열중했습니다. 심지어는 그 유명한 다윈의 <종의 기원>에서 제시한 생물학적 공통 조상 개념 역시 이러한 비교언어학적 성과에서 영감을 얻은 것이라고 합니다. 이 비교 방법론comparative method은 어원적 뿌리가 같은 동계어cognate 간에 소리 패턴이 규칙적으로 대응된다는 사실을 알게 되면서 더욱 신뢰도가 높아졌고, 역사비교언어학historical comparative linguistics이라는 학문으로 발전했습니다. 다음 표에서 영어, 고트어, 라틴어, 그리스어, 산스크리트어 간의 친족 어휘 대응 관계를 볼 수 있습니다. (어형 앞의 * 표시는 기록에 나타나지 않는 가상의 형태임을 의미합니다.)
조상 언어 (인도·유럽 조어) | 현대 영어 | 고트어 | 라틴어 | 고대 그리스어 (아티케 방언) | 산스크리트어 |
---|---|---|---|---|---|
*meH₂tér- ‘어머니’ | mother | māter | mḗtēr | mātár- | |
*pH₂tér- ‘아버지’ | father | fadar | pater | patḗr | pitár- |
*bʰréH₂ter- ‘형제’ | brother | brōþar | frāter | pʰrā́tēr ‘씨족 구성원’ | bʰrā́tar- |
*swésor ‘자매’ | sister | swistar | soror | éor ‘사촌의 딸’ | svásar- |
*dʰugH₂-tér- ‘딸’ | daughter | daúhtar | tʰugátēr | duhitár- | |
*suHnú- ‘아들’ | son | sunus | huiós | sūnú- |
한눈에 봐도 영어와 고트어가 다른 언어들보다 좀 더 가까워 보이지 않나요? 역사적으로도 영어는 앵글로색슨족, 고트어는 고트족의 언어로서 게르만 민족들의 언어입니다. 그런데 게르만 언어 단어들의 형태를 보면, 나머지 언어에서의 p가 f로 (고 fadar : 라 pater) 대응하는 규칙이 나타납니다. 그렇다면 원래 언어에서 p였던 것이 게르만어에서는 f로 바뀌었다고 추측해 볼 수 있겠습니다. (물론 이것만 가지고는 원래 언어의 f를 게르만어에서만 보존하고 있다고도 생각할 수 있습니다.) 한편 게르만어에서 b인 소리는 라틴어에서 f, 그리스어에서 ph(거센소리 ㅍ), 산스크리트어에서는 bh로 대응됩니다. 원래 언어에서 해당 소리가 bh였다고 하면 게르만어에서는 기식성aspiration을 잃었고, 라틴어에서는 무성 마찰음이 되었고, 그리스어에서는 무성음화devoicing되었고, 산스크리트어에서는 보존되었다는 식의 규칙들을 상정할 수 있습니다.
이러한 변화 규칙들은 각 소리가 1:1로 무조건 대응하기도 하지만, 대부분의 경우 주변에 인접한 소리들과 액센트 등의 환경적 조건이 붙습니다. 이 조건들을 파악하는 것은 까다로운 작업이지만, 라틴어와 그리스어, 산스크리트어 등은 아주 오래 전부터 기록이 많이 남아 있어 그 조상 언어의 모습이 상당히 잘 밝혀졌습니다. 이 공통의 조상 언어는 오늘날 유럽 언어의 대부분과 이란, 인도 북부의 수많은 언어들로 갈라졌습니다. 그래서 이 언어들을 인도·유럽어족Indo-European family이라고 부릅니다. 어족language family이란 말 그대로 서로 친연 관계가 있는 언어 가족이라는 뜻입니다. 그리고 한 어족의 최초 공통 조상 언어는 지금은 남아 있지 않지만 앞에서 본 비교 방법론으로 재구할 수 있으며, 이를 조어protolanguage라고 합니다. 인도·유럽어족의 조어는 인도·유럽 조어Proto-Indo-European이라고 하는 식이죠. 인도·유럽어족에 대해서는 이후 포스팅들에서 자세히 다루겠습니다.
세상에는 몇 개의 어족이 있을까
인도·유럽어족을 성공적으로 규명한 이후, 역사비교언어학자들은 세계의 다른 언어들로 눈길을 돌렸습니다. 앞서 언급한 아랍어와 히브리어, 아람어는 셈어Semitic languages라는 어족을 형성하고, 셈어는 다시 고대 이집트어, 베르베르어Berber languages, 하우사어Hausa 등과 함께 아프리카·아시아어족Afro-Asiatic family(예전에는 함·셈어족Hamito-Semitic이라고도 불렀습니다)을 이룬다는 사실이 밝혀졌습니다. 셈어는 아프리카·아시아어족의 한 어파branch인 셈이죠. 중국어의 경우 한자의 특성상 옛 발음을 바로 알기 어려웠습니다. 그럼에도 뛰어난 학자들이 옛 시의 운율 등을 이용해 상고 한어Old Chinese를 재구해냈고, 이를 주변 언어들과 비교해 중국어가 티베트어Tibetan와 미얀마의 버마어Burmese와 함께 중국·티베트어족Sino-Tibetan에 속한다는 사실까지 알아낼 수 있었습니다.
기록이 없거나 비교적 최근에야 시작된 언어들은 비교 방법론을 통해 친연 관계를 밝히기가 어려울 수밖에 없습니다. 이때 중점적으로 보는 것은 기초 어휘basic vocabulary입니다. 인칭 대명사, 수사, 자연물, 신체 부위, 친족 명칭과 같이 문화의 영향을 적게 받고 보편적이며 일상적인 개념을 가리키는 단어일수록 더 오래되었을 가능성이 높다는 생각에 기반한 것이죠. 이 방법도 꽤 효과적이어서 문자 전통이 빈약한 세계 각지의 어족이 빛을 보게 되었습니다. 인도양과 태평양을 아우르는 광대한 영역에 걸친 오스트로네시아어족Austronesian family과 아메리카의 수많은 토착 어족들을 비롯해 거의 모든 어족이 이런 방식으로 확인되었습니다. 역사비교언어학이 쇠퇴하고 대부분의 언어가 계통이 밝혀진 지금도 어족이 밝혀지지 않은 언어들과 이미 밝혀진 어족들의 친척을 찾아 비교 연구가 진행되고 있습니다.
여러 어족이 공존하는 지역은 언어 다양성이 높다고 봐도 좋겠습니다. 같은 인구라면 한 집안 식구가 동네를 독차지하는 것보다는 여러 가족들이 모여 사는 것이 좀더 다양하지 않을까요? 문제는 언어의 개수를 세는 것보다도 어족의 개수를 세는 것이 더 어렵다는 점입니다. 사람과 달리 언어의 친연관계는 유전자로 확인할 수 있는 것이 아니다 보니 정답인 학설이 없습니다. 그래도 대략적인 수치만 알아봅시다. 남아메리카의 토착 어족은 약 53개로 독보적입니다. 그러나 면적 대비 다양성으로는 역시 26개의 어족이 존재하는 뉴기니 섬을 따라올 자가 없습니다. 아프리카와 아시아는 14개와 15개 정도로 언어 개수에 비해 어족의 수는 아주 적습니다. 오스트레일리아도 12개로 꽤 많고, 북아메리카는 22개입니다. 유럽은 7개, 뉴기니와 오스트레일리아를 제외한 오세아니아 지역은 오스트로네시아어족 단 하나입니다.
여기에 추가로 고려해야 할 변수가 있습니다. 열심히 비교 연구를 수행했지만 계통을 끝내 알아내지 못했거나, 같은 어족에 속하는 친족어들이 모두 사멸하여 혼자 남은 언어들이 있기 때문입니다. 이를 (계통론적) 고립어language isolate라고 합니다. 사어를 포함해 지금까지 알려진 고립어는 중남미에 28개, 북미에 15개, 호주에 6개, 뉴기니에 15개, 아시아에 10개, 아프리카에 3개, 유럽에 바스크어가 있습니다. 한국어는 고립어에 포함되기도 하고, 독자적인 한국어족을 이루는 것으로 보기도 하는데, 이 문제는 다음에 다루도록 하겠습니다.
사촌보다 가까운 이웃 : 언어동조대
돌고 돌아 한국어 이야기로 다시 왔습니다. 한국어는 일본어와 같은 어족이 아닐까요? 그런 생각을 한 사람들은 조선 시대에도 있었다고 합니다. 당시엔 비교 방법론이 생기기도 전이었지만 두 언어 간의 유사성은 눈에 띄었나 봅니다. 하지만 아쉽게도 엄밀한 비교 연구 결과 한국어와 일본어가 서로 친척이라고 인정할 만한 근거는 아직 찾지 못했습니다. 이는 고대 한국어 기록이 적은 탓도 있겠지만, 결정적으로 기초 어휘의 규칙적 대응이 부족하기 때문입니다. 그러면 일본어는 왜 한국어와 비슷한 걸까요?
유럽의 발칸 반도에는 다양한 언어들이 공존하고 있습니다. 남슬라브어파South Slavic languages에 속하는 여러 언어들, 라틴어의 후손인 루마니아어Romanian, 그리고 알바니아어Albanian와 그리스어 등입니다. 비록 모두 같은 인도·유럽어족에 속하는 언어들이지만, 충분히 오래 전에 여러 어파로 나뉘었음에도 상당히 많은 문법적 특징을 공유하는 점은 19세기부터 언어학자들의 흥미를 끌었습니다. 이들이 닮게 된 것은 지리적으로 인접해 있기 때문에 오랜 세월 언어 접촉이 일어난 결과라는 설명을 할 수 있습니다. 실제로 라틴어의 다른 후손인 프랑스어나, 슬라브어와 접촉하기 이전 시기의 그리스어는 ‘발칸 반도의 특징’을 보이지 않습니다. 이런 현상을 설명하기 위한 개념으로 언어 동조대Sprachbund(혹은 언어 연합language union, 언어 지역linguistic area)가 제안되었습니다. 한국어와 일본어도 하나의 언어동조대를 이룬다고 볼 수 있겠습니다.
어족이 형성되는 것은 조어의 여러 방언을 사용하던 집단들이 각각 이주나 고립으로 인해 서로 단절되고, 서로 간에 차이가 커져 개별 어파로 떨어져나가는 과정입니다. 그러다 보니 먼 옛날에 갈라진 ‘친척’ 언어보다는 이주한 뒤로 오래도록 함께 살아온 ‘이웃’ 언어와 더 닮게 되는 것은 어찌 보면 당연합니다. 역사비교언어학이 언어학의 주류이던 과거에는 이런 언어의 동조 현상은 정확한 재구와 어족 설정의 방해물로만 여겨졌습니다. 그러나 이제는 언어에 대해 계통뿐 아니라 유형적인 접근을 하게 되면서, 언어 동조대는 그 자체로 흥미로운 연구 대상이 되었습니다. 대표적인 예시가 바로 한때 ‘알타이어족’ 아래 묶였던 몽골어족Mongolic, 퉁구스어족Tungusic, 튀르크어족Turkic입니다. 이 세 어족들과 알타이 가설에 관해서는 따로 포스팅하도록 하겠습니다.
주요 개념어
- 어족, 어파, 어군, 고립어
- 역사비교언어학, 언어 계통론
- 비교 재구, 동계어
- 언어유형론, 언어동조대
더 읽어보기
- 세계의 어족 목록 (링크)
작성 양재영 감수 김민규
댓글이 없습니다