연속하는 동일조음위치 파열음의 시공간적 특성에 관한 연구: 전자구개도(EPG)를 기반으로

Spatio-temporal Characteristics of Successive Plosive Consonants in the Same Place of Articulation: An Electropalatographic Study

Article information

Commun Sci Disord Vol. 27, No. 2, 393-402, June, 2022
Publication date (electronic) : 2022 June 30
doi : https://doi.org/10.12963/csd.22901
aDepartment of Speech and Language Pathology, Graduate School of Rehabilitation, Daegu University, Gyeongsan, Korea
bBrain Convergence Research Center, Korea University College of Medicine, Seoul, Korea
cDepartment of Electronic Engineering, Dong Seoul University, Seongnam, Korea
dDepartment of Speech-Language Therapy, Keimyung College University, Deagu, Korea
eDepartment of Speech Pathology, Daegu University, Gyeongsan, Korea
오다희a,b, 우승탁c, 김지영a, 김미진d, 김수진a, 하지완,a,e
a대구대학교 일반대학원 재활과학과
b고려대학교 의과대학 융합뇌신경연구소
c동서울대학교 전자공학과
d계명문화대학교 언어치료학과
e대구대학교 언어치료학과
Correspondence: Ji-Wan Ha, PhD Department of Speech Pathology, Daegu University, 201 Daegudae-ro, Jillyang-eup, Gyeongsan 38453, Korea Tel: +82-53-850-4327 Fax: +82-53-850-4329 E-mail: jw-ha@daegu.ac.kr
This work was supported by the Ministry of Education of the Republic of Korea and the National Research Foundation of Korea (NRF-2019S1A5A2A03054267).
Received 2022 April 20; Revised 2022 May 13; Accepted 2022 May 13.

Abstract

배경 및 목적

본 연구에서는 동일 조음위치의 파열음이 연쇄할 때, 선행하는 자음이 실제로 발음되는지 조사하여, 한국어의 음운론에서 여전히 논란이 되고 있는 동일 조음위치 장애음 탈락의 실제에 대해 실험적인 결론을 이끌어 내고자 한다.

방법

정상 성인 5명을 대상으로 발화단위(단어, 문장), 단어여부(단어, 비단어), 음절구조(VCV, VC1C2V)에 따른 폐쇄지속시간 및 최대접촉점의 차이를 분석하였으며, 두 변수는 전자구개도를 통해 조음운동의 측면에서 측정되었다.

결과

폐쇄지속시간의 경우 VC1C2V 구조가 VCV 구조에 비해 유의하게 긴 폐쇄지속시간을 나타내었으나, 그 차이는 문장 수준에서 현저히 줄어들었다. 최대접촉점의 경우 음절구조에 따른 차이는 관찰되지 않았으며, 단어 조건이 비단어 조건에 비해 단어조건에서 유의하게 많은 최대접촉점이 관찰되었다.

논의 및 결론

본 연구의 결과와 같이 문장에서 문맥에 의해 단어의 의미가 충분히 구별된다면 두 단어의 미세한 차이를 구별하여 발음하기 위해 노력하지 않을 것이며, 이러한 결과는 조음 평가 시 현실 발음과 괴리가 있는 표준 발음에 대해 보다 합리적인 규준이 필요하다는 점을 시사하였다.

Trans Abstract

Objectives

This paper used electropalatography (EPG) to investigate the actual pronunciation when two plosives with the same articulation position appear successively. We aimed to determine the presence of the preceding consonant (C₁) in two successive consonants (VC₁C₂V) with the same articulation place.

Methods

Tongue-to-palate contacts were recorded during the pronunciation of 8 words and 4 sentences containing those words by 5 normal adults and the closure duration and the maximum contact frame for utterance units (word, sentence), meanings (real word, nonword), and syllable structures (VC₁C₂V, VCV) were analyzed.

Results

The closure duration in the syllable structures and the maximum contact frame in the meanings showed significant differences. The closure duration of the VC₁C₂V structure was significantly longer than that of the VCV structure in case of words; however, the difference reduced in the case of sentences. The maximum contact frame of the real words was significantly higher than that of non-words.

Conclusion

Since the temporal characteristics between VCV and VC₁C₂V structure was distinguished and the tensification of C₂ indirectly showed the existence of C₁. These result support the fact that the preceding consonant is not deleted in two successive consonants with the same articulation place.

말소리장애 아동뿐 아니라 일반 아동에서도 발달과정 중 많이 나타나는 음운오류패턴 가운데 어중종성생략과 어중종성역행동화는 구분이 모호한 면이 있다. 예를 들어 ‘국자(/국짜/)’를 [구짜]로 발음했을 때 표면적으로는 어중종성생략에 해당하지만, 이를 /굳짜/라는 어중종성역행동화 과정을 거쳐 동일조음위치 장애음탈락이라는 음운현상이 반영된 결과로 볼 수도 있기 때문이다(Ha & Kim, 2020). 앞 음절의 어중종성과 다음 음절의 어중초성에 동일 계열의 장애음이 존재할 경우(예: ‘학교’) 어중종성 유무를 청지각적으로 명확하게 판단하는 것은 불가능하기 때문에, 한국어 음운론에서는 어중종성이 포함된 발음형(예: [학꾜])과 생략된 발음형(예: [하꾜])을 모두 올바른 발음으로 허용한다(Shin, 2011). 따라서 앞의 ‘국자’의 예에서 오조음한 발음이 [구짜]인지 [굳짜]인지를 구분하는 것은 언어재활사에게도 어려운 과제일 수밖에 없다. 이에 대해 Ha와 Kim (2020)은 [구짜]와 같은 오조음에 대해 표면적 관찰형에 근거하여 어중종성생략으로 명명하되, 해당 오류를 어중종성역행동화의 연장선에서 해석할지 여부는 검사자가 판단해야 한다는 설명을 덧붙이고 있다. 그러나 이는 생략과 동화(대치)라는 음운오류패턴의 대분류 체계를 거스를 뿐 아니라, 아동의 어려움을 직관적으로 드러내 주지 못한다는 제한점이 있다.

경음화 음운오류패턴도 이와 비슷한 맥락에서 생각해 볼 여지가 있다. 예를 들어 ‘바지’를 [바찌]로 경음화했을 때 평음 /ㅈ/를 경음 / ㅉ/로 대치했다는 분석이 보편적이지만, 한편으론 /ㅈ/의 조음구간이 길어져 /받찌/로 발음되었음에도 불구하고 청자들이 /바찌/로 지각했을 가능성 또한 배제할 수 없다. 경음화 오류는 말소리발달 중 2세까지 보이다 3세 초반 이후 없어진다는 연구결과(Ha & Kim, 2020)에 근거할 때, 조음민첩성이 떨어지는 어린 아동의 경우 한 음소에서 다음 음소로 이동하는 조음전이(articulatory transition) 구간이 연장되고 그 결과 뒤 음절의 자음이 앞 음절의 모음에 걸쳐 발음될 수 있기 때문이다. 조음전이 능력의 결함으로 설명되는 아동기 말실행증에서도 경음화 오류가 두드러졌다는 선행연구 결과(Oh & Ha, 2021)는 이러한 가능성을 뒷받침해준다. 아동이 오조음한 발음을 [받찌]로 전사하고 종성첨가와 경음화로 분석할지, 조음전이 구간이 연장된 것이므로 왜곡오류로 간주해야 할지, [바찌]라는 표면형에 충실하게 그냥 대치오류로 명명할지는 논란의 여지가 있어 보인다.

논란의 이유 중 하나는 우리말에 경음이 음소로서 존재하기 때문이다. 경음이 음소에 포함되지 않은 영어의 경우 ‘student’의 /t/는 된소리로 발음되지만, 이는 /s/ 다음에 /t/가 연달아 발음되기 때문에, 즉 조음운동적 이유로 인해 발생한 변이음으로 간주된다. 만일 영어처럼 우리말에 경음이 존재하지 않았다면 경음화 오류는 대치가 아닌 왜곡으로 처리될 것이며, 이는 해당 말소리의 조음 직전부터 구강 중앙부에서 방해가 있었기 때문 즉, 선행 자음이 있거나 혹은 특정 조음위치에 머문 기간이 다소 길었기 때문에 초래된 조음 운동적 결과로 설명될 수 있다. 그러나 우리말에는 경음이 엄연히 음소로서 존재하므로 해당 오류가 추상적인 음소 차원의 문제인지 아니면 물리적인 운동 차원의 결과인지를 판단하는 것은 간단하지 않은 문제이다.

이와 관련된 논란은 음운론 분야에서도 다르지 않다. ‘내가 가장 아끼는 악기는 바이올린입니다’의 발화에서 ‘아끼(VCV)는’과 ‘악기(VC1C2V)는’이 같은 발음형으로 실현되는가는 한국어 음운론 연구에서 지속적인 관심을 받아왔다. /악기/와 같이 동일조음위치의 두 자음이 연쇄할 때 후행하는 자음(C2)이 경음화되는 것에는 이견이 없으나, 이때 선행하는 자음(C1)이 실제로 발음되는지에 대해서는 학자들 간 대립된 견해가 존재한다. C1 탈락을 지지하는 학자들은 한국어 화자는 [입법]과 [이뻡]을 구분하여 발음하거나 듣지 않으며 ‘젖소’는 결코 [젇쏘]로 발음하지 않는다고 주장한다(Shin, 2011). 즉, C1 탈락을 필수적 또는 수의적 음운현상으로 보고 ‘동일조음위치 장애음탈락(Shin & Cha, 2003)’, ‘중복자음감축(Bae, 2011)’이라는 용어를 사용하여 해당 주장을 일관되게 지지해 왔다. 이 주장을 실증적으로 검증한 실험음성학적 연구에서는 기저형에 경음으로 존재하는 ‘아끼(는)’과 기저형에 동일조음위치의 평음연쇄로 존재하는 ‘악기(는)’은 모두 동일한 음성형인 [아끼는]으로 산출된다고 하였으며, 동일조음위치의 두 자음이 연쇄할 때 C1는 음성학적으로 탈락했다고 설명하는 것이 현실 발음형에서 보다 합리적이라고 제안하였다(Kim & Oh, 2013).

반면 C1 탈락을 인정하지 않는 학자 중 가장 적극적으로 견해를 피력한 Kim (1981)은 ‘익기’와 ‘이끼’를 각각 [ikk’i]와 [ik’i]로 표기하여 두 단어의 발음형을 구분하였으며, ‘이끼’는 [i-k’i] 또는 [ik-k’ i]로 발음될 수 있지만 ‘익기’는 오로지 [ik-k’i]로만 실현되다고 주장하였다. 이러한 주장을 부분적으로 지지한 실험음성학적 연구에서는 인지와 산출 실험을 각각 실시하여 동일조음위치의 연속된 두 자음에 대해 화자와 청자 모두의 시각에서 논의하였다(Park & Kim, 2016). 여기에서 Park과 Kim (2016)은 ‘철자를 의식해 발화’한 화자는 선행 자음의 존재 여부에 대한 음성적 단서를 은연 중 표출하게 되는데 청자는 이를 토대로 실험자극어를 구별할 수 있다고 밝혔다. 하지만 ‘일반적 발화 상황’에서는 문맥의 도움 없이 음향 신호만으론 청자가 각 자극어를 구별하여 인식할 수 없음을 덧붙였다.

표준 발음법에서는 해당 음운현상에 대해 직접적 언급은 하지 않고 있지만, 다음 규정을 통해 한국어 어문규범에서 취하는 입장을 간접적으로나마 파악할 수 있다. 장애음 뒤 경음화와 관련된 표준 발음법 제 23항은 “받침 ‘ㄱ(ㄲ, ㅋ, ㄳ, ㄺ), ㄷ(ㅅ, ㅆ, ㅈ, ㅊ, ㅌ), ㅂ(ㅍ, ㄼ, ㄿ, ㅄ)’ 뒤에 연결되는 ‘ㄱ, ㄷ, ㅂ, ㅅ, ㅈ’는 된소리로 발음한다.”는 원칙의 예시로, /뻗대다/→[뻗때다], /있던/→[읻떤], /꽃다발/→[꼳따발] 등을 제시했다. 이는 동일조음위치 장애음이 연속될 때 C1을 탈락시키지 않고 발음하는 것이 표준 발음임을 간접적으로 드러낸 것으로 보인다. 이렇듯 표준 발음형과 일부 학자들이 제시하는 현실 발음형 간에는 다소 괴리가 있다. 앞에서 설명한 어중종성생략과 어중종성역행동화, 경음화와 조음전이 구간 연장이라는 오류에 대해 보다 명확한 해답을 얻기 위해서는 이와 같은 음운론적 논란이 먼저 해결되어야 할 것이다.

이에 본 연구에서는 한국어 화자에서 나타나는 동일조음위치 장애음의 실제에 대해 과학적 실험에 근거해 객관적 결론을 이끌어 내고자 하였다. 선행 연구(Park & Kim, 2016)에서는 C1의 실제 발음 여부를 확인하기 위해 VC1C2V (예: 익끼)와 VCV (예: 이끼) 간 폐쇄지속시간을 PCquirer 또는 praat 등을 사용하여 실험음성학적으로 비교하였다. 그러나 이러한 음향신호처리에 기반한 방법은 음성으로 산출된 결과물에 대해서만 분석이 가능하며, 따라서 분석하고자 하는 말소리가 종성 불파음일 경우 음향에너지가 0에 가깝기 때문에 그 존재 여부가 결과에 별다른 영향을 미치지 않았다. 이와 같은 이유로 선행 자음의 조음 후 후행 자음이 경음화되는지 혹은 선행 자음의 조음 없이 후행 자음을 경음으로 발음하는지에 대해서는 음향음성학적 분석보다 조음운동에 기반한 분석이 더 타당할 것이다. 이를 위해 본 연구에서는 전자구개도(Electropalatography, EPG)를 이용하여 다음과 같은 질문에 답하고자 하였다. 첫째, 동일조음위치 파열음이 연속할 때 VC1C2V와 VCV 간 폐쇄지속시간에 차이가 있는가? 둘째, 동일조음위치 파열음이 연속할 때 VC1C2V와 VCV 간 최대접촉점에 차이가 있는가? 두 질문에 대한 답을 통해 연속되는 두 자음의 조음운동 시 관찰되는 시간 및 공간적 변화양상을 확인하여 이전의 실험음성학적 연구에서 관찰되지 않았던 미묘하고 역동적인 차이를 발견하고자 하였으며, 이러한 발견이 동일조음위치의 연속된 두 자음과 관련한 논란에 실험적인 결론을 이끌어낼 수 있으리라 기대하였다.

연구방법

본 연구는 대구대학교 생명윤리위원회의 승인을 받아 진행되었다(IRB 승인번호: 1040621-201907-HR-061-02).

연구대상

본 연구의 대상은 한국어를 모국어로 하는 성인 남녀 5명으로, 이 중 4명은 여성이며, 1명은 남성이었다. 피험자들의 연령 범위는 27-40세 사이로, 평균 연령은 34세였다. 모든 피험자는 시각 및 청각에 이상이 없었으며, 말과 언어 능력이 정상범위에 속하였다. 4명의 여성 피험자는 박사과정을 수료한 언어치료 전공자들이었으며, 1명의 남성 피험자는 관련분야를 전공한 공학계열의 대학 교원이었다.

실험도구

실험에 사용된 전자구개도(SmartPalate, CompleteSpeech Inc., USA)는 124개의 Au전극으로 구성된 센서부와 측정된 접촉신호의 처리를 위한 신호처리부, 피험자와 검사자에게 시각적인 피드백을 제공하는 PC기반 모니터링부로 구성된다. 센서부의 경우 개별 피험자의 구강크기 및 구개에 맞게 제작된 구강틀에 Au전극이 삽입된 flexible PCB가 부착된 형태이며, 124개의 전극은 혀와 구개의 접촉에 따른 생체신호를 감지하여 신호처리부에 전달하게 된다. 전달된 신호들은 10 ms 단위로 전극별 위치 데이터를 모니터링부에 전달하며, 이를 통해 PC 화면에서 발화 전체에 걸쳐 혀와 구개의 접촉 양상을 연속적인 팰라토그램(Palatograms)으로 확인할 수 있다.

센서부에 부착된 전극 및 열의 위치는 Figure 1과 같다. 입술 움직임을 관찰할 수 있는 첫 번째 열을 포함하여 총 16개의 열로 구성되어 있으나, 본 연구에서는 양순음을 제외하고 치경음과 구개음만을 다루고 있으므로 결과 해석의 용이함을 위해 첫 번째 열은 분석에서 제외하였다. 따라서 본 연구에서는 15개의 열로 이루어진 122개 전극이 분석에 사용되었으며, 1-6열은 치경 위치를, 7-12열은 경구개 위치를, 13-15열은 연구개 위치를 나타낸다.

Figure 1.

Schematic diagram of artificial palate to show the position of electrode rows: alveolar (rows 1-6); palatal (7-12); velar (13-15).

실험자극어

연속하는 파열음의 조음위치는 양순음을 제외한 치경음과 연구개음으로 제한을 두었다. 이는 혀와 구개의 접촉양상을 주로 확인하는 전자구개도의 특성 상, 두 개의 전극으로만 표현되는 양순 파열음과 122개 이상의 전극으로 역동적인 움직임을 나타내는 치경 및 연구개파열음 간 객관적인 비교가 쉽지 않았기 때문이었다.

치경파열음과 연구개파열음 각각에서 실험자극어 목록을 제작하기 위해 음절구조, 발화단위, 의미여부가 고려되었다. 첫째, 동일조음위치의 파열음이 연속적으로 출현하는 VC1C2V와 C1이 탈락한 VCV를 비교하여 두 발음에 차이가 있는지 확인하기 위해 음절 구조를 구분하였다. 둘째, 발화단위는 단어단위와 문장단위로 구분하였다. Kim과 Oh (2013)의 연구를 참고하여 단어단위와 동일한 VCV와 VC1C2V가 한 문장에 모두 포함되도록 문장단위 자극어를 구성하였다. 셋째, 의미여부에 따른 차이를 비교하기 위해 다음과 같은 기준으로 의미와 무의미 자극어를 선정하였다. 의미 자극어는 연속하는 두 개의 자음이 동일 조음위치의 파열음이면서, VC1C2V(예: /있다/)와 C1이 탈락한 VCV(예: /이따/)의 기저형이 모두 의미를 가진 단어로써 존재해야 한다. 무의미 자극어는 Dromey와 Sanders (2009)의 연구를 참고하여 자음 산출 전 혀가 중립 위치에 오도록 선행 모음 V1에 중립모음 /ㅓ/를 배치하였다. 반면 후행 모음은 동시조음효과로 인해 선행 자음의 조음위치에 영향을 줄 수 있기 때문에(Butcher & Weiher, 1976), 의미 자극어와 동일한 V2를 사용하였다.

이상과 같은 조건들을 모두 고려하여 제작된 실험자극어는 총 12항목이었다. 치경 위치에서 의미 자극어는 ‘이따(VCV)/있다(VC1C2V)’(단어단위), ‘집에 잠시 있다있다(VC1C2V)가 이따(VCV)가 오세요’(문장단위), 무의미 자극어는 ‘어따(VCV)/얻따(VC1C2V)’ (단어단위), ‘이건 바로 어따(VCV)와 얻따(VC1C2V)입니다’(문장단위)였고, 연구개 위치에서 의미 자극어는 ‘아끼(는)(VCV)/악기(VC1C2V)’(단어단위), ‘내가 가장 아끼(VCV)는 악기(VC1C2V)는 바이올린이에요’(문장단위), 무의미 자극어는 ‘어끼(VCV)/억끼(VC1C2V)’(단어단위), ‘이건 바로 어끼(VCV)와 억끼(VC1C2V)입니다’(문장단위)였다.

이때 무의미 자극어 ‘어따/얻따’이 경우 ‘얻다’라는 단어의 발음형으로도 볼 수 있기 때문에 이것이 엄격하게 무의미 조건을 만족하는지에 대해서는 논란의 여지가 있어 보인다. 우리말에서는 7종성법에 따라 여러 자음들이 종성에서 /ㄷ/로 실현되는 특성이 있어, 치경파열음을 포함하여 기저형뿐 아니라 표면형에서도 무의미 조건을 만족하는 자극어를 구성하는 데에는 한계가 있었다. 그러나 표면형(‘어따/얻따’)을 소리가 아닌 철자로 제시하면 기저형(‘얻다’)을 떠올리기보다는 의미 없는 음소조합으로 인지한다는 선행 연구들(Kim, 2014; Kim & Oh, 2013; Park & Kim, 2016)에 근거하여, 의미와 무의미 자극어는 발음이 아닌 표기에서의 의미여부를 기준으로 삼았다.

실험절차

실험 전 피험자들은 인공 구개를 착용하고 발음하는 데 익숙해지는 과정을 거쳤다. 이 과정은 청자가 정상적인 조음이라고 인식하기까지 최소 20분의 연습이 필요하다는 선행연구(Cheng, Murdoch, Goozee, & Scott, 2007)에 따라 20-30분간 이루어졌다. 이후 본 실험은 주변 소음이 포집되지 않는 조용한 장소에서 개별적으로 진행되었다. 피험자가 연구의 목적을 숙지하고 실험에 참가할 경우, 심리적 작용으로 보다 의도를 가진 발화를 산출할 가능성을 배제할 수 없기 때문에 피험자들은 연구목적을 알지 못했다. 실험 자극어는 평소대로 자연스럽게 읽되, 속도는 연구자가 미리 제시한 오디오 샘플과 유사하게 유지하도록 지시받았다. 피험자들은 연구자의 지시에 따라 모니터에 글자로 제시된 12개의 자극어를 1초 간격으로 세 번씩 반복하였으며, 5명의 피험자가 12개의 자극어를 3번씩 반복한 총 180개의 발화데이터는 오디오 파일과 팰라토그램으로 저장되었다.

자료분석

폐쇄지속시간(closure duration)

폐쇄지속시간의 측정을 위해 전자구개도의 팰라토그램을 10 ms 간격으로 관찰하여 폐쇄구간을 확인하였다. 연구개파열음의 경우 15열의 모든 전극이 활성화되어 완전한 막힘(complete closure)을 형성한 구간부터 기류를 방출하기 위해 두 조음기관을 개방하여 15열 중앙에 위치한 전극의 비활성화가 관찰되는 지점까지를 폐쇄구간으로 보았다. 예를 들어, Figure 2는 ‘악기’에서 연구개 파열음이 막힘, 지속, 개방되는 과정을 20 ms 간격으로 나타낸 팰라토그램이다. 이때 혀와 연구개의 접촉으로 막힘이 시작된 0.88초부터 두 조음기관이 개방되기 직전인 1.0초까지를 폐쇄구간으로 보고, 이 구간의 지속시간인 0.12초 즉, 120 ms을 폐쇄지속시간으로 측정하였다.

Figure 2.

Palatograms showing tongue palate contact for velar plosive in /akki/.

최대접촉구간(maximum contact frame)에서의 최대접촉점

전자구개도 연구에서 최대접촉구간이란 특정 분절음 발화 시 활성화된 전극의 수가 가장 많이 관찰되는 구간을 말한다. 최대접촉구간은 해당 구간에서 혀와 구개의 접촉으로 활성화된 전극의 개수, 즉 최대접촉점으로 측정되는데, 이는 대다수의 전자구개도 연구에서 사용되는 대표적인 양적 지표이다(Cheng et al., 2007; McAuliffe, Ward, & Murdoch, 2001; Recasens, 1984; Shin, 1998). ‘the point of maximum contact’, ‘amount of tongue-to-palate contact’ 등 연구자마다 명칭이 상이하여, 본 연구에서는 최대접촉점이라 명명하였다. Figure 2에서 최대접촉구간은 1.0초에서 관찰되는 구간(frame)이며, 이때 최대접촉점은 68개이다.

최대접촉구간에서 관찰된 혀와 구개의 접촉 양상을 다차원적으로 분석하기 위해 해당 시점에서 각 열마다 활성화된 전극의 개수를 백분율로 환산하여 그래프로 시각화하였다(Farnetani, 1990; Shin, 1997, 1998). Figure 1에서 확인 가능하듯이 본 연구에 사용된 전자구개도는 양순 위치를 제외하고 총 15개의 열로 구성되어 있다. 따라서 이를 그래프로 시각화하면 x축은 전자구개도의 첫 번째 열부터 열다섯 번째 열까지 열의 위치를 나타내고 y축은 각 열에서 활성화된 전극의 양(%)을 나타낸다. 최대접촉점은 최대접촉구간에서 얻어진 전극의 ‘총 개수’를 의미하므로 최대접촉점이 같더라도 활성화된 전극의 위치와 양상은 상이할 수 있다. 따라서 최대접촉구간에서 활성화된 전극을 각 열에 대해 분석한 그래프는 두 발음 간 혀와 구개의 접촉 양상을 비교하는 데 용이하며, 보다 구체적인 공간적 분석을 가능하게 한다.

평가 신뢰도

검사자 간 신뢰도(interobsever reliability)

전자구개도 분석에 대한 검사자 간 신뢰도 측정을 위해 5명의 피험자가 12개의 자극어를 3번씩 반복하여 얻어진 180개의 발화데이터 중 25%를 무작위로 추출하였다. 추출된 오디오 및 팰라토그램 데이터에 대해 전자구개도를 이용한 연구 수행 경험이 있는 언어치료 전공 박사수료생에게 연구자와 동일한 방식으로 지속시간 및 최대접촉점을 측정해줄 것을 요청하였다. 이렇게 측정된 두 검사자 간 신뢰도는 지속시간의 경우 95.5%, 최대접촉점의 경우 100%였다.

검사자 내 신뢰도(intraobsever reliability)

검사자 내 신뢰도 측정을 위해 첫 번째 분석 이후 6개월이 경과한 이후, 검사자 간 신뢰도 분석과 마찬가지로 25%의 발화데이터를 무작위로 추출하였다. 추출된 데이터에 대해 이전의 방식과 동일한 기준을 적용하여 지속시간과 최대접촉점을 측정하였으며, 이렇게 측정된 검사자 내 신뢰도는 지속시간과 최대접촉점 모두 100%였다.

통계분석

자료의 통계처리를 위해 SPSS 25.0 (IBM, Armonk, NY, USA)을 이용하였다. 치경파열음과 연구개파열음 각각에서 발화단위, 의미 여부, 음절구조에 따른 폐쇄지속시간과 최대접촉점의 차이를 알아보기 위해 반복측정 분산분석(Repeated Measure ANOVA)을 실시하였다. 구형성 가정이 위배된 경우 자유도를 보정한 Greenhouse-Geisser correction을 사용하였으며, 요인 간 상호작용효과에 대해서는 COMPARE 하위명령 Syntax를 입력하여 사후분석을 실시하였다. 최대접촉구간에서의 각 열별 접촉 양상은 통계 분석 없이 그래프를 통한 질적 분석만 실시하였다.

연구결과

시간적 분석: 폐쇄지속시간

치경 파열음에서 음절구조, 발화단위, 의미여부에 따른 폐쇄지속시간의 차이

음절구조(VCV, VC1C2V), 발화단위(단어, 문장), 의미여부(의미, 무의미)가 치경파열음의 폐쇄지속시간에 미치는 영향을 알아본 결과, VCV (M=232 ms)보다 VC1C2V (M=330 ms)에서 유의하게 긴 폐쇄지속시간이 관찰되어 화자들이 VCV와 VC1C2V에 차이를 두어 발음하고 있음을 알 수 있었다. 그 밖에 발화단위에 따른 주효과와 발화단위와 음절구조 간 상호작용효과가 유의하였다(p<.05). 그러나 의미여부에 따른 주효과 및 기타 상호작용효과에는 유의한 차이가 관찰되지 않았다(p>.05). 발화단위의 경우 문장단위(M=208 ms)보다 단어단위(M=355 ms)에서 폐쇄지속시간이 유의하게 길었다(p<.01). 발화단위와 음절구조 간 상호작용효과에 대해 사후분석을 실시한 결과 문장단위에서도 음절구조에 따른 차이는 여전히 유의하였으나(p<.05), 단어단위에 비해 그 차이가 현저히 줄어들었음을 알 수 있었다(Figure 3).

Figure 3.

Differences in closure duration between syllable structures according to utterance units in alveolar plosive (ms).

연구개파열음에서 음절구조, 발화단위, 의미여부에 따른 폐쇄지속시간의 차이

음절구조(VCV, VC1C2V), 발화단위(단어, 문장), 의미여부(의미, 무의미)가 연구개파열음의 폐쇄지속시간에 미치는 영향을 알아본 결과, VCV (M=108 ms)보다 VC1C2V (M=169 ms)에서 유의하게 긴 폐쇄지속시간이 관찰되어 치경파열음과 마찬가지로 연구개파열음에서도 화자들이 VCV와 VC1C2V 간 차이를 두어 발음하고 있음을 알 수 있었다. 그 밖에 발화단위에 따른 주효과가 유의하였는데, 문장단위(M=110 ms)보다 단어단위(M=167 ms)에서 폐쇄지속시간이 유의하게 긴 것으로 나타났다(p<.01). 그러나 의미여부에 따른 주효과 및 이요인 또는 삼요인 상호작용효과는 어디에서도 유의성이 나타나지 않았다(p>.05). 앞에서 살펴보았던 치경파열음 분석에서 발화단위와 음절구조 간 상호작용효과가 유의하였기에, 연구개파열음에 대해서도 발화단위에 따라 VC와 VC1C2V 간 폐쇄지속시간에 차이가 있는지 알아보기 위해 그래프를 그려 양상을 비교해보았다. 그 결과 단어단위에서보다 문장단위에서 음절구조 간 차이가 크게 감소하여 연구개파열음의 경우도 치경파열음에서와 유사한 패턴이 관찰됨을 확인할 수 있었다(Figure 4).

Figure 4.

Differences in closure duration between syllable structures according to utterance units in velar plosive (ms).

공간적 분석: 최대접촉구간

치경파열음에서 음절구조, 발화단위, 의미여부에 따른 최대접촉점의 차이

음절구조(VCV, VC1C2V), 발화단위(단어, 문장), 의미여부(의미, 무의미)가 치경파열음의 최대접촉점에 미치는 영향을 알아본 결과, 음절구조에서 VCV (M=80.2개)와 VC1C2V (M=82.7개)의 차이, 발화단위에서 문장단위(M=81.4개)와 단어단위(M=81.5개)의 차이는 통계적으로 유의하지 않았다(p>.05). 그러나 의미여부에서는 무의미 자극어(M=71개)에 비해 의미 자극어(M=91개)에서 유의하게 많은 최대접촉점이 관찰되었다(p<.01).

이때 주의할 점은 최대접촉점이 목표 분절음 조음 시 구개 전체에서 최대로 활성화된 전극의 총 개수를 의미하는 단편적인 양적 지표라는 것이다. 즉 최대로 활성화된 전극 총량을 확인할 뿐, 각 전극들이 구개 공간 내에서 어떤 양상으로 활성화되었는지는 확인할 수 없다. 따라서 본 연구에서는 최대접촉구간에서 각 열마다 활성화된 전극의 개수를 백분율로 환산하여 혀와 구개의 접촉 양상을 그래프로 시각화하였다(Figure 5). 그래프는 피험자 5명에 대한 최대접촉점의 평균값이었으며, 이를 통해 의미여부에 따른 최대접촉점의 유의미한 차이를 보다 면밀히 분석할 수 있을 것으로 기대되었다.

Figure 5.

Differences in the maximum contact frame between meanings in alveolar plosive (%).

의미와 무의미 조건을 구분하여 최대접촉구간의 접촉 양상을 열의 위치에 따라 확인한 결과, 핵심 조음위치인 치경이 아닌 이외 영역에서 그 차이가 관찰되었음을 주목할 만하다. 즉, 치경 위치에서의 활성화 정도는 의미와 무의미 조건 간 유사하였으나, 경구개 및 연구개 위치의 활성화 정도에는 차이를 보였다. 9-15열에서 관찰된 무의미 조건의 평균 활성화 정도는 48.92%인 반면, 의미 조건의 평균 활성화 정도는 73.24%로 활성화 정도가 월등히 높았다. 다시 말해 치경파열음에서 의미와 무의미 조건 간 최대접촉점의 유의미한 차이는 혓날과 치경의 접촉이 아닌, 혓몸과 비핵심위치인 경구개 및 연구개의 접촉 면적이 증가함에 따라 발생한 것으로 보인다.

연구개파열음에서 음절구조, 발화단위, 의미여부에 따른 최대접촉점의 차이

음절구조(VCV, VC1C2V), 발화단위(단어, 문장), 의미여부(의미, 무의미)가 연구개파열음의 최대접촉점에 미치는 영향을 알아본 결과, 음절구조에서는 VCV (M=64.3개)와 VC1C2V (M=65.7개) 간 차이가 유의하지 않았고, 발화단위에서도 단어단위(M=64.3개)와 문장단위(M=65.7개) 간 차이가 유의하지 않았다(p>.05). 그러나 의미여부의 경우 무의미 조건(M=63.0개)에 비해 의미 조건(M=66.1개)에서 유의하게 많은 최대접촉점이 관찰되었다(p<.01).

최대접촉구간에서 의미여부에 따른 접촉 양상을 그래프로 비교한 결과, 두 조건의 전반적 양상은 상당히 비슷하나 의미 조건에서 모든 열의 활성화 정도가 다소 높다는 것을 알 수 있다(Figure 6). 더불어 치경파열음과 마찬가지로 그 차이가 비핵심위치에서 두드러졌다는 점이 주목할 만하다. 즉, 의미 조건의 활성화가 핵심조음 위치인 연구개에서는 미세하게 높았으나 비핵심위치인 경구개, 특히 후치경에서 보다 두드러졌다. 따라서 의미 조건에서 비핵심위치의 접촉 활성화가 결과적으로 유의하게 많은 최대접촉점을 초래한 것임을 알 수 있다.

Figure 6.

Differences in maximum contact frame between meanings in velar plosive (%).

논의 및 결론

본 연구는 한국어의 음운론에서 여전히 논란이 되고 있는 동일조음위치 장애음탈락의 실제에 대해 고찰하고자 하였으며, 궁극적으로는 말소리장애 아동의 조음분석 시 고려되는 현실 발음과 기저의 어려움에 대해 실험적 결론을 이끌어 내는 데에 그 목적이 있다. 연속된 치경 및 연구개파열음의 시간 및 공간적 특성을 전자구개도를 이용해 관찰한 결과는 다음과 같다. 첫째, 치경 및 연구개파열음의 폐쇄지속시간의 경우 VC1C2V구조가 VCV구조에 비해 유의하게 긴 폐쇄지속시간을 가졌으나, 그 차이는 문장단위에서 현저히 줄어들었다. 둘째, 치경 및 연구개파열음의 최대접촉점의 경우 음절구조에 따른 차이는 확인되지 않았으며, 무의미 자극어에 비해 의미 자극어에서 유의하게 많은 최대접촉점이 관찰되었다. 이상의 결과를 종합하여 동일조음위치의 두 파열음이 연속될 때 선행하는 자음의 실현 여부에 대해 다음과 같은 고찰을 하고자 한다.

폐쇄지속시간으로 알아본 시간적 차이는 치경 및 연구개파열음 모두에서 확인되었다. ‘악기’가 [악끼]가 아닌 [아끼]로 조음되었다면 ‘아끼’와 같거나 유의하지 않은 범위 내에서 차이를 보였을 것이다. 그러나 ‘악기’의 폐쇄지속시간은 ‘아끼’보다 유의하게 길었으며, 이는 대상자들이 선행 자음을 탈락시키지 않은 채 [악끼]로 발음하기 위해 노력한 것으로 보인다. ‘노력’이라고 표현한 이유는 대상자들이 ‘악끼’에서 선행 자음의 존재를 표현하기 위해 더 길고 강하게 폐쇄를 유지하는 과정이 다소 의도적이고 과장되게 여겨졌기 때문이다. 그러나 이러한 과장된 노력은 문장단위에서는 상당히 줄어들었다. 단어단위에서처럼 선행 자음을 과장되게 조음함으로써 두 단어의 의미를 구분하려는 노력이 문장 수준에서 현저히 줄어든 이유를 의사소통의 본질과 관련하여 생각해볼 수 있다. 구어 의사소통은 음성신호를 통해 내재된 의도를 전달하는 과정이다. 문맥과 어순에 의해 단어의 의미가 충분히 구별된다면 청지각적으로 인지하기 어려운 미세한 차이를 굳이 드러내기 위해 선행 자음을 더 길고 강하게 발음하려는 의도적 노력은 하지 않을 것이다. 그렇지만 오직 발음에 의해 두 자극어를 구분해야 하는 단어단위의 실험 상황의 경우 대상자들은 심리적 발음 실재체(mental entity for pronunciation, MEP)에 따라 허용되는 범위 내에서 극단에 가까운 발음형을 산출하여 ‘악기’와 ‘아끼’를 구분하였다. 단어와 비단어를 이용해 폐쇄지속시간과 VOT의 차이를 연구한 선행연구(Kim, 2014)에서도 이와 유사한 해석을 찾아볼 수 있는데, Kim (2014)은 의미가 존재하지 않는 비단어 자극어의 경우 발음을 통해 VCV와 VC1C2V의 차이를 전달하려는 노력이 극대화될 수 있음을 언급하였다.

그러나 본 연구에서 간과하지 말아야 할 점은 발화단위에 상관 없이 폐쇄지속시간에 대한 음절구조의 주효과가 유의하였다는 것이다. 문장단위에서 그 차이가 줄어들긴 했지만 여전히 VC1C2V의 폐쇄지속시간이 더 길다는 연구결과는 문맥에 의해 해당 단어가 무엇인지 충분히 전달 가능한 문장 조건에서도 화자들은 C1을 생략하지 않고 있음을 의미한다. 더 나아가 선행 자음 C1이 존재하였기에 그 결과 후행 자음 C2가 경음화되었을 가능성도 시사한다. 이런 해석에 근거할 때 동일조음위치 장애음탈락(정상적 음운현상)과 어중종성생략 및 경음화(음운오류패턴)는 화자의 입장이 아닌 청자의 입장을 반영한 음운변동으로 여겨진다. 특히 음운오류패턴 분석 시 선행 어중종성을 후행 어중초성에 동화시켜 동일조음위치의 장애음으로 조음한 것을 어중종성역행동화가 아닌 어중종성생략으로 분석한다면, 또는 장애음의 조음전이 구간이 길어져 그 영향으로 경음화된 것을 단순히 어중초성의 경음화로만 분석한다면, 아동의 기저 어려움을 제대로 파악하지 못한 채 부적절한 중재 방향을 설정하게 될 수 있다. 이는 명백히 청지각적 분석의 한계를 시사하며, 이를 극복하기 위해서는 전자구개도 등을 활용한 과학적 분석이 임상 현장에 더욱 보편화되어야 할 것이다.

한편 의미여부에 따른 차이는 폐쇄지속시간에 유의한 영향을 미치지 않았다. 무의미한 말소리조합의 경우 저장되어 있는 운동프로그램이 부재하여 실시간적 운동프로그래밍이 요구되고, 때문에 의미 단어에 비해 경우 조음전이 시간이 길어져 폐쇄지속시간에도 차이가 나지 않을까 기대하였다. 그러나 본 연구의 경우 실험 대상자들이 정상 성인이었고 또한 실험 자극어가 이음절의 짧은 말소리 조합이었음을 고려할 때 그로 인해 유의미한 차이가 발생하지 않았을 가능성을 배제할 수 없다. 아동, 특히 말소리장애 아동 혹은 아동기 말실행증 아동을 대상으로 자극어를 복잡하게 구성하여 실험한다면 본 연구와는 또 다른 결과를 기대해볼 수도 있을 것이다. 따라서 이에 대해서는 추후 연구에서 대상자와 자극어를 달리하여 자세히 다루어 볼 필요가 있다.

치경과 연구개파열음 모두에서 최대접촉점에 대한 음절구조의 차이는 관찰되지 않았다. 이와 관련하여 한 가지 의문점은 VC1C2V와 VCV 간 시간적 특성 외에 공간적 특성의 차이는 없는지, 만약 그렇다면 오로지 폐쇄지속시간의 차이만으로 서로 다른 발음형이라 말할 수 있는지에 대한 것이다. Lee (1996)는 동일조음위치 파열음의 연쇄에 대해(예: /악기/), 음운적 측면에서는 두 개의 자음(/k/, /k*/)이지만 조음적 측면에서는 한 개의 자음([k*])으로 간주하였다. 발음되는 조음위치가 동일하기 때문에 조음 이동이 발생하지 않으며, 따라서 [악끼]의 ‘ㄱ-ㄲ’ 연쇄와 [아끼]의 ‘ㄲ’는 같은 조음위치에 머무르는 한 개의 자음으로 보는 것이 타당하다는 입장이다. Lee (1996)의 입장과 본 연구결과에 근거할 때, 동일조음위치의 VC1C2V와 VCV를 변별하게 해주는 변수는 공간적 측면이 아닌 시간적 측면에 있음을 알 수 있다. 이러한 견해는 많은 연구들(Kim, 2014; Park & Kim, 2016; Oh & Johnson, 1997)에서 언급되어 왔으나, 이를 실험적 결론으로 이끌어낸 연구는 찾아볼 수 없었다. 본 연구에서는 전자구개도를 이용해 혀와 구개의 최대접촉점을 분석함으로써 VC1C2V와 VCV 간 유의한 차이가 없음을 확인했으며, 결론적으로 두 단어의 차이는 시간적 특성에만 의존함을 제안한다.

연구의 주요 논지에서는 다소 벗어나지만 본 연구를 통해 얻은 또 다른 주목할 만한 결과는 의미 자극어와 무의미 자극어 간 최대접촉구간의 최대접촉점에 차이가 있다는 점이다(Figures 5, 6). 최대접촉구간은 자음산출을 위해 필요한 구개공간을 뜻하는데(Liker, Horga, & Mildner, 2012), 이때 최대접촉점이 많다는 것은 보다 안정적 조음이 가능하다는 것을 의미한다(Kim et al., 2021). 이러한 관점에서 본 연구의 결과를 해석해보면, 익숙한 단어 산출을 위한 근육운동명령의 조합은 수없이 반복한 운동학습을 통해 프로그램화되어 있기 때문에 충분히 안정적인 산출이 가능하다. 반면 낯선 무의미 말소리조합은 조음에 요구되는 말-운동 정보가 전무하기 때문에 실시간적으로 조음기의 움직임을 프로그래밍하는 과정이 요구되며, 상대적으로 불안정한 운동명령에 의해 산출된다(Oh & Ha, 2021). 때문에 무의미 조건에 비해 의미 조건에서 유의하게 많은 최대접촉점이 관찰된 것은 의미 단어의 안정적 조음운동을 반영한 결과로 보인다.

더불어 접촉점의 차이가 치경파열음의 경우 치경을 제외한 위치에서, 연구개파열음의 경우 연구개를 제외한 위치에서 즉, 핵심 조음위치 이외 영역에서 관찰되었다는 점이 흥미롭다. 이는 조음활동 시 비핵심 영역의 보충적 역할에 대해 생각해보게 한다. 치경파열음의 산출과정을 팰라토그램으로 관찰한 연구에서는 혓날은 핵심 조음위치인 치경에 완전한 협착하고 혀 측면은 이외 영역에서 기류가 빠져나가는 것을 막기 위해 구개와 접촉한다고 설명하며, 비핵심 조음위치의 구조적 역할에 대해 언급한 바 있다(Nicolaidis, 2001). 본 연구결과도 핵심 조음위치 이외 영역 또한 조음 산출에 기여하는 바가 있으며, 특히 안정적 조음을 보조하기 위한 지지 기반으로서 기능을 수행하고 있음을 시사한다.

마지막으로 동일조음위치의 연속 파열음으로 구성된 VC1C2V 구조에서 C1의 실현 여부에 대한 연구자들의 입장을 정리해보면, 폐쇄지속시간이 증가하는 양상으로 VCV 구조와 구별된 시간적 특성을 가지는 것으로 볼 때 VC1C2V의 C1은 존재하는 것으로 보인다. C2의 경음화는 그 존재를 간접적으로 보여주는 증거일 것이다. 이러한 결과는 아동의 말소리 분석 시 최종 발음형만큼이나 도출되는 과정에 대해서도 깊은 고민이 필요하다는 것을 시사한다. 어중종성생략에 의한 [구짜]와 어중종성역행동화에 의한 [구짜]가 ‘국자’라는 정조음에 도달하기까지 요구되는 최적의 치료 방향성은 각기 다를 것이다. 말소리장애 아동의 근본적인 어려움을 수면 위로 끌어 올리는 것은 언어재활사의 몫이며, 이를 위해 최종 발음형에 대한 관찰에만 근거하여 아동의 조음오류를 종성 생략 또는 단순 경음화로 고민없이 해석하는 것은 지양해야 할 것이다.

References

1. Bae, J. C. (2011). Overview of Korean phonology. Seoul: Shingubook.
2. Butcher, A., & Weiher, E. (1976). An electropalatographic investigation of coarticulation in VCV sequences. Journal of Phonetics, 4, (1)59–74.
3. Cheng, H. Y., Murdoch, B. E., Goozee, J. V., & Scott, D. (2007). Electropalatographic assessment of tongue-to-palate contact patterns and variability in children, adolescents, and adults. Journal of Speech, Language, and Hearing Research, 50, (2)375–392.
4. Dromey, C., & Sanders, M. (2009). Intra-speaker variability in palatometric measures of consonant articulation. Journal of Communication Disorders, 42, (6)397–407.
5. Fametani, E. (1990). VCV lingual coarticulation and its spatiotemporal domain. Hardcastle, W. J., & Marchal, A. Speech production and speech modeling. (pp. 93–130). Dordrecht: Kluwer.
6. Ha, J. W., & Kim, S. J. (2020). Developmental phonological error patterns in a word-level test for children aged 2-7 years old. Communication Sciences & Disorders, 25, (4)890–904.
7. Kim, J. Y., Woo, S. T., Kim, M. J., Oh, D. H., Kim, S. J., & Ha, J. W. (2021). An electropalatographic study of Korean fricatives /s/ and /s*/. Communication Sciences & Disorders, 26, (2)485–500.
8. Kim, T. K. (2014). A phonetic study on two successive stop consonants with the same place in Korean. Journal of Language Sciences, 21, (3)45–64.
9. Kim, Y. B., & Oh, J. H. (2013). On the pronunciation of the two successive consonants with the same place related to tensification in Korean. Korean Linguistics, 58, 31–53.
10. Kim, Y. S. (1981). Woorimal sori yeongu. Seoul: Saemunsa.
11. Lee, H. Y. (1996). Korean phonetics. Seoul: Taehaksa.
12. Liker, M., Horga, D., & Mildner, V. (2012). Electropalatographic specification of Croatian fricatives /s/ and /z/. Clinical Linguistics & Phonetics, 26, (3)199–215.
13. McAuliffe, M. J., Ward, E. C., & Murdoch, B. E. (2001). Tongue-to-palate contact patterns and variability of four English consonants in an /i/ vowel environment. Logopedics Phoniatrics Vocology, 26, (4)165–178.
14. Nicolaidis, K. (2001). An electropalatographic study of Greek spontaneous speech. Journal of the International Phonetic Association, 31, (1)67–85.
15. Oh, D. H., & Ha, J. W. (2021). Development and clinical application of Korean-version nonword intervention to improve speech motor programming. Phonetics and Speech Sciences, 13, (2)77–90.
16. Oh, M. R., & Johnson, K. (1997). A phonetic study of Korean intervocalic laryngeal consonants. Speech Science, 1, 83–100.
17. Park, S. K., & Kim, J. Y. (2016). Study on the perception and production of Korean single and geminate stops in intervocalic position by Korean native speakers. Journal of Linguistics, 41, (4)571–591.
18. Recasens, D. (1984). Vowel‐to‐vowel coarticulation in Catalan VCV sequences. The Journal of the Acoustical Society of America, 76, (6)1624–1635.
19. Shin, J. Y. (1997). Consonantal production and coarticulation in Korean, (Doctoral dissertation). University of London; London, UK.
20. Shin, J. Y. (1998). An spatio-temporal study on Korean affricates. The Journal of the Acoustical Society of Korea, 17, 375–378.
21. Shin, J. Y. (2011). Speech sound of Korean. Seoul: Jisikkwakyoyang.
22. Shin, J. Y., & Cha, J. E. (2003). The system of Korean speech sound: towards the basic of Korean phonology. Seoul: Hankookmunhwasa.

Article information Continued

Figure 1.

Schematic diagram of artificial palate to show the position of electrode rows: alveolar (rows 1-6); palatal (7-12); velar (13-15).

Figure 2.

Palatograms showing tongue palate contact for velar plosive in /akki/.

Figure 3.

Differences in closure duration between syllable structures according to utterance units in alveolar plosive (ms).

Figure 4.

Differences in closure duration between syllable structures according to utterance units in velar plosive (ms).

Figure 5.

Differences in the maximum contact frame between meanings in alveolar plosive (%).

Figure 6.

Differences in maximum contact frame between meanings in velar plosive (%).