말소리 산출은 폐에서 생성된 기류가 성대를 지나 성도를 통과하면서, 혀, 입술 등 각 발음 기관의 활발한 움직임에 따라 다양하게 변형되는 조음 과정을 통해 이루어진다(Kim, 2021). 그런데, 정상적인 노화 과정에서 말소리 산출에 관여하는 각 기관들은 변화한다. 노년기에는 폐 기능이 감소하여 폐활량이 줄어들고, 호흡 조절의 어려움으로 발성을 유지하는 능력도 저하된다(Burda et al., 2014). 노화가 진행됨에 따라 조음 과정에서도 어려움이 나타나게 된다. 노화로 인하여 혀의 움직임, 두께와 같은 구강 구조에 변화가 발생하고(Bennett, Van Lieshout, & Steele, 2007), 이에 따라 진동 감각(Vibration-Sensation)의 민감성이 감소하여 말소리 산출의 부정확성(Imprecision)이 증가하게 된다(Kim & Kim, 2009). 이렇게 노화에 따른 말 산출 시스템의 구조적, 생리적 변화로 인해 노년층의 말명료도는 젊은 연령층에 비해 저하된다(Kuruvilla-Dugdale, Dietrich, Mckinley, & Deroche, 2020).
성대진동시작시간(Voice Onset Time, VOT)은 조음기관이 개방되어 파열되는 시점부터 성대의 진동이 시작되기까지의 시간을 측정하는 값으로(Kim, 1997), 언어를 막론하고 말 산출 능력의 변화를 감지하는 음성음향학적 지표로써 사용될 수 있다. 조음기관의 세밀한 협응으로 산출되는 한국어 파열음은 어두에서 ‘막음-지속-개방’의 세 단계를 거쳐 생성된다(Yoo & Kim, 2015). 그리고, 이러한 ‘막음-지속-개방’이 이루어지는 위치 즉, 조음위치에 따라 양순음, 치조음, 연구개음으로 나뉘고, 기식(aspiration)의 강도인 발성 유형에 따라 평음, 경음, 격음으로 나뉘어 파열음은 3중 대립체계로 분류된다. 이렇게, 한국어 자음의 3중 대립체계로 인해 각각의 음소들은 동일한 조음위치에서 발성유형에 따라 청지각적으로 명료하게 변별된다. 따라서 한국어 파열음의 구분에 기여하는 폐쇄구간과 기식 강도의 특성에 대한 분석을 통해 파열음의 조음 특성과 각 자음 조음 시 조음기관들 사이에 이루어지는 시간적 조절의 측면에 대해 알아볼 수 있다.
VOT의 분석을 통해 얻어지는 파열음 산출의 시간 소요 정보는 조음 기관의 성숙 혹은 변화에 대한 단서를 제공한다. 말소리의 협응에 대한 유의미한 정보를 제공하는 또 다른 음향학적 지표는 VOT 변이성(variability)이다. 변이성은 조음위치와 방법에 따라 VOT가 어느 정도의 변이(variation)를 보이는가를 나타내며, 연령의 변화에 따라 지속적으로 변화하는 조음 조절 능력의 차이를 민감하게 감지해낼 수 있다(Whiteside, Dobbin, & Henry, 2003). VOT의 변이성은 변동계수(Coefficient of Variation)를 통해 측정할 수 있으며, 각 VOT 평균값마다의 격차를 나타낸다. CoV는 표준편차를 평균으로 나눈 뒤 백을 곱한 수치로, 각 데이터의 크기를 상쇄시킨 상태에서 변이성의 패턴만을 살필 수 있다는 장점이 있다. 이에 따라 VOT 변동계수 값의 크기가 커질수록 해당 음소를 조음하는데 있어서의 불규칙성과 불안정성도 증가하는 것으로 해석할 수 있다. 만약 조음기관의 협응이 원활하지 못하다면 VOT의 수치가 정상범위를 이탈하거나 불안정한 값을 보이게 되고(Park, 2006), 이에 따라 CoV 값 또한 커질 것이다. 앞서 언급한 3중 대립체계를 가지는 한국어 자음의 변별적 특성을 고려할 때, 각 조음위치 및 발성 유형에 따른 변동계수의 값이 커지게 되면 VOT 값들 간의 중첩이 발생하게 된다. 즉, 특정 조음방식으로 산출되는 VOT의 불규칙성이 커지면 음소들 간의 대립이 모호해지고 변별이 어려워져 곧 말명료도의 저하로도 이어질 수 있다는 것이다. 이렇게 VOT의 CoV 값의 차이를 통해서도 노화에 따른 발성-조음 협응 능력(vocal articulatory coordination)의 변화를 확인할 수 있다.
성대진동시작시간을 통해 노년층의 파열음 산출 특성에 대해 연구한 국외 선행 연구들에 따르면, 노화에 따라서 노년층 VOT의 값은 점차 작아지며(Liss, Weismer, & Rosenbek, 1990; Morris & Brown, 1994; Torre & Barlow, 2009), 그들의 VOT 변이성은 커져 노화에 따른 조음능력의 저하가 나타난다(Morris & Brown, 1994; Petrosino, Colcord, Kurcz, & Yonker, 1993; Torre & Barlow, 2009). 한국어를 대상으로 한 국내의 선행 연구(Lee & Lee, 2015; Park & Lee, 2016)에서도 발성유형과 조음위치에 따른 VOT를 일반 아동과 정상 성인 집단에서 살펴봄으로써 한국어 사용 아동 및 성인의 조음 발달적 특성에 대해 밝힌 바 있으며, 장년층과 청년층의 비교(Park, 2006; Kang & Guion, 2008), 파킨슨 환자군과 정상 노년층의 비교를 위해 VOT 측정을 진행한 연구(Kang, Park, & Seong, 2009)가 있었다. 그러나 정상적인 노화 과정에서의 조음능력 변화와 변이성을 살피기 위한 국내 연구는 극히 드문 실정이다(Yoo & Kim, 2015). 다수의 국외 선행 연구들이 노화에 따른 파열음의 VOT와 VOT 변이성의 변화에 대해 밝혀왔다. 그러나 한국에 존재하는 경음이 영어에는 존재하지 않으며, 영어의 파열음과 한국어의 파열음이 가지는 조음음성학적 자질이 다름을 고려할 때(Ko, 2006), 국외의 선행 연구 결과를 한국의 노년층 VOT 특성과 동일선상에서 일치시켜 살피기에는 어려움이 있다. 또한 국내의 선행 연구에서 각 조음 위치와 발성 유형에 따른 VOT 값의 변이성을 VOT의 최대값에서 최소값을 뺀 결과의 절대값, 즉 범위값(range)으로 살핀 바 있으나 본 연구에서는 CoV 값을 사용하여 각 VOT 값의 크기를 상쇄시킨 후, 변이 자체의 정도를 살핌으로써 이전 연구와의 차이를 알아보고자 한다. 이에 본 연구에서는, 노화에 따른 조음 조절 능력의 변화를 살펴보기 위하여 청년층과 노년층의 한국어 파열음 조음에 나타나는 음성음향학적 특성을 비교하고자 하였다. 이에 따른 연구 질문은 아래와 같다.
1. 집단(청년층, 노년층), 파열음의 조음위치(양순음, 치조음, 연구개음) 및 발성유형(평음, 경음, 격음)에 따른 성대진동시작시간의 평균값(mean)에 유의한 차이가 있는가?
2. 집단(청년층, 노년층), 파열음의 조음위치(양순음, 치조음, 연구개음) 및 발성유형(평음, 경음, 격음)에 따른 성대진동시작시간의 변동계수(Coefficient of Variation)에 유의한 차이가 있는가?
연구방법
연구대상
본 연구는 정상 성인을 기준으로 청년층(만 18-39세) 16명과 노년층(만 65세 이상) 16명, 총 32명의 참여로 진행되었다. 실험 대상자의 선별 기준은 다음과 같다. (1) 모국어가 한국어인 자, (2) 조음, 언어 및 인지적 문제 등의 신경학적 · 발달적 병력이 보고되지 않은 자, (3)한국어판 고령자 청력 장애 검사(The Korean Hearing Handicap Inventory for Elderly, K-HHIE; Park et al., 2011) 점수가 정상 범위인 자로 선정하였다. 실험 대상자들의 조음능력에 관하여, 언어재활사 국가자격증을 소지한 검사자가 자발화 샘플을 통해 대상자 모두 조음에 문제가 없다는 것을 확인하였다. 본 실험에 참여한 대상자의 기술통계 정보는 Table 1에 제시하였다.
실험과제
조음위치와 발성유형에 따른 파열음 발화를 수집하기 위해서 9개의 파열음(ㅂ, ㄷ, ㄱ, ㅃ, ㄸ, ㄲ, ㅍ, ㅌ, ㅋ)과 /ㅏ/모음을 사용하여 VCV 문맥의 2음절로 실험 과제를 구성하였다(Table 2). 이때, 전체 모음 중에서 공명도가 가장 높은 /아/ 모음을 사용하여 파열음이 선행하거나 후행하는 모음의 영향을 받지 않도록 동일한 환경을 만들었다(Lee & Lee, 2015). 본 실험에 사용한 전체 발화 과제 목록은 Table 2에 제시하였다.
실험절차
대상자의 발화를 수집하기 위하여 대상자 가정 안의 조용한 환경에서 녹음을 진행하였다. 단일 지향성 핀마이크(ECM-CS10, Sony Inc., Osaka, Japan)를 삼각대에 고정시키고 대상자의 입술과 마이크 사이의 거리를 15-20 cm 정도로 떨어뜨린 뒤 디지털레코더(EDIROL R-05HR, Roland Inc., Osaka, Japan)를 이용하여 녹음하였다. 연구자는 대상군과 대조군에게 발화 과제에 대해 설명한 뒤, 과제 단어를 발화하는 모습을 보여주고 연속으로 5차례 반복하여 따라 말하게 하였다. 실험 대상자의 발화의 말속도를 조절하기 위해서 시각적 단서(예: 손가락 접기 등)를 제시하였으며, 대상자가 평상시 사용하는 편안한 음도와 강도로 발화를 산출하도록 유도하였다. 녹음 및 분석 시 표본 추출률은 44,100 Hz, 양자화는 16 bit이었다.
자료분석
대상자의 음성 자료는 프랏(Praat, ver. 5.2.23)에서 분석하였다. 전체 녹음 샘플 중에서 각 발화 과제의 1, 5번째 발화를 제외한 가운데 3개의 발화만을 사용하여 VOT를 측정하였다. VOT 구간은 스펙트로그램 상의 수직 스파이크(vertical spike)가 진동을 나타내는 지점부터 후행 모음 /아/의 제2 포먼트가 나타나는 시작 지점까지로 설정하였다. 이때, 녹음된 음성 및 음파(sound wave)의 형태, 포먼트, 스펙트로그램을 참조하였다. 이에 따른 성대진동시작시간의 측정 예시를 Figure 1에 제시하였다. 이후, Microsoft사의 Excel 2020에서 VOT의 평균값과 변동계수를 계산하였다. VOT 변동계수는 기능적 음성장애군의 VOT 변이성을 연구한 McKenna, Hylkema, Tardif와 Stepp (2020)의 측정 방법과 같은 공식으로, 표준편차의 크기를 산술 평균에 대한 백분율로 계산하여 산출하였다[(표준편차/평균)×100].
신뢰도
본 연구에서는 전체 음성 샘플의 25%에 해당하는 8명의 음성파일을 임의로 선택한 뒤, VOT 측정에 대한 검사자 간 신뢰도(inter-rater reliability)와 검사자 내 신뢰도(intra-rater reliability)를 분석하였다. 검사자 간 신뢰도를 산출하기 위해서 언어병리학과 대학원생 1명이 제2 평가자로 참여하였고, 독립적으로 VOT를 측정하였다. 피어슨 상관계수로 신뢰도를 산출한 결과, 검사자 간 신뢰도는 .991 (p<.001)로 나타났고, 검사자 내 신뢰도는 .995 (p<.001)로 나타났다.
자료의 통계적 처리
본 연구에서는 파열음의 조음위치(양순음, 치조음, 연구개음)와 발성유형(평음, 경음, 격음)에 따른 집단(청년층, 노년층) 간의 성대진동시작시간의 평균값과 변동계수에 차이를 알아보기 위하여 삼원혼합분산분석(three-way mixed ANOVA)을 실시하였다. 반복측정분산분석에 대해 Mauchly의 구형성 검정을 실시하였으며, 구형성 가정을 충족하지 않는 경우에는 Greenhouse-Geisser로 수정된 자유도와 F값을 보고 해석하였다. 본 연구에서의 자료 분석을 위해서, IBM SPSS Statistics version 26 (IBM Co., Armonk, NY, USA) 프로그램을 이용하였으며, 유의수준은 .05 미만으로 설정하였다.
연구결과
집단 간 VOT 비교
파열음의 발성유형(평음, 경음, 격음)과 조음위치(양순음, 치조음, 연구개음)에 따른 집단(노년층, 청년층) 간 성대진동개시시간의 평균값(mean)에 대한 기술통계는 Table 3에 제시하였다.
삼원혼합분산분석을 실시한 결과, 집단에 대한 주효과가 통계적으로 유의하게 나타났다[F(1,30) = 8.550, p<.01]. 즉, 노년 집단이 청년 집단에 비해 VOT 값이 유의하게 길었다. 조음위치에 대한 주효과도 유의하게 나타났다[F(1.378,41.352) = 61.181, p < .001]. Bonferroni 사후검정 결과, 양순음과 치조음(p<.01), 양순음과 연구개음(p<.001), 치조음과 연구개음(p<.001) 간에서 모두 유의한 차이를 보였다. 즉, VOT 값은 연구개음, 치조음, 양순음 순으로 길었다. 발성유형에 대한 주효과도 유의하게 나타났다[F(1.590, 47.688) =199.703, p<.001]. Bonferroni 사후검정을 실시한 결과, 평음과 경음(p<.05), 평음과 격음 (p<.001), 경음과 격음(p<.001)의 VOT 값에 모두 유의한 차이를 보였다. 즉, VOT 값은 경음, 평음, 격음 순서대로 길게 나타났다.
집단과 조음위치가 VOT 값에 미치는 이차 상호작용 효과가 유의하게 나타났다[F(1.378, 41.352) = 4.084, p < .05]. 집단 간 요인과 집단 내 요인에 대한 이차 상호작용 효과가 유의한 것으로 나타난 것에 대한 사후검정을 실시하기 위해서, LMATRIX와 MMATRIX 하위 명령어를 사용한 상호작용 대비검정을 실시하였다(Howell & Lacroix, 2012). 그 결과, 청년 집단의 경우, 연구개음의 VOT 값이 양순음이나 치조음에 비해 유의하게 길게 나타났으며, 노년 집단의 경우에도 연구개음의 VOT 값이 양순음이나 치조음에 비해 더 크게 증가하였다. 조음위치별로 볼 때, 양순음과 치조음은 집단 간 유의한 차이가 나타나지 않았으나, 연구개음에서 유의한 차이를 보였다. 결론적으로, 이차 상호작용 효과는 치조음에서의 노년 집단과 청년 집단의 VOT 차이보다 연구개음에서 두 집단 간 VOT 차이가 유의하게 커서 나타난 결과였다(p<.05)(Figure 2).
집단과 발성유형이 VOT 값에 미치는 이차 상호작용 효과가 유의하게 나타났으며[F(1.590, 47.688) = 7.594, p < .01], 이에 따라 명령어를 이용한 상호작용 대비검정을 실시하였다. 그 결과, 청년 집단의 경우, 격음의 VOT 값이 평음과 경음에 비해 유의하게 길게 나타났으며, 노년 집단의 경우에도 격음의 VOT 값이 큰 폭으로 증가했다. 발성 유형별로 볼 때, 평음과 경음에서는 집단 간 유의한 차이가 나타나지 않았으나, 격음에서 유의한 차이를 보였다. 결론적으로, 이차 상호작용 효과는 격음에서의 집단 간 VOT 차이가 경음에서 집단 간 차이보다 유의하게 크게 나타나서 발생하였다(p<.001) (Figure 3).
조음위치와 발성유형이 VOT 값에 미치는 이차 상호작용 효과는 유의하지 않았다[F(2.539,76.164) = 2.172, p>.05]. 즉, 조음위치와 발성유형에 따라 VOT 값에 유의한 차이는 나타나지 않았다.
집단, 조음위치, 발성유형이 VOT 값에 미치는 삼차 상호작용 효과가 유의하게 나타났다[F(2.539,76.164) = 5.154, p < .01]. 삼차 상호작용 효과를 검정하기 위해 반복측정분산분석(repeated measure ANOVA)을 집단별로 실시한 결과, 청년 집단에서는 조음위치와 발성유 형에 따른 이차 상호작용 효과가 유의하지 않았지만[F(2.193, 32.900) = .721, p >.05], 노년 집단에서는 조음위치와 발성유형에 따른 이차 상호작용 효과가 유의하였다[F(2.300, 34.503) = 5.635, p < .01]. 세부적으로 살펴보면, 노년 집단 내에서, 조음위치별로 볼 때 양순음과 치조음에 비해 연구개 위치에서 유의하게 길게 나타났으며, 발성유형 중격음의 VOT 값이 평음과 경음보다 크게 나타났다. 즉, 연구개 위치의 격음 VOT가 양순과 치조 위치의 VOT 값보다 유의하게 크게 나타났다(p<.001) (Figure 4).
집단 간 VOT 변동계수 비교
집단(청년층, 노년층), 파열음의 조음위치(양순음, 치조음, 연구개음) 및 발성유형(평음, 경음, 격음)에 따른 성대진동시작시간의 변동 계수(Coefficient of Variation)의 기술통계는 Table 4에 제시하였다.
삼원혼합분산분석을 실시한 결과, 집단에 대한 주효과가 통계적으로 유의하게 나타났다[F(1,30) = 8.091, p< .01]. 즉, 노년 집단의 VOT CoV 값이 청년 집단에 비해 유의하게 컸다. 조음위치에 대한 주효과는 나타나지 않았다[F(1.961,58.825) = 2.614, p>.05]. 발성유형에 대한 주효과는 유의하게 나타났다[F(1.919,57.570) = 6.332, p < .01]. Bonferroni 사후검정을 실시한 결과, 평음과 경음(p<.05)에서 VOT의 CoV 값에 유의한 차이를 보였다(Figure 5). 이는 평음의 VOT CoV 값이 경음의 VOT CoV 값보다 커서 발생한 결과였다. 집단과 조음위치간[F(1.961,58.825) =.110, pp>.05], 집단과 발성유형 간[F(1.919,57.570) =1.639, p>.05], 발성유형과 조음위치 간[F(3.074,92.228) =1.131, p>.05] 이차 상호작용 효과는 모두 유의하지 않은 것으로 나타났다. 또한, 집단과 조음위치, 발성유형 간 삼차 상호작용 효과도 통계적으로 유의하지 않았다[F(3.074,92.228) =1.288, p>.05].
논의 및 결론
본 연구에서는 집단(청년층, 노년층), 파열음의 조음위치(양순음, 치조음, 연구개음) 및 발성유형(평음, 경음, 격음)이 VOT와 VOT 변이성에 미치는 영향에 대해 살펴보았다. 그 결과, 노년층이 청년층에 비해 VOT 평균값이 통계적으로 유의하게 길었다. 조음위치에서는 연구개음, 치조음, 양순음 순서대로 VOT 평균값이 통계적으로 유의하게 길게 나타났고, 발성유형에서는 격음, 평음, 경음 순서로 유의하게 VOT 평균값이 길게 나타났다. 또한 노년 집단의 VOT CoV 값이 청년 집단에 비해 통계적으로 유의하게 높았다.
본 결과를 하나씩 살펴보면, 노년층 VOT 평균값이 청년층에 비해 통계적으로 유의하게 길게 나타났다. 연령 증가에 따른 VOT 변화에 대해 논한 많은 연구들이 보고해온 것처럼(Neiman, Klich, & Shuey, 1983), 본 연구에서도 마찬가지로 노화에 따라 노년층의 VOT 평균값이 젊은 연령층에 비해 길어지는 양상을 보인 것이다. 정상 노화 과정에서 관찰되는 조음기관의 비일관적이고 느린 운동 능력이 VOT 평균값을 증가시키는 원인으로 작용하였다고 추측할 수 있다(Yoo & Kim, 2015). 이러한 결과는 노화에 따라 VOT가 짧아진다는 일부 국외의 선행 연구결과(Liss et al., 1990; Morris & Brown, 1994; Torre & Barlow, 2009)와는 다른데, 그 이유는 영어와 한국어 파열음의 특성이 다르기 때문으로 이해할 수 있을 것이다. 예를 들어, 청지각적으로는 영어의 파열음 /t/와 한국어의 파열음 /ㅌ/가 비슷하게 들리지만 영어의 /t/는 설첨 치경 무성음이고 한국어의 /ㅌ/는 전설 무성음이며 학자에 따라 치경과 치음으로 조음위치에 대한 이견이 있다(Ko, 2006).
조음위치에 따른 VOT 평균값에 통계적으로 유의하게 차이가 있었으며 후방 자음일수록 VOT 평균값이 증가하였다. 선행연구 (Pyo et al., 1999)의 파열음의 VOT 값은 조음위치가 전방보다 후방일수록 크다는 결과와 맥락이 일치한다. 이는 조음위치가 앞쪽에 위치하며 혀의 앞 부분을 사용하는 전방 자음보다 조음위치가 뒤쪽이며 혀 뒷부분의 움직임을 사용하는 후방 자음이 산출하기에 더 어려워(Kim, Ko, Shin, Hong, & Seo, 1997) 나타나는 결과로 사료된다. 또한 Bóna (2014)는 조음위치에 따른 성문하압의 크기가 다르기 때문에 기류역학적인 측면으로 설명하였다. 연구개음에서더 큰 성문하압이 요구되어 VOT 평균값이 길어지는 것으로 볼 수 있다(Cho & Ladefoged, 1999).
발성유형에 따른 VOT 평균값에 통계적으로 유의한 차이가 있었으며, 격음, 평음, 경음 순서로 VOT 평균값이 유의하게 길어졌다. 기식성이 평음과 경음에 비하여 강한 격음의 경우 폐쇄 기간 동안 성대가 멀리 떨어져 있는데, 이 때문에 파열의 개방 이후 후행 모음을 진동시키는데 있어 성대의 진동에 더 많은 시간이 소요되어 나타난 결과로 이해할 수 있다. 경음 발성 시 성대가 닫히는 시간이 가장 짧은 것은 성대의 폭이 가장 좁게 열리기 때문이며, 격음 발성 시에는 성대가 닫히는 시간이 긴 것은 성대의 폭이 가장 넓게 열리기 때문이라는 선행연구(Kim, 1997; Pyo et al., 1999) 결과와 일치한다. 즉, 기식성 자질을 가지고 있는 파열음의 격음이 성대가 열린 채로 조음이 유지되기 때문에 평음과 경음에 비해 성대가 진동하기 전 VOT가 더 길어지게 되는 것으로 설명할 수 있다(Lee & Lee, 2015).
VOT 평균값에서 집단과 조음위치 간의 이차 상호작용 효과가 유의하게 나타났으며, 이는 노년층에서 양순음과 치조음에 비해 연구개음의 VOT 평균값이 유의하게 증가하여 나타난 결과이다. 이는 한국어 파열음 중 연구개음만이 가지는 특성을 통해 설명할 수 있다. 연구개음은 양순음과 치조음에 비해 더 큰 구강과 혀의 움직임을 필요로 한다(Kang et al., 2009). 우리말 자음의 조음복잡성을 조음위치상으로 구분할 때 가장 그 복잡도가 높은 자음 중 하나가 연구개음이기도 하다(Lee, Han, & Sim, 2004). 이렇게 혀를 비롯한 구강구조 움직임에의 의존도가 특히 높은 연구개음 산출에 있어 노화는 영향을 미칠 것이다. 노화로 인한 혀 근력의 약화가 청, 중년층에 비해 현저히 벌어지면서 혀의 큰 움직임을 사용해 연구개음을 산출하는데 더 많은 시간이 소요될 수 있다는 것이다(Kim, 2019). 결과적으로, 양순음, 치조음에 비해 연구개음의 VOT 평균값이 길어지게 된다.
집단과 발성유형 간의 이차 상호작용 효과도 유의하였는데, 노년층에서 평음, 경음에 비해 격음의 VOT 평균값이 유의하게 증가하여 나타난 결과이다. 정상 노화 과정을 겪는 노년층에게 신경생리학적 퇴화가 나타나는데, 이로 인한 비일관적인 조음운동능력이 VOT 값을 증가시키는 원인이 될 수 있다(Yoo & Kim, 2015). 그러므로 격음에서 VOT 평균값이 큰 이유는 노화로 인한 성대의 비일관적인 운동능력이 성대가 열린 채로 조음하는 격음 산출(Lee & Lee, 2015)에 영향을 미친 결과로 사료된다.
또한, 집단, 조음위치, 발성유형 간 삼차 상호작용 효과가 유의하게 나타났다. 이는 노년층에서만 양순, 치조 위치의 격음에 비해 연구개 위치의 격음의 VOT 평균값이 유의하게 길었다. 이러한 결과는, 연구개음 및 격음의 특성과 노화로 인한 조음 동작의 저하로 설명할 수 있다. 먼저, 양순음, 치조음에 비해 연구개음의 경우, 성도에서 혀와 연구개의 닫힘(valving)이 시작되는 부분부터 성대까지의 공간이 상대적으로 좁아지고 이러한 구조가 성문하압을 증가시켜 VOT 값이 길어지는 결과가 발생할 수 있다(Cho & Ladefoged, 2002; Lee, 1998). 또한, 격음의 특성과 관련하여, VOT는 기식성의 정도와 비례하다고 알려져 있다(Seo, 2002). 즉, 기식성이 커질수록 성도가 폐쇄되어 있는 기간 동안 성대가 서로 떨어져 있는 길이가 멀어져서, 파열음 산출로 인해 성문이 열리고 난 후, 후행 모음을 발성하기 위하여 성대가 진동하기까지 더 긴 시간이 소요하게 된다. 따라서, VOT 값은 파열의 위치가 뒤로 갈수록 증가하는 경향을 보이게 된다. 마지막으로, 노년층의 조음 동작은 청년층에 비해 혀, 입술, 연구개의 협응을 위한 움직임이 비교적 둔화되어 있으며, 성대 양쪽이 붙는 폐쇄 구간에서 성대의 탄력과 근긴장성의 감소로 적절한 수축-이완이 이루어지지 않는다. 앞에서 언급한 내용을 종합 해볼 때, 삼차상호작용의 결과는 연구개음과 격음이 지니고 있는 공기역학적인 특성을 바탕으로, 정상 노년층이 노화로 인해 조음 기관의 협응 능력이 저하되어, 연구개 격음의 VOT 평균값이 유의하게 길어졌다고 설명할 수 있다.
본 연구에서는 성대진동시작시간의 변이성에 대해서도 살펴보았는데, 결과적으로 VOT CoV 값은 집단 간 유의한 차이가 나타났다. 즉, 노년층에서 전반적으로 VOT의 변이성이 더 컸으며, 이것은 정상 노년층에게 노화가 진행되면서 일어나는 발성-조음 협응능력 (vocal articulatory coordination)의 퇴화로 볼 수 있다. 이러한 결과는 노년층의 VOT에 관한 Sweting과 Baken (1982)의 연구에서 성별간 유의한 차이는 없었으나, 연령이 증가할 수록 노년층에서 VOT의 대상자 내 변이성(intra-subject variability)이 높았다는 선행 연구들과도(Morris & Brown, 1994; Torre & Barlow, 2009) 일치하는 결과이며, 노년층의 VOT range가 넓다고 보고한 국내의 연구(Yoo & Kim, 2015) 결과와도 동일한 맥락의 결과로 볼 수 있다.
발성유형과 관련하여, 평음의 VOT CoV 값이 경음의 VOT CoV 값보다 유의하게 크게 나타났다. 이러한 결과는 발성-조음 메커니즘의 시간적 협응(temporal coordination)의 저하로 설명할 수 있다(Torre & Barlow, 2009). VOT는 시간적(temporal) 음성음향학적 지표이면서 구강의 조음과정과 후두의 성대 진동의 협응을 볼 수 있는 지표이다. 평음과 경음은 VOT 값으로 일차적으로 대립되어야 하는데(Kang & Guion, 2008), 긴장성이 변별자질인 경음은 성대뿐만 아니라 후두에서의 미세한 근육긴장도를 유지하여야 한다. 이러한 근육의 미세한 조작능력이 저하되는 노년층은 경음에서 짧은 지연(short lag)의 유지가 어려워서 긴 지연(long lag)을 가지는 평음과 중첩될 수 있기 때문에, 결국 시간적 협응능력의 저하로 VOT의 변이성이 증가하게 된다(Yoo & Kim, 2015). 노년층에서 VOT 변이성의 증가로 평음과 경음의 VOT 값이 중첩되고 이에 따라 음소 대립의 어려움이 발생할 수 있다. 이러한 음소 대립의 어려움은 노화가 진행되면서 말명료도가 저하되는 현상으로 이어질 수 있다.
정상적인 노화과정에서 말산출 기제의 구조적, 생리적, 신경학적 변화들이 나타난다. 구조적 및 생리적인 변화로는 후두 연골이 골화, 근육 위축과 점액 분비의 변화들이 나타나며(Gorham-Rowan & Laures-Gore, 2006), 신경학적인 변화로는 말 운동의 계획과 실행 단계에서의 저하가 나타난다(Tremblay et al., 2018). 이는 노화가 진행되면서 말 산출과 연관된 뇌 영역들이 과대활성화(overactivation) 또는 과소활성화(underactivation)되며, 이로 인해 신경망의(neural network) 재구조화(reorganisation)가 이루어지기 때문이다(Soros, Bose, Sokoloff, Graham, Stuss, 2011). 따라서 이러한 후두와 중추신경계의 변화는 노년층에게 급속도로 진행되는 과정이기 때문에, 역시 VOT 변이성의 증가가 발생한다고 볼 수 있다. 뿐만 아니라 노화에 따른 구강안면(oro-facial) 운동제어능력의 저하로 인한 시간적 변이성(temporal variability) 증가(Ballard, Robin, Woodworth, & Zimba, 2001) 및 음운처리능력 저하, 특히 음소배열(sequencing)능력의 저하도(MacKay & James, 2004) 노년층의 VOT 변이성 증가를 설명할 수 있다.
이상의 논의로 미루어 볼 때, 노년층 음성음향학적 특성에 관한 국내 연구가 매우 제한적이었음에도 불구하고, 본 연구는 성대진동시작시간의 변동계수(CoV)를 통해 노화에 따른 조음조절능력의 변이성을 더욱 면밀히 살펴보았다는 점에서 의의를 갖는다. 또한, VOT를 통해 말 산출능력의 변화를 음성 음향학적으로 분석하여서 청지각적으로는 감지하기 어려운 정상적인 노화에 따른 발성-조음능력의 변화를 살펴보았다. 이러한 정상 노년층의 말소리 산출 특성은 노년층에서 주로 발생하는 파킨슨병과 같은 말소리 장애를 가진 환자들의 말 산출을 정상과 장애로 평가할 때 유용하게 사용될 수 있는 지표일 수 있다.
후속 연구를 위한 본 연구에서의 제한점 및 제언은 다음과 같다. 먼저, 정상군을 대상으로 집단별 16명의 인원은 본 연구의 결과를 일반화하기에는 다소 부족한 숫자이다. 추후 연구에서는 집단별 대상자들의 인원을 더 많이 포함하고, 노년층 집단을 고령 집단과 초고령 집단으로 세분화하여 정상 노년층의 VOT 특성을 살펴볼 필요가 있겠다. 다음으로, 실험 과제로 /ㅏ/ 모음과 결합한 VCV 문맥의 어음 목록을 사용하였기 때문에 대상자의 평상 시 발화를 대표하기에는 무리가 있었다. 따라서, 추후 연구에서는 자발화 과제 혹은 낭독 과제와 같이 일상 생활과 관련한 자연스러운 발화 안에서 산출되는 파열음 음성을 분석해볼 필요가 있다. 마지막으로, 대상자가 연속 발화를 산출할 때, 대상자의 말 속도 조절에 대한 실험 통제 조건이 완전하지 않았다. 따라서, 시각적인 단서뿐만 아니라, 소리 자체의 템포를 일정하게 조절할 수 있는 전문 음향 장비를 이용하여 발화 수집을 진행한다면 더욱 대상자 내 신뢰도가 높은 음성 자료를 확보하게 될 것이다. 결론적으로, 노년 화자의 조음 양상을 보다 심층적으로 분석하기 위해서는 화자의 자연스러운 발화 음성에서 강도, 운율 및 말 속도와 같은 세부 변인을 고려한 질적 분석이 필요하다고 사료된다.