초록배경 및 목적본 연구에서는 음성장애를 지닌 환자군의 중재 전후 및 성별에 따른 세 가지의 발화 기본주파수 절대오차(AEF0)의 반응도를 살펴보고, 중재 후 청지각적 평정치의 개선을 보인 개선 집단과 미개선 집단 간 AEF0 변화량(ΔAEF0)의 차이가 있는지 확인하고자 하였다. 또한 ΔAEF0가 다면적 음성검사 결과의 변화량과 상관관계가 있는지를 알아보았다. 마지막으로 중재 전후 AEF0의 유의미한 개선 정도를 판단하는 데 도움이 될 수 있는 기준점을 확인하고자 하였다.
방법연구대상은 양성 성대질환이 있는 음성장애 환자 남성 30명, 여성 30명이었다. 각 대상자는 음성 및 말 범위 프로파일과 문단 읽기 과제를 수행하였다. 수술적 중재 전후 음성 및 말 범위 프로파일(VRP, SRP)을 통해 AEF0를 계산하여 AEF0중재 전후 및 성별에 따라 비교하였다. AEF0와 다면적 음성검사 측정치의 중재 후 변화량 간 상관관계를 살펴보았다. 또한 ROC 곡선 분석을 통하여 음성 개선 여부에 대한 절단점을 계산하였다.
AbstractObjectivesThe purpose of this study was to investigate the responsiveness of the absolute error of estimated speaking fundamental frequency (AEF0) after intervention of voice disorders. The correlation between the changes in AEF0 measures and multidimensional voice measurements were explored. Usefulness of the changes in the AEF0 (ΔAEF0) measures for predicting vocal improvement was also explored.
Methods30 male and 30 female patients with benign vocal fold lesions participated in the study. Participants were asked to perform voice and speech range profile and passage-reading tasks to yield the AEF0. Pre- vs. post-operative AEF0 in voice and speech range profile tasks were compared. The correlation between the ΔAEF0 and changes in the voice parameters was explored. The cutoff score of the ΔAEF0 for the improved group was calculated.
ResultsFor both male and female patients, voice and speech range profile measures did not show significant change after surgery. On the other hand, AEF0 measured by voice and speech range profiles decreased regardless of gender. ΔAEF0 after surgery showed weak to moderate correlation with the changes in the multidimensional voice measurements. The area under the curve of the ΔAEF0VRP, ΔAEF0SRP, ΔAEF0SUM for screening vocal improvement were .693, .669, and .753; and the cutoff scores were ≤ 4.035, ≤ -2.403, ≤ 0.389, respectively.
음성장애는 여러 가지 원인에 의하여 음도(pitch), 음량(loudness), 음질(voice quality)의 변화가 초래되고 그것이 어떤 사람의 성별, 체격, 문화 등의 특성과 부조화를 이루게 되는 말 장애의 한 유형이므로(Aronson & Bless, 2009), 음도에 대한 평가는 음성장애 평가의 중요한 한 축을 차지하고 있다고 할 수 있다. 음도는 음향학적으로는 기본주파수(fundamental frequency, F0)로 측정되며, 음성장애에서 이러한 음도의 변화는 주로 후두의 병변에 의한 성대 질량, 길이, 긴장도 등의 변화에 기인하는 것으로 알려져 있다(Colton, Casper, & Leonard, 2011). 음성장애 환자의 음도 측면에 대한 평가는 다양한 방식으로 이루어질 수 있는데, 일상적인 말 산출을 할 때의 습관적인 음도가 반영되는 기본주파수, 즉 발화 기본주파수(speaking F0, SF0)는 가장 우선적으로 고려되는 평가 변수들 중의 하나로서 다양한 과제를 통해 측정이 가능하다(Ma & Lam, 2015). 그러나 우리는 자연스럽게 대화를 할 때에도 다양한 형식과 정도로 음도를 변화시키며, 가창의 경우와 같이 말 산출 이외의 발성을 수행할 때에는 산출되는 음도의 범위가 대화 시와는 크게 달라질 수 있다. 그러므로 이를 고려한 음도 측면의 평가가 이루어져야만 평가 대상자의 실제 음성 상태를 적절하게 반영한 평가가 이루어질 수 있다. 이와 같은 맥락에서 Titze가 1995년에 제안한 가이드라인을 포함하는 여러 문헌에서도 둘 이상의 과제를 통하여 습관적 음도를 평가할 것을 권하고 있다(Ma & Yiu, 2011). 또한 임상에서 흔히 마주치게 되는 음성장애 환자에서는 특히 모음 발성 시 습관적인 음도를 벗어나 음도와 음량을 증가시켜 발성하면, 성대진동의 진폭이 증가하면서 병변에 의한 영향이 감소됨에 따라 음질도 개선되곤 한다. 즉 환자가 산출하는 음도에 따라 음질이 달라지는 임상 케이스가 많다는 것이다. 무엇보다도 음도 측면에 대한 정확하고 광범위한 평가는 음역대에 있어 이상을 보이는 환자, 특히 가수, 배우, 성우 등을 포함하는 엘리트 음성사용자(elite vocal performer)에 있어 적합한 중재 계획 수립과 치료 효과 일반화에도 직결되는 사항이라고 할 수 있다.
앞서 언급하였듯 음역대에 대한 평가에 이용되는 방법은 매우 다양하다. 가장 손쉽게 확인할 수 있는 방법은 최고 음도와 최저 음도로 모음 발성을 하도록 하여 이들 음도 간의 범위를 측정하는 방법이 있다. 2018년에 제시된 음성에 대한 기기 평가 프로토콜에서도 간단하게라도 위와 같은 방법으로 음도의 범위를 측정하도록 권고된 바 있다(Patel et al., 2018). 모음 발성을 이용하되 이보다 더 면밀하게 음도와 음량 측면까지 평가하는 도구로서 임상에서 널리 활용되는 것은 음성 범위 프로파일(voice range profile, VRP)이다. VRP는 임상에서 다양한 방식으로 이루어질 수 있고, 이를 통해 임상가는 각 음도에 따른 음량 범위를 측정함으로써 포네토그램(phonetogram)을 얻을 수 있으며, VRP는 병리적 음성과 정상 음성을 감별하는 데에 널리 이용되어 왔다(Jung, Choi, & Choi, 2019; Ma & Yiu, 2011).
그런데 VRP를 통해 전체 포네토그램을 얻고자 철저한 절차를 따르자면 반음(semitone) 단위의 각 음도마다 음량 범위를 측정하여야 한다. 따라서 환자의 음도 범위가 넓을수록 최대 1시간 30분에 이르는 많은 시간이 소요되어 임상적 활용도가 제한적이고(Jung et al., 2019), 환자에게 많은 음성 부하(vocal loading)를 요구하여 자칫 음성 상태를 악화시킬 우려를 완전히 배제할 수 없다. 뿐만 아니라, 전문적 음성사용자가 아닌 경우 지시사항 자체를 따르기 어려워하는 경우가 빈번하여 적절한 음역대 측정에 어려운 점이 있을 수 있다. 최근에는 VRP와 함께 일상에서 실제 발화 시의 음도 및 음량 측면을 반영하여 음역대를 평가하기 위한 방법으로서 말 범위 프로파일(speech range profile, SRP)에 대한 연구들도 보고되어 왔다(Berg et al., 2017; Kim & Lee, 2019; Kim & Lee, 2021; Ma et al., 2007; Ma & Yiu, 2011). 다만 아직 임상에서의 활용도가 높지는 않은 실정이며, 이는 다양한 활용방법을 제시하는 연구와 질환군에서의 특성 연구, 또한 중재 후의 음성개선에 대한 반응도를 증명하는 연구가 아직은 부족하기 때문이라 할 수 있다.
음역대는 사람마다 다를 수 있고, 같은 사람이라도 후두의 상태나 전신적 상태, 호르몬의 영향 등에 따라 달라질 수 있는데, 임상적인 관점에서 중요하게 던져볼 수 있는 질문으로 과연 환자의 음역대에 맞는 적정 SF0는 얼마인가 하는 것이 있다. Titze (1995)의 경우 다른 음성평가 과제에 앞서 먼저 VRP를 시행하고, 이를 통해 얻은 기본주파수 범위의 10%, 50%, 80% 지점을 각각 ‘낮음(low)’, ‘중간(medium)’, ‘높음(high)’ 지점의 음도로 규정할 수 있다고 제안하였다. 그러나 여기에서 말하는 ‘낮음’ 혹은 ‘중간’ 지점이 말하기에 편안한 습관적인 발화 음도라고 보기에는 다소 근거가 부족하다. 환자가 지나치게 높거나 낮은 음도로 발화하는 경향이 있는 음성장애군을 살펴보면, 성대의 전반적 부종(edema)을 동반하는 라인케 부종(Reinke’s edema)이나 접촉성 육아종(contact granuloma), 후두 주변부 과긴장을 동반할 수 있는 기능적 실성증/부전실성증(functional aphonia/dysphonia)나 사춘기 남성에서 주로 관찰되는 변성기 발성장애(mutational falsetto) 등이 해당된다(Boone, McFarlane, Von Berg, & Zraick, 2020; Kim & Woo, 2022; Nam, Kim, Jin, & Lee, 2019; Pyo, 1998). 이 중에서 특히 접촉성 육아종은 성대 돌기 내측의 염증이나 궤양, 인후두 역류 등의 원인들 외에도 습관에 의해 적정 음도보다 낮은 음도로 발화하는 경향이 연관된 것으로 알려져 있다(Lee, 2019). 이 경우 과기능적 음성 사용을 자제시킴과 더불어 적절한 SF0를 확립하는 것이 치료의 핵심 요소 중 하나가 될 수 있으며, 임상가는 어떠한 합리적인 방식으로 대상자의 적절한 혹은 권고되는 발화 기본주파수를 추론하여 모범적인 대안으로 제시할 수 있는지에 대한 현실적인 질문에 부딪히게 된다. 만약 이러한 임상케이스의 환자가 임상가와 성별이 다르다면, 임상 가가 적정 음도를 모델링하는 데까지도 어려움이 있을 수 있어 문제는 더욱 복잡해진다.
임상적으로 중요함에도 아직 그 수요가 충족되지 않은 이러한 맥락에서 Lee와 Kim (2019)은 활창 과제를 활용한 VRP와 간단한 문장 산출을 이용한 SRP를 통해 측정한 음역대 관련 변수들을 이용하여 대상자의 실제 문단 읽기 시의 습관적 SF0를 예측할 수 있는지 살펴보았다. 즉 음도의 최댓값, 최솟값, Hz 및 반음(semitone) 단위의 범위 등을 추출하고, 성별, 연령 등의 인구학적 정보를 이용하여 EGG로 측정한 SF0를 예측하였다. 그 결과 VRP와 SRP 각각의 변수를 이용하여 추정 SF0 (estimated SF0, ESF0)를 예측할 수 있는 공식이 확립되었고, adjusted R 2 은 VRP가 .931, SRP가 .963으로 매우 높았다. 또한 이렇게 예측된 값과 실제 관측된 값이 서로 차이나는 정도 또한 중요할 것으로 여겨졌으며, 이 차이의 절댓값을 성별 간에 비교한 결과 정상 성인에서는 성별 차가 없었다. 이러한 차이를 나타내는 용어로서는 그 개념을 반영하여 추정 발화 기본주파수 절대오차(absolute error of estimated speaking fundamental frequency, AEF0)를 제시할 수 있겠다고 판단되었다.
이어진 후속연구에서는 양성성대질환(benign vocal fold lesion) 환자군과 정상 대조군 각 85명에서 AEF0를 계산하여 집단 간 비교를 수행하였다(Lee & Kim, 2020). 그 결과 성별과 무관하게 환자군의 AEF0가 대조군에 비해 높았으며, 이는 바람직한 SF0와 측정된 SF0 간의 차이가 환자군에서 더 크다는 점을 시사하여 AEF0가 임상적으로도 유용할 가능성을 뒷받침하였다. 아울러 AEF0는 GRBAS 척도의 전반적 중증도(Grade) 평정 결과와 일정 수준의 양의 상관 관계를 보이기도 하였으며, 음성장애 선별을 위한 기준점이 마련되어 음성장애에 대한 선별검사도구로서 활용될 가능성도 일부 보여주었다. 다만 이 연구에서도 임상적 유용성을 제고하기 위해서는 음성장애에 대한 중재가 이루어진 후 반응도를 추가적으로 살펴보는 것이 숙제로 남았다.
따라서 본 연구에서는 음성장애 환자군의 수술적 중재 전후 및 성별에 따른 세 가지의 AEF0의 반응도를 살펴보고, 중재 후 청지각적 평정치의 개선을 보인 개선군과 비개선군 간 AEF0 변화량(ΔAEF0)의 차이가 있는지 확인하고자 하였다. 또한 ΔAEF0가 다면적 음성 검사 결과의 변화량과 상관관계가 있는지를 알아보았다. 마지막으로 중재 전후 AEF0의 유의미한 개선 정도를 판단하는 데 도움이 될 수 있는 기준점을 확인하고자 하였다.
연구방법연구대상G*Power (Faul, Erdfelder, Buchner, & Lang, 2009)를 통해 중재(전후)와 성별집단(2개)에 따른 비교를 위한 최소한의 표본 수를 확인한 결과 총 대상자 수는 54명이었다(two-way repeated measures of ANOVA, effect size f = .25, α = .05, Power = .95). 이에 성별집단 별로 각 30명의 대상자를 연구대상으로 선정하였다. 구체적으로는 2018년 1월부터 2019년 8월까지 서울에 소재한 대학병원의 이비인후과 음성클리닉에 내원하여 이비인후과 전공의가 시행한 후두 스트로보스코피를 통해 이비인후과 두경부외과 전문의에게 양성 성대질환으로 진단된 후, 수술적인 중재를 받은 만 19세 이상의 성인 환자 60명(남 30명, 여 30명)을 대상자로 선정하였다. 구체적인 진단명으로는 성대폴립, 성대내 낭종, 과각화증, 성대결절, 라인케 부종이 포함되었다. 각 대상자는 혈관용해 레이저(angiolytic laser)를 이용한 후두미세수술(laryngeal microsurgery)을 시행받았다. 대상자들은 수술 전 1급 언어재활사에게 음성위생교육을 시행받았으며, 수술 후 평가를 시행하기 전에 별도의 음성치료를 시행받지는 않았다. 이때 음성질환과 관련이 있는 신경학적 질환 이력이나 내원 전 후두미세수술, 음성치료 이력이 있는 대상자, 문단 읽기 과제에 어려움을 보일 정도로 시력 문제가 있거나 문해력이 제한된 대상자는 연구에서 제외하였다. 두 성별집단 간 평균 연령, 발병 후 경과기간, 중재 전 청지각적 평정치, 수술 후 음성검사까지의 경과기간, 각 진단명과 직업적 음성사용 여부의 비율 차이는 없었다. 성별 집단에 따른 인구학적 정보와 진단명 정보, 성별집단 간 기초 정보의 비교 결과가 Table 1에 제시되어 있다.
연구절차음성장애의 중재 전후 음성검사의 절차는 아래와 같다. 먼저 사전면담 및 차트 리뷰를 통해 인구학적 정보 및 사례력을 수집하였다. 다음으로는 심리측정적 평가를 위해 한국판 음성장애지수(Korean version of Voice Handicap Index, KVHI)와 음성 활동 및 참여 프로파일-한국판(Korean version of the Voice Activity and Participation Profile, K-VAPP) 설문지를 무작위 순서로 작성하도록 하였다(Kim et al., 2007; Lee et al., 2016)이어서 각 대상자는 소음이 통제된 음성검사실에 입실하여 의자에 편안하게 착석하되, 등받이에서는 등을 떼고 바르게 앉도록 하였다. 마이크는 대상자의 입술로부터 약 10 cm의 거리를 유지하도록 위치시켰으며, 갑상연골의 패임을 기준으로 좌우에 각각 전기성문파형검사(electroglottography, EGG)의 전극을 위치시킨 후 벨크로로 고정한 상태에서 이후 음성검사 절차에 임하도록 하였다.
녹음 및 자료 기록 기기로는 Computerized Speech Lab (Model 4150B; KayPentax, Lincoln Park, NJ, USA; CSL)과 Real-time EGG(Model 6103; KayPENTAX, Lincoln Park, NJ, USA)의 기기를 연결하여 사용하였으며, 마이크로폰으로는 SM48 단일지향성 다이나믹 마이크(SHURE, Niles, IL, USA)를 사용하였다. 녹음 및 분석을 위한 소프트웨어로는 CSL의 모듈프로그램인 CSL 메인 프로그램(Model 4150B), Real-time EGG 프로그램(Model 6103), Multi-dimensional Voice Program (Model 5105, KayPentax, Lincoln Park, NJ, USA; MDVP), Voice Range Profile(Model 4326; KayPENTAX, Lincoln Park, NJ, USA; VRP), Analysis of Dysphonia in Speech and Voice (Model 5109, KayPentax, Lincoln Park, NJ, USA; ADSV), Phonatory Aerodynamic System (Model 6600, KayPentax, NJ, USA; PAS)을 활용하였다.
본 연구의 핵심과제인 VRP와 SRP의 시행 절차로는 먼저 VRP 모드 버튼을 눌러 점등시킨 다음, 모음 ‘아’를 활창(gliding)하도록 하여 진성구(modal register)와 가성구(falsetto register)를 모두 포함한 전체 음역대를 기록하는 VRP 과제를 실시하고 VRP 플롯파일(.pho)을 저장하였다. VRP를 시행하기 위한 더 구체적인 절차 및 지시사항들은 선행연구에 더욱 상세히 기술되어 있다(Lee & Kim, 2019). 한편 SRP 과제에서는 편안한 음도와 크기로 한국어 표준 문단의 하나인 ‘가을’ 문단(Kim, 2012)의 첫 문장인 ‘우리나라의 가을은 참으로 아름답다’를 발화하도록 한 후 VRP 플롯파일(.pho)을 저장하였다. 또한 MDVP를 통해 모음 ‘아’를 편안한 음도와 크기로 4초 이상 발성하도록 하여 4초 길이의 wav 확장자 샘플(음향신호 + EGG신호의 2채널, 44,100 Hz, 16 bit)을 저장하였다. CSL 메인 프로그램을 통하여서는 ‘가을’ 문단(Kim, 2012) 전체를 읽도록 하여 녹음한 후 저장한 뒤, 두 번째 문장(‘무엇보다도 산에 오를 땐 더욱 더 그 빼어난 아름다움이 느껴진다’)을 별도로 트리밍하여 wav 파일로 저장하였다. 모음 발성 및 문단 읽기 과제를 시행하는 동안 이비인후과 음성검사실에서의 임상 경력이 5년 이상인 2인의 1급 언어재활사가 7점 척도의 GRBAS 척도를 이용하여 합치에 이르도록 청지각적 평정을 실시하였다(Hirano, 1981; Choi, Yu, & Choi, 2021). 최대 발성 시간(maximum phonation time, MPT) 측정을 위하여 PAS 기기 및 프로그램을 통해 MPT 프로토콜을 3회 시행하였다.
자료분석먼저 문단 읽기 음성 샘플을 EGG 프로그램에서 로드 및 분석하여 해당 샘플 내에서의 평균 발화기본주파수(SF0EGG, Hz)의 평균과 표준편차를 측정하였으며, 이때 분석 범위는 70-1,000 Hz, 평활화(smoothing) 기능은 off로 설정하였다. 다음으로는 VRP상에서 VRP 및 SRP 플롯을 각각 분석하여 최고(MaxVRP, MaxSRP, Hz)와 최저 음도(MinVRP, MinSRP, Hz), Hz 단위(RangeVRP, RangeSRP)와 반음 단위(Semi VRP, SemiSRP)의 음역대를 측정하였다. 위의 측정치들은 Lee와 Kim (2019)의 계산식에 대입하여 ESF0VRP와 ESF0SRP를계산하고, 이 예측치들과 SF0EGG 간의 차이의 절댓값, 즉 AEF0(AEF0VRP, AEF0SRP)와 두 AEF0의 합(AEF0SUM)을 구하였다. ESF0 와 AEF0의 계산식은 각각 아래와 같다.
ESF0VRP = 71.779 + (57.116×Gender) + (0.447× MinVRP) − (0.308× Age) + (0.016× RangeVRP) (Gender: male = 0, female =1)
ESF0SRP = 33.446 + (0.728× MaxSRP)−(3.353× SemiSRP)
AEF0VRP =| ESF0VRP − SF0EGG |
AEF0SRP =| ESF0SRP − SF0EGG |
AEF0SUM =AEF0VRP + AEF0SRP
상관관계 탐색을 위한 다른 다면적 검사 변수들은 반응도에 대한 선행연구를 참고하여 아래와 같이 선정 및 측정하였다(Lee, Lim, & Choi, 2017). 먼저 MDVP를 통해서는 주파수변동률(jitter percent, Jitt), 진폭변동률(shimmer percent, Shim), 소음 대 배음비율 (noise-to-harmonic ratio, NHR)을 측정하였다. 한편 모음 4초 샘플과 문장 샘플에 대하여 ADSV를 이용하여 켑스트럼 피크 현저성(cepstral peak prominence, CPPV, CPPS)과 표준편차(σCPPV, σCPPS)를 측정하였다. MPT의 경우 3회 시행한 결과 중 가장 긴 시간을 최대 수행력으로 간주하여 추후 분석에 활용하였으며, EGG 프로그램에서 가을 문단 전체 샘플을 분석하여 성문폐쇄지수(closed quotient, CQ)와 표준편차를 측정하였다. KVHI에서는 총점(KVHITTL), 기능(KVHIF), 신체(KVHIP), 감정(KVHIE) 하위점수를 계산하였으며, K-VAPP에서는 총점(K-VAPPTTL), 활동 제한 점수(activity limitation score, ALS), 참여 제약 점수(participation restriction score, PRS), 중증도 점수(Severity), 직업 점수(Job), 일상생활 점수(Daily), 사회생활 점수(Social), 감정 점수(Emotion)를 계산하였다. 다면적 음성지수의 하나인 음향학적 심리측정적 음성장애 중증도 지수(Acoustic Psychometric Severity Index of Dysphonia, APSID) 또한 계산하였다. APSID는 모음 및 문장의 CPP와 K-VAPP 점수를 이용하여 다면적 음성 특성을 반영하여 전문가가 수행한 CAPE-V의 전반적 중증도를 예측하는 지수이며, 아래와 같은 계산식으로 계산하였다(Lee, Choi, & Kim, 2021).
APSID = 84.984-(7.159× CPPs)+(2.104× Self-perceived severity)+(5.724× σCPPv)-(2.054×CPPv)-(5.174×Gender) (Gender: male = 0, female =1)
통계 분석성별에 따른 차이가 있을 것으로 예상되는 기본주파수 관련 변수들에 대해서는 중재 전후와 성별에 따른 비교를 위해 이원 반복 측정 분산 분석을 시행하였다. 그 외의 다면적 평가 측정치들은 AEF0와의 상관관계를 살펴봄으로써 반응도를 확인하기 위하여 제시되었으며, 중재 전후 변화의 성별 차이가 본 연구의 주요 관심사는 아니므로, 성별에 관계없이 중재 전후의 비교를 위하여 대응 표본 t 검정(paired t-test)을 시행하였다. 각 변수의 중재 전후 변화량(Δ) 간의 상관관계를 알아보기 위해서는 피어슨 상관분석을 시행하였다. 중재 전후 비교 결과 GRBAS 척도의 Grade 평정치가 1 이상 감소한 경우 개선군(improved group), 감소한 정도가 1 미만인 경우 비개선군(non-improved group)으로 간주하고, 개선군과 비개선군 간 세 ΔAEF0 비교를 위해 독립표본 t 검정을 시행하였다. 세 AEF0의 중재 전후 상태를 구분하기 위한 절단점(cutoff score)을 확인하기 위해 수신자 조작 특성 곡선(receiver operating characteristic curve, ROC curve) 분석을 시행하였다. 이원 반복측정 분산 분석과 t 검정에는 SPSS 25.0 (IBM-SPSS Inc., Armonk, NY, USA), ROC 곡선 분석 및 시각화에는 MedCalc® 통계 소프트웨어 20.009(MedCalc Software Ltd, Ostend, Belgium), 상관분석 및 상관관계 시각화에는 Python 3.9 (Van Rossum & Drake, 2009)를 이용하였다. 통계분석 시 유의수준은 .05로 설정하였다.
연구결과중재 전후 성별에 따른 음성 및 말 범위 프로파일 측정치의 변화중재 전후 성별에 따른 EGG, VRP, SRP 측정치와 ESF0, AEF0의 기술통계가 각각 Tables 2와 3에 제시되어 있다. SemiVRP를 제외한 모든 EGG, VRP, SRP 변수에 있어 여성의 측정치가 남성보다 높았다. 그러나 중재 후 유의하게 변화한 EGG, VRP, SRP 변수는 없었다.
세 가지 AEF0를 중재 전후 성별에 따라 비교한 결과, AEF0VRP (Wilk’s Lambda = .922, p= .030), AEF0 SRP (Wilk’s Lambda = .934, p= .048), AEF0SUM (Wilk’s Lambda = .868, p= .004)이 모두 중재 후 유의하게 감소하였다. 성별 집단 간 차이는 남성의 AEF0SRP가 여성에 비해 유의하게 낮았으나(p= .048), 세 가지 모두 교호작용은 유의하지 않았다(p>.05).
중재 전후 성별에 따른 다면적 음성검사 측정치의 변화중재 전후 음향학적, 심리측정적, 그리고 기타 다면적 평가 측정치의 기술통계 및 비교결과가 Tables 4, 5, 6에 제시되어 있다. 먼저 음향학적 측정치를 비교한 결과, Jitt (t = 3.669, p< .001), Shim (t = 3.585, p< .001), NHR (t = 2.757, p= .008), σCPPv (t = 2.469, p= .016), APSID (t = 5.800, p< .001)가 유의하게 감소한 반면, CPPs (t = -3.956, p< .001), σCPPs (t = -3.819, p< .001), CPPv (t = -3.513, p< .001)는 유의하게 증가하였다(Table 4).
KVHI와 K-VAPP 설문 점수 중에서는 K-VAPP의 PRS (t = -1.696, p= .095), Daily (t = -.213, p= .832), Social (t = .509, p= .612)을 제외한 모든 하위점수 및 총점이 유의하게 감소하였다(Table 5). GRBAS 척도 중에서는 Asthenia 척도(t =1.000, p= .321)를 제외한 모든 청지각적 평정치가 유의하게 감소하였다. MPT는 유의하게 증가한 반면(t = -3.587, p< .001), CQ의 평균과 표준편차는 중재 전후 유의한 변화가 관찰되지 않았다(Table 6).
중재 전후 ΔAEF0와 다면적 음성검사의 변화량 간의 상관관계중재 전후 개선을 보인 음성 변수 중 음성의 질과 밀접한 관련이 있는 것으로 알려진 변수들과 AEF0 간의 상관관계 히트맵이 Figure 1에 제시되어 있다. 히트맵에서 붉은 색은 양의 상관관계를, 푸른색은 음의 상관관계를 나타낸다. 개선된 청지각적 평정치인 ΔG, ΔR, ΔB, ΔS는 AEF0 변수들과 약함-중간 수준의 양의 상관관계 (r = .25-.53)를 보였다. 그 밖에 ΔAEF0VRP, ΔAEF0SRP, ΔAEF0SUM과 약함 수준의 상관관계를 보인 변수들을 살펴보면, ΔCPPS가 음의 상관관계(r = -.23, -.28, -.35)를, ΔAPSID가 양의 상관관계(r = .24, .26, .34)를 보였다. ΔKVHI (r = .41, .34)와 ΔK-VAPP (r = .23, .30), ΔSEVERITY (r = .32, .32) 등의 설문점수는 ΔAEF0VRP, ΔAEF0SUM 과 약함 수준의 양의 상관관계를 보였으나, ΔAEF0SRP와는 유의한 상관관계가 없었다.
중재 전 후 세 가지의 ΔAEF0 (중재 후 측정치-중재 전 측정치), 즉 ΔAEF0가 중재 후 개선 여부(Grade 1 이상 감소)에 대한 선별도구로서의 유용성을 지니고 있는지 알아보기 위해 개선군과 비개선군 간 ΔAEF0를 비교한 결과와 ROC 곡선 분석을 시행한 결과가 Tables 7, 8과 Figure 2에 제시되어 있다. 이때 앞의 성별과 중재 전후의 비교 결과에서 교호작용은 관찰되지 않았으므로, 성별에 따라 나누어 분석을 진행하지는 않았다. 개선군과 비개선군 간 비교 결과세 가지 ΔAEF0 모두 개선군에서 유의하게 낮게 나타났다. ΔAEF0VRP, ΔAEF0SRP, ΔAEF0SUM의 AUC는 각각 .693, .669, .753이었으며, 환자군과 정상군을 구분하는 변화량의 기준점은 각각 ≤4.035, ≤-2.403, ≤.389이었다. ROC 곡선 간의 비교를 수행한 결과, VRP와 SRP (z = 0.258, p= .797), VRP와 SUM (z = 1.268, p= .205), SRP와 SUM (z = 1.464, p= .143) 간 차이가 모두 유의하지 않았다.
논의 및 결론이 연구에서는 음성장애 환자군의 중재 전후 및 성별에 따른 AEF0의 반응도를 살펴보았으며, 중재 후 개선군과 비개선군 간 ΔAEF0의 차이를 살펴보았다. 그 결과 음성장애 중재 후 AEF0는 유의미하게 감소되었으며, 개선군에서 ΔAEF0가 더 많이 감소하였다. 또한 ΔAEF0가 다른 음성검사 변화량과 갖는 상관관계를 알아본 결과, 약함-중간 수준의 상관관계를 보였다. 마지막으로 중재 전후 AEF0의 개선 여부를 구분하는 절단점(cutoff score)을 산출하였다. 이와 같은 결과로 미루어 볼 때 AEF0가 중재 전후의 개선 정도를 반영할 수 있는 반응도가 확인되었으며, 그 임상적 유용성 또한 일정 정도 확인되었다고 할 수 있다.
먼저 VRP와 SRP 측정치 그 자체는 수술적 중재 전후 유의한 차이를 보이지 않았음에도 불구하고, AEF0의 경우 세 가지 종류의 AEF0가 모두 수술 후 유의하게 감소하였다. 또한 청지각적 평정치, 공기역학적 측정치, 전통적인 음향변수와 켑스트럼 음향변수, 설문 점수 등이 모두 중재 후 개선된 것을 확인하였다. 이는 음성장애 중재 후 음성이 개선됨에 따라, VRP 혹은 SRP 과제를 통해 유추한 바람직한 SF0와 실제 측정된 SF0 간의 간극이 감소하였음을 의미한다. 즉 환자 본인의 음역대에 비추어 바람직한 SF0에 가까운 음도로 발화를 하게 되었다는 것이다. 이는 환자군의 AEF0가 정상군보다 더 높았던 선행연구의 결과와도 일치한다(Lee & Kim, 2020). 그리고 VRP와 SRP 측정치 자체로는 중재 전후 유의한 차이가 없었던 점으로 미루어 볼 때, 이러한 개선은 VRP나 SRP 과제 그 자체만 가지고는 탐지하기 어려울 수 있으며, AEF0가 그 대안의 하나가 될 수 있다는 점 또한 시사된다고 할 수 있다. 이는 일정 부분 병변이 제거되고 이로 인해 음질이 개선되며, 특히 양성 성대질환에서 발화 시 흔히 관찰되는 이중음도(diplophonia) 혹은 음도 일탈(pitch break) 증상이 일정 정도 개선된 결과로 해석할 수 있다.
다만 중재 전후 AEF0VRP와 AEF0SRP의 경우 중재 전후 차이의 유의성이 높지는 않았다. 이는 다음과 같이 해석할 수 있다. 첫째, 양성 성대질환에 대한 중재 후 구조적 이상은 해결이 되었음에도 불구하고, 불충분한 술 후 경과기간 등으로 인하여 기능적으로는 과기능적 발성습관이 지속되는 등 완전히 병전의 상태로 회복되지 못했을 가능성이 있다. 본 연구에서 중재 후 AEF0VRP (남 12.452 Hz, 여 15.464 Hz), AEF0SRP (남 6.823 Hz, 여 11.147 Hz), AEF0SUM (남 19.275 Hz, 여 26.610 Hz)의 평균값들 중 대부분이 선행연구에서 음성장애군과 정상대조군을 구분했던 절단점(각각 >10.867 Hz, >10.348 Hz, >17.777 Hz)을 상회하는 점도 이를 반영한다. 둘째, 통상적으로 후두미세수술을 받는 환자는 수술 전 또는 후 음성 위생교육(vocal hygiene education)을 시행받고 수술 후 음성 휴식(voice rest)을 일정 기간 취하도록 안내를 받으므로, 수술 후 검사, 특히 VRP를 시행할 때 실제 본인의 음역대에 비해 조심스러운 발성을 함으로 인해 AEF0의 변화가 실제의 개선 정도를 완전하게 반영하지 못하였을 가능성을 배제할 수 없다. 따라서 AEF0의 개선 정도가 저평가되었을 수 있다는 것이다. 셋째, 대상자의 바람직한 SF0를 추정할 때에는 VRP와 SRP과제를 함께 이용하는 것이 바람직하며, 위 두 AEF0의 합산을 통하여 AEF0 SUM을 산정하여 임상적 판단 및 의사결정을 하는 것이 바람직할 수 있다는 점을 유추할 수 있다. 이는 음도에 대한 평가 시 둘 이상의 과제를 사용하는 것이 좋다는 지침과도 일맥상통한다(Ma & Yiu, 2011).
또한 이러한 AEF0의 개선 정도와 성별 간의 교호작용은 관찰되지 않아 성별에 따른 개선 정도의 차이는 유의하지 않다는 점을 확인하였다. 이는 일반적으로 남성과 여성의 기본주파수와 관련된 변수들이 차이를 보인다는 점을 감안하면 다소 의외의 결과라 할 수있다. 이러한 결과는 부분적으로 AEF0를 개발할 당시 이미 성별이 계산 공식에서 하나의 변인으로 포함되었으므로, 수술 후 AEF0의 변화 정도에도 성별에 따른 변화 정도가 선반영되었기 때문으로 풀이된다. 임상적인 관점에서 보자면, 이러한 결과는 AEF0가 감소하는 것이 성별과 무관하게 음성장애의 개선을 나타내는 것을 나타내며, 다른 다면적인 음성평가 결과에서 확인된 음성장애 중재의 정도를 반영하는 지표의 하나로 활용될 가능성을 시사한다.
수술 전후 ΔAEF0와 ΔGRBS 간의 상관관계를 살펴본 결과, 약함에서 중간 수준의 양의 상관관계가 관찰되었다. 이는 AEF0의 비교 결과에서 관찰된 감소 경향에 따라 청지각적 평정 척도 점수 또한 함께 감소하는 경향이 있었음을 시사한다. 청지각적 평가 결과는 음성장애의 다면적 평가에 있어서 가장 중요한 척도로 평가되는 만큼, AEF0가 청지각적 척도와 양의 상관관계를 보인 것은 일정 정도 임상적 의미를 부여할 수 있는 결과이다. 다만 그 상관관계의 크기가 강함이 되지는 않았는데, 이는 첫째로 앞서 언급한 수술 후 발성에 대한 적극성의 감소로 인한 간극으로 일정 정도 설명된다. 즉 VRP 결과의 영향을 받는 AEF0의 경우 높은 음도와 음량으로 산출하는 발성이 어려운 수술 후 검사의 특성상 어느 정도 저평가되어 GRBS와의 상관관계가 감소한 것으로 해석할 수 있을 것이다. 둘째로 GRBAS 척도는 Consensus Auditory-Perceptual Evaluation of Voice (CAPE-V)와는 달리 신뢰도가 높은 장점은 있으나, 그 자체로는 음질의 평가에 집중할 뿐 음도와 강도 측면을 반영하지 않는다는 점과도 연관이 있는 것으로 여겨진다(Lee, 2021). 따라서 GRBAS 척도가 중재 후의 음도 측면에서의 미세한 변화나 과제에 따른 차이 등을 반영하기에는 부족했을 수 있다는 것이다. 다만 이러한 점을 보완하기 위하여 R, B, A, S 척도를 먼저 평정한 후 음도와 강도 측면을 반영하여 G를 종합적으로 평정하는 절충안이 제시되었으며, 본 연구에서도 이와 같은 방법이 이용되었다(Lee, 2021).
중재 후 비개선군에 비해 개선군은 AEF0가 더욱 크게 감소하였으며, 개선 여부를 판단할 수 있는 ΔAEF0의 절단점 또한 확인되었다. 이는 ΔAEF0이 다면적 음성결과의 변화량과 상관관계를 보인 결과와도 일맥상통하는 것이며, 중재 후 음역대라는 고유한 측면을 반영한 음성개선 판단 도구가 될 수 있는 가능성을 시사하는 결과라 할 수 있다. 또한 세 ΔAEF0 중 ΔAEF0 SUM의 AUC만 .7 이상이었다는 점도 주목할 만한데, 이는 음성장애의 개선 여부를 판단할 때 음역대의 여러 측면을 잘 반영하려면 VRP와 SRP 과제를 모두 시행하고 그 개선양상을 종합적으로 살펴보아야 한다는 점을 시사할 수 있기 때문이다. 다만 ROC 곡선 분석 결과 AUC가 크지는 않았는데, 이는 음성의 개선에는 음역대 외에도 다른 여러 가지 측면이 관여하며, 다면적 음성검사를 통해 이를 종합적으로 파악할 필요가 있다는 점을 뒷받침해준다.
결론적으로 본 연구를 통하여 AEF0가 음성장애의 중재 후 대상자의 음역대와 관련된 개선사항을 종합적으로 반영하는 지표 중의 하나로 사용될 수 있는 가능성이 확인되었다고 할 수 있다. 또한 임상적인 간극으로 남아있던 부분, 즉 대상자의 음역대를 고려하여 바람직한 SF0를 객관적으로 추산하여 제시할 수 있는 새로운 가능성을 열었다고 할 수 있으며, 이는 AEF0가 단순히 연구 수준에서 만들어진 지표가 아니라 평가 및 치료 측면에서 실질적인 임상적 유용성을 가진 지표로 자리매김할 수 있는 잠재력을 더해주는 부분이라 할 수 있다. 마지막으로 이러한 지표로서의 유용성이 실제 중재 과정을 거친 대상자의 중재 전후 음성결과들을 통해 재검증 되었다는 데에서 본 연구의 의의를 찾을 수 있다.
다만 본 연구의 경우 수술적 중재를 받은 양성 성대질환 환자에 국한되었다는 한계가 있다. 또한 본 연구에 활용된 AEF0의 계산에 EGG를 이용하여 측정한 SF0가 필요하다는 한계가 있으므로, 임상에서 보다 활발하게 이용되는 Real-Time Pitch나 연구에서 활발히 활용되는 Praat 프로그램을 이용하여 음향학적으로 측정한 SF0에서도 이러한 AEF0 공식의 유용성이 적용되는지에 대한 후속 검증이 필요하다. 양성 성대질환 외에도 음역대에 비해 부적절한 음도를 산출하는 환자군이나 중재 전후 F0의 변화가 큰 환자군, 아동 및 노인 음성장애군에서의 집중적인 연구를 통하여 임상적 활용도를 제고하는 일도 필요하다고 할 수 있다. 아울러 본 연구에서는 음성장애에 대한 여러 중재 방법 중에서 수술적인 중재에 국한하였던 만큼, 후속연구에서는 행동적인 중재인 음성치료를 이용한 연구가 필요할 것이다. 또한 GRBAS 대신 음도와 강도 측면을 반영하는 CAPE-V를 이용하면 변수들 간의 관련성을 더욱 면밀히 살펴볼 수 있을 것이다. 마지막으로 본 연구에서의 중재 후 개선 여부에 대한 기준은 조작적인 정의에 의한 것이었으므로 해석 시 주의가 필요하며, 추후에는 음성 개선 정도를 보다 상세히 수량화하여 이를 예측하는 연구 또한 가능할 것으로 본다.
Table 1.Table 2.
Table 3.
Table 4.
Table 5.
Table 6.
Table 7.
REFERENCESAronson, A. E., & Bless, D. (2009). Clinical voice disorders New York, NY: Thieme.
Berg, M., Fuchs, M., Wirkner, K., Loeffler, M., Engel, C., & Bergerm, T. (2017). The speaking voice in general population: normative data and associations to sociodemographic and lifestyle factors. Journal of Voice, 31(2), e13–257.e24.
Boone, D. R., McFarlane, S. C., Von Berg, S. L., & Zraick, R. I. (2020). The voice and voice therapy (10th ed .). Hoboken, NJ: Pearson Education.
Choi, S. H., Yu, M., & Choi, C. H. (2021). Comparison of 4-point GRBAS, 7-point GRBAS, and CAPE-V for auditory perceptual evaluation of dysphonia. Audiology and Speech Research, 17(2), 206–219.
Colton, R. H., Casper, J. K., & Leonard, R. (2011). Understanding voice problems (4th ed .). Baltimore, MD: Lippincott Williams & Wilkins.
Faul, F., Erdfelder, E., Buchner, A., & Lang, A. G. (2009). Statistical power analyses using G* Power 3.1: tests for correlation and regression analyses. Behavior Research Methods, 41, 1149–1160.
Hirano, M. (1981). Clinical examination of voice New York, NY: Springer.
Jung, W. J., Choi, S. H., & Choi, C. H. (2019). Development and validation of a novel simplified voice range profile measurement method: comparison of maximum vocal performance based on the VRP protocol. Communication Sciences & Disorders, 24(3), 770–784.
Kim, B. R., & Woo, J. H. (2022). A case of voice therapy for long standing functional aphonia. v, 33(2), 119–122.
Kim, H. (2012). Neurogenic speech-language disorders Seoul: Sigma press.
Kim, J., & Lee, S. J. (2019). Development and validation of Speech Range Profile task. Phonetics and Speech Sciences, 11(3), 77–87.
Kim, J., & Lee, S. J. (2021). Voice range profile in premutation, mutation, and postmutation of men. Phonetics and Speech Sciences, 13(4), 89–100.
Kim, J., Lim, S. E., Park, S. Y., Choi, S. H., Choi, J. N., & Choi, H. S. (2007). Validity and reliability of Korean-Version of Voice Handicap Index and Voice-Related Quality of Life. Speech Sciences, 14(3), 111–125.
Lee, S. J. (2021). Discussions on auditory-perceptual evaluation performed in patients with voice disorders. Journal of the Korean Society of Laryngology, Phoniatrics & Logopedics, 32(3), 109–117.
Lee, S. J., Choi, H. S., Kim, H., Byeon, H. K., Lim, S. E., & Yang, M. K. (2016). Korean Version of the Voice Activity and Participation Profile (K-VAPP): a validation study. Communication Sciences & Disorders, 21(4), 695–708.
Lee, S. J., Choi, H. S., & Kim, H. (2021). Acoustic Psychometric Severity Index of Dysphonia (APSID): development and clinical application. Journal of Voice, 35(4), 660.e19–660.e25.
Lee, S. J., & Kim, J. (2019). Prediction of speaking fundamental frequency using the voice and speech range profiles in normal adults. Phonetics & Speech Sciences, 11(3), 49–55.
Lee, S. J., & Kim, J. (2020). Clinical usefulness of estimated speaking fundamental frequency using the voice and speech range profiles in voice disorders. Communication Sciences & Disorders, 25(2), 480–488.
Lee, S. J., Lim, S. E., & Choi, H. S. (2017). Responsiveness of the Korean Version of the Voice Activity and Participation Profile (K-VAPP) after surgical intervention. Communication Sciences & Disorders, 22(2), 379–390.
Lee, S. W. (2019). Clinical application of botulinum toxin to contact granuloma and vocal nodule. Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics, 30(2), 82–86.
Ma, E. P. M., & Lam, N. L. N. (2015). Speech task effects on acoustic measure of fundamental frequency in Cantonese-speaking children. International Journal of Pediatric Otorhinolaryngology, 79(12), 2260–2264.
Ma, E. P., Robertson, J., Radford, C., Vagne, S., El-Halabi, R., & Yiu, E. (2007). Reliability of speaking and maximum voice range measures in screening for dysphonia. Journal of Voice, 21(4), 397–406.
Ma, E. P., & Yiu, E. M. (2011). Handbook of Voice Assessments San Diego, CA: Plural Publishing, Inc.
Nam, W., Kim, S. W., Jin, S. M., & Lee, S. H. (2019). The efficacy of percutaneous steroid injection via cricothyroid membrane for Reinke’s edema. Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics, 30(2), 101–106.
Patel, R. R., Awan, S. N., Barkmeier-Kraemer, J., Courey, M., Deliyski, D., Eadie, T., Paul, D., Švec, J. G., & Hillman, R. (2018). Recommended protocols for instrumental assessment of voice: American Speech-Language-Hearing Association expert panel to develop a protocol for instrumental assessment of vocal function. American Journal of Speech-Language Pathology, 27(3), 887–905.
Pyo, H. Y. (1998). The efficiency of voice therapy for the patients with mutational falsetto. Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics, 9(2), 134–141.
Titze, I. R. (1995). Summary statement: workshop on acoustic voice analysis. National Center for Voice and Speech. Retrieved from http://ncvs.org/.
Van Rossum, G., & Drake, F. L. (2009). Python 3 reference manual Scotts Valley, CA: CreateSpace.
|
|