정상압수두증과 파킨슨병 환자의 어휘인출 수행력
Lexical Retrieval Performance in Patients with Normal Pressure Hydrocephalus and Parkinson’s Disease
Article information
Abstract
배경 및 목적
본 연구에서는 비슷한 양상을 보이지만 다른 중추신경계 퇴행성 질환인 정상압수두증과 파킨슨병 환자의 어휘인출 수행력을 비교하였다.
방법
정상압수두증 환자 14명, 파킨슨병 환자 14명, 정상 노인 14명을 대상으로 어휘인출과제를 실시하여 정반응 점수, 반응시간, 오류유형을 비교하였고, K-BNT를 추가적으로 실시하여 어휘인출과제의 타당도를 알아보았다.
결과
첫째, K-BNT에서는 세 집단 간 점수에 유의한 차이가 없었다. 둘째, 어휘인출과제에서는 정상압수두증과 파킨슨병 집단의 점수가 정상 노인 집단보다 유의하게 떨어졌다. 셋째, 어휘인출과제 반응시간의 경우 정상압수두증 집단만 정상 노인 집단보다 유의하게 느렸다. 넷째, 오류유형 분석 결과 정상 노인 집단보다 정상압수두증 집단은 의미오류와 비단어오류를, 파킨슨병 집단은 의미오류를 유의하게 많이 보였다. 다섯 째, 상관관계 분석 결과 K-BNT와 어휘인출과제 점수 간에는 상관계수 .721의 유의한 정적 상관이 있었다.
논의 및 결론
정상압수두증 과 파킨슨병 환자의 선별 및 감별진단에 어휘인출과제가 유용하게 사용될 수 있음을 제안한다.
Trans Abstract
Objectives
This study aimed to investigate lexical retrieval performance in patients with similar patterns but different central nervous system degenerative diseases, specifically normal pressure hydrocephalus (NPH) and Parkinson’s disease (PD).
Methods
A lexical retrieval task was performed on 14 patients with NPH, 14 patients with PD, and 14 healthy elderly subjects (HE) to compare their correct response scores, reaction times, and error types, and the Korean-Boston naming test (K-BNT) was additionally performed to determine the validity of the lexical retrieval task.
Results
First, there was no significant difference in scores between the three groups on the K-BNT. Second, the scores of the NPH and PD groups were significantly lower than the HE group on the lexical retrieval task. Third, only the NPH group was significantly slower than the HE group in the reaction time on the lexical retrieval task. Fourth, the error type analysis showed that the NPH group made significantly more semantic and nonword errors and the PD group made significantly more semantic errors than the HE group. Fifth, the correlation analysis showed a significant static correlation between K-BNT and the lexical retrieval task scores with a correlation coefficient of .721.
Conclusion
We suggest that the lexical retrieval task may be useful in the screening and differential diagnosis of patients with NPH and PD.
정상압수두증(Normal Pressure Hydrocephalus, NPH)은 노화로 인해 뇌척수액 순환이 원활하지 않아 뇌실이 비대해지고 그 결과 뇌실과 인접한 기저핵, 전두엽, 운동섬유 등 중추신경계에 압박을 초래하게 되는 질환이다. 일반인에게는 잘 알려지지 않은 다소 생소한 질환이지만 70세 이상 100명 중 2명에서 관찰되는 흔한 병이며, 고령화로 인해 발병률이 계속 증가하는 추세이다(Cho, Park, Kang, & Ha, 2024). 대표 증상으로 보행장애, 인지저하, 소변장애가 주로 언급되는데(Shprecher, Schwalb, & Kurlan, 2008), 이 중 인지저하와 관련해서는 NPH의 6%가 치매를 동반하고, 80-98.5%가 실행기능, 작업기억, 시공간기능, 언어기능, 주의력 등의 인지기능에 결함을 보이는 것으로 보고되었다(Xiao, Hu, Ding, & Ye, 2022). 다른 증상들보다 인지저하가 먼저 나타나기도 하는데, 그 경우 일반적으로 경도에서 중등도 사이의 문제를 보이는 것으로 알려져 있다(Katzen et al., 2011).
뇌실이 비대해져 기저핵을 압박하게 되면 NPH 증상은 파킨슨병(Parkinson’s disease, PD)과 상당히 유사해진다. PD는 중추신경계 신경세포 손상으로 인해 기저핵의 기능저하가 발생하여 나타나는 질병으로, 주요 증상으로는 근육강직, 손 떨림, 보행장애, 무력감, 말-언어장애 및 기억장애 등이 있다(Sveinbjornsdottir, 2016). 해당 질환이 알려지기 시작한 무렵에는 운동기능 손상이 주로 부각되었고 인지장애 여부에 대해서는 다소 논란의 여지가 있었다. 그러나 최초 PD 진단 시부터 경도인지장애 발생률이 정상인보다 두 배 이상 높고 진단 후 5년 이내에 20-57%의 환자에서 경도인지장애가 발생한다는 연구(Kim, Jin, Jang, Choi, & Kwon, 2011), 치매로 진단받지 않더라도 언어유연성, 실행기능, 시공간기능, 회상기억 등의 인지 능력이 질환 초기부터 유의미하게 떨어진다는 연구(Lee, 2016; Pack, Sohn, & Kim, 2011) 등 근래에는 많은 PD 환자에서 인지저하가 동반된다는 것에 대부분의 연구자들이 동의하고 있다(Choi, Chung, Leem, & Kwon, 2012).
주요 임상적 증상이 중복되기 때문에 두 질환을 오진하는 경우가 종종 발생하는데, NPH를 PD로 오진하는 경우가 그 반대 경우 보다 더 흔하다(Picascia et al., 2019). 상대적으로 일반인들에게 더 많이 알려진 PD로 본인의 증상을 잘못 자가진단하고 상당 기간 불필요한 치료적 접근을 한 후 비로소 전문의에게 NPH로 진단받고 안도하는 사례도 종종 볼 수 있다. ‘안도’의 가장 큰 이유는 여타 신경퇴행성 질환들과 달리 NPH는 수술로 치료가 가능한 질환이기 때문이다. 조기에 진단을 받으면 약 80%는 수술로 완치를 기대할 수 있어 NPH를 소위 ‘치료 가능한 치매’라고 부르기도 한다. 대표적 수술법으로 뇌실복강 단락술(Ventriculoperitoneal shunt, VP shunt)을 들 수 있는데, VP shunt로 보행장애와 소변장애 증상은 대부분 완화되고(Adams, Fisher, Hakim, Ojemann, & Sweet, 1965), 인지기능의 경우도 다소 상반된 의견이 존재하긴 하지만 수술로 호전을 기대해볼 수 있다(Graff-Radford, 2007). 그러나 조기에 뇌압을 경감시키지 못하면 NPH는 영구적 장애로 남게 되므로, 어떤 질병이든 조기 진단은 중요하겠지만, NPH야말로 조기 감별 진단만이 성공적인 치료의 첫 시작이라 할 수 있다(Gallia, Rigamonti, & Williams, 2006).
운동장애가 주 증상이면서 인지장애를 동반하는 질환의 경우 인지저하의 진행 양상은 질환의 감별진단에 유용한 정보를 제공한다(Choi et al., 2012). 기저의 여러 단계와 과정들이 복합적으로 작용하여 최종적으로 표출되는 활동인 만큼 환자 또는 질환마다 다른 수준과 다양한 양상의 인지결함들을 보일 수 있기 때문이다. 특히 복잡한 고차인지기능인 언어기능의 결함 여부, 정도, 양상을 비교하는 것은 각 질환별 변별적 특성을 파악하는 데에 도움이 된다. 그러나, 초기부터 인지저하가 동반될 수 있음에도 그 정도가 알츠하이머병과 같은 피질 치매처럼 두드러지지 않아(Chung, 2018; Lee, 2016), NPH와 PD에서 인지와 언어결함은 운동결함에 비해 덜 부각된 경향이 있다. 하지만 이 경우에도 저하된 인지 또는 언어기능이 일상생활에 미치는 영향은 표준화 검사에서 드러난 것보다 훨씬 더 심각할 수 있으며(Chung, 2018), 때문에 표준화 검사 이외에 보다 심층적 평가방법을 통해 환자들의 언어와 인지능력을 보다 면밀히 살펴볼 필요가 있다(Cho et al., 2024).
따라서 본 연구자들은 NPH와 PD 환자들의 언어-인지능력을 심층적으로 검사하여 결함 여부와 양상을 비교해보고자 하였고, 그 첫 시작으로 언어-인지능력 평가에 가장 기본이 되는 이름대기(naming) 수행력에 대해 알아보고자 하였다. 이름대기는 사물 또는 그림을 보여주고 대상자로 하여금 스스로 해당 이름을 떠올려 말하도록 하는 과제로, 이름대기 결함은 모든 인지장애, 언어장애 환자들에서 공통적으로 나타나는 문제이며, 손상 정도에 따라 다양한 수준과 양상을 보일 수 있다. 이에 한국판 간이정신상태검사 2판(Korean-Mini Mental State Examination, 2nd Edition, KMMSE-2; Kang, Jang, Kim, & Korean Dementia Association, 2020), 파라다이스 한국판 웨스턴 실어증 검사 개정판(Paradise Korean Western Aphasia Battery Revised, PK-WAB-R; Kim & Na, 2012) 등 뇌손상 환자의 인지 또는 언어능력을 평가하는 대부분의 표준화 검사들에 이름대기 항목이 포함되어 있다. 이 같은 표준화 이름대기 검사 문항들은 높은 타당성과 신뢰성을 갖추고 있어 언어장애 또는 인지장애를 선별하는 데에 매우 유용하다. 그러나, 앞에서도 언급하였듯이, 기능저하가 막 시작되었거나 결함의 정도가 경미한 경우 대상자들의 어려움을 민감하게 파악하지 못할 가능성을 배제할 수 없다.
이 같은 이유로 본 연구에서는 기존 이름대기 검사 방법 대신 Dell, Schwartz, Martin, Saffran과 Gagnon (1997)이 제안한 어휘인출과제를 사용하고자 하였다. 어휘인출과제는 그림자극을 이용해 단어찾기(word finding)를 유도한다는 점에서 기존 대면이름대기 검사들과 방식이 유사하지만, 평가의 초점이 대상자들의 어휘집 총량(vocabulary size) 또는 최종 이름대기 성공률이라기보다 기저 어휘인출 처리과정이라는 점에서 차이를 보인다. 최종적으로 정답을 말하더라도 단어 이름을 주저하면서 말한 경우와 주저함 없이 단번에 말한 경우, 전자보다 후자의 어휘인출능력이 우수하다고 할 수 있다. 더불어 전자에서 주저하는 동안 보여준 정답 이외 반응들은 대상자의 머릿속에서 일어나고 있는 기저 어휘처리과정상 어려움을 간접적으로 보여줄 수 있다(Dell et al., 1997; Ha & Sim, 2011). 이러한 점에 주목하여, 본 연구에서는 어휘인출 시 주저함을 유도할 수 있는 난이도가 높은 자극들로 문항을 구성하고, 정반응 점수 뿐 아니라 반응시간과 오류분석까지 가능한 새로운 어휘인출과제를 개발하고자 하였다.
어휘인출과제는 기존 대면이름검사들과 비교하여 항목, 반응 유도, 분석 방법 등에 있어 다음과 같은 차이를 보인다. 첫째, 경미한 문제를 보이는 대상자도 민감하게 평가할 수 있도록 난이도가 높은 저빈도 단어와 다음절 단어를 항목에 다수 포함한다. 둘째, 대상자로 하여금 그림을 보자마자 떠오르는 단어를 즉각 대답하도록 독려하고 이름을 모르더라도 단서를 제공하지 않는다. 기저의 어휘 인출 처리과정을 평가하는 것이 목적인 만큼, 그림을 보자마자 산출한 최초 반응을 의미 있는 반응으로 기록하고, 스스로 수정하여 정반응한 경우도 수정 전 반응을 분석한다. 셋째, 정반응 점수 및 반응시간 분석과 함께, 오류분석을 실시하여 기저 어휘인출 처리 과정 중 특정 단계에서 특히 어려움을 보이는지 파악한다. 오류분석을 통해 어휘인출과정상 기저 어려움을 감별진단할 수 있다는 것은 여러 선행연구들에서 밝혀진 바 있다(Dell et al., 1997; Ha & Sim, 2011). 많은 연구들이 어휘선택(lexical selection)과 음운부호화(phonological encoding)의 2단계 단어산출모형에 근거하여 어휘인출결함을 설명하고 있는 바(Levelt, Roelofs, & Meyer, 1999), 해당 모델에 기반하여 의미표제어(lemma)와 어휘소(lexeme) 오류를 빈번하게 유도할 수 있는 자극들로 항목을 구성한다.
정리하면, 본 연구에서는 어휘인출능력을 민감하게 평가할 수 있는 새로운 어휘인출과제를 개발하여, 이를 이용해 NPH, PD, 정상 노인 집단 간 어휘인출 정반응 점수, 반응시간, 오류유형을 비교해보고자 한다. 더불어 이름대기 심층검사로서 공신력을 인정받고 있는 한국판 보스톤 이름대기 검사(Korean-Boston naming test, K-BNT; Kim & Na, 1997)를 추가적으로 실시하여 어휘인출과제와 K-BNT의 수행력 또한 비교해보고자 한다. 항목 구성, 반응 유도, 분석 방법 등에 차이가 있는 만큼, 두 검사 간 수행력 비교는 NPH와 PD 환자들의 언어능력 평가와 치료 방향에 대해 시사하는 바가 있을 것이다. 이상과 같은 본 연구의 연구질문들을 정리하면 다음과 같다. 첫째, NPH, PD, 정상군의 세 집단 간 표준화 검사인 K-BNT점수에 유의한 차이가 있는가? 둘째, NPH, PD, 정상군의 세 집단 간 어휘인출과제 정반응 점수에 유의한 차이가 있는가? 셋째, NPH, PD, 정상군의 세 집단 간 어휘인출과제 평균 반응시간에 유의한 차이가 있는가? 넷째, NPH, PD, 정상군의 세 집단 간 어휘인 출과제의 오류유형별 오류빈도에 유의한 차이가 있는가? 다섯째, K-BNT 점수와 어휘인출과제 점수 간 상관관계는 어떠한가?
연구방법
본 연구는 칠곡경북대학교병원 기관생명윤리위원회의 승인을 받아 진행되었다(IRB 승인번호: 2019-01-006-010).
연구대상
NPH 환자 14명, PD 환자 14명, 정상 노인 14명의 총 42명이 본 연구에 참여하였다. 대상자들의 연령은 60세에서 79세 사이에 해당하였으며, 이 중 NPH 대상자 선정기준은 다음과 같다. 첫째, 한국어를 모국어를 사용하고, 둘째, 신경과 및 신경외과 전문의에 의해 뇌 영상에서 뇌실 확장의 소견으로 NPH로 진단받았고, 셋째, 뇌실복강 단락술(ventriculoperitoneal shunt)을 받기 전이며, 넷째, 시각 및 청각적 이상 소견이 보고된 바 없고, 다섯째, NPH 이외 다른 신경학적 및 해부학적 이상 소견이 없어야 한다. PD 대상자 선정기준은 다음과 같다. 첫째, 한국어를 모국어를 사용하고, 둘째, 신경과 전문의에 의해 특발성 파킨슨병(idiopathic Parkinson’s disease) 으로 진단받았고, 셋째, 뇌 영상검사에서 도파민 수치의 부족이 확인되었고, 넷째, 도파민 치료에 양성반응을 보이고, 다섯째, 호엔야르 척도(HoehnYahr Scale) 1-2단계에 해당하며, 여섯째, 시각 및 청각적 이상 소견이 보고된 바 없고, 일곱째, PD 이외 다른 신경학적 및 해부학적 이상 소견이 없어야 한다. NPH 및 PD 대상자 기준에 부합하더라도 치매 또는 기타 뇌질환을 동반하지 않았는지 신경외과 또는 신경과 전문의가 한 번 더 확인하는 과정을 거쳤고, 동반 질환이 의심되는 경우는 연구대상에서 제외하였다. 마지막으로 정상 노인 대상자 선정기준은 다음과 같다. 첫째, 한국어를 모국어를 사용하고, 둘째, 본인의 보고에 의해 감각적, 신경학적, 신체적 결함이 없음을 확인하였고, 셋째, 본인의 보고에 의해 인지, 언어, 구어에 아무런 문제가 없음을 확인하였고, 넷째, K-MMSE-2 실시 결과 연령 및 교육수준 대비 정상 범주에 속하며, 다섯째, 시각 및 청각적 이상 소견이 없어야 한다.
세 집단 간 동질성 검정을 위해 일원분산분석을 실시하였다. 그 결과 K-MMSE-2 점수에는 NPD 집단과 정상 노인 집단 간, PD 집단과 정상 노인 집단 간 차이가 유의하였으나(p<.05), 연령 및 교육 년수에는 집단 간 차이가 유의하지 않았다(p<.05). PK-WAB-R은 NPH와 PD 두 집단만 실시하였는데, 독립표본 t-검정 결과 두 집단 간 실어증 지수에 유의한 차이가 없었다(p>.05). 세 집단의 대상자들에 대한 기본정보는 Table 1과 같다.
실험과제
어휘인출과제 단어목록 선정
본 연구에서는 어휘인출능력을 민감하게 평가하고 오류를 통해 어휘산출단계상 기저 어려움을 파악할 수 있는 새로운 어휘인출과제를 고안하고자 하였다. 단어목록 선정을 위해 유사 선행연구와 검사도구(Categorical Naming Test, CNT; Hwang, Na, & Pyun, 2021; K-BNT; Kim & Na, 1997; 현대 국어 사용 빈도 조사2; National Institute of Korean Language, 2005; 의미지식검사, Hwang & Pyun, 2015)를 검토하여, 심상성(imageability)이 높아 직관적 이미지로 표현 가능하고, 명명일치도(name agreement)가 높아 일관된 동일 반응을 유도할 수 있고, 의미범주 내 다수 단어들이 존재하여 어휘(의미표제어) 선택의 오류 가능성이 높고, 음운구조가 단순하지 않아 음운형태(어휘소) 오류 발생 가능성이 높은 보통 명사 120개를 후보단어들로 선정하였다.
이후 120개의 후보단어 목록에서 다음과 같은 과정을 거쳐 최종 실험단어들을 선정하였다. 첫째, Hwang 등(2021)의 연구를 참고하여 각 단어의 의미범주를 자연물과 인공물로 구분하고, 자연물은 동물, 곤충, 조류, 식물, 과일, 채소로, 인공물은 가정(욕실)용품, 주방용품, 기타 도구, 기타 인공물, 탈 것, 악기로 재분류하였다. 각 의미범주별 두 개 이상 단어들이 배치될 수 있도록 범주 내 다른 단어가 존재하지 않는 경우는 목록에서 제외하였다. 둘째, 해당 단어가 익숙하지 않아 어휘인출에 실패할 가능성을 배제하기 위해 60세 이상 정상 성인 25명을 대상으로 5점 척도(1점: 매우 친숙하지 않다, 5점: 매우 친숙하다)의 단어친숙도 조사를 실시하여, 평균 4점 이하에 해당하는 경우는 목록에서 제외하였다. 셋째, 음운오류 발생 가능성을 높이기 위해 3음절 이상 단어들을 우선적으로 선택하였다. 넷째, 단어빈도의 균형을 맞추기 위해 ‘현대 국어 사용 빈도 조사 2’(National Institute of Korean Language, 2005)에 근거하여 단어빈도 15 이상은 고빈도어로, 15 미만은 저빈도어로 분류한 후(Hong, 2022), 자연물과 인공물 내에서 고빈도 또는 저빈도 단어가 2/3 이상 분포되지 않도록 하였다.
신경학적 질환 환자들을 대상으로 하는 이름대기 검사의 경우 주의집중력 제한 등의 이유로 약 30개의 문항수가 적절하다는 선행연구(Kang, Kim, & Na, 2000)에 근거하여, 본 어휘인출과제도 30개 항목으로 문항을 구성하였다. 최종 선정된 30개 실험단어들의 음절길이는 2음절어 5개, 3음절어 13개, 4음절어 11개, 5음절어 1개였고, 의미범주는 자연물 14개(동물 4개, 곤충 2개, 조류 2개, 식물 2개, 과일 2개, 채소 2개)와 인공물 16개(가정(욕실)용품 2개, 주방용품 3개, 기타 도구 4개, 기타 인공물 3개, 탈 것 2개, 악기 2개)로 구성되었다(Appendix 1).
전산화 어휘인출과제 제작
이미지는 셔터스톡(Shutterstock) 사이트에서 실물 사진을 유로로 다운받아 사용하였다. 대상자의 시선이 분산되지 않도록 목표 단어를 나타내는 이미지 외에는 다른 배경이 없도록 하였고, 배경은 흰색으로 제작하였다. 이후 어휘인출과제를 전산화 시스템으로 제작하였다. 전산화 어휘인출과제 시스템은 검사자 정보입력 모듈, 대상자 정보입력 모듈, 어휘인출과제 실시 모듈, 어휘인출과제 분석 모듈의 네 가지 모듈로 구성되었다. 검사자 정보입력 모듈에서는 검사자 이름, 검사실시 장소 등을 입력하고, 마이크, 이미지, 오디오 상태 등을 테스트할 수 있다. 대상자 정보입력 모듈에서는 대상자 이름, 성별, 생년월일(연령), 교육년수, 직업, 손잡이, 돋보기/보청기 착용여부 등을 기입하고, 어휘인출과제 실시 방법을 시청할 수 있다. 어휘인출과제 실시 모듈에서는 화면에 이미지 자극이 제시되면 이에 대한 대상자 반응이 자동 녹음되어 구글 드라이브에 저장된다. 어휘인출과제 분석 모듈에서는 저장된 오디오 파일을 재생하여 청취할 수 있고, 스펙트로그램상에서 자극 제시부터 대상자의 첫 반응까지의 반응시간을 측정할 수 있다. 이와 같은 전산화 어휘인출과제의 예시를 Figure 1에 제시하였다.
실험절차
모든 실험은 칠곡경북대학교병원 음성발화 샘플링실에서 개별적으로 진행되었다. 본 실험에 앞서 모든 대상자들에게 K-MMSE-2를 실시하였고, NPH와 PD 집단의 경우 PK-WAB-2를 추가로 실시하여 언어장애 유무를 확인하였다. 이후 본 실험과제인 K-BNT와 어휘인출과제를 실시하였다. 어휘인출과제 시작 전 모든 대상자들에게 실험절차를 설명하고 그림의 이름을 가능한 빠르고 정확하게 말하도록 지시하였다. 대상자가 실험절차를 충분히 이해하였다고 판단되면, 전산화 어휘인출과제 시스템을 사용하여 총 30개 항목으로 이루어진 본 실험에 착수하였다.
자료처리
K-BNT 점수는 검사 매뉴얼의 지침대로 채점하였다. 정반응은 1점, 오반응은 0점으로 처리되며, 만점은 60점이다. 주저한 경우, 개념 설명 후 목표단어를 산출한 경우, 오반응 후 목표단어로 수정한 경우 등 15초 내에 최종적으로 목표단어를 산출하면 모두 정반응으로 처리된다. 반면, 어휘인출과제는 대상자의 최초 반응을 점수화 하였다. 아무런 단서가 제공되지 않는 상황에서 그림자극 제시 후 수정 없이 곧바로 목표단어를 산출한 경우만 1점으로 처리되고, 그 이외 반응은 모두 0점으로 처리된다. 만점은 30점이다.
반응시간은 그림자극 제시 순간부터 대상자의 발화 시작 시점까지의 시간을 의미하며, 이는 전산화 어휘인출과제의 분석 모듈에서 측정이 가능하다. 분석 모듈에서 측정된 반응시간을 Praat 음성분석 프로그램에서 한 차례 더 측정함으로써 반응시간 수치에 오차가 없는지 확인하는 과정을 거쳤다. 반응시간 처리와 관련하여, 오류가 많은 경우 제한된 정반응수로 인해 정확한 반응시간 측정이 어려울 뿐 아니라, 갈등요인이 동반된 과제에서는 반응시간이 빠르면 오류가 증가하는 반응시간-오류율의 교환효과가 나타날 수 있다는 연구를 찾아볼 수 있다(Bruyer & Brysbaert, 2011). 이러한 가능성을 통제하기 위해, 본 연구에서는 Bruyer와 Brysbaert (2011)의 지침에 따라 측정된 반응시간을 정확한 반응의 수로 나누어 백분율(%)로 산출한 역효율지수(inverse efficiency score, IES; Bruyer & Brysbaert, 2011)를 반응시간의 지표로 사용하였다.
0점으로 처리된 오반응의 경우 오류유형 분석을 위해 대상자의 최초 반응을 구체적으로 기록하였다. 오류유형은 기본적으로 Dell 등(1997)에 근거하였는데, 본 어휘인출과제에서는 Dell 등의 연구에서 보고된 것 이외에 다른 오류유형들 또한 관찰할 수 있었다. 대상자들의 반응을 분석한 결과, 오류유형은 의미오류(semantic error), 형태오류(formal error), 혼합오류(mixed error), 비관련오류 (unrelated error), 비단어오류(nonword error), 시각오류(visual error), 맞는 개념설명(correct conceptualization), 틀린 개념설명(wrong conceptualization), 무반응(no response)의 아홉 가지로 분류할 수 있었다. 의미오류는 목표어와 의미적으로 비슷한 단어를 선택한 경우(호랑이→‘사자’), 형태오류는 목표어와 음운적으로 비슷한 단어를 선택한 경우(가지→‘가시’), 혼합오류는 목표어와 의미 및 음운적으로 비슷한 단어를 선택한 경우(책꽂이→‘책상’), 비관련 오류는 목표어와 의미 및 음운적으로 관련 없는 단어를 선택한 경우(사슴→‘모자’), 비단어오류는 우리말에서 단어로 존재하지 않는 말소리 조합을 산출한 경우(실로폰→‘시잘푼’), 시각오류는 시지각적으로 유사한 단어를 선택한 경우(복숭아→‘축구공’)이다. 맞는 개념설명과 틀린 개념의 설명은 둘 다 목표단어의 이름을 말하지 못하고 개념을 설명한 경우인데, 전자는 그 설명이 적절한 경우(하모니카→‘입으로 불면 소리 나는 거’)이고, 후자는 그 설명이 적절하지 않은 경우(하모니카→‘머리에 쓰는 거’)이다. 마지막으로 ‘모르겠어요’, ‘음’, ‘다음’ 등과 같이 분석 불가능한 반응을 한 경우는 모두 무반응으로 처리하였다. 이후 오류유형별 비교를 위해 각 오류유형별 오류의 빈도를 세어 기록하였다.
통계분석
자료의 통계처리는 SPSS (Statistics Package for the Social Science, version 25.0 for Window)를 이용하여 분석하였다. 세 집단 간 K-BNT 점수, 어휘인출과제 점수, 어휘인출과제 반응시간에 유의한 차이가 있는지 알아보기 위해 일원배치 분산분석(One-way ANOVA)을 실시하였다. 세 집단 간 어휘인출과제 오류유형별 오류빈도에 유의한 차이가 있는지 알아보기 위해 1피험자 간-1피험자 내 혼합분산분석(Mixed ANOVA)을 실시하였다. K-BNT 점수와 어휘인출과제 점수 간 상관관계를 알아보기 위해 피어슨 적률상관 분석을 실시하였다.
연구결과
세 집단 간 K-BNT 점수 비교
K-BNT 평균 점수는 NPH 집단 32.43점(SD 10.56), PD 집단 35.86점(SD 2.46), 정상 노인 집단 39.64점(SD 4.25)으로, NPH와 PD 집단은 정상 집단보다 평균적으로 낮은 점수를 보였다. 그러나 일원배치 분산분석 결과 세 집단 간 차이는 통계적으로 유의하지 않았다(F(2, 39)=2.548, p>.05).
세 집단 간 어휘인출과제 정반응 점수 비교
어휘인출과제 평균 점수는 NPH 집단 18.79점(SD 5.54), PD 집단 19.29점(SD 4.34), 정상 노인 집단 23.71점(SD 2.27)으로 나타났으며, 일원배치 분산분석 결과 세 집단 간 차이가 통계적으로 유의하였다(F(2, 39)=5.658, p<.01). Scheffé 사후분석 결과 NPH 집단과 정상 노인 집단 간, PD 집단과 정상 노인 집단 간 차이는 유의하였으나(p<.05), NPH와 PD 집단 간 차이는 유의하지 않았다(p>.05) (Figure 2).
세 집단 간 어휘인출과제 반응시간 비교
어휘인출과제 평균 IES는 NPH 집단 2.63% (SD 1.36), PD 집단 1.97% (SD .52), 정상 노인 집단 1.57% (SD .41)로 나타났으며, 일원 배치 분산분석 결과 세 집단 간 차이가 통계적으로 유의하였다(F(2, 39)=5.224, p<.05). Scheffé 사후분석 결과 NPH 집단과 정상 노인 집단 간 차이는 유의하였으나(p<.05), PD 집단과 정상 노인 집단 간, NPH 집단과 PD 집단 간 차이는 유의하지 않았다(p>.05) (Figure 3).
세 집단 간 어휘인출과제 오류유형 비교
‘자료처리’에서 설명하였듯이 어휘인출과제 수행 시 관찰된 오류 유형은 의미오류, 형태오류, 혼합오류, 비관련오류, 비단어오류, 시각오류, 맞는 개념설명, 틀린 개념설명, 무반응의 아홉 가지로 분류할 수 있었다. NPH, PD, 정상 노인 집단이 보인 오류유형 별 평균 오류 빈도와 표준편차는 Table 2와 같다.
세 집단 모두에서 평균적으로 의미오류가 가장 많이 나타났으나, 그 외에는 집단 간 다소 상이한 양상을 보였다. 집단 간 오류유형별 오류 빈도에 대해 혼합분산분석을 실시하였다. Mauchly 구형성 가정을 만족하지 못하여 Greenhouse-Geisser 교정 통계값을 이용하여 결과를 검정하였고, 그 결과 집단 간 주효과(F(2, 39)=5.658, p<.01), 오류유형에 대한 주효과(F(3.515, 137.075)=51.202, p<.001) 및 집단과 오류유형 간 상호작용효과(F(7.029, 137.075)=2.470, p<.05)가 모두 유의하였다. 집단 간 주효과에 대해 Scheffé 사후검정을 실시한 결과 NPH 집단과 정상 노인 집단 간, PD 집단과 정상 노인 집단 간 차이가 유의하였는데(p<.05), 이는 정반응 점수 분석 결과를 통해서도 이미 확인한 바 있다. 오류유형에 대한 주효과를 구체적으로 알아보기 위해 Bonferroni 사후검정을 실시하였고, 그 결과 의미오류는 나머지 모든 오류 유형들보다(p<.001), 혼합오류와 무반응은 형태, 비관련, 비단어, 틀린 개념설명보다, 맞는 개념설명은 형태, 비단어, 틀린 개념설명보다 유의하게 많이 발생함을 알 수 있었다(p<.05) (Figure 4).
집단과 오류유형 간 상호작용효과에 대해 사후분석을 실시하기 위해, COMPARE syntax를 입력하여 각 오류유형에 대해 세 집단 간 차이를 비교하였다. 그 결과 의미오류에서 NPH 집단과 정상 노인 집단 간(p<.01), PD 집단과 정상 노인 집단 간(p<.05), 비단어 오류에서 NPH 집단과 정상 노인 집단 간(p<.05) 유의한 차이가 있었고, 나머지 오류유형에서는 집단 간 차이가 유의하지 않았다(p>.05) (Figure 5). 즉, 환자군인 NPH와 PD 집단은 정상 집단보다 의미오류를 유의하게 많이 보이며, NPH의 경우, 그 빈도가 많지는 않지만, 비단어오류 또한 정상 집단보다 유의하게 많이 보임을 알 수 있다.
K-BNT 점수와 어휘인출과제 점수의 상관관계
42명 전체 대상자들의 K-BNT 점수와 어휘인출과제 점수에 대해 피어슨 상관분석을 실시한 결과, 상관계수 .721의 유의한 정적 상관이 관찰되었다(p<.01).
논의 및 결론
본 연구에서는 NPH, PD, 정상 노인 집단을 대상으로 K-BNT와 어휘인출과제를 실시하여 수행력을 비교하였고, 그 결과는 다음과 같다. 첫째, K-BNT에서는 세 집단 간 점수에 유의한 차이가 없었다. 둘째, 어휘인출과제에서는 NPH와 PD 집단의 점수가 정상 노인 집단보다 유의하게 떨어졌다. 셋째, 어휘인출과제 반응시간의 경우 NPH 집단만 정상 노인 집단보다 유의하게 느렸다. 넷째, 오류유형 분석 결과 정상 노인 집단보다 NPH 집단은 의미오류와 비단어오류를, PD 집단은 의미오류를 유의하게 많이 보였다. 다섯째, 상관관계 분석 결과 K-BNT와 어휘인출과제 점수 간에는 상관계수 .721의 유의한 정적 상관이 있었다.
결과 해석에 앞서 대상자들의 특성을 재확인해보면(Table 1), NPH와 PD 집단의 MMSE-2 점수는 20.14점(SD 5.10)과 21.86점(SD 5.26), P·K-WAB-R의 AQ는 85.15 (SD 6.48)와 87.06 (SD 8.91)으로, 두 집단의 전반적 인지기능과 언어기능은 경미하게 저하되어 있음을 알 수 있다. 그럼에도 불구하고 연구결과 1에서 두 집단의 K-BNT 점수는 정상 노인 집단보다 유의하게 떨어지지 않았다. 세 집단의 K-BNT 평균은 NPH 집단 32.43점(SD 10.56), PD 집단 35.86점(SD 2.46), 정상 노인 집단 39.64점(SD 4.25)으로, 선행연구(Kang et al., 2000)에 근거하여 K-BNT의 절단점(cut-off score)을 33점으로 간주하면 PD와 정상 노인 집단은 대다수의 대상자들이, NPH 집단은 절반 가량의 대상자들이 ‘정상’으로 진단받게 됨을 가늠할 수 있다.
반면, 연구결과 2를 통해 어휘인출과제에서는 NPH 집단 평균 18.79점(SD 5.54), PD 집단 평균 19.29점(SD 4.34), 정상 노인 집단 평균 23.71점(SD 2.27)으로, 두 환자 집단은 평균뿐 아니라 통계적으로도 정상 노인 집단보다 유의하게 떨어짐을 확인하였다(Figure 2). 이처럼 K-BNT와 어휘인출과제 간 상이한 결과가 나타난 이유는, 단어항목, 반응 유도, 분석 방법상의 차이 모두에서 찾을 수 있겠지만, 특히 반응 유도와 분석 방법의 차이에 상당 부분 기인한 것으로 보인다. 15초라는 시간 여유를 주고 스스로 수정할 기회를 허용하여 그 시간 안에 정답이 출현하면 정반응로 채점하는 K-BNT와 달리, 어휘인출과제는 그림을 보자마자 산출한 대상자의 최초 반응을 분석하였다. 예를 들어 ‘카네이션’에 대해 “튤립, 아니 카네이션” 또는 “어버이날에 주는 건데, 아, 카네이션”이라고 응답한 경우, 스스로 수정해 정답을 말했지만 최초 반응인 ‘튤립’과 ‘어버이 날에 주는 건데’가 대상자의 반응으로 고려되어 정반응 점수에 반영되지 않고 오류분석을 하게 된다. NPH와 PD 집단에서 이 같은 반응은 빈번하게 관찰되었는데, 이는 피질하 치매로 분류되는 두 질환의 특성이 반영된 것으로 보인다. 피질하 치매의 경우 많은 연구들에서 인지 자체의 손실보다도 인지 처리결함(processing disorder) 에 주목하였고, 이러한 처리결함이 기억력을 포함한 전반적 인지기능에 이차적으로 영향을 미치는 것으로 보고된 바 있다(Whitehouse, Lerner, & Hedera, 1993). 어휘인출은 기본적으로 개념화부를 거쳐 의미표제어 단계의 어휘선택과 어휘소 단계의 음운 부호화를 거치게 되는데(Levelt et al., 1999), 이 과정에서 이전 단계와 이후 단계 간 활발한 상호작용에 기반한 매우 복잡한 처리활동들이 일어난다(Dell et al., 1997; Kim & Ha, 2018). 이에 근거할 때, 처리결함을 주 특성으로 하는 NPH와 PD 환자들이 어휘인출과제 시 목표단어를 즉각 인출하지 못하고 개념을 설명하는 모습을 보이거나 어휘 선택의 오류 또는 잘못된 음운부호화 등의 모습을 보인것은 이들의 처리과정상 어려움이 겉으로 표출된 것으로 사료된다. 따라서 목표어휘를 찾아가는 과정 중 나타난 이러한 반응들이 정반응 점수에 반영되지 않았고, 이 때문에 결과적으로 NPH와 PD 집단의 점수가 정상 집단보다 유의하게 떨어졌다는 본 연구결과는 어휘인출과제가 두 집단의 어휘인출 수행력과 그 특성을 평가하는 과제로서 민감성과 타당성을 충분히 확보하고 있음을 시사한다. 즉, K-BNT에서는 드러나지 않았던 집단 간 차이가 어휘인출과제에서 관찰되었다는 연구결과를 통해, NPH와 PD의 경우 정적 지식보다 역동적 처리과정에 중점을 둔 평가를 이용해 기저의 취약점을 파악하는 것이 더욱 타당함을 알 수 있다.
뿐만 아니라 연구결과 3에서 NPH 집단은, PD 집단과 달리, 어휘인출과제 수행 시 반응시간에서도 정상 집단과 차이가 있었다. 이 같은 결과는 전두엽의 다양한 신경시스템이 과제수행의 반응시간을 통제한다는 선행연구(Stuss et al., 2005)에 기반해 그 의미를 해석할 수 있다. Stuss 등(2005)은 전두엽, 특히 브로드만 영역 24, 32를 포함한 상내측(superior medial, SM) 병변 환자에서 선택과제의 느린 반응시간(choice reaction time)이 관찰되었음을 보고하며, 여러 선택지 중 단 하나를 택해야 하는 선택과제의 경우 성공적 수행을 위해서는 억제와 주의집중력이 요구되는데, 해당 연구를 통해 이 기능들이 SM 신경시스템에서 통제됨을 밝혔다고 강조하였다. 심성어휘집으로부터 활성화된 여러 어휘들 중 가장 적절한 목표단어 하나를 최종 선택하는 어휘인출과정은 억제와 주의집중력을 발휘해 여러 선택지 중 단 하나를 택하는 선택과제와 본질적으로 다르지 않다. 전두엽의 SM 영역이 뇌측실(lateral ventricles)과 매우 인접해있음을 감안할 때, 본 연구에서 NPH의 경우 뇌측실의 비대로 인해 SM 영역을 포함한 주변 신경시스템이 압박을 받았고, 그로 인해 이 집단에서만 유의미하게 느린 반응시간이 나타났을 가능성에 대해 생각해볼 수 있다. NPH 환자의 주의결함을 보고한 여러 연구들(Cho et al., 2024; Chung, 2018; Xiao et al., 2022) 또한 이 가능성에 대해 신뢰할 수 있는 근거를 제공해주며, 따라서 연구자들은 반응시간이 NPH를 정상 노인 집단으로부터 감별해내는 중요 지표임을 제안하는 바이다.
또한 본 연구에서는 오류분석을 통해서도 의미 있는 결과를 도출하였다. 집단에 상관없이 모든 대상자들이 가장 많이 보인 오류는 의미오류였는데, 이는 장애 여부 또는 장애 유형에 상관 없이 발화 시 나타나는 오류는 의미오류가 가장 빈번하다는 선행연구들(Dell et al., 1997; Ha & Sim, 2011; Kim & Ha, 2018)과 동일한 결과이다. 어휘의 의미표상은 단일 개념이 아닌 다수의 개념들로 구성되어 있고 각각의 개념들은 복잡한 네트워크로 연결되어 있어 정상 화자들도 유사한 의미를 가진 다른 단어를 선택하는 실수를 간혹 보이곤 한다(Dell et al., 1997). 뇌손상 환자 또는 언어장애인에서는 이러한 의미오류가 양적으로 더욱 많아지는데(Ha & Sim, 2011; Kim & Ha, 2018), 본 연구에서도 이 같은 양상을 확인할 수 있었다. 더 나아가 NPH와 PD 집단이 정상 노인 집단보다 의미오류를 유의하게 많이 보인다는 연구결과를 통해(Figure 5), 의미오류의 양적 변화가 집단 변별의 기능을 할 수 있음을 확인하였다. 다시 말해 정상인의 경우도 다른 유형의 오류들보다 의미오류를 빈번하게 보이지만, 그 수가 유의하게 많다면 인지저하의 가능성을 생각해볼 수 있다.
그러나 그보다 더 흥미로운 결과는 NPH 집단의 경우, 그 빈도가 많지는 않지만, 비단어오류 또한 정상 집단보다 유의하게 많이 보였다는 것이다(Figure 5). PD 집단에서는 이러한 결과가 나타나지 않았던 만큼, 본 연구자들은 NPH의 변별적 특징으로 비단어오류에 주목하고자 한다. 비단어오류는 어휘후 단계(sublexical stage), 즉 어휘소 단계의 음운부호화 과정에서 발생하는 오류이며, 이는 대상자의 음운처리결함을 반영한다(Ha & Sim, 2011). 음운처리에 대한 뇌 연구들을 살펴보면, 하전두피질(inferior frontal cortex)이 음운 처리를 담당한다는 연구(Burton, 2001), 등쪽경로(dorsal stream) 내전운동피질(premotor cortex), 중심앞이랑(precentral gyrus) 등의 병변이 어휘의 음운정보 인출결함을 초래한다는 연구(Schwartz, 2014; Schwartz, Faseyitan, Kim, & Coslett, 2012)와 같이, 많은 연구들이 음운처리결함을 전두엽 내 특정 영역의 손상과 관련지어 설명하고 있다. 이러한 연구들에 근거하여, 본 연구의 NPH 환자의 경우 비대해진 뇌측실이 인접한 전두엽의 여러 영역들을 압박하였고, 그 결과 전두엽의 기능저하가 음운처리결함을 초래하여 비단어오류가 유의하게 많이 발생하였다는 해석이 가능하다. 따라서 연구자들은 반응시간과 더불어 비단어오류의 빈도 또한 NPH 집단을 정상 노인 집단으로부터 변별해낼 수 있는 유의미한 지표임을 제안한다.
그러나, 이처럼 두 집단을 변별해주는 유의미한 지표임에도 불구하고, NPH의 경우도 비단어오류의 빈도가 그리 많지 않았다는 것에 대해 다소 의문의 여지가 있다. 이에 대해서는 발화 시 동반되는 화자의 모니터링 기제와 관련하여 설명이 가능할 듯한데, 해당 가설에 의하면 화자는 본인이 산출할 발화에 대해 내적으로 모니터링 하는 능력을 갖고 있으며 이때 오류가 감지되면 이를 수정하여 최종적으로는 올바른 발화를 산출하게 된다는 것이다(Nooteboom, 2010). 이 과정에서 비단어오류는 화자의 머릿속에 저장되어 있지 않은 정보이기 때문에 쉽게 감지되는 반면, 머릿속에 저장된 또 다른 단어형태인 의미오류는 잘 감지되지 않는다(Nooteboom, 2010). 때문에 비단어오류는 내적 모니터링 과정에서 대부분 수정되어 환자 집단에서도 그 빈도가 높지 않은 반면, 의미오류는 그렇지 않기 때문에 정상 집단에서도 많이 발생하는 것으로 보인다. 이러한 내적 모니터링은 전두엽 백질경로(frontal white matter tracts)에서 담당한다고 보고된 바 있는데(Mandal et al., 2020), 이에 근거할 때 비단어오류의 높은 내적 수정가능성(Nooteboom, 2010)에도 불구하고 NPH 집단에서 그 빈도가 유의미하게 많았다는 본 연구의 결과는 뇌측실의 비대와 그것이 내적 모니터링을 포함한 전두엽의 다양한 기능에 미치는 영향에 대해 다시 한 번 생각해보게 한다.
본 연구에는 집단별 충분하지 않은 대상자 수 등 연구방법상 제한점이 분명 존재한다. 그럼에도 불구하고 NPH와 PD의 어휘인출능력을 다각적으로 분석하여 의미 있는 결과를 도출하였다는 점에서 그 의의가 있을 것이며, 이에 연구자들은 본 연구를 통해 얻은 결과들을 종합하여 다음과 같은 제안을 하고자 한다. 첫째, 경미한 손상을 보이는 NPH 또는 PD 환자의 언어-인지결함을 민감하게 평가하기 위해서는 대상자들의 역동적 처리능력을 평가할 수 있는 진단방법을 사용하는 것이 적절하다. 둘째, NPH와 PD 집단의 감별 진단을 위해서는 반응시간 및 특정 오류의 빈도를 고려할 것을 제안한다. 이때 NPH 환자는 반응시간이 느리고 비단어와 같이 음운 처리결함을 반영하는 오류를 유의하게 많이 보일 수 있음을 명심한다. 셋째, 어휘인출과 관련한 NPH 집단의 많은 어려움은 뇌측실의 비대, 그로 인한 전두엽 기능의 저하와 관련이 있는 만큼, 중재 방향을 설정할 때에도 이를 감안하도록 한다. 마지막으로 본 연구에서 개발한 어휘인출과제를 활용할 경우, NPH와 PD의 선별은 정반응 점수로, NPH와 PD의 감별진단은 반응시간과 오류분석을 종합하여 판단할 것을 제안한다. 본 연구에서는 연구결과 5를 통해 어휘인출과제가 표준화 검사인 K-BNT와 높은 정적 상관관계가 있음을 확인하였다. 앞에서 설명한 어휘인출과제의 변별적인 강점과 더불어 공인타당도 또한 어느 정도 확보한 것으로 보이며, 따라서 다양한 환자군을 대상으로 어휘인출과제가 유용하게 사용되기를 기대한다.