스펙트로그램을 이용한 내전형 연축성 발성 장애와 근긴장성 발성 장애의 감별
Differentiation of Adductor-Type Spasmodic Dysphonia from Muscle Tension Dysphonia Using Spectrogram
Article information
Trans Abstract
Background and Objectives
Adductor type spasmodic dysphonia (ADSD) is neurogenic disorder and focal laryngeal dystonia, while muscle tension dysphonia (MTD) is caused by functional voice disorder. Both ADSD and MTD may be associated with excessive supraglottic contraction and compensation, resulting in a strained voice quality with spastic voice breaks. The aim of this study was to determine the utility of spectrogram analysis in the differentiation of ADSD from MTD.
Materials and Methods
From 2015 through 2017, 17 patients of ADSD and 20 of MTD, underwent acoustic recording and phonatory function studies, were enrolled. Jitter (frequency perturbation), Shimmer (amplitude perturbation) were obtained using MDVP (Multi-dimensional Voice Program) and GRBAS scale was used for perceptual evaluation. The two speech therapist evaluated a wide band (11,250 Hz) spectrogram by blind test using 4 scales (0-3 point) for four spectral findings, abrupt voice breaks, irregular wide spaced vertical striations, well defined formants and high frequency spectral noise.
Results
Jitter, Shimmer and GRBAS were not found different between two groups with no significant correlation (p>0.05). Abrupt voice breaks and irregular wide spaced vertical striations of ADSD were significantly higher than those of MTD with strong correlation (p<0.01). High frequency spectral noise of MTD were higher than those of ADSD with strong correlation (p<0.01). Well defined formants were not found different between two groups.
Conclusion
The wide band spectrograms provided visual perceptual information can differentiate ADSD from MTD. Spectrogram analysis is a useful diagnostic tool for differentiating ADSD from MTD where perceptual analysis and clinical evaluation alone are insufficient.
서 론
내전형 연축성 발성장애(Adductor type spasmodic dysphonia, ADSD)는 발성과 호흡근육을 지배하는 신경학적 체계의 이상으로 인해 발생하는 신경성 발성장애로 분류된다[1]. 후두에 국한적으로 발생한 근긴장 이상증으로 그 원인은 명확히 잘 알려져 있지 않으나[1,2] 보툴리늄 독소 주입술에 좋은 치료 효과를 보이고 음성 치료도 병행 할 수 있다[3]. 근긴장성 발성장애(muscle tension dysphonia, MTD)는 후두에 뚜렷한 구조적 혹은 신경학적 이상이 없이 후두 근육의 과도한 긴장에 의해 발생하는 기능성 음성 장애로 분류된다[5]. 주로 음성의 오용과 남용으로 인하여 발생하며[4] 해부학적이나 신경학적인 후두 구조는 정상이지만 지나친 근긴장으로 병리적인 음성이 나타나고[4,5], 치료는 후두 마사지와 음성 치료가 근간이 된다[4].
두 질환은 쥐어짜거나 목이 조이는 듯한 노력성 음성(strangled, strained voice)과 함께 음성 단절(voice break) 등의 특징적인 음성학적 유사 증상을 보임에도 불구하고 치료 방법이 서로 상이하기 때문에 감별진단이 정확하고 분명하게 이루어져야 한다[5]. 이를 위하여 후두 굴곡 내시경, 발성 끊김 분석, 스펙트로그램 및 발화과제에 따른 음향적 분석, 청지각적 평가들이 두 질환을 감별하고 그 특성을 연구하는데 이용되고 있다[6,7]. 하지만, 아직까지 명확한 객관적 진단법이 없이 주로 발화과제시의 음성끊김 여부와 청지각적인 특성에 의존하여 그 감별진단이 이루어지고 있는 현실이다[5].
두 질환의 특성을 살펴보는 방법 중 스펙트로그램 분석이 있으며 청지각적 평가나 임상적 평가에서 두 질환을 변별하기에 충분치 않은 경우에 중요한 정보를 제공해준다[8]. 몇몇 연구에서 스펙트로그램에서 두 질환간의 특징적인 차이가 보고되었으며[9], 그 특성으로 갑작스런 음성의 끊김(abrupt voice breaks), 불규칙하고 넓은 수직적 간격(irregular wide spaced vertical striations), 선명한 포먼트(well defined formants), 고주파수 대역의 스펙트럼 잡음(high frequency spectral noise)에서 나타났다고 보고하였다[8,10]. 이에 저자들은 ADSD와 MTD를 진단할 때 스펙트로그램 분석이 시각적이고 세부적인 정보를 제공하여 보다 정확하고 세부적인 정보를 제공해줄 수 있는지 알아보고자 ADSD와 MTD로 진단 받은 환자들을 대상으로 그 특성을 살펴 보았다.
대상 및 방법
2015년 1월부터 2017년 6월까지 본원 이비인후과를 내원하여 전반적인 음성평가를 통해 이비인후과 전문의와 음성언어 치료사에 의해 ADSD와 MTD로 진단받은 총 37명을 대상으로 하였다. ADSD는 청지각적 특징으로 음성일탈과 쥐어짜는 음질, 일시적으로 정상적인 음성을 보이거나 비구어적인 발성 또는 고음에서 개선된 음질을 보이는 경우에 진단하였다[11]. MTD는 비구어 발성 또는 높은 음도로 발성 할 때 음질의 개선이 없으며 짧은 기간의 음성치료로 음질의 개선을 보이고 과도한 후두긴장을 동반한 경우로 진단하였다. 대상자중 ADSD군은 17명이며 평균 나이는 45.5세로 모두 여자였으며, MTD군은 20명으로 여자는 8명, 남자는 12명으로 평균나이는 54.6세였다(Table 1).
두 환자군에서 청지각적 평가는 GRBAS scale을 이용하여 2인의 언어 치료사가 0점에서 3점까지 4점 척도(0 : clear, 1 : mild, 2 : moderate, 3 : severe)로 평가하였고, 점수가 높을수록 음성장애의 문제가 심한 정도를 의미한다. 음향학적 평가는 Computerized Speech Lab(Model 4500 ; Kaypentax, USA)의 MDVP(Multi-dimensional Voice Program)을 이용하여 실시하였으며 Jitter, Shimmer 값을 평가 하였다. 대상자의 입과 마이크의 거리를 약 10 cm로 조정하고 최대한 안정된 자세에서 /a/ 모음을 5초동안 연장 발성하여 안정된 구간 1.5 초를 잘라 분석하였다.
스펙트로그램 자료 수집은 Computerized Speech Lab을 이용하였고 환자들에게 /a/ 모음을 발성하게 하여 광역대 스펙트로그램(11,250 Hz)으로 분석하였으며 2명의 언어치료사가 blind test로 평가하였다. 스펙트로그램 평가는 4점 척도(0~3점)로 갑작스런 음성 끊김, 불규칙하고 넓은 수직간격, 고주파수 대역의 스펙트럼 잡음 정도는 ‘0점 : clear, 1점 : mild, 2점 : moderate, 3점 : severe’로, 선명한 포먼트는 ‘0점 : absent, 1점 : mild, 2점 : well-defined, 3점 : excessive’로 평가하였다. 평가자에게는 4가지 항목에 대한 정의와 기준에 대한 교육을 실시하였고 예시를 제공하여 실험 전 충분한 예비평가를 진행하였다.
갑작스런 음성 끊김은 문장발화시 유성음에서 발성의 끊김을 의미한다. 불규칙하고 넓은 수직적 간격에 대해 수직적 간격은 glottal pulsing을 의미하고 불규칙적인 간격은 쥐어짜는 음성을 의미한다[10]. 선명한 포먼트는 음향학적 에너지가 집중된 영역을 의미한다. 고주파수의 대역의 스펙트럼 잡음 정도는 쉰 소리로 인하여 고주파수 대역에서 잡음이 형성된 것을 의미한다[10]. 이러한 정의를 기준으로 4가지 항목에 대해 스펙트로그램을 통해 평가를 실시 하였다(Figs, 1, 2). 수집된 자료는 통계분석 프로그램 Statistical package for the social sciences(SPSS, version12.0, Chicago, IL)로 분석하였다. 각 항목에 대하여 두 집단 간의 차이는 독립 표본 t-검증(independent sample t-test)을 실시하였고 통계 검정상 p-value <0.05를 유의한 것으로 간주하였다. 평가자간-내 신뢰도를 측정하기 위해 피어슨 상관계수(pearson r correlation)로 분석하였다.
결 과
1. 평가자 간 신뢰도
평가자 간 신뢰도는 r=0.742~0.837(p<0.001)로 상관이 높은 것으로 나타났다. 평가자 내 신뢰도는 평가자가 두 질환을 각각 평가하였기에 상관도를 분석하지 않았다.
2. 청지각적 및 음향학적 평가 분석
ADSD군에서 평가한 GRBAS scale의 평균은 1.94±0.392점이며 MTD 군에서의 평균은 2.05±0.34점이었다. 두 집단의 GRBAS scale은 통계적으로 유의한 차이를 보이지 않았다(P=0.378)(Table 2). ADSD 군에서 평가한 Jitter, Shimmer 값의 평균은 각각 2.09±1.40점, 6.6±3.39점이며 MTD 군에서의 평가한 Jitter, Shimmer 값의 평균은 각각 6.6±3.39점, 5.88±3.28점으로 두 집단간 유의한 통계적 차이는 없었다(P=0.625, p=0.516)(Table 2).
3. 스펙트로그램 특성 비교 분석
‘갑작스런 음성 끊김’과 ‘불규칙하게 넓은 수직적 간격’ 그리고 ‘고주파수의 대역의 스펙트럼 잡음’에 대해 두 집단 간 유의한 차이를 보였다(p<0.001). 하지만 ‘선명한 포먼트’에서는 유의한 차이가 없었다(p>0.05). ‘갑작스런 음성 끊김’에 대한 ADSD군의 평균점수는 1.824±0.999점 이었으며 MTD군은 0.600±0.709점으로 ADSD군에서 통계적으로 유의하게 높은 결과를 보였다(p<0.001). ‘불규칙하게 넓은 수직적 간격’에 대한 점수도 ADSD군의 평균점수는 2.588±0.609점, MTD군은 1.725±0.847점으로 ADSD군에서 유의하게 높은 결과를 보였다(p<0.001). 하지만, ‘선명한 포먼트’에 대해서는 ADSD군의 평균점수는 2.235±0.699점, MTD군은 2.125±0.791점으로 두 집단 간 통계적으로 유의한 차이를 보이지 않았다(p=0.926). 또한, ‘고주파수의 대역의 잡음 정도’ 항목에서는 평균점수가 ADSD군 1.206±0.687점, MTD군 1.85±0.864점으로 MTD군에서 통계적으로 유의하게 더 높은 결과를 보였다(p<0.001)(Table 3).
고 찰
1871년 Traube [12]에 의해 처음 기술된 연축성 발성 장애는 신경성 음성장애에 속하며 원인은 아직 확실히 밝혀져 있지 않으나 특발성인 것이 대부분으로 윌슨씨병, 헌팅턴씨병, 파키슨씨병 또는 외상이나 염증에 의하여 발병된다는 보고도 있다[1,2]. 연축성 발성 장애는 세 종류로 나뉘어지는데 성대의 불수의적인 과내전에 의해 수시로 음성이 끊어 지고 목을 조이는 듯한 거친 목소리가 나타나는 내전형과 성대의 불수의적인 과외전에 의해 간헐적으로 바람이 새는 듯한 목소리를 나타내는 외전형 그리고 혼합형으로 구분 된다[5]. 대부분의 환자가 내전형에 속하며 내전형 연축성 발성 장애는 발성 시에 성대가 너무 강하게 내전되어서 원활한 발성이 잘 안되고 음성의 크기를 조절하는데 어려움을 느끼며 음성단절과 노력성 음성(strained voice), pitch의 편향, 애성(hoarseness) 등의 특징적인 음성을 보인다[1,2].
근긴장성 발성 장애는 구조적, 신경학적 병변이 없이 발생하는 발성 장애로 후두내근과 후두 외근에 과도한 긴장이 주어지는 것을 의미하고 이러한 근긴장은 인두 수축근이나 심경부의 다른 근육에도 작용하게 된다[4]. 이로 인해 쉰 목소리, 노력성 발성 고음의 가성 발성, 음이탈 등의 증상이 나타날 수 있다[5]. 원인으로는 심인성, 과도한 발성 패턴 후두의 감각 과민등이 있으나 정확한 원인은 아직 불분명 하다[4].
근긴장성 발성장애에서는 후두 마사지, 음성 치료가[6] 내전형 연축성 발성장애에서는 보툴리늄 독소 주입술이 치료의 근간이 되고 음성 치료의 효과는 떨어진다는 점에서 두 질환간의 차이를 보인다[3,5]. 두 질환의 치료 방법이 서로 다르기 때문에 정확한 감별 진단이 중요한데, 최근 스펙트로그램 분석이 청지각적 평가와 상관성이 높을 뿐만 아니라 음성장애의 높은 감별진단 정확도를 가진다는 연구들이 보고되고 있다[8,10].
스펙트로그램은 주파수와 진폭의 시간에 따른 변화를 보여주는 삼차원적인 그림으로 협대역 스펙트로그램은 일반적으로 45 Hz 이하의 좁은 주파수 대역폭을 이용하며 광대역 스펙트로그램은 300 Hz 이상의 넓은 주파수 대역폭을 이용한다. 광대역 스펙트로그램은 협대역 스펙트로그램처럼 음향 신호가 가진 주파수 관련 정보를 자세하게 알 수 없지만 포먼트(formant)라 불리는 공명주파수의 에너지 영역뿐 아니라 음성의 주기성을 관찰할 수 있다[8]. 스펙트로그램 분석을 통하여 ADSD와 MTD의 특성을 ‘갑작스런 음성의 끊김’, ‘불규칙하고 넓은 수직적 간격’, ‘선명한 포먼트’, ‘고주파수 대역의 스펙트럼 잡음’ 정도를 기준으로 구분할 수 있다[8,9].
본 연구에서 두 집단의 청지각적 평가는 Hirano [13]가 도입한 GRBAS scale 을 이용하였으며 음향학적 평가로 Jitter와 Shimmer를 측정하였다. 성대 진동 시 주기와 주기 사이의 기간이나 주기와 주기 사이의 강도의 변이성을 가질 수 있는 데 시간 측면에서 주기간 길이의 변동을 Jitter, 연속적인 성대 진동시 주기간 강도의 변동을 Shimmer이라고 하며[14] 성대 진동이 얼마나 비주기적인지 정도를 객관적으로 측정할 수 있다[15].
Zwirner와 Buchman [7]에 의하면 연축성 발성장애 환자군과 근긴장성 발성 장애 환자군에서 정상인 군보다 Jitter와 Shimmer가 높게 측정되는 것으로 알려져 있다[6]. 이번 연구에서 연축성 발성 장애 환자군에서 Jitter는 평균 2.09, Shimmer는 6.6이였으며 근긴장성 환자군에서 Jitter는 평균 1.84, Shimmer는 5.88을 보였다. 하지만 두 집단에서 GRBAS, Jitter, Shimmer 값의 차이는 모두 통계적으로 유의하지 않았다.
스펙트로그램 분석에서 두 집단 모두 ‘갑작스런 음성 끊김’을 관찰할 수 있었고 ADSD군이 MTD군에 비해 높은 결과를 보였으며 통계적으로도 유의한 차이가 있었다. 따라서 두 질환을 구분할 때 주요한 기준이 되는 특징이 음성 끊김(phonatory breaks)이며, 이를 스펙트로그램 상에서도 시각적으로 확인 할 수 있었다. Roy 등[10]의 연구에서는 ADSD보다는 적지만 MTD에서도 문장 산출 동안 음성 끊김을 보였다고 하였다. 본 연구에서도 MTD군에서도 음성 끊김이 관찰되었으며, 그 정도는 ADSD군에 비해 낮은 결과를 보였다. 또한 일부 연구에서는 두 질환을 진단할 때 다양한 발화과제상황에서 살펴보기도 하는데, ADSD는 ‘과제의존도(task-specific)’가 높아 모음연장발성에서는 음성 끊김이 관찰되지 않을 수 있지만 문장산출 동안에 끊김을 보인다고 하였고, 유성음과 무성음에 따른 변화가 큰 반면, MTD는 과제에 따른 특성 차이가 거의 없다고 하였다[8]. 따라서 두 질환을 구분할 때 다양한 발화과제를 통한 스펙트로그램 분석도 요구된다.
‘불규칙하고 넓은 수직적 간격’은 ADSD군이 MTD군에 비해 더 높은 결과를 보였고, 통계적으로도 유의한 차이를 보였다. 스펙트로그램에서 규칙적인 수직적 간격은 음성신호의 주기적인 파형유형(quasiperiodic wave type)을 의미한다[8]. ‘불규칙하고 넓은 수직적 간격’은 glottal pulsing으로 인한 수직적 간격과 쥐어짜는 음성으로 인한 불규칙한 간격을 의미한다. 내전근 경련(adductor spasm)으로 인한 쥐어짜고 조이는 발성(strained strangled voice)과 관련 지을 수 있는 부분으로 MTD군에 비해 ADSD군에서 더 저명하게 관찰 되었다. 따라서 청지각적으로 힘을 주고 조이는 발성양상이 스펙트로그램에서는 수직적 간격이 넓고 비주기적인 형태로 관찰된다는 것을 알 수 있었다.
‘포먼트 형성 정도’를 분석한 결과, 두 집단 간 통계적으로 유의한 차이는 없었으며, ADSD군과 MTD군이 비슷한 결과를 보였다. 포먼트(formant)는 공명 강(resonant cavities)의 크기나 형태의 변화에 의해 에너지의 주파수가 형성되는 영역으로 정상 음성은 스펙토그램에서 음향학적 에너지가 집중된 영역이 선명하고 뚜렷하게 나타난다. 하지만 불완전한 성대 내전 시 쉰 음성(breathy voice)과 함께 공명 에너지 형성이 어려워지게 된다. Rees 등[8]의 연구에서는 ADSD에서 포먼트(formant)형성이 잘 이루어졌으며, MTD에서는 관찰 되지 않았다고 하였으나 본 연구에서는 MTD군에서도 비교적 포먼트(formant)형성이 잘 이루어진 것이 관찰되었다. 이러한 차이는 대상자 선정에 따른 차이인 것으로 보이는데, 본 연구에서는 다른 질환이 동반되지 않은 MTD만을 대상으로 하였고, 반면 Rees 등[8]의 연구에서는 성대마비와 같은 불완전한 성대내전으로 인한 MTD였기 때문에 포먼트(formant)형성에 어려움을 보인 것으로 보인다.
마지막으로 스펙트로그램을 통해 살펴본 항목 중 ‘고주파수 대역에서의 잡음’은 ADSD군에 비해 MTD군에서 통계적으로 유의하게 높은 점수를 보였다. 고주파수 대역에서의 잡음은 과도한 후두 내외근육의 긴장으로 인한 공명의 붕괴와 성대 진동의 감소 그리고 불완전한 성대내전으로 인한 쉰목소리에 의해 발생 할 수 있다. Rees 등[8]의 연구에서 MTD군은 과도한 고주파수 대역에서 잡음이 관찰되었고 반면 ADSD군에서는 일부에서만 관찰되었으나 통계적으로 유의한 차이는 보이지 않았다. 본 연구에서는 그 차이가 통계적으로 유의하게 관찰되었으며 이는 불완전한 성대내전으로 인한 MTD군이 배제되었기 때문으로 보인다. 이를 통해 과도한 후두 내외근육의 긴장으로 인한 공명의 붕괴와 성대 진동의 감소가 고주파수 대역에서의 잡음에 더 큰 영향을 주는 것으로 생각할 수 있다.
결 론
위와 같은 스펙트로그램 분석을 통해 ADSD는 음성 단절과 불규칙하고 넓은 수직적 간격(vertical striation)이 관찰되고 MTD는 음성 단절과 고주파수 대역에서의 잡음이 발생하는 특징이 관찰되었다. 이러한 스펙트로그램 분석은 청지각적 평가나 임상적 평가에서 두 질환을 변별하기 충분하지 않은 경우 감별 진단 검사로 적합하며 유용성을 확인하였다. 향후 좀더 많은 대상자를 확보 하고 연령이나 성별 차이 등을 고려하여 음성 효율 및 관련 특성간의 상관관계에 대한 연구가 필요할 것으로 사료 된다.