| Home | E-Submission | Sitemap | Editorial Office |  
top_img
J Korean Soc Laryngol Phoniatr Logop > Volume 28(2); 2017 > Article
com일측성 성대마비 환자 평가에서 Cepstral Peak Prominence의 유용성

Abstract

Background and Objectives

The purpose of this study was to compare the usefulness of Cepstral peak prominence (CPP) with parameter of Multiple Dimensional Voice Program (MDVP) in evaluating unilateral vocal fold paraylsis patients with subjective voice impairment.

Materials and Methods

From July 2014 to August 2016, 37 patients with unilateral vocal fold paralysis who had been diagnosed with unilateral vocal fold paralysis and had received two or more voice tests before and after the diagnosis were evaluated for maximum phonation time (MPT), MDVP and CPP. Respectively. Voice tests were performed with short vowel /a/ and paragraph reading.

Results

The CPP-a (CPP with vowel /a/) and CPP-s (CPP with paragraph reading) of the Cepstrum were statistically negatively correlated with G, R, B, and A before the voice therapy. Jitter, Shimmer, and NHR of MDVP were positively correlated with G, R, B. Jitter, Shimmer, and NHR of the MDVP were significantly correlated with the Cepstrum index. G, B, A and CPP-a and CPP-s showed a statistically significant negative correlation and a somewhat higher correlation coefficient between 0.5 and 0.78. On the other hand, in MDVP index, there was a positive correlation with G and B only with Jitter of 0.4.

Conclusion

CPP can be an important evaluation tool in the evaluation of speech in the unilateral vocal cord paralysis when speech energy changes or the cycle is not constant during speech.

서 론

목소리에 대한 관심이 높아지면서 목소리 이상으로 이비인후과 진료를 받는 환자 수도 늘어나고 있다. 개인만의 고유한 특징인 목소리를 객관적으로 측정하여 기술하고 비교 분석할 수 있는 검사 장비와 지표가 다양하게 개발되고 있다. 그러나 시간과 장소, 개인의 상황 등 다양한 원인에 따라 예민하게 변하는 목소리를 측정하고 평가하는 것은 상당히 쉽지 않다. 현재 임상에서 가장 많이 사용되고 있는 음성 분석 방법인 Multi-Dimensional Voice Program(MDVP)에서는 주파수 변동과 관련된 연관성을 보는 지터(jitter), 진폭 변동과 관련된 쉬머(shimmer), 소음과 조화음의 연관성을 보는 잡음 대 배음비(noise to harmonic ratio, NHR) 등의 지표로 목소리를 측정하고 비교 평가한다. MDVP는 비교적 빠르고 정확한 음성 측정 방법으로 평가받고 있지만, 평가 방법의 특성상 음성 샘플의 일부분만 발췌하여 각 지표들의 변화(pertubation) 정도를 측정한다.
목소리 이상으로 내원하는 환자들 중에는 발화의 시작보다 발화 중반부에서 유지가 힘들다고 호소하는 분들도 많은데, 이런 경우 MDVP 만으로는 정확한 음성의 변화를 평가하는데 다소 한계가 있다[1,2].
Cepstrum은 검사를 위해 녹음한 음성 샘플 전반의 에너지 변화 정도를 측정하는데 유용하다. 그리고 검사를 위해 환자가 읽은 문단 전체를 분석하기 때문에 앞서 언급한 발화 중반부 이상의 음성 변화를 측정하기에 도움이 된다. Cepstrum의 여러 가지 지표 중 구하기 쉽고 비교가 용이한 Cepstral peak prominence를 기존에 자주 사용되는 MDVP 지표와의 비교를 통해 발화 유지 이상을 호소하는 환자 평가시 그 임상적 유용성을 알아보고자 한다.

대상 및 방법

1. 대 상

본원에서 2014년 7월부터 2016년 8월까지 일측성 성대마비로 진단받고 1번 이상의 음성 치료를 받은 108명 환자 중 음성 치료 전후 음성 검사 결과가 확인 가능한 환자 37명을 대상으로 연구를 진행하였으며 남자가 19명, 여자가 18명으로 평균연령은 60.4세였다. 이 연구는 환자 개인의 치료 전후 음성 증상에 대한 비교로 성대 마비로 인한 성대 주입술을 받은 환자도 포함되었다.
환자의 일측성 성대마비의 원인으로는 신체 타 장기의 원발암으로 인한 전이성 임파선이 되돌이 후두신경을 침범하거나 압박해서 성대 마비가 발생한 경우가 10례로 가장 많았으며, 폐암과 갑상선암의 직접적인 신경 침범이 각각 7례였고, 그 외 원인들로는 식도암, 뇌신경 병변 순이었다(Table 1).
전체 37명의 환자 중, 음성 치료 후 증상 호전은 26명, 악화는 5명, 호전 후 악화는 3명, 변화 없음 등을 포함한 기타가 3명이었다. 연구 참여 환자 중 성대 주입술을 시행받은 환자는 12명이었으며, 시술 전 후 모두 증상의 호전을 보였다가 3명이 점차 다시 악화되는 양상을 보였다. 연구 대상 환자 중 후두 내시경상 성대 마비의 완전 회복을 보인 환자는 없었다.

2. 음성 검사

환자들은 진단 당시와 각 치료 후 회기별로 음성 검사를 시행하였다.
임상 경력 5년 이상의 1명의 언어 재활사가 아래와 같은 음성 검사 및 청지각적 검사인 GRBAS scale(Fex, 1994)도 함께 측정하였다.
음성 자료 수집은 소음이 없는 음성 검사실에서 실시하였으며, 검사 전 편안한 음도와 강도 수준을 찾기 위해, 환자 스스로 2회 가량 연습하도록 하였다. 음성 녹음은 입과 약 10 cm의 거리를 둔 마이크로폰을 사용하였고, 평상시 발화와 같은 편안한 크기와 속도를 유도하기 위해
“◯◯◯입니다. 아~ ”라고 환자 스스로 자신의 이름을 말한 뒤 /a/ 모음 연장 발성을 약 5초 정도 시행하도록 하였으며, “산책 문단” 전체를 읽도록 하였다.
음향학적 분석은 Computerized Speech Lab(CSL 4150B ; KayPENTAX, Lincoln Park, NJ) 중 MDVP(multi-dimensional voice program)를 이용하여 기본주파수(Fundamental frequency), 주파수변동율(Jitter), 진폭변동율(shimmer), 신호대 잡음비(Noise-to-harmonic)을 측정하였다.
공기 역학적 검사 중에서는 최장연장발성시간(maximum phonation time, MPT)을 측정하여 비교하였다.
켑스트럼 분석을 위해 Hillenbrand가 개발한 CPP 방식을 이용하였으며 해당 홈페이지에서 speech tool을 다운로드 받으면 쉽게 구할 수 있다.
CPP는 켑스트럼에서 가장 높은 magnitude 지점인 cepstral peak부터 켑스트럼 소리 에너지의 평균인 회귀선(regression line)까지의 거리값으로 구하였다.

3. 음성 치료

음성치료의 목적은 호흡기능의 개선과 함께 성대 운동성의 복원에 초점을 맞추었다. 음성치료 기법은 성대운동성을 회복시킴과 동시에 부적절한 성문상부 움직임을 제거하고 환자가 능동적인 호흡 기류를 이용하도록 구성되었으며, 주로 성대움직임의 개선과 횡격막 호흡과의 협응과정에 중점을 두었다. 치료의 첫 단계는 후두의 운동성을 회복하는 것과 성문상부의 과긴장을 개선시키는 것이었다. 대상자는 복식호흡 훈련을 먼저 시행하였고, 이어서 복식호흡과 함께 흡기발성을 시작하였다. 흡기발성 후 높은 가성으로 길게 연장 발성하도록 한 후, 가장 편안하다고 생각되는 음도와 강도 수준으로 점차 음도를 하강시키면서 연장 발성하도록 하였다. 그 다음 단계는 성문접촉을 강화시키기 위한 훈련을 시작하였다. 대상자는 횡격막 흡기발성 후 잠시 동안 호흡을 멈춘 상태로 유지하다가 호흡을 한 번에 다 내보내는 감각으로 /a/를 단속 발성하도록 하고 나서, 바로 이어 /a/를 연속 발성하도록 하였다. 이때 대상자의 음질이 개선되면 읽기 및 연속발화 단계로 전이시켰다.

4. 통계분석

각 회기 별 검사결과를 비교하기 위해 SPSS version 22.0 software(SPSS Inc. Chicago, USA)를 이용하여 T-test, Pearson’s Correlation analysis가 사용되었다. 통계학적 유의성은 p-value 값이 0.05 이하인 경우로 판단하였다.

결 과

1. 청지각적 음성평가

음성 치료 전, 후에 각각 실시한 청기각적 음성평가인 GRBAS scale에서 Strained 항목을 제외한 다른 항목, Grade, Roughness, Breathiness 그리고 Asthenic 항목 모두에서 치료 전, 후 모두 통계학적으로 유의하게 호전되었다(p=0.000).

2. 음향학적 검사

음성 치료 전후에 각각 실시한 음향학적 검사에서 MDVP를 이용하여 구한 Jitter, Shimmer, NHR은 모두 치료 후 호전되었고 이것은 통계적으로 유의미한 차이가 나타났다.
Speech tool를 이용해서 구한 Cepstrum 분석에서는 모음연장발성을 검사한 CPP-a와 문단 검사를 한 CPP-s에서 모두 치료 후 통계적으로 유의하게 높은 CPP 값을 보였다(Table 2).
음성 치료 전후 변화된 음성에 대한 청지각적 검사 지표와 음성학적 검사 지표에 대한 상관분석을 시행하였다.
음성 치료 전 청지각적 지표인 G, R, B, A는 Cepstrum 지표인 CPP-a, CPP-s는 통계학적으로 유의하게 음의 상관관계가 있는 것으로 나타났고, MDVP의 Jitter, Shimmer, NHR은 G, R, B 지표와 양의 상관관계를 보였다(Table 3).
Cepstrum 지표인 CPP-a, CPP-s와 MDVP의 Jitter, Shimmer, NHR은 모두 저명하게 음의 상관관계를 보였다(Table 4). 문단과 모음연장발성의 차이를 가지는 CPP-a와 CPP-s는 서로 뚜렷한 양의 상관관계를 보였다(r=0.739, p=0.000).
음성 치료 후 호전된 목소리에 대해 시행한 음성 검사 결과들을 같은 방법으로 비교 분석해 보았다. 환자 음성에 대한 청지각적인 평가 중 G, B, A와 CPP-a, CPP-s는 통계학적으로 유의한 음의 상관 관계, 0.5~0.78 사이의 다소 높은 상관계수를 보였다. 이에 비해 MDVP 지표의 경우 G, B에서 Jitter에서만 0.4의 상관계수를 보이는 양의 상관관계를 보였다(Table 5).
Jitter는 CPP-a, CPP-s와 모두 음의 상관관계를 보였고, Shimmer의 경우 CPP-a에서 음의 상관관계를 통계학적으로 유의하게 나타냈다(Table 6).
치료 후에도 CPP-a와 CPP-s는 서로 양의 상관관계를 보였다(r=0.607, p=0.000).

3. 공기역학적 검사

MPT는 음성치료 전 평균 이 4.37±1.88이였으며, 음성치료 이후 8.99±3.48으로 치료 후 최장 연장발성 시간의 증가가 통계적으로 유의미하게 나타났다(T-test, p=0.000). 그러나 치료 후 CPP-a와 MPT, CPP-s와 MPT 간의 상관관계 분석에서는 통계적 유의성이 나타나지 않았다(Pearson’s Correlation, r=-0.174, p=0.303 & r=-0.051, p=0.765).

고 찰

암이나 각종 수술 후 발생하는 일측성 성대 마비의 경우, 그 원인에 따라 증상 호전의 정도가 다양하게 나타난다. 적절한 음성 치료로 증상의 호전을 도모하지만, 그 증상의 정도를 정확하게 평가하고 비교하는 것은 환자 치료의 방향을 설정하는데 중요하다.
임상 환경에서 가장 많이 사용되는 MDVP는, 검사를 위해 취득한 전체 음성 샘플 중 일부분을 선택하여 주파수, 진폭 등의 변화 정도를 측정하고 이를 통해 이전 검사 수치와의 비교를 할 수 있다. 전형적으로 음향학적인 부분에 중점을 둔 예민한 검사 지표로 인정을 받고 있지만, 기본 주파수의 변화에 민감하게 영향을 받아 수치의 변화가 잦고, 주기적이지 못한 음성의 경우 상대적으로 상당히 낮은 수치로 평가되는 한계가 있다[1-3].
성대가 마비되어 성대 접촉이 원활하지 못한 환자의 음성은, 정상 음성에 비해 심한 소음을 동반하게 되어 상당히 기식적(breathy)인 음성으로 나타나며 비주기적(aperiodic)으로 생성되는 경우가 많다. 특히 본 연구의 환자처럼, 발화의 시작보다는 발화의 중간 부분에서 소리가 달라진다고 호소하는 경우, MDVP 만으로는 환자의 음성을 정확하게 측정하기 어렵다. Cepstrum은 음성 샘플에서 두 번의 푸리에 변환을 통해 만들어진 함수로, 그래프 함수의 기저선(regression line)은 전체 음성 에너지의 평균이며, 이 기저선과 그래프의 가장 높은 점(Cepstral peak) 사이의 거리값이 CPP이다. 전체 음성 중 소음 환경에서 얼마나 조화음(Harmonics)이 잘 발생하는지를 측정할 수 있기 때문에, 정상 음성의 경우 상당히 뚜렷하고 날카로운 높은 정점(peak)을 보이는 반면, 성대 마비 환자처럼 심한 기식적 음성인 경우, 약하고 명확하지 않은 정점이 나타나게 된다. 따라서 음성이 나쁠수록 CPP 값은 감소한다. 기본 주파수가 아닌 음성 에너지 평균에서의 변화 정도를 나타내므로 주파수나 주기에 영향을 덜 받기 때문에 음성 검사의 환경에도 상대적으로 제약이 없다[1-4].
CPP를 측정하는 방법은 대표적으로 두 가지 방식이 있는데, 대표적으로 본 연구에서 시행하였던 Hillenbrand이 고안한 Cepstrum에서 기저선과 Cepstral peak 사이의 거리값을 구하는 방법이다. 그리고 CSL(computerized speech lab, Kay Pentax, Lincoln Park, New Jersey, USA)의 CMV 방식이 있으며, MDVP의 선택 프로그램을 구매한 경우 CMV값을 용이하게 구할 수 있다[3].
이미 여러 연구를 통해 CPP는 성대 마비 환자의 음성 평가에서 유용한 평가도구로 알려져 있다. 본 연구는 이러한 CPP를 이용해 여러 가지 음성 증상 중, 발화 시작시점보다 대화를 유지하는 중간에 소리가 변하는 증상을 가진 환자를 평가할 때, 기존에 많이 사용하던 MDVP의 Jitter, Shimmer 만으로는 해당 증상을 파악하는데 다소 발견되었던 한계점을 Cepsturm의 CPP를 같이 보완하여 비교해보면 증상에 대한 더 면밀한 평가가 가능한 것으로 생각되었다. 이번 연구처럼 Running speech에서의 정확한 평가를 위한 도구로 CPP에 대한 관심은 다른 연구에서도 발표가 되었는데, Eadie 등은 CPP 가 running speech에서 roughness 정도를 측정하는데 MDVP의 shimmer와 비교하여 평가하면 더욱 정확하다고 발표하였고, Moers 등은 breathiness와 hoarseness 측정에 CPP가 perturbation 평가 도구보다 증상의 정도와 상관관계가 높다고 결론지었다[1,5]. 저자는 발화의 시작보다 발화의 중간 단계에서 음성 장애를 측정하는 것에 관심을 가지고 CPP를 연구하였는데, 이것은 음성 에너지를 비교하기 용이한 Cepstrum의 특징을 반영한 것으로 이미 신경학적 음성장애(neurogenic voice disorder)나 과소 기능성 음성장애(hypofunctional voice disorder) 환자의 음성 평가에서 그 유용성이 확인되었다[1,5].
이번 연구에서는 일측성 성대 마비 환자의 음성 평가에서 GRBAS에서 G, B, A와 MDVP에서 Jitter, Shimmer에서 CPP-a, CPP-s와 유의한 상관관계를 보임을 확인하였다. 그러나 MPT와는 양의 상관관계는 보이나 통계적으로 유의미한 결과를 얻을 수는 없었다. MPT는 주로 발화의 시작에 필요한 기능을 평가하는 것으로, 추후 더욱 다양한 환자를 대상으로 비교해 보면, CPP-a와 연관이 있을 것으로 생각된다.
본 연구에 참여한 환자수가 작고 성대 마비 정도가 경미한 경우가 많아 뚜렷하게 모음 발성과 문단 읽기에서 큰 차이를 보인 경우가 작아 CPP-a, CPP-s의 통계적인 차이는 보이지 않았지만 후속 연구를 위해 다양하고 많은 환자 수로 분석해보면 발화의 중간 단계에서 목소리 변화가 있는 환자의 경우 CPP-s가 좀 더 예민하게 저하되는 양상을 보이고 있어 추후 좀 더 의미있는 결과를 보일 수 있을 것으로 생각된다.

결 론

일측성 성대마비 환자에서 발화 도중, 음성 에너지가 바뀌거나 주기가 일정하지 못한 경우의 음성 평가에서 CPP는 중요한 평가도구가 될 수 있다.

Table 1.
Cause of vocal fold paralysis
Cause Patient number
Metastatic nodes 10
Lung cancer 7
Thyroid cancer 7
Esophagus cancer 6
idiopathic 2
Cranial nerve injury 2
Saccular cyst 1
Benign Lymph node 1
Chronic laryngitis 1
Table 2.
Cepstrum analysis
Variable Before voice therapy After voice therapy p-value
Cpp-a 4.3 5.9 0.000*
Cpp-s 2.2 2.7 0.000*

* : p<0.05 by paired t-test.

CPP-a : CPP with vowel /a/, CPP-s : CPP with paragraph reading

Table 3.
Correlation phonological analyses before voice therapy
G R B A S
CPP-a -.712** (.000) -.618** (.000) -.765** (.000) -.491** (.002) -0.18 (.917)
CPP-s -.733** (.000) -.494** (.002) -.691** (.000) -.472** (.003) -.012 (.945)
Jitter .687** (.000) .716** (.000) .641** (.000) .285 (.087) .342* (.038)
Shimmer .696** (.000) .789** (.000) .618** (.000) .344* (.037) .180 (.287)
NHR .581** (.000) .642** (.000) .533** (.001) .196 (.246) .363* (.027)

* : p<0.05,

** : p<0.005 by Pearson’s correlation.

CPP-a : CPP with vowel /a/, CPP-s : CPP with paragraph reading, NHR : Noise-to-harmonic ratio

Table 4.
Comparative analysis of CPP with MDVP before voice therapy
Jitter Shimmer NHR
CPP-a -.768** (.000) -.716** (.000) -.678** (.000)
CPP-s -.550** (.000) -.545** (.000) -.442** (.006)

* : p<0.05,

** : p<0.005 by Pearson’s correlation.

CPP-a : CPP with vowel /a/, CPP-s : CPP with paragraph reading, NHR : Noise-to-harmonic ratio

Table 5.
Correlation phonological analyses after voice therapy
G R B A
CPP-a -.590** (.000) -.185 (.272) -.642** (.000) -.458** (.004)
CPP-s -.737** (.000) -.278 (.096) -.782** (.000) -.618** (.000)
Jitter .440** (.006) .179 (.290) .446** (.006) .316 (.057)
Shimmer .158 (.352) .200 (.235) .083 (.626) .045 (.790)
NHR -.012 (.944) .209 (.214) -.060 (.723) -.123 (.470)

* : p<0.05,

** : p<0.005 by Pearson’s correlation.

CPP-a : CPP with vowel /a/, CPP-s : CPP with paragraph reading, NHR : Noise-to-harmonic ratio

Table 6.
Comparative analysis of CPP with MDVP after voice therapy
Jitter Shimmer NHR
CPP-a -.770** (.000) -.471** (.003) -.345* (.037)
CPP-s -.481** (.003) -.267 (.111) .024 (.887)

* : p<0.05,

** : p<0.005 by Pearson’s correlation

REFERENCES

1. Fraile R, Godino-Llorente JI. Cepstral peak prominence: A comprehensive analysis. J Biomedical Signal Processing and Control March 2014;(22):1-24.
crossref
2. Heman-Ackah YD, Michael DD, Goding GS Jr. The relationship between cepstral peak prominence and selected parameters of dysphonia. J Voice 2002;1(16):20-7.
crossref
3. Park MC, Mun MK, Lee SH, Jin SM. Clinical usefulness of cepstral analysis in dysphonia evaluation. Korean J Otorhinolaryngol-Head Neck Surg 2013;56(9):574-8.
crossref
4. Kim TH, Choi JI, Lee SH, JIn SM. Comparison of vowel and text-based cepstral analysis in dysphonia evaluation. J Korean Logo Phon 2015;26(2):117-21.
crossref
5. Eadie TL, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice 2006;(20):527-44.
crossref pmid
Editorial Office
Journal of The Korean Society of Laryngology, Phoniatrics and Logopedics, Ewha Womans University, College of Medicine.
Anyangcheon-ro 1071, Yangcheon-gu, Seoul, Republic of Korea
TEL: +82-10-3008-3075   FAX: +82-2-2646-3076    E-mail: secretary@kslpl.org
About |  Browse Articles |  Current Issue |  For Authors and Reviewers
Copyright © Journal of The Korean Society of Laryngology, Phoniatrics and Logopedics.                 Developed in M2PI