IT, 컨텐츠

광주과학기술원의 IT, 컨텐츠의 유용한 기술정보를 검색 및 문의하실 수 있습니다.

기 술 명
타 언어권 화자 음성에 대한 음성 인식시스템의 성능향상을 위한 발음 특성에 기반한 음향모델 변환 방법 및이를 이용한 장치
연 구 자
김홍국(정보통신공학부)
등록번호
10-0815115-00-00
출원번호
10-2006-0029321
문 의 처
문희곤062-715-3077hgmoon@gist.ac.kr
발명정보

본 발명은 타 언어권 화자 음성에 대한 인식성능 향상을 위하여 음향모델 변환 기법의 제공에 있다. 음향모델을 적응시키기 위하여 먼저 타 언어권 화자 음성을 분석하여 변이 발음을 조사한다. 그 후 타 언어권 화자 음성의 변이 발음을 바탕으로 음향모델의 학습과정 중 상태공유단계에서 음향모델을 변환한다. 음향모델을 변환하는 본 발명과 기존의 음향모델 적응기법을 결합함으로써 보다 좋은 인식성능 향상을 얻을 수 있다. 본 발명은 타 언어권 화자 음성에 대한 인식성능 향상뿐 아니라, 원어민 화자 음성에 대한 인식성능의 저하를 줄이는 효과를 보인다.

발명효과

본 발명에 따르면, 타 언어권 화자 음성에 대한 음성 인식시스템의 성능 향상의 제공이 가능하고, 본 발명은 원어민 화자 음성에 대한 음성 인식시스템의 성능 저하를 감소시킬 수 있다. 그리고 데이터 기반으로 타 언어권 화자 음성의 발음 변이를 분석함으로써 이를 위한 인적 노력을 줄일 수 있다. 또한, 데이터 기반으로 타 언어권 화자 음성의 발음 변이를 분석함으로써 타 언어권 화자에 대한 지식이 부족한 상황에서 발음 변이 분석을 가능하게 하고, 기존의 방식과의 결합으로 보다 높은 음성인식 성능 향상을 제공할 수 있다.

대표청구항

타 언어권 화자 음성에 대한 발음 분석을 통하여 타 언어권 화자의 변이 발음을 조사하는 발음 변이 분석 단계; 및 원어민 화자에 의한 학습용 음성데이터를 이용하여 단음 기반 음향모델을 생성한 후, 트라이폰기반 음향모델을 생성하는 단계; 상기 생성된 트라이폰기반 음향모델을 타 언어권 화자에 대한 발음변이여부 존재에 따라 공유하는 단계; 및 상기 공유된 트라이폰기반 음향모델의 혼합 밀도를 증가시키는 단계를 포함하는 음향모델 변환 기법.