LikeSNU-서울대 중앙도서관 빅데이터 지식 플랫폼

최근 확인한 콘텐츠

2건 더보기

Text-to-Speech for Low-Resource Agglutinative Language With Morphology-Aware Language Model Pre-Training

저자

Liu, R.; Hu, Y.; Zuo, H.; Luo, Z.; Wang, L.; Gao, G.

학술지명

IEEE/ACM Transactions on Audio, Speech, and Language Processing, Audio, Speech, and Language Processing, IEEE/ACM Transactions on, IEEE/ACM Trans. Audio Speech Lang. Process.

출판/발행연도

2024

주제

요약

본 연구는 저자원 교착어의 텍스트 음성 변환(TTS) 성능 향상을 위해 형태소 정보를 활용한 언어 모델 사전 훈련 방법을 제안합니다. 대규모 비지도 텍스트 데이터를 활용하여 BERT 기반 언어 모델을 사전 훈련하고, 이를 통해 TTS 모델의 입력 텍스트에서 심층적인 언어 정보를 추출하여 합성 음성의 자연스러움을 개선합니다. 실험 결과, 제안하는 MAM-BERT 모델이 다양한 TTS 모델에서 효과적인 성능 향상을 보였으며, 특히 저자원 환경에서 유용함을 확인했습니다.

학술지 영향력

[IEEE/ACM Transactions on Audio, Speech, and Language Processing, Audio, Speech, and Language Processing, IEEE/ACM Transactions on, IEEE/ACM Trans. Audio Speech Lang. Process.]