LikeSNU 서울대학교 도서관
서울대학교 빅데이터 지식정보플랫폼

전체 메뉴

AI 검색
반출리포트 생성
  • 분류
  • 리포트명
  • 그룹
  • 링크
  • 리포트 썸네일
논문 목록
논문 목록 (0건) Excel 내보내기

데이터가 존재하지 않습니다.

SNAC: Speaker-Normalized Affine Coupling Layer in Flow-Based Architecture for Zero-Shot Multi-Speaker Text-to-Speech

저자
Choi, Byoung Jin; Jeong, Myeonghun; Lee, Joun Yeop; Kim, Nam Soo
학술지명
IEEE Signal Processing Letters
출판/발행연도
2022
요약

본 연구는 보이지 않는 화자의 음성 특성을 가진 음성 샘플을 생성하는 제로샷 다화자 음성 합성(ZSM-TTS) 모델의 화자 유사도를 향상시키는 데 초점을 맞추고 있습니다. 이를 위해 화자 임베딩 벡터에 따라 아핀 커플링 레이어의 스케일 및 편향 파라미터를 예측하는 기존 화자 조건부 기법을 개선하여 정규화 기반 조건부 기법을 활용하는 SNAC 레이어를 제안합니다. 제안하는 방식은 ZSM-TTS 환경에서 음성 품질 및 화자 유사도 측면에서 최첨단 성능을 달성합니다.

학술지 영향력
[IEEE Signal Processing Letters]
CiteScore
7.2
ES
0.01892
JCI
0.87
JCR
3.9
SJR
0.938

인용 논문(0)

해당 논문이 인용한 논문 목록

논문 지표

연관 콘텐츠

LikeSNU에서 의미기반으로 분석하여 연관된 자료를 추천해드립니다.

이전
다음
이전
다음
이전
다음
TOP