주메뉴 바로가기
본문 바로가기(skip to content)
도서관 정보 바로가기

서울대학교 빅데이터 지식정보플랫폼

LikeSNU 소개

전체 메뉴

AI 검색

최근 확인한 콘텐츠

3건 더보기

반출리포트 생성

논문 목록

SNAC: Speaker-Normalized Affine Coupling Layer in Flow-Based Architecture for Zero-Shot Multi-Speaker Text-to-Speech

저자

Choi, Byoung Jin; Jeong, Myeonghun; Lee, Joun Yeop; Kim, Nam Soo

학술지명

IEEE Signal Processing Letters

출판/발행연도

2022

주제

요약

본 연구는 보이지 않는 화자의 음성 특성을 가진 음성 샘플을 생성하는 제로샷 다화자 음성 합성(ZSM-TTS) 모델의 화자 유사도를 향상시키는 데 초점을 맞추고 있습니다. 이를 위해 화자 임베딩 벡터에 따라 아핀 커플링 레이어의 스케일 및 편향 파라미터를 예측하는 기존 화자 조건부 기법을 개선하여 정규화 기반 조건부 기법을 활용하는 SNAC 레이어를 제안합니다. 제안하는 방식은 ZSM-TTS 환경에서 음성 품질 및 화자 유사도 측면에서 최첨단 성능을 달성합니다.

학술지 영향력

[IEEE Signal Processing Letters]

CiteScore: 7.2

ES: 0.01892

JCI: 0.87

JCR: 3.9

SJR: 0.938

출처 바로가기 찜하기

인용 논문(0)

해당 논문이 인용한 논문 목록

논문 지표

연관 콘텐츠

LikeSNU에서 의미기반으로 분석하여 연관된 자료를 추천해드립니다.

이전

다음

이전

다음

이전

다음

TOP