최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
Choi, Byoung Jin; Jeong, Myeonghun; Lee, Joun Yeop; Kim, Nam Soo
2022 / IEEE Signal Processing Letters
데이터가 존재하지 않습니다.
loading...
본 연구는 보이지 않는 화자의 음성 특성을 가진 음성 샘플을 생성하는 제로샷 다화자 음성 합성(ZSM-TTS) 모델의 화자 유사도를 향상시키는 데 초점을 맞추고 있습니다. 이를 위해 화자 임베딩 벡터에 따라 아핀 커플링 레이어의 스케일 및 편향 파라미터를 예측하는 기존 화자 조건부 기법을 개선하여 정규화 기반 조건부 기법을 활용하는 SNAC 레이어를 제안합니다. 제안하는 방식은 ZSM-TTS 환경에서 음성 품질 및 화자 유사도 측면에서 최첨단 성능을 달성합니다.
Automatic speech analysis and recognition : proceedings of the NATO Advanced Study Institute held at Bonas, France, June 29-July 10, 1981
Data-driven techniques in speech synthesis
Springer handbook of speech processing
Digital speech processing, synthesis, and recognition
Recent research towards advanced man-machine interface through spoken language
Automatic speech and speaker recognition : advanced topics
Progress in speech synthesis
Self-learning speaker identification : a system for enhanced speech recognition
Text-to-speech synthesis
Recent advances in speech understanding and dialog systems
Digital signal processing in telecommunications : European project COST#229 technical contributions
Bandwidth extension of speech signals
Automated Speaking Assessment : Using Language Technologies to Score Spontaneous Speech.
Spoken language processing : a guide to theory, algorithm, and system development
Applied speech technology
Speech coding : code-excited linear prediction
VLSI artificial neural networks engineering
Automated speaking assessment : using language technologies to score spontaneous speech
Neural networks and speech processing
Acoustical and environmental robustness in automatic speech recognition
IEEE Signal Processing Letters
Choi, Byoung Jin; Jeong, Myeonghun; Kim, Minchan; Kim, Nam SooIEEE Signal Processing Letters
Hyungchan Yoon; Changhwan Kim; Seyun Um; Hyun-Wook Yoon; Hong-Goo KangIEEE Signal Processing Letters
Yoon H.,Kim C.,Um S.,Yoon H.W.,Kang H.G.IEEE/ACM Transactions on Audio, Speech, and Language Processing
Neeraj Kumar; Ankur Narang; Brejesh LallIEEE/ACM Transactions on Audio Speech and Language Processing
Kumar N.,Narang A.,Lall B.PROCEEDINGS OF 2022 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC)
Choi, Byoung Jin; Jeong, Myeonghun; Kim, Minchan; Mun, Sung Hwan; Kim, Nam SooPROCEEDINGS OF 2022 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC)
Choi, Byoung Jin; Jeong, Myeonghun; Kim, Minchan; Mun, Sung Hwan; Kim, Nam Soo2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING
Cooper, Erica; Lai, Cheng-, I; Yasuda, Yusuke; Fang, Fuming; Wang, Xin; Chen, Nanxin; Yamagishi, JunichiIEEE Signal Processing Letters
Wang, H.; Qiang, C.; Wang, T.; Wang, L.; Gong, C.INTERNATIONAL CONFERENCE ON MACHINE LEARNING, VOL 162
Casanova, Edresson; Weber, Julian; Shulby, Christopher; Candido Junior, Arnaldo; Goelge, Eren; Ponti, Moacir AntonelliIEEE Transactions on Neural Networks and Learning Systems
Lee, S.-H.; Choi, H.-Y.; Kim, S.-B.; Lee, S.-W.IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING
Chen, Sanyuan; Wang, Chengyi; Wu, Yu; Zhang, Ziqiang; Zhou, Long; Liu, Shujie; Chen, Zhuo; Liu, Yanqing; Wang, Huaming; Li, Jinyu; He, Lei; Zhao, Sheng; Wei, FuruIEEE/ACM Transactions on Audio Speech and Language Processing
Lian J.,Zhang C.,Anumanchipalli G.K.,Yu D.Applied Acoustics
Song R.,Oh K.,Choi C.,Ku B.,Ko H.아시아태평양융합연구교류논문지
이호준, 석종원Sensors
Bang C.W.,Chun C.IEEE Signal Processing Letters
Lee, J.; Song, N.-S.; Chang, J.-H.IEEE/ACM Transactions on Audio Speech and Language Processing
Huang S.F.,Lin C.J.,Liu D.R.,Chen Y.C.,Lee H.Y.Transactions of the Association for Computational Linguistics
Kharitonov E.,Vincent D.,Borsos Z.,Marinier R.,Girgin S.,Pietquin O.,Sharifi M.,Tagliasacchi M.,Zeghidour N.2024 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2024)
Mehta, Shivam; Tu, Ruibo; Beskow, Jonas; Szekely, Eva; Henter, Gustav Eje전선 / 대학원
본 강의에서는 디지탈 음성처리의 이론과 그 응용에 대하여 고찰하는 것이 목적이다. 우선 음성신호의 통계적인 특성과 성질을 논하고 인간의 음성발생 원리를 설명한다. 또한 음성발생 원리에 근거한 선형 예측 부호화에 따른 이론적인 배경과 해법을 설명한다. 한편 음성합성, 음성인식의 원리와 이론을 고찰하고 최근 발표되고 있는 논문들을 중심으로 여러 알고리듬을 살펴보고 이의 장단점을 비교, 분석 하도록 한다. 본 강의를 수강하기 위해서는 디지탈 신호처리의 이해와 습득이 필수적이다.전선 / 대학원
본 교과목은 오늘날 인공지능의 중심을 이루는 거대언어모델(Large Language Models)과 이를 기반으로 한 대화형 인공지능을 다룬다. 특히 거대언어모델의 학습부터 응용까지 이어지는 전체 파이프라인을 아래와 같이 체계적으로 다룬다. (1) Pre-training: 지식 습득을 위한 사전학습(Transformer, BERT, GPTs) (2) Supervised Fine-tuning: 상호작용 학습(Dialogue Fine-tuning, Instruction Tuning, Reasoning) (3) Alignment: 인간 가치와의 정렬(RLHF, DPO, KTO 등) 및 언어모델 해석 기법(AI Psychometrics, Mechanistic Interpretability) (4) Grounding: 외부 데이터 및 도구 활용 기법(페르소나, 문서, 이미지, 지식 그래프, 도구 증강 에이전트) (5) Applications: 다양한 도메인으로의 응용(대화 시뮬레이션 및 심리상담·교육·설득 응용) 수업에서는 각 연구 주제별로 핵심 논문들의 아이디어, 데이터, 방법론 등을 강의한다. 실습으로는 언어모델 학습, 언어모델 API를 이용한 대화 시스템 구현, 대화형 인공지능과 관련된 작은 연구 프로젝트를 수행한다. 이 과목을 통해 수강생들은 거대언어모델 연구 동향을 큰 틀에서 파악하고, 핵심적인 연구 주제들과 방법론을 이해하며, 이를 실제 연구에 적용하는 능력을 기르게 된다.전선 / 대학원
말소리의 음향적 특성에 관한 이론을 학습하고, 이를 토대로 스펙트로그램을 판독하고, 음소 단위로 분절하고, 각 음소를 올바른 발음기호로 표기하는 능력을 함양한다. 또한 녹음 장비 및 음향 분석기 사용법과 실험 음성학 방법론을 학습하고, 이를 토대로 한국어와 영어를 비롯한 여러 언어의 발음을 과학적으로 연구할 수 있는 능력을 함양한다. 그리고 음성학적 지식을 어떻게 음성합성기와 음성인식기의 성능 향상에 기여할 수 있을지 모색한다.전선 / 대학원
이 교과목에서는 음성언어처리, 특히 연속음성인식 및 대화처리를 위하여 필요한 기초이론에 대해서 배운다. 구체적으로는 대용량 연속음성 인식을 위한 대표적인 기법인 Hidden Markov Model의 기초 이론 및 주요 구성 요소인 음향 모델, 어휘 모델, 언어 모델과 탐색 방법에 대해서 배우며, 언어학과 공학의 학제적 성격을 가지는 낭독체 및 대화체 연속음성인식과 대화처리를 위한 언어학 이론의 적용 방법에 대하여 배운다.전선 / 대학원
산업공학의 새로운 기법들을 소개하고 이의 응용실태를 알아본다.전선 / 대학원
프로그래밍 언어 이론 및 응용기술의 기초를 강의한다. 프로그래밍 언어 의미구조, 요약해석, 타입시스템, 컴파일러 검증 및 검산, 자동증명 검증기, 프로그램 증명, 프로그램 정적분석 등을 다룬다.전필 / 학사
본 강좌를 통해 약학을 전공하는 학생, 예비보건의료인으로서 의사소통 관련 개념을 학습하고, 다양한 환경에서의 의사소통 방법을 익힘. 약학연구자, 환자, 타보건의료인을 포함한 다양한 인간관계에서 대상자를 공감적으로 이해, 배려, 수용하는 태도를 지닌 약학전문인의 리더십 역량을 배양함.전선 / 학사
연구실에서의 연구참여 활동을 통하여 전공 지식을 심화 학습한다. 각자가 원하는 연구에 참여하며 그 연구에 대한 직접적인 경험을 갖는다.전필 / 학사
첨단융합학부 학생의 전공탐색을 위한 과목으로, 융합데이터과학의 핵심 개념과 다양한 응용 분야를 소개하여 향후 전공선택에 필요한 필수적인 정보를 제공한다. 특히, 융합데이터과학 분야에서 진행되는 첨단연구와 연구의 실제 응용 사례를 직접 체험하여, 자신의 전공 적성을 좀 더 구체적으로 알아보고 설계할 수 있는 기회를 제공한다.전선 / 대학원
기계학습의 기초, AI 시스템의 평가, 윤리적 /법적 측면과 함의를 교육분야의 적용 사례를 통해 살펴보고, 전통적 과학교수학습이론과 평가이론과의 접목을 논의하면서 인공지능 및 언택트 시대의 과학교수학습과 평가에 대한 조망 및 새로운 연구분야에 대한 이해를 높인다.전선 / 학사
영어 읽기, 쓰기, 듣기, 말하기 지도에 대한 이론들과 실제 활용하는 방법을 탐구한다. 또한 중등 영어수업에서 사용할 수 있는 실질적인 지도 방법을 개발하여 실습해 본다.전선 / 대학원
음성언어 인터페이스는 인간과 컴퓨터의 상호작용에 가장 자연스러운 정보 교환 수단을 제공해준다. 음성언어처리는 이를 위한 음성인식, 음성합성 및 음성언어이해에 관련된 이론 및 기술을 가리키는 용어이다. 본 과목에서는 방대하며 학제적인 성격을 가지는 음성언어처리 분야를 이해하는데 필요한 기초이론을 체계적으로 제공하며, 또한 각종 소프트웨어 도구를 사용해서 실질적인 응용에 어떻게 기초이론들이 적용되는지를 보여준다.전선 / 대학원
데이터사이언스와 관련한 여러 분야의 최근의 국내외 연구동향을 소개한다. 강의와 세미나를 통하여 관련분야의 최신 방법론과 특정 주제를 심도 있게 습득할 수 있도록 한다.전선 / 대학원
ATM에 관하여 Physical layer, ATM Layer, ATM Adaptation Layer 각 layer에 관하여 강의를 하며 특히 connectionless service, traffic management, switch에 관하여 심도있는 강의를 한다.전선 / 학사
본 과목에서는 자연어 처리 분야의 최근 기술 발전과 이를 이해하기 위한 배경 지식 전반을 강의한다. Transformer model 기반 자연어 처리 기법을 주로 다루며, 이를 이해하기 위해 필요한 배경 지식(Embedding, Encoder-Decoder, Attention 등)을 다룬다. 실제 자연어 처리 문제를 해결하기 위해 Transformer를 수정/활용하는 프로젝트를 진행한다.교양 / 학사
본 강좌의 목적은 말하기, 듣기, 읽기, 쓰기의 영역을 모두 다룸으로써 학생들의 영어 의사소통 능력은 물론 통합적인 사고능력을 향상시키는데 있다.전선 / 대학원
대형언어모델(Large Language Model, LLM)은 수억 이상 파라미터를 갖는 인공신경망으로 구성된 언어모델이다. 자기지도학습이나 반자기지도학습을 사용하여 레이블링 되지 않은 대규모 텍스트로 훈련된다. 토큰화, 트랜스포머 모델, 프롬프트 엔지니어링, 파인 튜닝 등으로 구성된다. Neural Network, CNN, RNN, LSTM, 어텐션, 트랜스포머, RLHF, 프롬프트 엔지니어링, 파인튜닝, RAG 등을 다룬다. LLM 이론을 기초부터 완성 단계까지 학습한다. LLM를 소규모로 직접 사전학습모델을 구현한다. 사전학습된 모델을 기반으로 프롬프트 엔지니어링, 파인튜닝, RAG를 통하여 성능을 향상시키는 것을 구현한다.전선 / 대학원
본 교과목은 단순한 질의응답을 넘어, 스스로 목표를 설정하고, 도구를 사용하며, 복잡한 과업을 자율적으로 수행하는 ‘에이전트(Agentic)' AI의 설계 원리와 구현 방법론을 심층적으로 다룬다. 기존의 LLM(Large Language Model)이 가진 한계를 극복하고, LLM을 ‘추론 엔진'으로 활용하여 실제 세계와 상호작용하는 지능형 시스템을 구축하는 데 초점을 둔다. 수강생들은 단일 에이전트의 핵심 구성 요소인 사고-행동-관찰(Reasoning-Acting-Observation) 루프, 동적 도구 사용(Tool Use), 장단기 기억(Memory) 메커니즘을 학습한다. 나아가 여러 에이전트가 협력하여 인간의 개입을 최소화하면서 복잡한 문제를 해결하는 멀티 에이전트 시스템(Multi-Agent System)의 설계 패턴(예: 계층적, 협력적)과 통신 프로토콜을 배운다. LangChain, AutoGen, CrewAI와 같은 최신 프레임 워크를 활용한 실습을 통해, 에이전트 아키텍처 설계부터 정교한 프롬프트 체이닝, 실행 루프 구현까지의 전 과정을 경험하며, 차세대 AI 애플리케이션을 개발할 수 있는 실전 역량을 배양하는 것을 목표로 한다.전선 / 대학원
이 과목에서는 자연어처리에 대한 간단한 소개와 함께, 대표적인 인공신경망 기법들이 자연어처리 어떻게 적용되는지 살펴본다. 최근 일상생활에서도 많이 쓰이는 자연어처리는 인공신경망의 성장과 함께 비약적인 발전을 보였다. 인공신경망을 이용한 딥러닝 기법은 이론적인 면뿐만 아니라, 효율적 계산과 최적화 등의 실험적인 요소가 많아 실습이 중요하다. 이 과목을 듣기 위해서는 기계학습에 대한 기본적인 이해와 파이썬, 딥러닝 모형을 사용하는 능력이 요구된다. 이 강좌는 학생들이 자연어처리의 최근 방법론을 학습하고, 실제 구현하는 능력을 배양하며, 마지막으로 최근 방법론이 가진 한계점, 미래 연구주제에 관해 탐구한다.전선 / 학사
본 과정에서는 인공지능에 대한 개요 및 deep learning에 대해 이해하며 TensorFlow 개념 및 기초 programming 실습을 진행한다. 그리고 Deep Learning 기반 Object Detection 방법과 무인점포 개발 응용을 위한 학습 trainset 자동 생성 방법을 실습을 통해 익힌다. 또한 AI Chip이 내장된 NPU 가속기 Board와 nVidia Jetson TX2 Board를 이용하여 YOLO V3 Object Detection 실습을 진행한다. 마지막으로 nVidia CUDA를 이용한 GPU Programming 개념 및 병렬 Programming 실습을 통해 GPU 구조에 대해 배운다.