최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
Yoon H.,Kim C.,Um S.,Yoon H.W.,Kang H.G.
2023 / IEEE Signal Processing Letters
데이터가 존재하지 않습니다.
loading...
본 논문은 제로샷 다화자 음성 합성(ZSM-TTS) 시스템에 적용 가능한 효과적인 화자 조건부 방법을 제안합니다. 화자 임베딩으로부터 컨볼루션 커널을 예측하고, 이를 음성 특징에 적용하는 화자 조건부 컨볼루션 신경망(SC-CNN)을 통해 음성 생성 시 화자 특성을 효과적으로 모델링합니다. 실험 결과, SC-CNN을 적용한 모델이 주관적 및 객관적 평가 모두에서 기존 ZSM-TTS 모델보다 우수한 성능을 보였습니다.
Data-driven techniques in speech synthesis
Automatic speech and speaker recognition : advanced topics
Digital speech processing, synthesis, and recognition
Applied speech technology
Springer handbook of speech processing
Automatic speech analysis and recognition : proceedings of the NATO Advanced Study Institute held at Bonas, France, June 29-July 10, 1981
Recent research towards advanced man-machine interface through spoken language
CONCUR '90 : theories of concurrency--unification and extension, Amsterdam, the Netherlands, August 27-30, 1990 : proceedings
Speech-to-speech translation : a massively parallel memory-based approach
Pattern recognition in speech and language processing
Speech coding : code-excited linear prediction
Computational linguistics and intelligent text processing : 7th international conference, CICLing 2006, Mexico City, Mexico, February 19-25, 2006 : proceedings
Mathematical foundations of speech and language processing
Neural networks and speech processing
Advanced speech applications : European research on speech technology
Speech enhancement : theory and practice
Connectionist natural language processing : readings from Connection science
Text, speech and dialogue : Second International Workshop, TSD'99, Plzen, Czech Republic, September 13-17, 1999 : proceedings
Category theory and computer science : 6th International Conference, CTCS '95, Cambridge, United Kingdom, August 7-11, 1995 : proceedings
IEEE Signal Processing Letters
Hyungchan Yoon; Changhwan Kim; Seyun Um; Hyun-Wook Yoon; Hong-Goo KangIEEE Signal Processing Letters
Choi, Byoung Jin; Jeong, Myeonghun; Lee, Joun Yeop; Kim, Nam SooPROCEEDINGS OF 2022 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC)
Choi, Byoung Jin; Jeong, Myeonghun; Kim, Minchan; Mun, Sung Hwan; Kim, Nam SooINTERNATIONAL CONFERENCE ON MACHINE LEARNING, VOL 162
Casanova, Edresson; Weber, Julian; Shulby, Christopher; Candido Junior, Arnaldo; Goelge, Eren; Ponti, Moacir AntonelliPROCEEDINGS OF 2022 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC)
Choi, Byoung Jin; Jeong, Myeonghun; Kim, Minchan; Mun, Sung Hwan; Kim, Nam SooIEEE/ACM Transactions on Audio, Speech, and Language Processing, Audio, Speech, and Language Processing, IEEE/ACM Transactions on, IEEE/ACM Trans. Audio Speech Lang. Process.
Gong, C.; Wang, X.; Cooper, E.; Wells, D.; Wang, L.; Dang, J.; Richmond, K.; Yamagishi, J.2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING
Qian, Kaizhi; Fin, Zeyu; Hasegawa-Johnson, Mark; Mysore, Gautham J.IEEE Transactions on Neural Networks and Learning Systems
Lee, S.-H.; Choi, H.-Y.; Kim, S.-B.; Lee, S.-W.IEEE Signal Processing Letters
Choi, Byoung Jin; Jeong, Myeonghun; Kim, Minchan; Kim, Nam SooMultimedia Tools and Applications
Al-Radhi M.S.,Csapó T.G.,Németh G.IEEE Signal Processing Letters
Wang, H.; Qiang, C.; Wang, T.; Wang, L.; Gong, C.Computers, Materials and Continua
Sung W.T.,Kang H.W.,Hsiao S.J.아시아태평양융합연구교류논문지
이호준, 석종원IEEE/ACM Transactions on Audio Speech and Language Processing
Jati A.,Georgiou P.IEEE/ACM Transactions on Audio Speech and Language Processing
Kumar N.,Narang A.,Lall B.IEEE/ACM Transactions on Audio Speech and Language Processing
Zhang M.,Zhou Y.,Zhao L.,Li H.IEEE/ACM Transactions on Audio, Speech, and Language Processing
Neeraj Kumar; Ankur Narang; Brejesh LallApplied Acoustics
Song R.,Oh K.,Choi C.,Ku B.,Ko H.Speech Communication
Inoue K.,Hara S.,Abe M.,Hojo N.,Ijima Y.IEEE/ACM Transactions on Audio Speech and Language Processing
Huang S.F.,Lin C.J.,Liu D.R.,Chen Y.C.,Lee H.Y.전선 / 대학원
본 교과목은 오늘날 인공지능의 중심을 이루는 거대언어모델(Large Language Models)과 이를 기반으로 한 대화형 인공지능을 다룬다. 특히 거대언어모델의 학습부터 응용까지 이어지는 전체 파이프라인을 아래와 같이 체계적으로 다룬다. (1) Pre-training: 지식 습득을 위한 사전학습(Transformer, BERT, GPTs) (2) Supervised Fine-tuning: 상호작용 학습(Dialogue Fine-tuning, Instruction Tuning, Reasoning) (3) Alignment: 인간 가치와의 정렬(RLHF, DPO, KTO 등) 및 언어모델 해석 기법(AI Psychometrics, Mechanistic Interpretability) (4) Grounding: 외부 데이터 및 도구 활용 기법(페르소나, 문서, 이미지, 지식 그래프, 도구 증강 에이전트) (5) Applications: 다양한 도메인으로의 응용(대화 시뮬레이션 및 심리상담·교육·설득 응용) 수업에서는 각 연구 주제별로 핵심 논문들의 아이디어, 데이터, 방법론 등을 강의한다. 실습으로는 언어모델 학습, 언어모델 API를 이용한 대화 시스템 구현, 대화형 인공지능과 관련된 작은 연구 프로젝트를 수행한다. 이 과목을 통해 수강생들은 거대언어모델 연구 동향을 큰 틀에서 파악하고, 핵심적인 연구 주제들과 방법론을 이해하며, 이를 실제 연구에 적용하는 능력을 기르게 된다.전선 / 대학원
본 강의에서는 디지탈 음성처리의 이론과 그 응용에 대하여 고찰하는 것이 목적이다. 우선 음성신호의 통계적인 특성과 성질을 논하고 인간의 음성발생 원리를 설명한다. 또한 음성발생 원리에 근거한 선형 예측 부호화에 따른 이론적인 배경과 해법을 설명한다. 한편 음성합성, 음성인식의 원리와 이론을 고찰하고 최근 발표되고 있는 논문들을 중심으로 여러 알고리듬을 살펴보고 이의 장단점을 비교, 분석 하도록 한다. 본 강의를 수강하기 위해서는 디지탈 신호처리의 이해와 습득이 필수적이다.전선 / 대학원
말소리의 음향적 특성에 관한 이론을 학습하고, 이를 토대로 스펙트로그램을 판독하고, 음소 단위로 분절하고, 각 음소를 올바른 발음기호로 표기하는 능력을 함양한다. 또한 녹음 장비 및 음향 분석기 사용법과 실험 음성학 방법론을 학습하고, 이를 토대로 한국어와 영어를 비롯한 여러 언어의 발음을 과학적으로 연구할 수 있는 능력을 함양한다. 그리고 음성학적 지식을 어떻게 음성합성기와 음성인식기의 성능 향상에 기여할 수 있을지 모색한다.전필 / 학사
첨단융합학부 학생의 전공탐색을 위한 과목으로, 융합데이터과학의 핵심 개념과 다양한 응용 분야를 소개하여 향후 전공선택에 필요한 필수적인 정보를 제공한다. 특히, 융합데이터과학 분야에서 진행되는 첨단연구와 연구의 실제 응용 사례를 직접 체험하여, 자신의 전공 적성을 좀 더 구체적으로 알아보고 설계할 수 있는 기회를 제공한다.전선 / 대학원
데이터사이언스와 관련한 여러 분야의 최근의 국내외 연구동향을 소개한다. 강의와 세미나를 통하여 관련분야의 최신 방법론과 특정 주제를 심도 있게 습득할 수 있도록 한다.전선 / 대학원
본 강좌는 중국 언어학에서 논점이 되는 다양한 주제를 선정하여 체계적으로 고찰하는 것을 목표로 한다. 주제는 매학기 달라지며, 부제의 형태로 사전에 공지된다.전선 / 학사
연구실에서의 연구참여 활동을 통하여 전공 지식을 심화 학습한다. 각자가 원하는 연구에 참여하며 그 연구에 대한 직접적인 경험을 갖는다.전선 / 대학원
이 과목은 보건의료 영역에서 컴퓨터를 활용한 텍스트 분석을 다룬다. 보건의료 영역에는 여러 종류의 언어 자료가 존재한다. 사람들이 온라인 공간에서 여러 질병에 대해 던지는 질문들, 보건의료 전문가들의 연구들, 질병과 건강에 대한 신문기사들이 그 예다. 이들로부터 정보를 체계적이고 과학적으로 추출할 수 있다면, 보건의료에서 다양한 방식으로 활용할 수 있다. 최근 많이 사용되고 있는 컴퓨터를 활용한 텍스트 분석은 이런 작업에 새로운 가능성을 제시한다. 본 과목에서는 여러 가지 컴퓨터를 활용한 텍스트 분석 방법을 학습하고, 보건의료 영역 자료에 적용하는 것을 실습한다.전선 / 학사
프로그래밍 언어론에 대한 전반적인 이해를 높이고, 다양한 프로그래밍 언어를 익힌다. 이를 위해 프로그래밍 언어의 개념, 설계이론, 구현 방법에 대해 공부한다.전선 / 학사
인공신경망의 원리와 종류를 살펴보고 그 동작을 이해한다. 이를 기반으로 딥러닝 네트워크의 원리를 공부하고 설계하여 그 동작을 이론과 실습을 통해 이해한다. 또한 응용 분야에 따른 다양한 딥러닝 네트워크를 알아보고 학습과 검증 과정을 통해 설계 및 응용분야에 적용하는 예제를 공부한다.전선 / 학사
본 과목에서는 대용량의 텍스트를 분석하여 유의미한 결론을 도출하는 텍스트마이닝 기법에 대해 강의한다. Natural language processing, probabilistic topic model, text clustering, text categorization, contextual text mining 등, 텍스트마이닝 분야의 핵심 Keyword 및 기법에 대해 다룬다.전선 / 대학원
프로그래밍 언어 이론 및 응용기술의 기초를 강의한다. 프로그래밍 언어 의미구조, 요약해석, 타입시스템, 컴파일러 검증 및 검산, 자동증명 검증기, 프로그램 증명, 프로그램 정적분석 등을 다룬다.전선 / 대학원
음성언어 인터페이스는 인간과 컴퓨터의 상호작용에 가장 자연스러운 정보 교환 수단을 제공해준다. 음성언어처리는 이를 위한 음성인식, 음성합성 및 음성언어이해에 관련된 이론 및 기술을 가리키는 용어이다. 본 과목에서는 방대하며 학제적인 성격을 가지는 음성언어처리 분야를 이해하는데 필요한 기초이론을 체계적으로 제공하며, 또한 각종 소프트웨어 도구를 사용해서 실질적인 응용에 어떻게 기초이론들이 적용되는지를 보여준다.전선 / 대학원
이 강좌에서는 현 시점에서 본 반도체 소자의 각 세부 분야의 주요한 연구 주제에 대한 소개와 토의가 이뤄진다. 개설 학기에 따라 주제가 변하며, 이 강좌 내의 다른 주제에 대한 특강을 수강할 수 있다.전선 / 대학원
본 교과목은 데이터사이언스 대학원의 ABC(AI model/algorithm, Big data, Computing) 교육 과정 중 컴퓨팅(C) 분야 첫번째 강좌이다. 본 교과목의 전반부는 C++ 언어 프로그래밍과 C++ 기반 객체 지향 프로그래밍으로 이루어져 있다. (1) C++ 언어의 기초 문법, 클래스의 개념과 사용법, template과 중요한 라이브러리를 학습하고, (2) abstraction, inheritance, polymorphism 등 객체 지향 프로그래밍의 원리를 습득한 뒤, (3) 예제들을 통해 클래스 기반 객체 지향 프로그래밍을 C++ 언어를 사용하여 직접 구현 할 수 있도록 한다. 본 교과목의 후반부는 중급 자료 구조 및 알고리즘과 딥러닝 플랫폼으로 이루어져 있다. (1) 데이터사이언스를 위한 컴퓨팅의 기초 강좌에서 다루지 않은 자료구조 및 정렬 알고리즘 (Quick sort, Radix sort, heap sort), 트리 알고리즘, 그래프 알고리즘 (Dijkstra, Kruskal 등) 등을 습득하고, (2) 배운 자료 구조와 알고리즘들을 C++ 언어를 사용하여 직접 구현 할 수 있도록 한다. 또, (3) Pytorch, TensorFLow 등 널리 사용되는 딥러닝 플랫폼을 학습하고, 동일 학기 수강이 권장되는 머신러닝 및 딥러닝 1(ABC 과정 중 A 분야 첫번째 강좌)에서 배운 딥러닝의 기본 원리들을 직접 구현하고, 이에 더하여 상기 플랫폼을 통해 구현 할 수 있도록 한다.전선 / 대학원
시스템 성능평가의 주요 도구 중 하나인 stochastic process와 queueing theory를 배움으로써, 컴퓨터 및 통신공학자들이 시스템을 모델링하고 성능분석 하는데 잘 활용할 수 있도록 한다. 이 강의에서는 기본 확률이론과 다양한 종류의 Markov Process, 큐잉 시스템을 포함하고 게임이론과 최적화 이론의 기본 개념을 다룬다.교양 / 학사
최근 기술 발전에 힘입어 사회 전반적으로, 특히 일상생활 영역에서 AI가 급속히 확산하고 있다. 이에 본 교과목은 기술적 이해와 적용을 넘어 AI에 대한 사회과학적 이해를 제공하는 데 목적이 있다. 구체적으로, AI 기술이 구현한 미디어를 알고리듬 미디어로 규정하고 AI 미디어, AI 텍스트, AI와의 상호작용, 인간 및 사회에 대한 영향 등을 사회과학 이론들을 토대로 설명함으로써 현대 고도 기술 사회에서 인간과 사회에 대한 AI의 영향과 함의를 모색하고자 한다. 수강생들은 이 수업을 통해 AI라는 새로운 기술 변화에 대한 통합적, 체계적 이해를 갖게 될 것이다.전선 / 대학원
이 교과목은 '통사론연구 1'(108.520)의 교과목 내용을 기초로 이론의 확대적용 및 발전을 좀더 깊이 있게 모색한다.전선 / 대학원
기계학습은 다양한 분야에서 점차 큰 관심을 받고 있으나, 막상 실제 데이터에 적용하여 성공적인 결과를 도출하는 데에는 많은 어려움이 따른다. 본 과목은 기계학습 기법들을 실제 문제에 적용할 때에 중요한 데이터 전처리, 피쳐 추출, 차원 축소, 클래스 불균형, 모델 앙상블 등의 주제들을 다루고, 데이터로부터 모형과 종속성을 학습하는 원리와 기법들을 소개하는 바, 특히 확률, 통계 및 최적화 이론에 기반하여 신경망 (Neural Networks), 서포트 벡터 머신 (Support Vector Machines), 은닉 마르코프 모형 (Hidden Markov Models) 및 강화 학습 (Reinforcement Learning) 기법들을 공부한다. 또한, 이들 기법을 활용하여, 다양한 시계열 데이터들을 대상으로 예측 및 분류 모델을 구현하는 프로젝트들과 데이터 기반 학습의 사례 연구들이 포함된다.전선 / 학사
본 과목에서는 자연어 처리 분야의 최근 기술 발전과 이를 이해하기 위한 배경 지식 전반을 강의한다. Transformer model 기반 자연어 처리 기법을 주로 다루며, 이를 이해하기 위해 필요한 배경 지식(Embedding, Encoder-Decoder, Attention 등)을 다룬다. 실제 자연어 처리 문제를 해결하기 위해 Transformer를 수정/활용하는 프로젝트를 진행한다.