최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
Mun, Sung Hwan; Shim, Hye-Jin; Tak, Hemlata; Wang, Xin; Liu, Xuechen; Sahidullah, Md; Jeong, Myeonghun; Han, Min Hyun; Todisco, Massimiliano; Lee, Kong Aik; Yamagishi, Junichi; Evans, Nicholas; Kinnunen, Tomi; Kim, Nam Soo; Jung, Jee-Weon
2023 / Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH
데이터가 존재하지 않습니다.
loading...
본 연구는 스푸핑에 강인한 단일 통합 스피커 검증(SASV) 임베딩을 개발하는 것을 목표로 하며, 비대상 화자의 입력과 대상 화자의 위조 입력을 모두 거부하고, 자동 스피커 검증(ASV) 및 대항 측정(CM) 임베딩의 융합 성능을 능가하는 것을 목표로 합니다. 이를 위해 다단계 훈련과 손실 함수 조합을 포함하는 새로운 프레임워크를 제안하고, 복사 합성 및 다양한 음성 코덱을 활용하여 위조 데이터 부족 문제를 해결했습니다.
Automatic speech and speaker recognition : advanced topics
Microphone arrays : signal processing techniques and applications
Robustness in automatic speech recognition : fundamentals and applications
Syntactic and structural pattern recognition
Speech enhancement : theory and practice
Recent advances in speech understanding and dialog systems
Incorporating knowledge sources into statistical speech recognition
Computational auditory scene analysis
Automatic speech analysis and recognition : proceedings of the NATO Advanced Study Institute held at Bonas, France, June 29-July 10, 1981
Prosody in speech understanding systems
Automatic speech recognition : the development of the SPHINX system
Bandwidth extension of speech signals
VLSI artificial neural networks engineering
Signal processing and its applications
Speech enhancement
Audio signal processing for next-generation multimedia communication systems
Principles and theory for data mining and machine learning
Audio- and video-based biometric person authentication : first International Conference, AVBPA '97, Crans-Montana, Switzerland, March 12-14, 1997 : proceedings
Speechreading by humans and machines : models, systems, and applications
Self-learning speaker identification : a system for enhanced speech recognition
IEEE Transactions on Information Forensics and Security
Gomez-Alanis A.,Gonzalez-Lopez J.A.,Dubagunta S.P.,Peinado A.M.,Magimai.-Doss M.Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH
Lee, Jin Woo; Kim, Eungbeom; Koo, Junghyun; Lee, KyoguInternational Journal of Speech Technology
Kumar A.K.,Paul D.,Pal M.,Sahidullah M.,Saha G.Computer Speech and Language
Sinha, S.; Dey, S.; Saha, G.IEEE Journal of Selected Topics in Signal Processing, Selected Topics in Signal Processing, IEEE Journal of, IEEE J. Sel. Top. Signal Process.
Wu, Z.; Yamagishi, J.; Kinnunen, T.; Hanilci, C.; Sahidullah, M.; Sizov, A.; Evans, N.; Todisco, M.; Delgado, H.IEEE Access
Grinberg P.,Shikhov V.한국데이터정보과학회지
강태인, 곽일엽Circuits, Systems, and Signal Processing
Zhao Y.,Togneri R.,Sreeram V.Computer Speech and Language
Wang X.,Yamagishi J.,Todisco M.,Delgado H.,Nautsch A.,Evans N.,Sahidullah M.,Vestman V.,Kinnunen T.,Lee K.A.,Juvela L.,Alku P.,Peng Y.H.,Hwang H.T.,Tsao Y.,Wang H.M.,Maguer S.L.,Becker M.,Henderson F.,Clark R.,Zhang Y.,Wang Q.,Jia Y.,Onuma K.,Mushika K.,Kaneda T.,Jiang Y.,Liu L.J.,Wu Y.C.,Huang W.C.,Toda T.,Tanaka K.,Kameoka H.,Steiner I.,Matrouf D.,Bonastre J.F.,Govender A.,Ronanki S.,Zhang J.X.,Ling Z.H.Expert Systems with Applications
Javed A.,Malik K.M.,Malik H.,Irtaza A.Multimedia Tools and Applications
Janicki, A.Artificial Intelligence Review
Khan A.,Malik K.M.,Ryan J.,Saravanan M.IEEE/ACM Transactions on Audio Speech and Language Processing
Kinnunen T.,Delgado H.,Evans N.,Lee K.A.,Vestman V.,Nautsch A.,Todisco M.,Wang X.,Sahidullah M.,Yamagishi J.,Reynolds D.A.Circuits, Systems, and Signal Processing
Rostami A.M.,Homayounpour M.M.,Nickabadi A.Computer Speech and Language
Mirza, A.R.; Al-Talabani, A.K.Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH
Kang, Woo Hyun; Kim, Nam SooINTERSPEECH 2021
Wang, Xin; Yamagishi, JunichiINTERSPEECH 2021
Zhang, Yuxiang; Wang, Wenchao; Zhang, PengyuanINTERSPEECH 2019
Kinnunen, Tomi H.; Lee, Kong Aik; Todisco, Massimiliano; Wang, Xin; Vestman, Ville; Sahidullah, Md; Delgado, Hector; Nautsch, Andreas; Yamagishi, Junichi; Evans, NicholasPROCEEDINGS OF THE 30TH ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA, MM 2022
Sheikh, Shakeel A.; Sahidullah, Md; Ouni, Slim; Hirsch, Fabrice전선 / 학사
연구실에서의 연구참여 활동을 통하여 전공 지식을 심화 학습한다. 각자가 원하는 연구에 참여하며 그 연구에 대한 직접적인 경험을 갖는다.전선 / 대학원
이 교과목에서는 음성언어처리, 특히 연속음성인식 및 대화처리를 위하여 필요한 기초이론에 대해서 배운다. 구체적으로는 대용량 연속음성 인식을 위한 대표적인 기법인 Hidden Markov Model의 기초 이론 및 주요 구성 요소인 음향 모델, 어휘 모델, 언어 모델과 탐색 방법에 대해서 배우며, 언어학과 공학의 학제적 성격을 가지는 낭독체 및 대화체 연속음성인식과 대화처리를 위한 언어학 이론의 적용 방법에 대하여 배운다.전선 / 대학원
기계학습은 다양한 분야에서 점차 큰 관심을 받고 있으나, 막상 실제 데이터에 적용하여 성공적인 결과를 도출하는 데에는 많은 어려움이 따른다. 본 과목은 기계학습 기법들을 실제 문제에 적용할 때에 중요한 데이터 전처리, 피쳐 추출, 차원 축소, 클래스 불균형, 모델 앙상블 등의 주제들을 다루고, 데이터로부터 모형과 종속성을 학습하는 원리와 기법들을 소개하는 바, 특히 확률, 통계 및 최적화 이론에 기반하여 신경망 (Neural Networks), 서포트 벡터 머신 (Support Vector Machines), 은닉 마르코프 모형 (Hidden Markov Models) 및 강화 학습 (Reinforcement Learning) 기법들을 공부한다. 또한, 이들 기법을 활용하여, 다양한 시계열 데이터들을 대상으로 예측 및 분류 모델을 구현하는 프로젝트들과 데이터 기반 학습의 사례 연구들이 포함된다.전선 / 대학원
본 강의에서는 디지탈 음성처리의 이론과 그 응용에 대하여 고찰하는 것이 목적이다. 우선 음성신호의 통계적인 특성과 성질을 논하고 인간의 음성발생 원리를 설명한다. 또한 음성발생 원리에 근거한 선형 예측 부호화에 따른 이론적인 배경과 해법을 설명한다. 한편 음성합성, 음성인식의 원리와 이론을 고찰하고 최근 발표되고 있는 논문들을 중심으로 여러 알고리듬을 살펴보고 이의 장단점을 비교, 분석 하도록 한다. 본 강의를 수강하기 위해서는 디지탈 신호처리의 이해와 습득이 필수적이다.전선 / 대학원
본 교과목은 오늘날 인공지능의 중심을 이루는 거대언어모델(Large Language Models)과 이를 기반으로 한 대화형 인공지능을 다룬다. 특히 거대언어모델의 학습부터 응용까지 이어지는 전체 파이프라인을 아래와 같이 체계적으로 다룬다. (1) Pre-training: 지식 습득을 위한 사전학습(Transformer, BERT, GPTs) (2) Supervised Fine-tuning: 상호작용 학습(Dialogue Fine-tuning, Instruction Tuning, Reasoning) (3) Alignment: 인간 가치와의 정렬(RLHF, DPO, KTO 등) 및 언어모델 해석 기법(AI Psychometrics, Mechanistic Interpretability) (4) Grounding: 외부 데이터 및 도구 활용 기법(페르소나, 문서, 이미지, 지식 그래프, 도구 증강 에이전트) (5) Applications: 다양한 도메인으로의 응용(대화 시뮬레이션 및 심리상담·교육·설득 응용) 수업에서는 각 연구 주제별로 핵심 논문들의 아이디어, 데이터, 방법론 등을 강의한다. 실습으로는 언어모델 학습, 언어모델 API를 이용한 대화 시스템 구현, 대화형 인공지능과 관련된 작은 연구 프로젝트를 수행한다. 이 과목을 통해 수강생들은 거대언어모델 연구 동향을 큰 틀에서 파악하고, 핵심적인 연구 주제들과 방법론을 이해하며, 이를 실제 연구에 적용하는 능력을 기르게 된다.전선 / 학사
인공지능 기술의 발달로 외국어교육 연구에서도 많은 혁신이 요구된다. 본 강의에서는 인공지능 기술을 언어교육에 활용하는 방안을 모색해 본다. 구체적으로, 본 과목은 언어 학습자 및 언어 교육 맥락에 대한 이해를 바탕으로 다양한 언어 교육 목적의 테크놀로지를 활용하여 언어를 교수하고 평가하는 방법을 익히는 것을 목적으로 한다. 이를 위해 언어입력, 출력, 상호작용, 피드백과 같이 언어교육 및 발달과 관련한 주요 개념을 익히고, 다양한 인공지능 도구를 활용하고 적용해 본다.전필 / 학사
첨단융합학부 학생의 전공탐색을 위한 과목으로, 융합데이터과학의 핵심 개념과 다양한 응용 분야를 소개하여 향후 전공선택에 필요한 필수적인 정보를 제공한다. 특히, 융합데이터과학 분야에서 진행되는 첨단연구와 연구의 실제 응용 사례를 직접 체험하여, 자신의 전공 적성을 좀 더 구체적으로 알아보고 설계할 수 있는 기회를 제공한다.전선 / 학사
4차 산업혁명 시대의 출현과 동시에 바이오 및 의료산업 분야의 혁신적인 성장이 일어나고 있다. 특히 의학 전공자들의 아이디어와 연구결과가 창업으로 이어지면서 미래를 선도할 의료빅데이터 기반 유니콘 기업들이 생겨나고 새로운 일자리를 창출하고 있다. 또한, 바이오헬스산업은 현 정부의 차세대 성장동력으로 선정되어 K-Bio 산업의 발전을 주도하고 있다. 본 강좌는 수의대 학생들을 대상으로 4차 산업 기반의 혁신과 기업가 정신의 함양과 함께 미래를 선도할 창의적이고 도전적인 수의대 인재 양성을 목표로 한다.전선 / 대학원
본 교과목은 불어교육에 있어서 기존의 교육보조재들의 문제점들을 살펴봄으로써 멀티미디어를 활용한 교수방법의 가능성을 살펴보는 것을 목적으로 한다. 이를 위하여 컴퓨터 등 다양한 멀티미디어 교육보조재의 활용가능성을 심도있게 다루게 된다.전선 / 대학원
현대 교육철학의 여러 이론들에서 발견되는 비판적 논점들에 대한 분석이 주된 관심사이다. 특히 이 비판적 논점들을 다룰 수 있기 위해서 요구되는 현대 교육철학 문헌들(Dewey, Peters, Oakeshott 등)에 대한 독서가 있어야 하며, 각각의 논점들을 나름대로 구조화하여 교육을 보는 체계적인 철학적 관점을 구성하는 데 도움이 되도록 해야 한다. 현대 교육철학의 입문서들에 대한 사전 지식을 필요로 하는 강의이다.전필 / 대학원
인공지능(AI) 기반 교육을 현장에서 적용하기 위해선, AI융합전공 수강생들은 인공지능(AI)을 교과 수업 상황에 융합하여, 수업을 설계하고 실행할 수 있는 역량이 요구된다. 이 강의는 AI융합전공 수강생들이 인공지능(AI) 자체에 대한 수업과, 인공지능(AI) 학습도구를 활용한 인공지능(AI)-교과 융합수업을 설계하고, 실행할 수 있는 역량을 갖추는 것을 목적으로 한다. 이를 위해 AI융합전공 수강생들은 먼저, 인공지능(AI) 자체에 대한 수업 설계 역량을 기른다. 그리고 실제적이고 집중적인 교육을 통해, 이 교과목은 수강생들의 인공지능 교과 융합 수업을 설계하고 실행하는 역량 증진시킬 것이다.전선 / 대학원
디자인 연구의 기본이 되는 논문의 개념 및 기본 연구 설계 방법을 학습하고 실습한다. 디자인 자료 수집의 기초가 되는 설문지 및 인터뷰 시나리오 구성, 자료 수집 방법 및 전략, 연구 대상 설정 등의 연구 설계의 기초 과정을 이해하여, 연구 설계를 할 수 있는 능력을 배양한다. 또한 본인 연구주제와 관련된 선행 연구 분석을 통해, 연구논문계획서를 작성하여, 디자인 연구 진행의 기초가 될 수 있도록 한다.전선 / 대학원
본 교과목은 단순히 기존의 가속기를 활용하는 수준을 넘어, 차세대 AI 반도체 분야의 창업 및 핵심 개발에 필요한 맞춤형 AI 추론 엔진 개발 능력을 배양하는 것을 목표로 한다. 이를 위해 최첨단 설계 방법론인‘알고리즘-소프트웨어-하드웨어 통합 설계(Co-design)'에 대한 깊이 있는 이론과 실전 경험을 제공한다. 수강생들은 GPU와 같은 범용 하드웨어의 한계를 이해하고, 특정 LLM 알고리즘에 최적화된 하드웨어를 직접 설계함으로써 전력, 비용, 속도 측면에서 압도적인 경쟁력을 갖춘 엣지 AI 솔루션을 구현하는 방법을 학습한다. 특히, 최신 경량화 기술인 저비트 양자화(Low-bit Quantization) 기법을 알고리즘 단계에서 적용하고, 이를 C++ 기반의 고수준 합성(High-Level Synthesis, HLS)을 통해 FPGA 상에 하드웨어 로직으로 구현하는 전 과정을 실습한다. 최종적으로는 SoC(System on Chip) 환경에서 프로세서(PS)와 프로그래머블 로직(PL)을 연동하여 완전한 LLM 추론 가속 시스템을 구축하는 프로젝트를 통해, 아이디어를 실제 하드웨어 프로토타입으로 구현하는 역량을 완성한다.전선 / 대학원
아시아 연구 데이터 분석은 아시아 전역의 사회문화적 역학 연구를 위해 데이터 집약적 기법과 인문학적 해석을 연결하는 학제적 방법으로서 문화 분석을 소개한다. 이 강의는 문화 분석을 단순한 방법론적 틀이 아닌, 컴퓨터적 접근 방식과 해석적 실천을 연결하는 구체적인 방식으로 다룬다. 이를 통해 인문학과 사회과학을 특징짓는 상호텍스트성, 심층적인 역사적 맥락, 그리고 상황적 발화를 전면에 부각시킨다. 경험적으로, 이 과정은 텍스트, 시각, 청각의 세 가지 탐구 영역을 아우르며, 컴퓨터 도구를 활용하여 민족주의, 카스트와 같은 사회적 응집력, 그리고 언어, 지역, 젠더, 계급 등 사회학적 지표 전반에 걸친 다양한 변이와 같은 강력한 사상의 궤적을 추적한다.전선 / 학사
본 강좌는 예비영어교사들에게 <컴퓨터를 활용한 언어학습 (CALL)>의 원리를 중등학교 영어교육방법의 실제에 활용하는 기회를 제공한다. 학생들은 영어교육 공학기법을 탐구하여, 영어교육방법의 기본적 바탕을 익힌다.전선 / 대학원
본 강좌는 중국 언어학에서 논점이 되는 다양한 주제를 선정하여 체계적으로 고찰하는 것을 목표로 한다. 주제는 매학기 달라지며, 부제의 형태로 사전에 공지된다.전선 / 학사
프로그래밍 언어론에 대한 전반적인 이해를 높이고, 다양한 프로그래밍 언어를 익힌다. 이를 위해 프로그래밍 언어의 개념, 설계이론, 구현 방법에 대해 공부한다.전선 / 대학원
이 교과목은 대학원생들을 대상으로, 현재 사용되고 있는 최신 암호 알고리즘을 설명한다. 이 과목은 다음과 같이 두 부분으로 구성된다: 첫째, DES, IDEA, RC5, RC6 와 같은 블록 암호 알고리즘들을 각각 키(key) 생성, 암호화, 복호화 하는 과정으로 설명한다. 둘째, 전자 서명에 근거한 다양한 인증 기법을 소개한다. DMDC, MD5, SHA-1, HMAC 와 같은 다양한 해쉬(hash) 함수를 사용하여 문장을 축약하고 인증하는 방식을 제시한다.전선 / 학사
이 과목은 다중언어·다문화 사회에서 나타나는 한국언어문화 현상과 (한)국어 교육이 실천되는 다양한 맥락을 이해하고, 학습자 배경·정체성·언어권 문제를 고려한 (한)국어 교육의 체계적 접근법을 탐색하는 것을 목적으로 한다. 이를 위해 언어와 사회·문화의 관계를 다루는 사회언어학적 관점을 토대로, 양층/다층언어현상, 코드스위칭, 트랜스랭귀징 등의 다중언어 현상의 실제와 이론적 쟁점을 분석하고 논의한다. 또한, 국내 제2언어로서의 (한)국어(KSL) 교육과 국외 계승어로서의 (한)국어(KHL) 교육의 다중언어·다문화 풍경의 특징과 이에 따른 교육 내용 및 방법, 언어교육 정책 등을 비교·분석한다. 이를 통해 다중언어현상과 다문화주의 개념, 제2언어·계승어 교육의 언어학습 및 사회문화 특징을 이해하고 그 특징에 맞는 교육과정, 교육자료 개발 설계 등을 실천할 수 있는 역량을 함양한다.전선 / 대학원
이 강좌에서는 현 시점에서 본 반도체 소자의 각 세부 분야의 주요한 연구 주제에 대한 소개와 토의가 이뤄진다. 개설 학기에 따라 주제가 변하며, 이 강좌 내의 다른 주제에 대한 특강을 수강할 수 있다.