최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
Choi, Byoung Jin; Jeong, Myeonghun; Kim, Minchan; Kim, Nam Soo
2024 / IEEE Signal Processing Letters
데이터가 존재하지 않습니다.
loading...
본 논문에서는 제로샷 다화자 텍스트 음성 변환(ZSM-TTS)을 위해 가변 길이 참조 임베딩 시퀀스를 활용하는 새로운 화자 조건화 기법을 제안합니다. 기존 방법과 달리, 제안하는 방식은 전체 참조 음성을 나타내는 단일 고정 차원 벡터 대신 가변 길이 임베딩 시퀀스를 추출하여 보다 유연하고 효율적인 조건화를 가능하게 합니다. 실험 결과, 제안하는 방법은 화자 유사성, 음성 자연성 및 음성 명료도 측면에서 기존 방법보다 향상된 성능을 보였습니다.
Recent research towards advanced man-machine interface through spoken language
Automated speaking assessment : using language technologies to score spontaneous speech
Automatic speech analysis and recognition : proceedings of the NATO Advanced Study Institute held at Bonas, France, June 29-July 10, 1981
Springer handbook of speech processing
Data-driven techniques in speech synthesis
Audio and Speech Processing with MATLAB
Microphone arrays : signal processing techniques and applications
Progress in speech synthesis
Applied speech technology
Recent advances in speech understanding and dialog systems
Self-learning speaker identification : a system for enhanced speech recognition
Automated Speaking Assessment : Using Language Technologies to Score Spontaneous Speech.
Digital speech processing, synthesis, and recognition
Speech acoustics and phonetics
Advances in speech coding
Multilingual text-to-speech synthesis : the Bell Labs approach
Text-to-speech synthesis
Speech processing and synthesis toolboxes
Multilingual speech processing
Automatic speech and speaker recognition : advanced topics
IEEE Signal Processing Letters
Choi, Byoung Jin; Jeong, Myeonghun; Lee, Joun Yeop; Kim, Nam SooINTERSPEECH 2025
Park, Hyun Joon; Li, Jeongmin; Kim, Jin Sob; Yang, Jeong Yeol; Hang, Sung Won; Song, EunwooIEEE Signal Processing Letters
Wang, H.; Qiang, C.; Wang, T.; Wang, L.; Gong, C.2025 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)
Park, Nohil; Kim, Heeseung; Lee, Che Hyun; Choi, Jooyoung; Yeom, Jiheum; Yoon, SungrohIEEE Transactions on Neural Networks and Learning Systems
Lee, S.-H.; Choi, H.-Y.; Kim, S.-B.; Lee, S.-W.IEEE/ACM Transactions on Audio, Speech, and Language Processing
Neeraj Kumar; Ankur Narang; Brejesh LallApplied Acoustics
Song R.,Oh K.,Choi C.,Ku B.,Ko H.INTERNATIONAL CONFERENCE ON MACHINE LEARNING, VOL 162
Casanova, Edresson; Weber, Julian; Shulby, Christopher; Candido Junior, Arnaldo; Goelge, Eren; Ponti, Moacir Antonelli2024 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2024)
Mehta, Shivam; Tu, Ruibo; Beskow, Jonas; Szekely, Eva; Henter, Gustav Eje2021 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2021)
Weiss, Ron J.; Skerry-Ryan, R. J.; Battenberg, Eric; Mariooryad, Soroosh; Kingma, Diederik P.IEEE/ACM Transactions on Audio Speech and Language Processing
Kumar N.,Narang A.,Lall B.IEEE/ACM Transactions on Audio, Speech, and Language Processing, Audio, Speech, and Language Processing, IEEE/ACM Transactions on, IEEE/ACM Trans. Audio Speech Lang. Process.
Miao, C.; Zhu, Q.; Chen, M.; Ma, J.; Wang, S.; Xiao, J.IEEE Signal Processing Letters
Hyungchan Yoon; Changhwan Kim; Seyun Um; Hyun-Wook Yoon; Hong-Goo KangIEEE Journal of Selected Topics in Signal Processing, Selected Topics in Signal Processing, IEEE Journal of, IEEE J. Sel. Top. Signal Process.
Li, Y.A.; Han, C.; Mesgarani, N.IEEE Signal Processing Letters
Yoon H.,Kim C.,Um S.,Yoon H.W.,Kang H.G.Multimedia Tools and Applications
Al-Radhi M.S.,Csapó T.G.,Németh G.ICASSP 2025-2025 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, ICASSP
Yeom, Jiheum; Kim, Heeseung; Choi, Jooyoung; Lee, Che Hyun; Park, Nohil; Yoon, SungrohIEEE Signal Processing Letters
Lee, J.; Song, N.-S.; Chang, J.-H.IEEE/ACM Transactions on Audio Speech and Language Processing
Du C.,Guo Y.,Chen X.,Yu K.2021 IEEE SPOKEN LANGUAGE TECHNOLOGY WORKSHOP (SLT)
Guo, Haohan; Zhang, Shaofei; Soong, Frank K.; He, Lei; Xie, Lei전선 / 대학원
본 강의에서는 디지탈 음성처리의 이론과 그 응용에 대하여 고찰하는 것이 목적이다. 우선 음성신호의 통계적인 특성과 성질을 논하고 인간의 음성발생 원리를 설명한다. 또한 음성발생 원리에 근거한 선형 예측 부호화에 따른 이론적인 배경과 해법을 설명한다. 한편 음성합성, 음성인식의 원리와 이론을 고찰하고 최근 발표되고 있는 논문들을 중심으로 여러 알고리듬을 살펴보고 이의 장단점을 비교, 분석 하도록 한다. 본 강의를 수강하기 위해서는 디지탈 신호처리의 이해와 습득이 필수적이다.전선 / 대학원
본 교과목은 오늘날 인공지능의 중심을 이루는 거대언어모델(Large Language Models)과 이를 기반으로 한 대화형 인공지능을 다룬다. 특히 거대언어모델의 학습부터 응용까지 이어지는 전체 파이프라인을 아래와 같이 체계적으로 다룬다. (1) Pre-training: 지식 습득을 위한 사전학습(Transformer, BERT, GPTs) (2) Supervised Fine-tuning: 상호작용 학습(Dialogue Fine-tuning, Instruction Tuning, Reasoning) (3) Alignment: 인간 가치와의 정렬(RLHF, DPO, KTO 등) 및 언어모델 해석 기법(AI Psychometrics, Mechanistic Interpretability) (4) Grounding: 외부 데이터 및 도구 활용 기법(페르소나, 문서, 이미지, 지식 그래프, 도구 증강 에이전트) (5) Applications: 다양한 도메인으로의 응용(대화 시뮬레이션 및 심리상담·교육·설득 응용) 수업에서는 각 연구 주제별로 핵심 논문들의 아이디어, 데이터, 방법론 등을 강의한다. 실습으로는 언어모델 학습, 언어모델 API를 이용한 대화 시스템 구현, 대화형 인공지능과 관련된 작은 연구 프로젝트를 수행한다. 이 과목을 통해 수강생들은 거대언어모델 연구 동향을 큰 틀에서 파악하고, 핵심적인 연구 주제들과 방법론을 이해하며, 이를 실제 연구에 적용하는 능력을 기르게 된다.전선 / 대학원
본 강좌는 중국 언어학에서 논점이 되는 다양한 주제를 선정하여 체계적으로 고찰하는 것을 목표로 한다. 주제는 매학기 달라지며, 부제의 형태로 사전에 공지된다.전선 / 대학원
말소리의 음향적 특성에 관한 이론을 학습하고, 이를 토대로 스펙트로그램을 판독하고, 음소 단위로 분절하고, 각 음소를 올바른 발음기호로 표기하는 능력을 함양한다. 또한 녹음 장비 및 음향 분석기 사용법과 실험 음성학 방법론을 학습하고, 이를 토대로 한국어와 영어를 비롯한 여러 언어의 발음을 과학적으로 연구할 수 있는 능력을 함양한다. 그리고 음성학적 지식을 어떻게 음성합성기와 음성인식기의 성능 향상에 기여할 수 있을지 모색한다.전필 / 대학원
인공지능(AI) 기반 교육을 현장에서 적용하기 위해선, AI융합전공 수강생들은 인공지능(AI)을 교과 수업 상황에 융합하여, 수업을 설계하고 실행할 수 있는 역량이 요구된다. 이 강의는 AI융합전공 수강생들이 인공지능(AI) 자체에 대한 수업과, 인공지능(AI) 학습도구를 활용한 인공지능(AI)-교과 융합수업을 설계하고, 실행할 수 있는 역량을 갖추는 것을 목적으로 한다. 이를 위해 AI융합전공 수강생들은 먼저, 인공지능(AI) 자체에 대한 수업 설계 역량을 기른다. 그리고 실제적이고 집중적인 교육을 통해, 이 교과목은 수강생들의 인공지능 교과 융합 수업을 설계하고 실행하는 역량 증진시킬 것이다.전선 / 대학원
이 강좌에서는 외국어로서의 한국어교육의 교육과정과 관련된 여러 요인들과 각 요인들의 상호작용, 그리고 한국어교육과정 개발과 운영 등에 대하여 심도 있는 탐구를 진행하게 된다. 특히 한국어 교육내용의 선정과 위계화, 내용 체계의 조직 의 원리 등을 언어 요인, 문화 요인과 결부시켜 집중적으로 논구하게 된다.전선 / 대학원
이 강좌에서는 현 시점에서 본 반도체 소자의 각 세부 분야의 주요한 연구 주제에 대한 소개와 토의가 이뤄진다. 개설 학기에 따라 주제가 변하며, 이 강좌 내의 다른 주제에 대한 특강을 수강할 수 있다.전선 / 학사
프로그래밍 언어론에 대한 전반적인 이해를 높이고, 다양한 프로그래밍 언어를 익힌다. 이를 위해 프로그래밍 언어의 개념, 설계이론, 구현 방법에 대해 공부한다.전선 / 대학원
이 과목은 대규모 언어모델(Large Language Model; 이하 LLM)이 언어 연구 방법론에 가져온 주요 변화를 중심으로 자연어처리의 이론적 기반과 방법론을 학습하고, LLM의 본질적 특성을 이해함으로써 LLM을 활용한 새로운 언어 연구 방법을 탐색하는 것을 목적으로 한다. 이를 위해 프롬프트 학습, 파인튜닝, 다언어 모델, 텍스트 생성 및 멀티모달 모델 등 최신 자연어처리 기술을 살피고, 구문, 의미, 담화, 정서 분석 등 언어학의 주요 연구 영역을 전통적 접근과 LLM 기반 접근으로 비교한다. 또한, LLM의 언어능력, 의미 이해, 화용론적 한계에 관한 학문적 논쟁을 검토하여 언어 연구에서의 가능성과 제약을 비판적으로 고찰한다. 이를 통해 LLM 시대에 적합한 새로운 언어 연구 방법론을 습득하고, 인간의 언어 능력과 기계의 언어 처리의 차이에 대해 성찰할 수 있는 소양을 기를 수 있다.전선 / 대학원
오늘날 프랑스어교수법은 실천으로부터 경험적으로 확인된 고유한 문제론에 입각하여 이론을 정립함으로써 하나의 독립된 학문분야로서, 과학으로서 그 특수성을 인정받고 있다. 프랑스어교수법의 이러한 지위는 다른 학문들로부터 고립되어 이루어진 것이 아니다. 본 교과목은 언어학, 사회언어학, 심리언어학 등의 응용언어학이 프랑스어교수법과 어떻게 연관관계를 맺고 있는지 심도 있게 탐구하고 응용언어학의 연구결과를 프랑스어교육의 이론과 실제에 적용해보도록 한다.전선 / 대학원
이 과목은 언어사용에서 나타나는 다양한 변이들, 즉 장면이나 상황에 따라 나타나는 상황적 변이나 기능적 변이를 주목하고, 이러한 변이 중에서 특히 사회적 변이와 상황적 변이, 즉 사회적 패턴을 이루는 언어변이형태와 다른 사회적 행동과의 관계를 규명하고 해석하는 것을 목표로 한다. 이 강의는 세미나의 형식으로 진행된다.전선 / 대학원
음파의 생성, 투과, 흡수, 방사 등에 대한 기본 이론들을 단순한 모델을 통하여 설명하고, 이러한 이론들을 음향 및 소음 공학의 여러 가지 중요한 분야에 응용할 수 있는 능력을 개발하는데 목적이 있다. 이를 위하여 학생들에게 그 기본 개념, 용어, 그리고 음향공학적인 문제들을 다룰 수 있는 해석 방법들을 소개한다.전선 / 대학원
본 강좌는 중국어학 연구의 다양한 이론과 실제를 섭렵하기 위해 개설되었다. 통시적으로는 전통시기 한자문화권에서 활용된 연구방법론부터 근대적인 연구방법론을 다루며, 지역적으로는 중국과 대만, 홍콩과 같은 중화권 및 우리나라, 일본 그리고 근대 이후 중국학 연구의 주요 거점으로 성장한 영국과 미국, 프랑스 등지의 연구방법론을 다룬다. 다만 상술한 범위는 그 양과 깊이가 상당하므로, 실제 강좌는 중국어학연구방법론에서 주요 논점이 되는 다양한 주제를 선정하여, 이를 매개로 중국어학연구방법론에 대한 체계적인 안목과 깊은 통찰력 및 응용력을 배양하는 방식으로 진행된다. 따라서 주제는 매 학기 달라지며, 부제의 형태로 사전에 공지된다. 강의형태는 부제에 따라 세부 주제에 대한 토론과 세미나, 연구논저의 강독과 비판적 읽기 및 에세이 작성 등의 방식을 선별적으로 운용한다.전선 / 학사
본 강의는 현대통사이론의 기초 개념과 주요 이슈를 세미나 형식으로 다루는 학부 수업이다. 문법 구성 체계, 구 구조, 논항 구조, 구조와 형태의 관계, 장거리 의존관계와 일치 현상, 이동과 의미해석 등 통사론의 주요 논제들을 최소주의 통사론의 관점에서 심도 있게 다룬다. 본 수업을 통해서 학생들이 현대통사이론의 기초를 탄탄히 쌓고 학습한 이론을 여러 언어의 통사 현상에 적용하고 분석하는 방법을 익히는 것을 목표로 한다.전선 / 학사
연구실에서의 연구참여 활동을 통하여 전공 지식을 심화 학습한다. 각자가 원하는 연구에 참여하며 그 연구에 대한 직접적인 경험을 갖는다.전선 / 학사
응용언어학의 한 분야인 담화분석에 대해 소개하고 대화분석, 상호작용적 사회언어학, 비판적 담화분석 등 담화분석의 제반 이론 및 분석방법론을 살펴본다. 아울러 이들 방법론을 이용하여 다양한 장르의 영어 담화를 분석해 봄으로써 구체적 상황 맥락에서의 영어의 사용에 대한 이해를 돕고 언어의 기능을 분석하는 능력을 높인다.전선 / 대학원
데이터사이언스와 관련한 여러 분야의 최근의 국내외 연구동향을 소개한다. 강의와 세미나를 통하여 관련분야의 최신 방법론과 특정 주제를 심도 있게 습득할 수 있도록 한다.전선 / 학사
이 강좌에서는 음성학적 지식이 어떤 분야에서 응용될 수 있는지 논의된다. 최근 들어 활발하게 논의되고 있는 한국어와 영어 표준발음 교육과 관련된 언어교수법, 언어활동의 장애(예를 들어 실어증과 같은) 요인과 그 치료를 연구하는 언어 치료 방법론 모색이 주요 강의 내용이 되며, 이밖에도 언어정책이나 음성정보처리 분야에서 음성학적 지식을 어떻게 응용할 수 있는지 모색한다.전선 / 학사
본 교과목은 인공지능 기반 혹은 컴퓨터 지원 교육이 활발한 현 상황에 맞춰 각 교과의 교육에 자연어처리를 활용할 수 있도록 자연어처리와 관련분야의 중요한 기본 개념과 이론을 소개한다. 특히 본 교과목은 자연어처리뿐만 아니라, 철학적 배경과 함께 음성처리, 인공지능, 언어학, 교육 등 다양한 분야를 융합하여 통합적인 관점에서 자연어처리를 소개한다. 또한, 본 교과목에서는 자연어처리에 가장 많이 쓰이는 프로그래밍 언어인 파이썬과 자연어처리 관련 기초 코딩 예제, 딥러닝 기본 예제 등을 구글 코랩 등을 통해 실습함으로써 향후 학생의 목적에 따라 기술을 사용할 수 있는 기반을 형성하는데 목표를 둔다.전선 / 대학원
본 과정은 선형 시스템, 전달 함수, 라플라스 변환에 대하여 소개한다. 안정성과 피드백을 다루고 과도 응답 사양을 위한 기본 설계 도구를 제공한다. 또한 주파수 영역 기술도 간략하게 다룬다. 이 과정에는 컴퓨터 프로그래밍 실습 및 제어 설계 프로젝트가 포함된다. 실습 프로젝트에 관련된 전공은 조선해양공학은 물론 로봇공학, 기계공학, 전자공학, 전기공학, 산업응용수학 등이다.