최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
Lee H.W.,Choi T.Y.,Lee M.S.,Lee J.A.,Jun J.H.,Choi J.,Ang L.,Lee C.H.,Lee J.M.,Park K.S.,Kim D.C.,Jang S.R.,Yoo J.E.,Kim D.i.,Cho S.H.,Yang S.J.,Lee I.S.,Ahn I.S.,Lee D.N.,Choi C.M.,Song M.H.,Kim E.
2021 / Integrative Medicine Research
Liu, R.; Hu, Y.; Zuo, H.; Luo, Z.; Wang, L.; Gao, G.
2024 / IEEE/ACM Transactions on Audio, Speech, and Language Processing, Audio, Speech, and Language Processing, IEEE/ACM Transactions on, IEEE/ACM Trans. Audio Speech Lang. Process.
데이터가 존재하지 않습니다.
loading...
본 연구는 저자원 교착어의 텍스트 음성 변환(TTS) 성능 향상을 위해 형태소 정보를 활용한 언어 모델 사전 훈련 방법을 제안합니다. 대규모 비지도 텍스트 데이터를 활용하여 BERT 기반 언어 모델을 사전 훈련하고, 이를 통해 TTS 모델의 입력 텍스트에서 심층적인 언어 정보를 추출하여 합성 음성의 자연스러움을 개선합니다. 실험 결과, 제안하는 MAM-BERT 모델이 다양한 TTS 모델에서 효과적인 성능 향상을 보였으며, 특히 저자원 환경에서 유용함을 확인했습니다.
Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition
Data-driven techniques in speech synthesis
핸즈온 LLM : 프롬프트 엔지니어링부터 임베딩, 시맨틱 검색, 미세 튜닝까지, 손에 잡히는 LLM 개념
Linguistic structure prediction
구글 BERT의 정석 : 인공지능, 자연어 처리를 위한 BERT의 모든 것
Native listening : language experience and the recognition of spoken words
Spoken language processing : a guide to theory, algorithm, and system development
인공지능 구조 원리 교과서: 개발자와 프로젝트 매니저를 위한 AI 수업, 머신러닝·딥러닝·CNN·RNN·LLM 메커니즘 해설
Recent advances in speech understanding and dialog systems
Topic detection and tracking : event-based information organization
Progress in speech synthesis
Machine translation and the information soup : third Conference of the Association for Machine Translation in the Americas, AMTA'98, Langhorne, PA, USA, October 1998, proceedings
Aspects of automated natural language generation : 6th International Workshop on Natural Language Generation, Trento, Italy, April 5-7, 1992 : proceedings
The open handbook of linguistic data management
Springer handbook of speech processing
마스터링 트랜스포머 : BERT에서 LLM, 스테이블 디퓨전까지, Transformers 라이브러리와 함께하는 트랜스포머 탐구
Text, speech and dialogue : Second International Workshop, TSD'99, Plzen, Czech Republic, September 13-17, 1999 : proceedings
English prosodic morphology
Computational linguistics and intelligent text processing : 7th international conference, CICLing 2006, Mexico City, Mexico, February 19-25, 2006 : proceedings
Mathematical foundations of speech and language processing
IEEE Signal Processing Letters
Wei Zhao; Zuyi Wang; Li XuIEEE Signal Processing Letters
Zhao W.,Wang Z.,Xu L.IEEE/ACM Transactions on Audio Speech and Language Processing
Xue L.,Soong F.K.,Zhang S.,Xie L.IEEE/ACM Transactions on Audio, Speech, and Language Processing
Jeong, Myeonghun; Kim, Minchan; Choi, Byoung Jin; Yoon, Jaesam; Jang, Won; Kim, Nam SooIEEE/ACM Transactions on Audio, Speech, and Language Processing, Audio, Speech, and Language Processing, IEEE/ACM Transactions on, IEEE/ACM Trans. Audio Speech Lang. Process.
Saeki, T.; Maiti, S.; Li, X.; Watanabe, S.; Takamichi, S.; Saruwatari, H.IEEE Transactions on Computational Social Systems, Computational Social Systems, IEEE Transactions on, IEEE Trans. Comput. Soc. Syst.
Liang, Y.; Lv, H.; Li, Y.; Duo, L.; Liu, C.; Zhou, Q.IEEE Transactions on Computational Social Systems
Yatao Liang; Hui Lv; Yan Li; La Duo; Chuanyi Liu; Qingguo ZhouIEICE Transactions on Information and Systems
Xin Wang; Junichi Yamagishi; Shinji TakakiArtificial Intelligence Review
Kaur N.,Singh P.PROCEEDINGS OF THE 2020 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING (EMNLP)
Vulie, Ivan; Ponti, Edoardo M.; Litschko, Robert; Glava, Goran; Korhonen, Anna2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING
Huang, Yinghui; Kuo, Hong-Kwang; Thomas, Samuel; Kons, Zvi; Audhkhasi, Kartik; Kingsbury, Brian; Hoory, Ron; Picheny, Michael58TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (ACL 2020)
Cohan, Arman; Feldman, Sergey; Beltagy, Iz; Downey, Doug; Weld, Daniel S.IEEE Journal of Selected Topics in Signal Processing, Selected Topics in Signal Processing, IEEE Journal of, IEEE J. Sel. Top. Signal Process.
Li, Y.A.; Han, C.; Mesgarani, N.Junichi YAMAGISHI; Shinji TAKAKI; Xin WANG
인문언어
지인영, 김희동정보과학회 컴퓨팅의 실제 논문지
서수민, 김남규말소리
이근배, 김병창IEEE/ACM Transactions on Audio Speech and Language Processing
Huang S.F.,Lin C.J.,Liu D.R.,Chen Y.C.,Lee H.Y.IEEE/ACM Transactions on Audio, Speech, and Language Processing, Audio, Speech, and Language Processing, IEEE/ACM Transactions on, IEEE/ACM Trans. Audio Speech Lang. Process.
Yang, D.; Liu, S.; Huang, R.; Weng, C.; Meng, H.INTERNATIONAL CONFERENCE ON MACHINE LEARNING, VOL 97
Song, Kaitao; Tan, Xu; Qin, Tao; Lu, Jianfeng; Liu, Tie-Yan전선 / 대학원
데이터사이언스와 관련한 여러 분야의 최근의 국내외 연구동향을 소개한다. 강의와 세미나를 통하여 관련분야의 최신 방법론과 특정 주제를 심도 있게 습득할 수 있도록 한다.전선 / 대학원
산업공학의 새로운 기법들을 소개하고 이의 응용실태를 알아본다.전선 / 학사
본 강의에서는 다양한 산업에서 발생하는 텍스트 데이터에 대한 이해와 함께, 이에 대한 분석 기법들을 학습하는 것을 목적으로 한다. 크게 텍스트 데이터의 이해, 텍스트 데이터의 전처리 및 표상화, 언어 모델의 구조 이해, 그리고 텍스트 데이터의 응용 과업 등의 네 가지 파트로 구성하여 강의를 진행한다. 텍스트 데이터의 이해 파트에서는 제조업, 마케팅, 금융 등의 비즈니스에서 발생하는 텍스트 데이터의 특징과 이에 대한 활용 사례를 주로 다룬다. 텍스트 데이터의 전처리 및 표상화 파트에서는 전통적인 bag-of-words 방식을 포함하여, word2vec, GloVe, Fasttext와 같은 신경망 기반의 텍스트 표상화 방법을 강의한다. 언어모델의 구조 이해 파트에서는 Seqence-to-sequence Learning과 Transformer 구조에 대한 이해를 바탕으로 BERT 및 GPT 등의 대표적인 언어모델 구조를 강의한다. 마지막으로 텍스트 데이터의 응용 과업 파트에서는 감성 분석, 문서 요약, 질의 응답 등의 실제 비즈니스에서 자주 사용되는 텍스트 데이터 분석 과업을 소개하고 이를 해결하기 위한 적절한 방법론을 강의한다.전선 / 대학원
본 교과목은 오늘날 인공지능의 중심을 이루는 거대언어모델(Large Language Models)과 이를 기반으로 한 대화형 인공지능을 다룬다. 특히 거대언어모델의 학습부터 응용까지 이어지는 전체 파이프라인을 아래와 같이 체계적으로 다룬다. (1) Pre-training: 지식 습득을 위한 사전학습(Transformer, BERT, GPTs) (2) Supervised Fine-tuning: 상호작용 학습(Dialogue Fine-tuning, Instruction Tuning, Reasoning) (3) Alignment: 인간 가치와의 정렬(RLHF, DPO, KTO 등) 및 언어모델 해석 기법(AI Psychometrics, Mechanistic Interpretability) (4) Grounding: 외부 데이터 및 도구 활용 기법(페르소나, 문서, 이미지, 지식 그래프, 도구 증강 에이전트) (5) Applications: 다양한 도메인으로의 응용(대화 시뮬레이션 및 심리상담·교육·설득 응용) 수업에서는 각 연구 주제별로 핵심 논문들의 아이디어, 데이터, 방법론 등을 강의한다. 실습으로는 언어모델 학습, 언어모델 API를 이용한 대화 시스템 구현, 대화형 인공지능과 관련된 작은 연구 프로젝트를 수행한다. 이 과목을 통해 수강생들은 거대언어모델 연구 동향을 큰 틀에서 파악하고, 핵심적인 연구 주제들과 방법론을 이해하며, 이를 실제 연구에 적용하는 능력을 기르게 된다.전필 / 학사
첨단융합학부 학생의 전공탐색을 위한 과목으로, 융합데이터과학의 핵심 개념과 다양한 응용 분야를 소개하여 향후 전공선택에 필요한 필수적인 정보를 제공한다. 특히, 융합데이터과학 분야에서 진행되는 첨단연구와 연구의 실제 응용 사례를 직접 체험하여, 자신의 전공 적성을 좀 더 구체적으로 알아보고 설계할 수 있는 기회를 제공한다.전선 / 대학원
영어의 통사구조, 음운구조, 의미구조, 기타 영어학분야의 주제ㅐ를 선택하여 이를 집중적으로 연구한다.전선 / 학사
본 강좌는 예비영어교사들에게 <컴퓨터를 활용한 언어학습 (CALL)>의 원리를 중등학교 영어교육방법의 실제에 활용하는 기회를 제공한다. 학생들은 영어교육 공학기법을 탐구하여, 영어교육방법의 기본적 바탕을 익힌다.전선 / 대학원
이 과목은 보건의료 영역에서 컴퓨터를 활용한 텍스트 분석을 다룬다. 보건의료 영역에는 여러 종류의 언어 자료가 존재한다. 사람들이 온라인 공간에서 여러 질병에 대해 던지는 질문들, 보건의료 전문가들의 연구들, 질병과 건강에 대한 신문기사들이 그 예다. 이들로부터 정보를 체계적이고 과학적으로 추출할 수 있다면, 보건의료에서 다양한 방식으로 활용할 수 있다. 최근 많이 사용되고 있는 컴퓨터를 활용한 텍스트 분석은 이런 작업에 새로운 가능성을 제시한다. 본 과목에서는 여러 가지 컴퓨터를 활용한 텍스트 분석 방법을 학습하고, 보건의료 영역 자료에 적용하는 것을 실습한다.전선 / 대학원
대형언어모델(Large Language Model, LLM)은 수억 이상 파라미터를 갖는 인공신경망으로 구성된 언어모델이다. 자기지도학습이나 반자기지도학습을 사용하여 레이블링 되지 않은 대규모 텍스트로 훈련된다. 토큰화, 트랜스포머 모델, 프롬프트 엔지니어링, 파인 튜닝 등으로 구성된다. Neural Network, CNN, RNN, LSTM, 어텐션, 트랜스포머, RLHF, 프롬프트 엔지니어링, 파인튜닝, RAG 등을 다룬다. LLM 이론을 기초부터 완성 단계까지 학습한다. LLM를 소규모로 직접 사전학습모델을 구현한다. 사전학습된 모델을 기반으로 프롬프트 엔지니어링, 파인튜닝, RAG를 통하여 성능을 향상시키는 것을 구현한다.전선 / 대학원
음성언어 인터페이스는 인간과 컴퓨터의 상호작용에 가장 자연스러운 정보 교환 수단을 제공해준다. 음성언어처리는 이를 위한 음성인식, 음성합성 및 음성언어이해에 관련된 이론 및 기술을 가리키는 용어이다. 본 과목에서는 방대하며 학제적인 성격을 가지는 음성언어처리 분야를 이해하는데 필요한 기초이론을 체계적으로 제공하며, 또한 각종 소프트웨어 도구를 사용해서 실질적인 응용에 어떻게 기초이론들이 적용되는지를 보여준다.전선 / 대학원
인지과학 연습 1의 내용을 보다 확장하여 인지과학의 연구사, 연구주제등을 다각도로 검토하여 과정에 진입한 학생들에게 인지과학의 기초적 지식배경을 제공하는데 목적이 있다.전선 / 대학원
소셜 컴퓨팅과 라지데이터 분석 등이 커뮤니케이션 분야에서도 중요한 이슈로 부상함에 따라 컴퓨터공학을 전공하지 않은 연구자들도 소셜 네트웍 시스템의 기술적, 구조적 특성을 이해할 필요가 있다. 이 수업에서는 Ruby나 Python 등을 사용한 기초 프로그래밍 학습과, 웹 기반 기술(web technology), 데이터베이스 등의 관련 기술에 대한 학습을 통해 실제로 소셜 네트웍을 개발하고 분석하는 방법을 배운다. 또한, 이 과정에서 트위터 등의 소셜 네트웍의 데이터 마이닝 기법을 배우고 소셜 네트웍 분석을 실습을 통해 학습한다.전선 / 학사
인공지능 기술의 발달로 외국어교육 연구에서도 많은 혁신이 요구된다. 본 강의에서는 인공지능 기술을 언어교육에 활용하는 방안을 모색해 본다. 구체적으로, 본 과목은 언어 학습자 및 언어 교육 맥락에 대한 이해를 바탕으로 다양한 언어 교육 목적의 테크놀로지를 활용하여 언어를 교수하고 평가하는 방법을 익히는 것을 목적으로 한다. 이를 위해 언어입력, 출력, 상호작용, 피드백과 같이 언어교육 및 발달과 관련한 주요 개념을 익히고, 다양한 인공지능 도구를 활용하고 적용해 본다.전선 / 학사
본 강좌에서는 코퍼스 언어학의 내용을 기반으로 모국어로 혹은 제2 언어나 외국어로 한국어를 학습하는 학습자의 언어 자료를 사용하여 (한)국어 교육에 활용하는 방안에 대해 고찰하고자 한다. 이를 위해 학생들은 코퍼스의 개념과 유형을 한국어 코퍼스와 연관 지어 살펴보고, 콘코던스 프로그램을 통한 한국어 코퍼스 검색 및 분석에 관련된 실제적 지식을 함양한다. 나아가 한국어 코퍼스를 어휘 교육, 문법 교육, 담화 교육, 교과서 분석 등에 활용하는 구체적 방안에 대해서도 탐구한다. 본 강좌를 통해 학생들은 한국어 코퍼스를 (한)국어 교육 현장의 필요에 따라 효과적으로 활용할 수 있는 교수 역랑을 기를 수 있다.전선 / 대학원
오늘날 프랑스어교수법은 실천으로부터 경험적으로 확인된 고유한 문제론에 입각하여 이론을 정립함으로써 하나의 독립된 학문분야로서, 과학으로서 그 특수성을 인정받고 있다. 프랑스어교수법의 이러한 지위는 다른 학문들로부터 고립되어 이루어진 것이 아니다. 본 교과목은 언어학, 사회언어학, 심리언어학 등의 응용언어학이 프랑스어교수법과 어떻게 연관관계를 맺고 있는지 심도 있게 탐구하고 응용언어학의 연구결과를 프랑스어교육의 이론과 실제에 적용해보도록 한다.전필 / 학사
본 강의는 언어학에 대한 기본 개념을 바탕으로 언어학적 관점에서 프랑스어에 대한 언어학적 제문제를 파악하고 이러한 문제를 데이터를 통하여 접근하는 방법을 탐구하는 것을 목적으로 한다. 전통적 관점에서 언어학에 대한 기본적인 연구 방법론과 데이터와 실험을 중심으로 프랑스어를 분석하는 다양한 방법론, 그리고 데이터를 기반으로 한 언어 교육 방법론 및 그 활용 방법을 고찰한다.전선 / 대학원
말소리의 음향적 특성에 관한 이론을 학습하고, 이를 토대로 스펙트로그램을 판독하고, 음소 단위로 분절하고, 각 음소를 올바른 발음기호로 표기하는 능력을 함양한다. 또한 녹음 장비 및 음향 분석기 사용법과 실험 음성학 방법론을 학습하고, 이를 토대로 한국어와 영어를 비롯한 여러 언어의 발음을 과학적으로 연구할 수 있는 능력을 함양한다. 그리고 음성학적 지식을 어떻게 음성합성기와 음성인식기의 성능 향상에 기여할 수 있을지 모색한다.전선 / 학사
이 강좌는 언어학의 응용분야로 인간이 쓰는 언어가 컴퓨터에서 어떻게 처리되는지 다룬다. 인간 언어가 지닌 음성, 형태, 통사, 의미적인 측면이 정보처리 관점에서 음성합성, 음성인식, 형태분석, 구문분석, 의미처리 등과 관련하여 어떻게 구현되는지 살펴보며, 실제로 음성합성기, 음성인식기, 정보검색시스템이나 기계번역기 등 상용화된 시스템 구축방법에 대해서도 살펴본다. 또한 대량의 자료를 수집하고 처리하는 코퍼스도 논의하여, 한국어 정보처리를 위한 기초자료 구축도 병행한다. 이 과목은 이론적인 방법론뿐만 아니라 실제처리에도 많은 초점이 맞추어지기 때문에 컴퓨터 프로그래밍 학습을 통하여 시스템 구축이나 자료를 처리하는 실습도 병행한다.전선 / 대학원
이 강좌에서는 외국어로서의 한국어교육의 교육과정과 관련된 여러 요인들과 각 요인들의 상호작용, 그리고 한국어교육과정 개발과 운영 등에 대하여 심도 있는 탐구를 진행하게 된다. 특히 한국어 교육내용의 선정과 위계화, 내용 체계의 조직 의 원리 등을 언어 요인, 문화 요인과 결부시켜 집중적으로 논구하게 된다.전선 / 대학원
기계학습은 다양한 분야에서 점차 큰 관심을 받고 있으나, 막상 실제 데이터에 적용하여 성공적인 결과를 도출하는 데에는 많은 어려움이 따른다. 본 과목은 기계학습 기법들을 실제 문제에 적용할 때에 중요한 데이터 전처리, 피쳐 추출, 차원 축소, 클래스 불균형, 모델 앙상블 등의 주제들을 다루고, 데이터로부터 모형과 종속성을 학습하는 원리와 기법들을 소개하는 바, 특히 확률, 통계 및 최적화 이론에 기반하여 신경망 (Neural Networks), 서포트 벡터 머신 (Support Vector Machines), 은닉 마르코프 모형 (Hidden Markov Models) 및 강화 학습 (Reinforcement Learning) 기법들을 공부한다. 또한, 이들 기법을 활용하여, 다양한 시계열 데이터들을 대상으로 예측 및 분류 모델을 구현하는 프로젝트들과 데이터 기반 학습의 사례 연구들이 포함된다.