최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 논문은 사전학습 언어모델의 자가집중 메커니즘을 활용하여 의존 구문분석 성능을 개선하는 방법을 제안한다. 특히, 어절 사이의 상대거리 파라미터와 구분자 토큰 활용 기법을 통해 KorBERT_base 및 KorBERT_large 모델에서 기존 연구 대비 약 3% 이상의 성능 향상을 보였다.
구글 BERT의 정석 : 인공지능, 자연어 처리를 위한 BERT의 모든 것
한국어 상적 보조용언 구성의 용언 결합 양상
파이썬 텍스트 마이닝 완벽 가이드 : 자연어 처리 기초부터 딥러닝 기반 BERT와 트랜스포머까지
Computational linguistics and intelligent text processing : 7th international conference, CICLing 2006, Mexico City, Mexico, February 19-25, 2006 : proceedings
Quantitative data analysis for language assessment
코퍼스와 어휘 데이터베이스
언어 현장의 다면성과 구어의 복합지식
Text, speech and dialogue : Second International Workshop, TSD'99, Plzen, Czech Republic, September 13-17, 1999 : proceedings
언어 정보와 인문언어학
Dependency linguistics : recent advances in linguistic theory using dependency structures
안녕, 트랜스포머 : BERT에서 시작하는 자연어 처리 레시피
영·한 기계번역을 위한 영·한 의존구조 대조분석에 관한 연구
학습용 기본 명사 연어 빈도 사전
Textual patterns : key words and corpus analysis in language education
한국어 임베딩 : 자연어 처리 모델의 성능을 높이는 핵심 비결 Word2Vec에서 ELMo, BERT까지
Lexical input processing and vocabulary learning
Using large corpora
Connectionist psycholinguistics
Data-driven techniques in speech synthesis
Output-driven phonology : theory and learning
정보과학회논문지
임준호, 김현기한국컴퓨터정보학회논문지
김유희정보과학회논문지 : 소프트웨어 및 응용
최맹식; 김학수; 정석원정보과학회논문지
박천음, 이창기정보과학회논문지
김근하; 고영중國語學
이상아58TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (ACL 2020)
Wu, Zhiyong; Chen, Yun; Kao, Ben; Liu, Qun청람어문교육
나상수, 강지영, 이상재, 오지은IEEE/ACM Transactions on Audio, Speech, and Language Processing
Chengyu Wang; Suyang Dai; Yipeng Wang; Fei Yang; Minghui Qiu; Kehan Chen; Wei Zhou; Jun HuangIEEE/ACM Transactions on Audio Speech and Language Processing
Wang C.,Dai S.,Wang Y.,Yang F.,Qiu M.,Chen K.,Zhou W.,Huang J.정보과학회논문지 : 소프트웨어 및 응용
최맹식, 김학수, 정석원Transactions of the Association for Computational Linguistics
Yan H.,Qiu X.,Huang X.한국컴퓨터정보학회논문지
남건민, 김남규정보과학회 컴퓨팅의 실제 논문지
김윤하, 전윤수, 김준우, 김남규Applied Intelligence
Sharad Verma; Ashish Kumar; Aditi Sharan정보처리학회논문지. 소프트웨어 및 데이터 공학
이성욱ACM Transactions on Asian and Low-Resource Language Information Processing
Shi, S.; Luo, D.; Wu, X.; Long, C.; Huang, H.언어와 정보
박권식, 김성태, 송상헌정보과학회 컴퓨팅의 실제 논문지
한장훈; 고영중; 서정연Artificial Intelligence
Zeng Z.,Xiong D.전필 / 학사
첨단융합학부 학생의 전공탐색을 위한 과목으로, 융합데이터과학의 핵심 개념과 다양한 응용 분야를 소개하여 향후 전공선택에 필요한 필수적인 정보를 제공한다. 특히, 융합데이터과학 분야에서 진행되는 첨단연구와 연구의 실제 응용 사례를 직접 체험하여, 자신의 전공 적성을 좀 더 구체적으로 알아보고 설계할 수 있는 기회를 제공한다.전선 / 대학원
구조주의 통사론, 변형생성 문법, 종속이론 등 여러 이론들의 통사론을 개괄적으로 고찰한 후 구체적으로 불어에서 나타나는 특징적인 통사 현상들, 문법 범주들에 대한 개별적인 분석 및 적용을 통해 언어학의 하위 분야인 통사론의 이해를 도모한다.전선 / 대학원
본 교과목은 오늘날 인공지능의 중심을 이루는 거대언어모델(Large Language Models)과 이를 기반으로 한 대화형 인공지능을 다룬다. 특히 거대언어모델의 학습부터 응용까지 이어지는 전체 파이프라인을 아래와 같이 체계적으로 다룬다. (1) Pre-training: 지식 습득을 위한 사전학습(Transformer, BERT, GPTs) (2) Supervised Fine-tuning: 상호작용 학습(Dialogue Fine-tuning, Instruction Tuning, Reasoning) (3) Alignment: 인간 가치와의 정렬(RLHF, DPO, KTO 등) 및 언어모델 해석 기법(AI Psychometrics, Mechanistic Interpretability) (4) Grounding: 외부 데이터 및 도구 활용 기법(페르소나, 문서, 이미지, 지식 그래프, 도구 증강 에이전트) (5) Applications: 다양한 도메인으로의 응용(대화 시뮬레이션 및 심리상담·교육·설득 응용) 수업에서는 각 연구 주제별로 핵심 논문들의 아이디어, 데이터, 방법론 등을 강의한다. 실습으로는 언어모델 학습, 언어모델 API를 이용한 대화 시스템 구현, 대화형 인공지능과 관련된 작은 연구 프로젝트를 수행한다. 이 과목을 통해 수강생들은 거대언어모델 연구 동향을 큰 틀에서 파악하고, 핵심적인 연구 주제들과 방법론을 이해하며, 이를 실제 연구에 적용하는 능력을 기르게 된다.전선 / 대학원
이 과목은 보건의료 영역에서 컴퓨터를 활용한 텍스트 분석을 다룬다. 보건의료 영역에는 여러 종류의 언어 자료가 존재한다. 사람들이 온라인 공간에서 여러 질병에 대해 던지는 질문들, 보건의료 전문가들의 연구들, 질병과 건강에 대한 신문기사들이 그 예다. 이들로부터 정보를 체계적이고 과학적으로 추출할 수 있다면, 보건의료에서 다양한 방식으로 활용할 수 있다. 최근 많이 사용되고 있는 컴퓨터를 활용한 텍스트 분석은 이런 작업에 새로운 가능성을 제시한다. 본 과목에서는 여러 가지 컴퓨터를 활용한 텍스트 분석 방법을 학습하고, 보건의료 영역 자료에 적용하는 것을 실습한다.전선 / 대학원
대형언어모델(Large Language Model, LLM)은 수억 이상 파라미터를 갖는 인공신경망으로 구성된 언어모델이다. 자기지도학습이나 반자기지도학습을 사용하여 레이블링 되지 않은 대규모 텍스트로 훈련된다. 토큰화, 트랜스포머 모델, 프롬프트 엔지니어링, 파인 튜닝 등으로 구성된다. Neural Network, CNN, RNN, LSTM, 어텐션, 트랜스포머, RLHF, 프롬프트 엔지니어링, 파인튜닝, RAG 등을 다룬다. LLM 이론을 기초부터 완성 단계까지 학습한다. LLM를 소규모로 직접 사전학습모델을 구현한다. 사전학습된 모델을 기반으로 프롬프트 엔지니어링, 파인튜닝, RAG를 통하여 성능을 향상시키는 것을 구현한다.전선 / 대학원
한국어교육에서 기본적으로 필요한 것은 학습자의 모어와 한국어를 대조분석하여 이를 바탕으로 언어간섭현상을 최소화하고 학습의 효과를 극대화하는 것이다. 이 강좌에서는 한국어와 주요 외국어를 대조분석하여 음운론적, 문법론적, 의미론적, 화용론적 층위에서 공통점과 차이점을 추출하는 과정에서 오류를 분석해냄으로써 효과적인 한국어교육의 기초로 삼는다.전선 / 대학원
본 교과목은 단순한 질의응답을 넘어, 스스로 목표를 설정하고, 도구를 사용하며, 복잡한 과업을 자율적으로 수행하는 ‘에이전트(Agentic)' AI의 설계 원리와 구현 방법론을 심층적으로 다룬다. 기존의 LLM(Large Language Model)이 가진 한계를 극복하고, LLM을 ‘추론 엔진'으로 활용하여 실제 세계와 상호작용하는 지능형 시스템을 구축하는 데 초점을 둔다. 수강생들은 단일 에이전트의 핵심 구성 요소인 사고-행동-관찰(Reasoning-Acting-Observation) 루프, 동적 도구 사용(Tool Use), 장단기 기억(Memory) 메커니즘을 학습한다. 나아가 여러 에이전트가 협력하여 인간의 개입을 최소화하면서 복잡한 문제를 해결하는 멀티 에이전트 시스템(Multi-Agent System)의 설계 패턴(예: 계층적, 협력적)과 통신 프로토콜을 배운다. LangChain, AutoGen, CrewAI와 같은 최신 프레임 워크를 활용한 실습을 통해, 에이전트 아키텍처 설계부터 정교한 프롬프트 체이닝, 실행 루프 구현까지의 전 과정을 경험하며, 차세대 AI 애플리케이션을 개발할 수 있는 실전 역량을 배양하는 것을 목표로 한다.전선 / 대학원
인지과학 연습 1의 내용을 보다 확장하여 인지과학의 연구사, 연구주제등을 다각도로 검토하여 과정에 진입한 학생들에게 인지과학의 기초적 지식배경을 제공하는데 목적이 있다.전선 / 대학원
본 교과목은 단순한 질의응답을 넘어, 스스로 목표를 설정하고, 도구를 사용하며, 복잡한 과업을 자율적으로 수행하는 ‘에이전트(Agentic)' AI의 설계 원리와 구현 방법론을 심층적으로 다룬다. 기존의 LLM(Large Language Model)이 가진 한계를 극복하고, LLM을 ‘추론 엔진'으로 활용하여 실제 세계와 상호작용하는 지능형 시스템을 구축하는 데 초점을 둔다. 수강생들은 단일 에이전트의 핵심 구성 요소인 사고-행동-관찰(Reasoning-Acting-Observation) 루프, 동적 도구 사용(Tool Use), 장단기 기억(Memory) 메커니즘을 학습한다. 나아가 여러 에이전트가 협력하여 인간의 개입을 최소화하면서 복잡한 문제를 해결하는 멀티 에이전트 시스템(Multi-Agent System)의 설계 패턴(예: 계층적, 협력적)과 통신 프로토콜을 배운다. LangChain, AutoGen, CrewAI와 같은 최신 프레임 워크를 활용한 실습을 통해, 에이전트 아키텍처 설계부터 정교한 프롬프트 체이닝, 실행 루프 구현까지의 전 과정을 경험하며, 차세대 AI 애플리케이션을 개발할 수 있는 실전 역량을 배양하는 것을 목표로 한다.전선 / 대학원
이 강좌에서는 외국어로서의 한국어교육의 교육과정과 관련된 여러 요인들과 각 요인들의 상호작용, 그리고 한국어교육과정 개발과 운영 등에 대하여 심도 있는 탐구를 진행하게 된다. 특히 한국어 교육내용의 선정과 위계화, 내용 체계의 조직 의 원리 등을 언어 요인, 문화 요인과 결부시켜 집중적으로 논구하게 된다.전선 / 대학원
소셜 컴퓨팅과 라지데이터 분석 등이 커뮤니케이션 분야에서도 중요한 이슈로 부상함에 따라 컴퓨터공학을 전공하지 않은 연구자들도 소셜 네트웍 시스템의 기술적, 구조적 특성을 이해할 필요가 있다. 이 수업에서는 Ruby나 Python 등을 사용한 기초 프로그래밍 학습과, 웹 기반 기술(web technology), 데이터베이스 등의 관련 기술에 대한 학습을 통해 실제로 소셜 네트웍을 개발하고 분석하는 방법을 배운다. 또한, 이 과정에서 트위터 등의 소셜 네트웍의 데이터 마이닝 기법을 배우고 소셜 네트웍 분석을 실습을 통해 학습한다.전선 / 대학원
기계학습은 다양한 분야에서 점차 큰 관심을 받고 있으나, 막상 실제 데이터에 적용하여 성공적인 결과를 도출하는 데에는 많은 어려움이 따른다. 본 과목은 기계학습 기법들을 실제 문제에 적용할 때에 중요한 데이터 전처리, 피쳐 추출, 차원 축소, 클래스 불균형, 모델 앙상블 등의 주제들을 다루고, 데이터로부터 모형과 종속성을 학습하는 원리와 기법들을 소개하는 바, 특히 확률, 통계 및 최적화 이론에 기반하여 신경망 (Neural Networks), 서포트 벡터 머신 (Support Vector Machines), 은닉 마르코프 모형 (Hidden Markov Models) 및 강화 학습 (Reinforcement Learning) 기법들을 공부한다. 또한, 이들 기법을 활용하여, 다양한 시계열 데이터들을 대상으로 예측 및 분류 모델을 구현하는 프로젝트들과 데이터 기반 학습의 사례 연구들이 포함된다.전선 / 대학원
본 과목은 한국어 및 외국어 교육을 담당하는 교사들을 대상으로 하여 언어교육에 기초가 되는 언어현상을 이해하고 이를 자연어처리기술을 이용하여 분석하는 것을 목적으로 한다. 이를 위하여 언어학과 언어처리분야에서 개발된 여러 가지의 언어 분석 소프트웨어를 이용하여 언어 현상을 이해하도록 지도한다. 이와 같이 컴퓨팅 사고력을 기반으로 한 언어에 대한 이해는 이후 발음 및 문법 교육을 인공지능화하는 기초 연구가 될 것이다.전선 / 대학원
본 강좌는 수강생에게 행정학과 정책학에 필요한 다중회귀분석에 대한 심층적 이해를 제공하는데 있다. 수강생은 일반회귀분석에 대한 집중분석과 더불어 프로빗 및 로짓 회귀분석에 대한 학습도 할 것이다. 회귀분석의 주제는 누락변수편의, 측정오류, 다중공선성 문제를 포함한다. 인과관계나 내생성 문제도 도구변수와 이중차이분석기법과 함께 논의될 것이다. 나아가 본 강좌는 다중선택 및 다중순서형 로짓모형과 프롯빗 모형, 토빗모형에 대한 간략한 소개도 할 것이다. 본 강좌는 다양한 통계프로그램을 활용하여 행정 및 정책 쟁점들과 관련된 실제 자료에 대한 분석을 강조하고자 한다.전선 / 대학원
응용행동분석 및 단일사례연구 방법론은 동질성의 다수 집단 구성이 어려운 특수교육 현장이나 언어치료 등의 임상 현장에서 특히 많이 적용되고 있는 방법으로 이들 현장과 관련된 사람들이 갖추어야 할 지식이다. 이러한 점에서 본 강좌는 단일사례연구 방법론에 대한 이론적 배경과 방법론적 특성, 박사과정생들의 직접적인 연구 수행을 위한 관찰 및 연구 설계방법론을 설명하는 데 목적이 있다.전선 / 대학원
데이터사이언스와 관련한 여러 분야의 최근의 국내외 연구동향을 소개한다. 강의와 세미나를 통하여 관련분야의 최신 방법론과 특정 주제를 심도 있게 습득할 수 있도록 한다.전선 / 대학원
영어교육과 관련된 제반 이론과 최신 이론들에 대한 심도 있는 연구와 영어교육에 관한 이론적, 방법적 모형을 개발한다.전선 / 대학원
독어학은 독일어의 음성·음운, 형태·통사 및 의미·화용론적인 특성에 대해서 연구하는 분야이다. 독어학이 독일어의 언어학적인 특성을 연구하는 학문인만큼, 독어학 연구를 위해서는 언어학의 하위분야에 대한 이론적 지식뿐만 아니라, 각 분야에 적합한 연구방법론 습득이 매우 중요하다. 따라서 이 교과목은 대학원에서 어학을 전공하는 학생들에게 다양한 독어학 연구방법론을 접할 수 있는 기회를 제공할 것이며, 이를 위해 2군 교과목으로 운영된다.전선 / 대학원
이 교과목에서는 음성언어처리, 특히 연속음성인식 및 대화처리를 위하여 필요한 기초이론에 대해서 배운다. 구체적으로는 대용량 연속음성 인식을 위한 대표적인 기법인 Hidden Markov Model의 기초 이론 및 주요 구성 요소인 음향 모델, 어휘 모델, 언어 모델과 탐색 방법에 대해서 배우며, 언어학과 공학의 학제적 성격을 가지는 낭독체 및 대화체 연속음성인식과 대화처리를 위한 언어학 이론의 적용 방법에 대하여 배운다.전선 / 대학원
변형생성문법이 러시아어의 여러 문법 현상들을 설명해 내는 데 어느 정도의 긍정적인 기제로 작용할 수 있는지 살펴보고, 그 적용가능성과 한계에 대해 논의한다.