최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 연구는 머신 러닝 기술과 Doc2Vec 모델을 활용하여 문서 유사도를 측정하고 문서 분류 시스템을 구축하는 방법을 제안한다. 키워드 기반 데이터 수집, 형태소 분석, 문서 임베딩 과정을 거쳐 서포트 벡터 머신을 학습한 결과, F1 점수 0.83의 우수한 성능을 보였다.
자연어 처리와 컴퓨터 언어학 : 파이썬으로 개발하는 자연어 처리 서비스
Guiding language learning
처음 배우는 머신러닝 : 기초부터 모델링, 실전 예제, 문제 해결까지
파이썬 텍스트 마이닝 완벽 가이드 : 자연어 처리 기초부터 딥러닝 기반 BERT 모델까지
파이썬 텍스트 마이닝 완벽 가이드 : 자연어 처리 기초부터 딥러닝 기반 BERT와 트랜스포머까지
Survey of text mining : clustering, classification, and retrieval
Survey of text mining II : clustering, classification, and retrieval
모두의 한국어 텍스트 분석 with 파이썬 = 기초부터 챗GPT까지, 누구나 쉽게 시작하는 자연어 처리
이론부터 실전까지 AI 에이전트 완벽 마스터 : LLM·RAG 기본부터 지식 그래프·강화학습·멀티 에이전트 심화까지
(만들면서 배우는) 파이토치 딥러닝 : 12가지 모델로 알아보는 딥러닝 응용법
Document analysis systems : theory and practice : Third IAPR Workshop, DAS'98, Nagano, Japan, November 4-6, 1998 : selected papers
Document Analysis and Recognition – ICDAR 2021 : 16th International Conference, Lausanne, Switzerland, September 5–10, 2021, Proceedings, Part I
Computational linguistics and intelligent text processing : 7th international conference, CICLing 2006, Mexico City, Mexico, February 19-25, 2006 : proceedings
한국어 임베딩 : 자연어 처리 모델의 성능을 높이는 핵심 비결 Word2Vec에서 ELMo, BERT까지
핸즈온 머신러닝 딥러닝 알고리즘 트레이딩 : 파이썬, Pandas, NumPy, Scikit-learn, 케라스를 활용한 효과적인 거래 전략
LLM을 활용한 실전 AI 애플리케이션 개발 : LLM의 기본부터 모델 학습, 임베딩, 벡터 데이터베이스로 만드는 RAG까지
퀀트 투자를 위한 머신러닝·딥러닝 알고리듬 트레이딩 : 파이썬, Pandas, 텐서플로 2.0, Scikit-learn을 활용한 효과적인 트레이딩
(머신러닝을 활용한) 소셜 빅데이터 분석과 미래신호 예측
Principles of digital document processing : 4th international workshop, PODDP '98, Saint-Malo, France, March 29-30, 1998 : proceedings
Mobile Networks and Applications
Gang L.,Huanbin Z.,Tongzhou Z.Applied Sciences (Switzerland)
Aubaid A.M.,Mishra A.응용통계연구
정호영; 신상민; 최용석정보과학회논문지
김도우, 구명완SN Computer Science
Sanku, Satya Uday; Pavani, Satti Thanuja; Lakshmi, T. Jaya; Chivukula, Rohit대한산업공학회지
모경현, 박재선, 장명준, 강필성정보과학회논문지
홍대영; 심규석Neurocomputing
Kim, Han Kyul; Kim, Hyunjoong; Cho, Sungzoon지능정보연구
박종인; 김남규Multimedia Systems
Lin, Yuping; Li, Yingyu; Song, Yonghong; Wang, FangKnowledge-Based Systems
Sinoara R.A.,Camacho-Collados J.,Rossi R.G.,Navigli R.,Rezende S.O.Scientometrics
Thijs B.정보시스템연구
김병태, 김남규International Journal of Data Science and Analytics
Unnam N.B.,Reddy P.K.Journal of Information Science
Priya D.U.,Thilagam P.S.IEEE Access
Li X.,You S.,Chen W.KSII Transactions on Internet and Information Systems
최성필, 맹성현, 조현양International Journal of Semantic Computing
Renjith P. Ravindran; Kavi Narayana MurthyFoundations of Science
Kotte V.K.,Rajavelu S.,Rajsingh E.B.IEEE transactions on neural networks and learning systems
Bo Cheng; Ximing Li; Yi Chang전선 / 대학원
계산이론은 컴퓨터공학의 기초학문이며, 중요한 문제에 대한 효율적인 알고리즘들을 소개하고, 그런 알고리즘의 복잡도 분석을 다룬다. 이 교과목에서는 먼저 알고리즘의 성능을 분석하는 기법, 특히 amortized analysis에 대해 배운다. 그리고, 계산이론 분야에서 중요한 알고리즘과 그 응용에 대해 배운다. 구체적으로, (스트링 매칭, 2차원 패턴 매칭, 근사 매칭, suffix trees, 데이터 압축 문제에 대한) 스트링 알고리즘과 bioinformatics에의 응용, (선택 문제, 다항식 확인 문제에 대한) randomized 알고리즘과 그 영향, (페이지 교체 문제, k 서버 문제에 대한) online 알고리즘과 금융문제(일방향 거래와 portfolio 선택 문제)에의 응용을 배운다.전선 / 대학원
본 과목에서는 다양한 인공 지능 (특히 머신 러닝) 및 빅데이터 분석 시스템에 대해 공부한다. 자원을 관리하는 자원 관리자, 데이터를 저장하는 분산 스토리지, 데이터 처리의 핵심 모델인 데이터 플로우 모델, 배치 분석, 인메모리 처리, 스트림 처리, SQL, 머신 러닝/딥러닝 시스템, 그래프 처리에 대해서 공부한다. 특히, 대표적인 시스템인 Spark, Beam, TensorFlow, PyTorch 등을 활용하여 실제로 해당 시스템들이 어떻게 동작하는지 깊게 공부한다. 배운 이론을 바탕으로 프로그래밍 과제와 팀별 연구 프로젝트를 수행한다.전선 / 대학원
임상서식 및 의학 문헌에서의 정보추출을 위한 다양한 알고리즘과 이론에 대해 학습한다. 특히 자연어처리 분야의 기존 연구들을 기반으로 의학 분야에서 자연어처리 기술이 적용될 수 있는 사례들을 개발하고, 실제 프로젝트를 통해 새로운 적용 분야들에 대해 연구하게 된다.전선 / 대학원
본 과목에서는 다양한 인공 지능 (특히 머신 러닝) 및 빅데이터 분석 시스템에 대해 공부한다. 자원을 관리하는 자원 관리자, 데이터를 저장하는 분산 스토리지, 데이터 처리의 핵심 모델인 데이터 플로우 모델, 배치 분석, 인메모리 처리, 스트림 처리, SQL, 머신 러닝/딥러닝 시스템, 그래프 처리에 대해서 공부한다. 특히, 대표적인 시스템인 Spark, Beam, TensorFlow, PyTorch 등을 활용하여 실제로 해당 시스템들이 어떻게 동작하는지 깊게 공부한다. 배운 이론을 바탕으로 프로그래밍 과제와 팀별 연구 프로젝트를 수행한다.전선 / 대학원
이 과목은 보건의료 영역에서 컴퓨터를 활용한 텍스트 분석을 다룬다. 보건의료 영역에는 여러 종류의 언어 자료가 존재한다. 사람들이 온라인 공간에서 여러 질병에 대해 던지는 질문들, 보건의료 전문가들의 연구들, 질병과 건강에 대한 신문기사들이 그 예다. 이들로부터 정보를 체계적이고 과학적으로 추출할 수 있다면, 보건의료에서 다양한 방식으로 활용할 수 있다. 최근 많이 사용되고 있는 컴퓨터를 활용한 텍스트 분석은 이런 작업에 새로운 가능성을 제시한다. 본 과목에서는 여러 가지 컴퓨터를 활용한 텍스트 분석 방법을 학습하고, 보건의료 영역 자료에 적용하는 것을 실습한다.전선 / 학사
통계분석 결과를 정확히 이해·해석하기 위한 확률과 기술통계, 가설검정, F 분포와 분산분석, 회귀·상관, 범주형·빈도 분석을 다룬 뒤, 머신러닝의 핵심 개념을 가볍게 소개한다. 간단한 분류·회귀·군집 알고리즘 및 기초적 모델 해석 가능성과 윤리·편향 이슈를 실습 중심으로 학습한다.전선 / 대학원
본 교과목은 오늘날 인공지능의 중심을 이루는 거대언어모델(Large Language Models)과 이를 기반으로 한 대화형 인공지능을 다룬다. 특히 거대언어모델의 학습부터 응용까지 이어지는 전체 파이프라인을 아래와 같이 체계적으로 다룬다. (1) Pre-training: 지식 습득을 위한 사전학습(Transformer, BERT, GPTs) (2) Supervised Fine-tuning: 상호작용 학습(Dialogue Fine-tuning, Instruction Tuning, Reasoning) (3) Alignment: 인간 가치와의 정렬(RLHF, DPO, KTO 등) 및 언어모델 해석 기법(AI Psychometrics, Mechanistic Interpretability) (4) Grounding: 외부 데이터 및 도구 활용 기법(페르소나, 문서, 이미지, 지식 그래프, 도구 증강 에이전트) (5) Applications: 다양한 도메인으로의 응용(대화 시뮬레이션 및 심리상담·교육·설득 응용) 수업에서는 각 연구 주제별로 핵심 논문들의 아이디어, 데이터, 방법론 등을 강의한다. 실습으로는 언어모델 학습, 언어모델 API를 이용한 대화 시스템 구현, 대화형 인공지능과 관련된 작은 연구 프로젝트를 수행한다. 이 과목을 통해 수강생들은 거대언어모델 연구 동향을 큰 틀에서 파악하고, 핵심적인 연구 주제들과 방법론을 이해하며, 이를 실제 연구에 적용하는 능력을 기르게 된다.전선 / 대학원
소셜 컴퓨팅과 라지데이터 분석 등이 커뮤니케이션 분야에서도 중요한 이슈로 부상함에 따라 컴퓨터공학을 전공하지 않은 연구자들도 소셜 네트웍 시스템의 기술적, 구조적 특성을 이해할 필요가 있다. 이 수업에서는 Ruby나 Python 등을 사용한 기초 프로그래밍 학습과, 웹 기반 기술(web technology), 데이터베이스 등의 관련 기술에 대한 학습을 통해 실제로 소셜 네트웍을 개발하고 분석하는 방법을 배운다. 또한, 이 과정에서 트위터 등의 소셜 네트웍의 데이터 마이닝 기법을 배우고 소셜 네트웍 분석을 실습을 통해 학습한다.전선 / 학사
본 과목에서는 대용량의 텍스트를 분석하여 유의미한 결론을 도출하는 텍스트마이닝 기법에 대해 강의한다. Natural language processing, probabilistic topic model, text clustering, text categorization, contextual text mining 등, 텍스트마이닝 분야의 핵심 Keyword 및 기법에 대해 다룬다.전선 / 대학원
기계학습은 다양한 분야에서 점차 큰 관심을 받고 있으나, 막상 실제 데이터에 적용하여 성공적인 결과를 도출하는 데에는 많은 어려움이 따른다. 본 과목은 기계학습 기법들을 실제 문제에 적용할 때에 중요한 데이터 전처리, 피쳐 추출, 차원 축소, 클래스 불균형, 모델 앙상블 등의 주제들을 다루고, 데이터로부터 모형과 종속성을 학습하는 원리와 기법들을 소개하는 바, 특히 확률, 통계 및 최적화 이론에 기반하여 신경망 (Neural Networks), 서포트 벡터 머신 (Support Vector Machines), 은닉 마르코프 모형 (Hidden Markov Models) 및 강화 학습 (Reinforcement Learning) 기법들을 공부한다. 또한, 이들 기법을 활용하여, 다양한 시계열 데이터들을 대상으로 예측 및 분류 모델을 구현하는 프로젝트들과 데이터 기반 학습의 사례 연구들이 포함된다.전필 / 대학원
컴퓨터 기반 측정 평가 및 진단 이론의 흐름과 최신 기술에 대해 배우고 관련 소프트웨어 사용방법을 배운다. 문항반응이론, 인지진단평가, 컴퓨터 적응 평가, 다단계 평가 등 기존 교육평가 분야에서 컴퓨터 기반 평가에 사용되는 기술 및 Knowledge tracing, 자동 문항 추천, 자동 문항 생성 및 자동 문항 채점 등 머신러닝 기반 교육평가의 최신 동향 및 알고리즘의 특성과 원리를 배운다.전선 / 대학원
한국어학 연구를 위해 컴퓨터를 활용하는 방법과 기계가 이해할 수 있도록 한국어를 처리하는 자연언어처리의 연구 성과를 학습하고 실습한다. 텍스트 처리를 위해 유용한 유닉스 명령어와 통계 패키지 R 등의 도구를 적절히 사용하는 방법을 익히고, 프로그래밍 언어 Python으로 텍스트 처리를 위해 스스로 코드를 짤 수 있도록 하며, 딥러닝을 포함한 기계학습 기법을 자연언어처리에 활용하는 방법도 탐구한다.전필 / 학사
본 과목에서는 정형 데이터와 비정형 데이터를 효과적으로 관리하고 분석하는 데에 필요한 제반 이론 및 기법을 배운다. 구체적으로, 본 과목의 전반부에서는 데이터베이스 (DB)를 기반으로 한 정보 시스템의 설계 및 구현, 그리고 DB 마이닝과 DB 기반 추천 시스템과 관련된 모형과 기법을 다루고, 후반부에서는 텍스트 데이터를 대상으로 정보 검색, 문서 분류 및 군집화를 위한 주요 이론과 방법론들을 소개한다. 아울러, 본 과목은 소개된 모형 및 기법들을 구현하여 다양한 형태의 데이터에 실적용해보는 프로젝트들을 포함하는 바, 이를 통해 실제 문제에 대한 해결 능력을 기르고, 관련된 기술적 이슈들을 경험해보는 것을 목표로 한다.전선 / 학사
딥 러닝의 핵심 개념, 모델 및 활용 사례를 강의한다. 강의 전반부에는 deep neural network의 정의, stochastic gradient descent, backpropagation, activation, optimization 등 딥 러닝의 핵심 개념을 강의하며, 후반부에는 convolutional neural network, recurrent neural network, generative adeversarial network, transformer 등 실제로 활용되는 딥 러닝 모델들의 특징과 활용 사례를 다룬다. 또한 각 모델들을 PyTorch를 통해 실제로 활용해볼 수 있도록 과제/프로젝트를 구성한다.전선 / 대학원
본 과목은 국제통상 전공자들에게 필요한 테이터 분석 방법론과 방법론의 응용을 가르치는 것을 목표로 한다. 방법론으로는 기초 통계학 이론 및 회귀분석 모형이 포함되며, 동시에 이 기법이 실제 어떻게 사용되는지 프로젝트 및 데이터 실습을 통해서 학습한다. 데이터 실습은 STATA를 기반으로 진행한다. 이에 더하여, 각국에서 도입중인 evidence-based policy making (EBPM)의 동향과 민간의 신용카드 및 교통정보를 기반으로 한 실시간 데이터가 정책입안에 어떻게 활용되는지 사례분석을 통해서 학습한다. 마지막으로 최근 활발히 이용되고 있는 머신러닝(Machine Learning)기법 일부도 소개한다. 학습 평가는 방법론에 대한 시험과 통계분석에 대한 final project를 기초로 이루어진다.전선 / 대학원
다른 과목에서 배운 계량적 분석방법을 현실 농업문제에 응용한다. 비교정학(comparative statics)에 의한 모형분석, 칼만 필터(Kalman filter), 뉴럴 네트워크(neural network), 유전자 알고리즘(genetic algorithm), 부트 스트랩핑(boot strapping), 커널 추정(kernel estimation) 등을 다룬다.전선 / 학사
인공신경망의 원리와 종류를 살펴보고 그 동작을 이해한다. 이를 기반으로 딥러닝 네트워크의 원리를 공부하고 설계하여 그 동작을 이론과 실습을 통해 이해한다. 또한 응용 분야에 따른 다양한 딥러닝 네트워크를 알아보고 학습과 검증 과정을 통해 설계 및 응용분야에 적용하는 예제를 공부한다.전선 / 대학원
메타데이터를 통한 전자기록 정보의 구조화 전반에 대해 다룬다. 메타데이터를 단순히 정보기술의 이론적 관점에서만 학습하는 것이 아니라, 역사기록물이나 인류문화유산 정보를 효과적으로 아카이브하기 위한 융합학문의 관점에서 살펴본다. 이를 위해 Semantic Web과 Linked Data 기술에 대한 이해와 첨단 정보기술을 활용한 디지털 인문학에 대해서도 함께 조망할 것이다. 더불어 선진국의 문화유산 아카이브를 위한 여러 모델들을 살펴보고 우리나라에서의 적용과 활용에 대해 고민해 본다.전선 / 학사
연구실에서의 연구참여 활동을 통하여 전공 지식을 심화 학습한다. 각자가 원하는 연구에 참여하며 그 연구에 대한 직접적인 경험을 갖는다.전선 / 대학원
한정된 자료들 사이의 공간적 상호관계를 분석하고 이를 바탕으로 임의의 위치에서 원하는 자료값을 예측하는 여러 크리깅 기법을 공부한다. 주어진 값과 그 분포를 항상 보전하는 조건부 시뮬레이션과 불확실성을 줄이기 위해 이용가능한 자료를 통합하여 사용하는 최적화 기법을 공부한다.