최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 연구는 LDA 토픽모형 추론 시 단어의 상대적 중요성을 반영하기 위해 점별 상호정보량을 이용한 근사추론 방법을 제안합니다. 특히, 깁스내 메트로폴리스-헤스팅스(PWMH-Gibbs) 알고리즘을 통해 불용어 제거 및 성능 향상을 도모하며, 실 자료 분석 결과 제안된 방법이 기존 방법보다 정확한 결과를 제공함을 확인했습니다.
R을 이용한 텍스트 마이닝 =
Advances in knowledge acquisition : 9th European Knowledge Acquisition Workshop, EKAW '96, Nottingham, United Kingdom, May 14-17, 1996 : proceedings
(토픽 모델링과 언어 네트워크 분석을 활용한) 한국어교육 연구 동향 =
Foundations of intelligent systems : 10th international symposium, ISMIS '97, Charlotte, North Carolina, USA, October 15-18, 1997 : proceedings
Grammatical inference : learning syntax from sentences : Third International Colloquium, ICGI-96, Montpellier, France, September 25-27, 1996 : proceedings
Principles of data mining and knowledge discovery : Second European Symposium, PKDD '98, Nantes, France, September 1998 : proceedings
AI IA 97, advances in artificial intelligence : 5th Congress of the Italian Association for Artificial Intelligence, Rome, Italy, September 17-19, 1997 : proceedings
Text mining in practice with R
디지털 시대 인문학의 미래
Process algebra and probabilistic methods : performance modeling and verification : joint international workshop, PAPM-PROBMIV 2001, Aachen, Germany, September 12-14, 2001 : proceedings
Computational linguistics in the Netherlands 1997 : selected papers from the eighth CLIN Meeting
Typed lambda calculi and applications : International Conference on Typed Lam[b]da Calculi and Applications, TLCA '93, March 16-18, 1993, Utrecht, the Netherlands : proceedings
Learning from data : artificial intelligence and statistics V
Survey of text mining : clustering, classification, and retrieval
데이터 과학을 위한 통계 : 데이터 분석에서 머신러닝까지50까지 핵심 개념
Foundations of intelligent systems : 11th International Symposium, ISMIS'99, Warsaw, Poland, June 1999 : proceedings
Machine translation and the lexicon : third International EAMT Workshop, Heidelberg, Germany, April 26-28, 1993 : proceedings
빅데이터 분석을 위한 스칼라와 스파크 : 대용량 빅데이터 분석과 머신 러닝까지 활용하는
Practical text mining with Perl
Types and programming languages
IEEE Transactions on Knowledge and Data Engineering
Rugeles D.,Hai Z.,Dash M.,Cong G.Journal of The Korean Data Analysis Society
문길성Computational Linguistics (Cambridge, MA)
Thielmann, Anton; Reuter, Arik; Seifert, Quentin; Bergherr, Elisabeth; Säfken, BenjaminJournal of Intelligent Information Systems: Integrating Artificial Intelligence and Database Technologies
Wu, Di; Yang, Ruixin; Shen, ChaoJournal of The Institution of Engineers (India): Series B: Electrical, Electronics & Telecommunication and Computer Engineering
Srivastav, Anukriti; Singh, SatwinderJournal of The Korean Data Analysis Society
황인옥, 김향경, 이지원, 김성용Expert Systems
Trinh T.,Quan T.,Mai T.Empirical Software Engineering
Silva C.C.,Galster M.,Gilson F.텍스트언어학
조은경, 한영균Journal of Physics: Conference Series
Gong, H.; You, F.; Lai, S.텍스트언어학
조은경; 한영균Journal of Internet Technology
Huang, L.; Xu, S.; Hu, G.; Zhang, C.; Xiong, N.N.Neurocomputing
Gao, S.; Li, X.; Yu, Z.; Qin, Y.; Zhang, Y.Research Journal of Applied Sciences, Engineering and Technology
Young-Sup Hwang; Min-Hee Jang; Sang-Wook Kim; Tae-Hwan Eom교육방법연구
김대석, 박우식Frontiers of Information Technology & Electronic Engineering
Hou-kui Zhou; Hui-min Yu; Roland HuSymmetry
Zhang T.,Cui W.,Liu X.,Jiang L.,Li J.Data Mining and Knowledge Discovery
Tang, Y.-K.; Mao, X.-L.; Huang, H.지능정보연구
유소연, 임규건International Journal of Information Technology (Singapore)
George L.,Sumathy P.전선 / 대학원
이 과목은 보건의료 영역에서 컴퓨터를 활용한 텍스트 분석을 다룬다. 보건의료 영역에는 여러 종류의 언어 자료가 존재한다. 사람들이 온라인 공간에서 여러 질병에 대해 던지는 질문들, 보건의료 전문가들의 연구들, 질병과 건강에 대한 신문기사들이 그 예다. 이들로부터 정보를 체계적이고 과학적으로 추출할 수 있다면, 보건의료에서 다양한 방식으로 활용할 수 있다. 최근 많이 사용되고 있는 컴퓨터를 활용한 텍스트 분석은 이런 작업에 새로운 가능성을 제시한다. 본 과목에서는 여러 가지 컴퓨터를 활용한 텍스트 분석 방법을 학습하고, 보건의료 영역 자료에 적용하는 것을 실습한다.전선 / 대학원
산업공학의 새로운 기법들을 소개하고 이의 응용실태를 알아본다.전선 / 대학원
데이터사이언스와 관련한 여러 분야의 최근의 국내외 연구동향을 소개한다. 강의와 세미나를 통하여 관련분야의 최신 방법론과 특정 주제를 심도 있게 습득할 수 있도록 한다.전선 / 학사
본 과목에서는 대용량의 텍스트를 분석하여 유의미한 결론을 도출하는 텍스트마이닝 기법에 대해 강의한다. Natural language processing, probabilistic topic model, text clustering, text categorization, contextual text mining 등, 텍스트마이닝 분야의 핵심 Keyword 및 기법에 대해 다룬다.전선 / 학사
본 강의에서는 다양한 산업에서 발생하는 텍스트 데이터에 대한 이해와 함께, 이에 대한 분석 기법들을 학습하는 것을 목적으로 한다. 크게 텍스트 데이터의 이해, 텍스트 데이터의 전처리 및 표상화, 언어 모델의 구조 이해, 그리고 텍스트 데이터의 응용 과업 등의 네 가지 파트로 구성하여 강의를 진행한다. 텍스트 데이터의 이해 파트에서는 제조업, 마케팅, 금융 등의 비즈니스에서 발생하는 텍스트 데이터의 특징과 이에 대한 활용 사례를 주로 다룬다. 텍스트 데이터의 전처리 및 표상화 파트에서는 전통적인 bag-of-words 방식을 포함하여, word2vec, GloVe, Fasttext와 같은 신경망 기반의 텍스트 표상화 방법을 강의한다. 언어모델의 구조 이해 파트에서는 Seqence-to-sequence Learning과 Transformer 구조에 대한 이해를 바탕으로 BERT 및 GPT 등의 대표적인 언어모델 구조를 강의한다. 마지막으로 텍스트 데이터의 응용 과업 파트에서는 감성 분석, 문서 요약, 질의 응답 등의 실제 비즈니스에서 자주 사용되는 텍스트 데이터 분석 과업을 소개하고 이를 해결하기 위한 적절한 방법론을 강의한다.전선 / 대학원
기계학습의 기초, AI 시스템의 평가, 윤리적 /법적 측면과 함의를 교육분야의 적용 사례를 통해 살펴보고, 전통적 과학교수학습이론과 평가이론과의 접목을 논의하면서 인공지능 및 언택트 시대의 과학교수학습과 평가에 대한 조망 및 새로운 연구분야에 대한 이해를 높인다.전선 / 대학원
범주형 자료를 분석하기 위한 통계기법들을 소개한다. 범주형 자료들은 대개 분할표를 이용해 정리할 수 있기 때문에 분할표를 분석할 수 있는 통계방법을 중점적으로 다룬다. 주된 주제들은 분할표분석, 로그 선형모형, 로지스틱모형이다.전선 / 대학원
인지과학 연습 1의 내용을 보다 확장하여 인지과학의 연구사, 연구주제등을 다각도로 검토하여 과정에 진입한 학생들에게 인지과학의 기초적 지식배경을 제공하는데 목적이 있다.전선 / 학사
Gauss 소거법, Cholesky 분해, Householder와 Gram-Schmidt 해법, 데이터 맞춤, 비선형 최소자승법, 심플렉스 해법, 행렬의 분할, Jacobi와 Seidel 반복법, 이완해법, 유한차분법, ADI 해법, 켤레 그래디언트 해법 등을 다룬다.전선 / 대학원
이 교과목은 '통사론연구 1'(108.520)의 교과목 내용을 기초로 이론의 확대적용 및 발전을 좀더 깊이 있게 모색한다.전선 / 대학원
구조주의적 접근에서부터 최근의 형식문법에 이르기까지 통사론의 연구 방법론에 대한 전반적인 이해를 목표로 한다. 특히 근래 활발하게 연구되고 있는 생성문법의 여러 통사이론(GB, GPSG, LFG, HPSG 등)을 비교하고 실제 언어자료에의 응용을 꾀한다. 또한 문법 전반에서의 의미론과의 관련성을 파악하고, 타당성 있는 새로운 통사이론의 정립을 모색한다.전선 / 대학원
본 강좌는 고급 자료분석을 위한 모형기반 통계분석방법론에 대해 다룬다. 자료의 특징과 분석의 목적에 따라 적합한 통계모형을 제시하고, 자료를 적합, 적합된 통계모형의 해석을 통한 인사이트 제시등에 대해 다룬다. 프로젝트를 통해서 배운 방법들을 실제 데이터에 적용하고 발표한다. ● Linear model and linear mixed model ● Generalized linear model ● Shrinkage method and variable selection ● Graphical methods and causal Inference ● Bayesian methods전선 / 대학원
경제를 계량적으로 파악하는 것은 현대 경제학에 있어서 아주 중요한 의미를 갖는다. 이 과목은 대학원에서 계량경제학을 전공하는 학생들이 계량경제학의 중요한 토픽들을 심화하여 이해할 수 있도록 하는 것을 목적으로 한다.전선 / 학사
이 과목에서는 역사정보 빅데이터의 특성과 현황을 이해하고 역사적 지식을 산출하는 기초적인 과정을 습득한다. 습득 과정은 크게 세 단계로 진행된다. 첫째, 한국 근대의 대표적인 언론 자료를 선정하여 역사적 맥락과 자료의 특성 및 유의미한 관찰 지점 등을 파악한다. 둘째, 해당 자료의 코퍼스를 구축하고, 파이썬 언어를 활용한 토픽모델링을 통해 그 자료의 핵심 주제를 발견한다. 셋째, 네트워크 분석 방법을 활용하여 핵심 주제의 상호 연결 관계를 살펴보고, 이를 통해 해당 자료의 논조가 시기별로 어떻게 변화하는가를 관찰한다.전선 / 대학원
이 강좌는 실험심리학에서 최근의 중요 연구들을 소개하고 인간 마음의 기본 원리를 탐색 및 논의하는 세미나이다. 우선 강의 초에 인간의 생리, 지각 및 인지 수준에서 일반이론을 소개하고 그 문제점들을 알아본다. 이 이론들에 기초하여, 이 강좌에서는 시각, 주의, 언어, 문제 해결, 인간 추리 등의 세부 주세를 다룬다. 또한 이 강좌에서는 이런 주제들에 관해 실험 실습을 통해 학생들의 구체적인 이해의 증진을 시도한다.전선 / 대학원
본 교과목은 오늘날 인공지능의 중심을 이루는 거대언어모델(Large Language Models)과 이를 기반으로 한 대화형 인공지능을 다룬다. 특히 거대언어모델의 학습부터 응용까지 이어지는 전체 파이프라인을 아래와 같이 체계적으로 다룬다. (1) Pre-training: 지식 습득을 위한 사전학습(Transformer, BERT, GPTs) (2) Supervised Fine-tuning: 상호작용 학습(Dialogue Fine-tuning, Instruction Tuning, Reasoning) (3) Alignment: 인간 가치와의 정렬(RLHF, DPO, KTO 등) 및 언어모델 해석 기법(AI Psychometrics, Mechanistic Interpretability) (4) Grounding: 외부 데이터 및 도구 활용 기법(페르소나, 문서, 이미지, 지식 그래프, 도구 증강 에이전트) (5) Applications: 다양한 도메인으로의 응용(대화 시뮬레이션 및 심리상담·교육·설득 응용) 수업에서는 각 연구 주제별로 핵심 논문들의 아이디어, 데이터, 방법론 등을 강의한다. 실습으로는 언어모델 학습, 언어모델 API를 이용한 대화 시스템 구현, 대화형 인공지능과 관련된 작은 연구 프로젝트를 수행한다. 이 과목을 통해 수강생들은 거대언어모델 연구 동향을 큰 틀에서 파악하고, 핵심적인 연구 주제들과 방법론을 이해하며, 이를 실제 연구에 적용하는 능력을 기르게 된다.교양 / 학사
인공지능 시스템이 급격하게 보급됨에 따라 현대 사회는 인간다움이 무엇인가에 대한 답을 그 어느 시대보다 절실하게 요구하고 있다. 그리고 인간의 “의미”에 대한 탐구는 인간다움을 정의하는 데에 있어 대체불가능한 요소이다. 본 강의의 목적은 단순히 오늘날 세상을 형성해 온 가장 영향력 있는 과학, 문학, 철학적 텍스트를 수동적으로 이해하고 암기하는 데에 있지 않고, (i) 이러한 텍스트들에서 제시된 아이디어가 어떻게 반박되거나 수정/대체되었는지, (ii) 의미에 대한 지배적인 서사가 변화하는 과정이 현재 우리가 살고 있는 사회와 문화에 어떠한 영향을 미치고 있는지에 대해 비판적으로 사고하고 능동적으로 생각할 수 있는 지적 역량을 갖추는데 주안점을 둔다.전선 / 대학원
본 강의는 정치외교학에서 양적 방법론의 기본이 되는 회귀분석 및 인과추론의 핵심을 전달하는 것을 목표로 한다. 우선 선형회귀 모형의 파라미터들을 최소자승법을 통해 추정하는 법을 배우고, 그 추정이 어떤 가정에 기반해 있는지, 가정들이 위배되는 경우 어떤 일이 일어나는지를 배운다. 그와 동시에 잠재적 결과 프레임워크(potential outcome framework), 또는 루빈 인과모형을 이해한다. 최종적으로 무작위대조연구, 회귀불연속설계이나 매칭, 이중차분법 등을 통해 실험연구 및 관찰연구에서 인과효과를 추론하는 법을 배운다. 본 강의는 통계학의 기본 개념(유의성 검정, 회귀분석, 통계적 추론 등)을 전제로 하며, 통계 소프트웨어 R을 이용하여 자료수집, 전처리, 분석, 시각화 및 문서 작성하는 실습도 포함한다. 수강생들은 한 학기 동안 소논문을 하나 작성하여 평가받게 된다.전선 / 대학원
중도절단 생존시간 자료를 분석하는 고급 통계적 기법들을 다룬다. 생존함수의 추정을 위한 일반적인 방법인 KaplanㅡMeier 추정량의 정의 및 여러 성질들을 다룬다. 좌 절단 자료의 분석을 위하여 필수적인 셈 과정에 대한 이론을 배우고, 이를 이용한 위험함수의 추정방법을 설명한다. 생존시간 자료의 회귀모형을 위하여 비례위험모형에 대하여 다루고, 회귀계수의 점근적 일치성 및 근사분포를 유도한다.전필 / 학사
본 과목에서는 정형 데이터와 비정형 데이터를 효과적으로 관리하고 분석하는 데에 필요한 제반 이론 및 기법을 배운다. 구체적으로, 본 과목의 전반부에서는 데이터베이스 (DB)를 기반으로 한 정보 시스템의 설계 및 구현, 그리고 DB 마이닝과 DB 기반 추천 시스템과 관련된 모형과 기법을 다루고, 후반부에서는 텍스트 데이터를 대상으로 정보 검색, 문서 분류 및 군집화를 위한 주요 이론과 방법론들을 소개한다. 아울러, 본 과목은 소개된 모형 및 기법들을 구현하여 다양한 형태의 데이터에 실적용해보는 프로젝트들을 포함하는 바, 이를 통해 실제 문제에 대한 해결 능력을 기르고, 관련된 기술적 이슈들을 경험해보는 것을 목표로 한다.