최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 연구는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 정확도를 향상시키는 방안을 제안합니다. 이질적인 데이터 소스로부터 추출한 형질을 원 문서에 노이즈 형태로 삽입하여 이질성 학습을 수행하고, 분류 규칙 중 정확도 향상에 기여하는 규칙만을 선별하여 적용하는 규칙선별 기반 앙상블 준지도학습을 제안합니다. 뉴스, 블로그, 소셜 미디어 등 다양한 출처의 텍스트 데이터를 활용하여 실험을 진행했습니다.
Intelligent text categorization and clustering
Text as data : a new framework for machine learning and the social sciences
Unsupervised learning : a dynamic approach
Machine learning paradigms : applications in recommender systems
Model-based clustering and classification for data science : with applications in R
Foundations of intelligent systems : 11th International Symposium, ISMIS'99, Warsaw, Poland, June 1999 : proceedings
Feature extraction, construction and selection : a data mining perspective
Data analytics in bioinformatics : a machine learning perspective
Mining the Web : discovering knowledge from hypertext data
Natural language processing for online applications : text retrieval, extraction, and categorization
Empirical model discovery and theory evaluation : automatic selection methods in econometrics
(SAS Text Miner를 활용한) 텍스트 마이닝 방법론
Survey of text mining : clustering, classification, and retrieval
Classification methods for remotely sensed data
Numbers, hypotheses & conclusions : a course in statistics for the social sciences
Semiparametric theory and missing data
Machine learning : ECML-98 : 10th European Conference on Machine Learning, Chemnitz, Germany, April 1998 : proceedings
Machine learning for social and behavioral research
Asia Pacific Journal of Information Systems
William Xiu Shun Wong; Donghoon Lee; 김남규Procedia Computer Science
N J, Avinash; Rao, Krishnaraj; H, Rama Moorthy; B, Raviprakash; K R, Raghunadan; Vasudeva; M, VenkatadriArtificial Intelligence Review
Kadhim A.I.Journal of Physics: Conference Series
Khalaf, Z.A.; Jawad, Z.M.National Academy Science Letters
Thirumoorthy, K.; Muneeswaran, K.Neural Computing and Applications
Dhal P.,Azad C.Journal of Physics: Conference Series
Santi Wulan Purnami; Dian Puspita Hapsari; Imam UtoyoMathematics
Dang Y.,Chen W.,Zhang X.,Chen H.Applied Artificial Intelligence
Kwangil Park; June Seok Hong; Wooju KimJournal of Interconnection Networks
Sanqiang Wei; Wei Li; Wenxia Song; Hongxia Hou; Hua SunACM Transactions on Asian and Low-Resource Language Information Processing
Ashokkumar, P.; Siva Shankar, G.; Srivastava, G.; Maddikunta, P.K.R.; Gadekallu, T.R.Journal of King Saud University - Computer and Information Sciences
Larabi Marie-Sainte S.,Alalyani N.Journal of Data and Information Quality
Shalmoli Ghosh; Anurag Roy; Kripabandhu Ghosh; Saptarshi GhoshApplied Sciences (Switzerland)
Ekolle Z.E.,Kohno R.Sādhanā: Published by the Indian Academy of Sciences
TÜFEKCİ, PINAR; BEKTAŞ, MELİKEExpert Systems with Applications
Mohasseb A.,Bader-El-Den M.,Cocea M.Journal of Data and Information Quality
Roy A.,Ghosh S.,Ghosh K.,Ghosh S.IEEE Access
Hasib K.M.,Azam S.,Karim A.,Marouf A.A.,Shamrat F.M.J.M.,Montaha S.,Yeo K.C.,Jonkman M.,Alhajj R.,Rokne J.G.Concurrency and Computation: Practice and Experience
Köksal Ö.,Yılmaz E.H.Journal of Shanghai Jiaotong University (Science)
Xu, Zewen; Li, Jianqiang; Liu, Bo; Bi, Jing; Li, Rong; Mao, Rui전선 / 학사
프로그램 안에서 데이터를 효율적으로 저장하고 접근하도록 자료구조의 다양한 개념을 소개한다. 특히 같은 목적을 위해 작성된 코드안에서 사용 가능한 여러 가지 자료구조들 중에서 어떤 자료 구조가 어떤 상황에서 더 유리한 지를 이해하고, 주어진 응용에 적합한 자료구조를 선택하고 새로운 자료구조를 디자인 할 수 있는 감각을 기른다. 이를 위해 수학적인 분석과 프로그래밍 실습을 통한 다양한 자료구조의 평가를 수행한다.전선 / 학사
본 과목에서는 대용량의 텍스트를 분석하여 유의미한 결론을 도출하는 텍스트마이닝 기법에 대해 강의한다. Natural language processing, probabilistic topic model, text clustering, text categorization, contextual text mining 등, 텍스트마이닝 분야의 핵심 Keyword 및 기법에 대해 다룬다.전필 / 학사
본 과목에서는 정형 데이터와 비정형 데이터를 효과적으로 관리하고 분석하는 데에 필요한 제반 이론 및 기법을 배운다. 구체적으로, 본 과목의 전반부에서는 데이터베이스 (DB)를 기반으로 한 정보 시스템의 설계 및 구현, 그리고 DB 마이닝과 DB 기반 추천 시스템과 관련된 모형과 기법을 다루고, 후반부에서는 텍스트 데이터를 대상으로 정보 검색, 문서 분류 및 군집화를 위한 주요 이론과 방법론들을 소개한다. 아울러, 본 과목은 소개된 모형 및 기법들을 구현하여 다양한 형태의 데이터에 실적용해보는 프로젝트들을 포함하는 바, 이를 통해 실제 문제에 대한 해결 능력을 기르고, 관련된 기술적 이슈들을 경험해보는 것을 목표로 한다.전선 / 대학원
전자의무기록, 소셜 미디어, 건강보험자 등 여러 자료원으로 부터 많은 양의 정형, 비정형 보건의료데이터가 생성되고 있다. 이런 데이터에서 얻은 정보와 지식은 보건의료서비스전달체계를 향상하고 의료비를 줄이는 데 활용할 수 있다. 보건의료분야에서 생성되는 데이터는 용량이 크고 복잡하여 분석하는 것도 쉽지 않고 그 분석결과를 임상실무에 적용하는 것 또한 쉽지 않다. 이 교과목에서는 전자의무기록, 소셜 미디어, 건강보험자 등에서 생산되는 보건의료 빅데이터의 특성과 이들 데이터를 분석하는 기법에 대해 소개한다. 본 교과목에서 데이터마이닝/기계학습, 분류등과 같은 정형데이터의 분석기법 뿐 아니라 자연어처리, 텍스트 마이닝 등 비정형데이터 분석기법을 포함한다.전선 / 대학원
소셜 컴퓨팅과 라지데이터 분석 등이 커뮤니케이션 분야에서도 중요한 이슈로 부상함에 따라 컴퓨터공학을 전공하지 않은 연구자들도 소셜 네트웍 시스템의 기술적, 구조적 특성을 이해할 필요가 있다. 이 수업에서는 Ruby나 Python 등을 사용한 기초 프로그래밍 학습과, 웹 기반 기술(web technology), 데이터베이스 등의 관련 기술에 대한 학습을 통해 실제로 소셜 네트웍을 개발하고 분석하는 방법을 배운다. 또한, 이 과정에서 트위터 등의 소셜 네트웍의 데이터 마이닝 기법을 배우고 소셜 네트웍 분석을 실습을 통해 학습한다.전선 / 학사
컴퓨터를 활용하여 문제를 해결할 시 그 활용이 필수적인 기본적인 자료 구조에 대해 가르친다. 배열, linked list, stack, queue, priority queue, search tree, hash table, balanced search tree 등의 자료구조의 구성, 활용 방법 및 효율성을 강의한다. Python 기반의 숙제를 통해 수강생이 직접 각 자료구조를 구현/활용할 수 있는 능력을 배양한다.전선 / 학사
수많은 기업과 조직들은 머신러닝과 AI를 빅데이터에 적용하여 의사결정을 내리고 가치를 창출하고 있습니다. 하지만 그 과정에서 점점 커져가는 데이터와 점점 복잡해져 가는 알고리즘을 의사결정자인 사람이 이해하는 것이 필수적으로 선행되어야 합니다. 데이터 시각화는 데이터와 알고리즘을 사람이 직관적으로 이해할 수 있도록 도와주는 강력한 도구입니다. 이 수업을 통해 학생들은 다양한 유형의 데이터를 요약하고 시각적으로 표현하여 다른 사람과 효과적으로 커뮤니케이션 할 수 있는 방법들에 대해서 배울 것입니다.전선 / 학사
사물인터넷(IoT)을 비롯한 스마트 환경과 소셜네트워크 서비스의 보편화로 인해 다양하고 방대한 데이터가 발생하고 있다. 이와 함께 막대한 양의 데이터를 신속하게 처리할 수 있는 컴퓨팅 환경의 발달과 창의적인 시각으로 데이터를 분석하고 연결하는 인공지능의 개발로 빅데이터는 여러 분야의 혁신적인 패러다임으로 등장하고 있다. 빅데이터는 데이터 그 자체의 효용성보다는 다양한 방법의 가공을 통한 데이터 간의 연결 및 창의적인 분석을 통해 혁신적인 가치를 창출하고 있으며, 빅데이터의 분석과 활용은 산업과 국가 경쟁력의 척도가 되고 있다. 빅데이터의 분석을 통해 새로운 가치를 창출하기 위해서는 다학제적 융합연구가 필요하다. 이 강의에서는 빅데이터 기업, 연구소 및 학계 전문가들을 초빙하여 최신 빅데이터 기술 경향에 대하여 알아본다. 또한 실제 업무에서 사용되는 툴을 활용하여 다양한 분석 기법을 공부하게 된다. 빅데이터 분야에 관심있는 학생들에게 진로 및 전공 선택에 대한 전망을 제시하게 될 것이다.전선 / 학사
문제를 해결하기 위해 알고리즘을 구성하고 이를 분석하는 방법에 대해 강의한다. 알고리즘의 효율성 분석 도구(점근적 복잡도, 점화식), 정렬 및 선택 알고리즘, 자료의 저장과 검색(검색 트리, 해시 테이블), 집합의 처리, 동적 프로그래밍, 그래프 알고리즘, 문자열 매칭, 계산의 한계(NP-completeness), 상태공간 트리의 탐색 등을 다룬다.전선 / 대학원
질적 연구의 설계, 질적 데이터의 수집, 체계적인 질적 데이터의 분석, 질적 데이터를 활용한 텍스트마이닝 방법에 대해 이론과 실습을 통해 학습한다.전선 / 학사
이 강의에서는 실질적 문제해결을 위한 다양한 자료 분석 방법론의 이해와 적용을 경험한다. 해결하고자 하는 문제의 구체화를 포함하여, 데이터의 수집 및 정리, 탐색적 데이터분석, 시각화, 통계적 추론 및 예측 그리고 의사결정의 핵심 원리를 배운다. 정형 데이터뿐만 아니라 비정형 데이터(텍스트 데이터, 공간 데이터, 네트워크 데이터) 분석 방법도 다루며, 이러한 데이터에 적합한 시각화 및 분석 기법을 학습한다. 학생들은 다양한 데이터의 구조를 이해하고 적절한 자료 분석 방법을 선택하며, 실습을 통해 배운 내용을 실제 문제에 적용하여 해결하는 전 과정을 경험한다. 이를 통해 문제해결 능력과 실무에서 활용 가능한 분석 역량을 효과적으로 향상시킨다.전선 / 대학원
온라인 교육 활동이 활발해지면서 교육 분야의 데이터가 폭발적으로 증가하고 있다. 온라인 교육이 쏟아내는 빅 데이터의 추출과 분석은 오프라인 데이터의 분석과 함께 과학교육의 현황을 파악하고 미래를 위한 과학교육의 방향을 결정하는데 중요한 정보를 제공할 수 있다. 이 과목에서는 학생들이 빅 데이터 분석의 원리와 방법을 이해하고, 학습 결과를 온라인과 오프라인 과학교육과 사회현상의 분석에 응용하는 능력을 기르는 것을 목표로 하며, 데이터 마이닝을 위한 확률 개념을 바탕으로 수집된 데이터에서 최대의 정보를 추출하는 방법을 학습한다. 특히, 대표적 분류 모형인 퍼셉트론, 합성곱 신경망, 순환 신경망, 생성 모형으로 오토 인코더, 적대적 생성 신경망, 볼츠만 머신, 딥 빌리프 네트워크 등을 깊이 다룰 예정이다. 학생들은 이 주제들에서 학습한 내용을 교육 데이터 마이닝의 실습, 무크와 같은 대규모 학습의 분석에 응용하는 연습을 한다. 이 과목은 교육 통계와 좋은 보완이 될 수 있다. 그러나 강의를 이해하는데 필요한 통계 수학과 컴퓨터 프로그램 지식을 선행 지식으로 요구하지는 않는다.전선 / 학사
에너지 수요 급증, 탄소중립, 환경 문제 등으로 인해 에너지 생산 및 사용의 효율성이 보다 중요해지고 있다. 본 교과목에서는 에너지 생산 및 사용의 효율성을 향상시킬 수 있는 데이터 사이언스 기법을 학습한다. 데이터 사이언스는 자료에 숨겨진 유의미한 패턴을 여러 분야의 기법을 사용하여 찾아내는 분야이다. 본 교과목에서는 대표적인 데이터 사이언스 기법인 주성분 분석, 다차원 척도법 등의 차원축소 기법, k-means 클러스터링, 밀도기반 클러스터링 등의 클러스터링 기법, 딥러닝, Support Vector Machine 등의 기계학습 기법을 학습한다. 학습한 데이터 사이언스 기법들을 에너지 데이터에 대해 특성 추출 및 분류, 이상현상 탐지 및 분류, 수요 및 가격 예측, 개발 계획의 신속한 최적화 등 다양한 문제에 적용하는 실습을 수행한다.전선 / 대학원
주어진 지식과 경험을 바탕으로 앞으로 주어질 작업을 효율적이고 체계적으로 수행할 수 있는 컴퓨터 프로그램 개발에 많은 연구가 계속되어 오고 있다. 이러한 연구의 핵심 분야인 기계 학습(Machine Learning)에 관한 강의로써 현재까지 발표된 대표적인 연구 논문들을 중심으로 이론 및 알고리즘, 응용 분야 등을 설명한다.전선 / 학사
이 교과목은 다양한 학습 데이터를 분석하여 학습자의 흥미와 필요를 고려한 맞춤형 학습을 설계하는 방법을 소개한다. 인공지능을 활용하여 학습활동을 자동으로 분석하고 학습결과를 예측하며, 그 결과를 바탕으로 교수자와 인공지능이 적응적으로 학습을 지원하는 방안을 탐색한다. 학습 상황과 학습자의 특성에 따라 최적의 학습경험을 어떻게 설계하고 지원할 수 있는지 논의한다. 그리고 디지털 테크놀로지를 활용하여 공교육에서 학습 데이터를 수집, 분석, 활용하는 과정에서 발생하는 사회적 문제를 비판적으로 검토하고 창의적인 해결방안을 모색한다.전선 / 대학원
기계학습은 다양한 분야에서 점차 큰 관심을 받고 있으나, 막상 실제 데이터에 적용하여 성공적인 결과를 도출하는 데에는 많은 어려움이 따른다. 본 과목은 기계학습 기법들을 실제 문제에 적용할 때에 중요한 데이터 전처리, 피쳐 추출, 차원 축소, 클래스 불균형, 모델 앙상블 등의 주제들을 다루고, 데이터로부터 모형과 종속성을 학습하는 원리와 기법들을 소개하는 바, 특히 확률, 통계 및 최적화 이론에 기반하여 신경망 (Neural Networks), 서포트 벡터 머신 (Support Vector Machines), 은닉 마르코프 모형 (Hidden Markov Models) 및 강화 학습 (Reinforcement Learning) 기법들을 공부한다. 또한, 이들 기법을 활용하여, 다양한 시계열 데이터들을 대상으로 예측 및 분류 모델을 구현하는 프로젝트들과 데이터 기반 학습의 사례 연구들이 포함된다.전선 / 대학원
최근 오감을 이용하는 것을 전제로 하여 AI 기술이 적용된 스마트 스피커, TV, 모바일 기기, AR/VR, 등 다양한 기기를 교실 환경에서 이용하기 위해서는 개별 과목과 콘텐츠를 기기와 기술에 맞게 재설계하는 것이 필요하게 된다. 이를 위하여 개별 과목의 교육 콘텐츠를 분류하는 기준을 정의하고 여러 콘텐츠를 디지털화하는 방법을 고안해야 할 것이다. 본 과목은 특히 인문 사회 과목의 전공자들이 각각 담당하는 과목과 내용에 맞는 교수 방법론과 콘텐츠 설계 방법을 정의하도록 지도하며 이를 바탕으로 일반적인 교육 콘텐츠 설계 방법을 도출해 내는 것을 목적으로 한다.전선 / 학사
현대의 과학, 공학, 그리고 경영의 응용시스템은 데이터에 점점 더 많이 의존하게 되었지만 전통적인 데이터 분석 기술들은 복잡한 빅 데이터 시대에 맞도록 설계되어 있지 않는 실정이다. 데이터를 수집, 저장, 가공하여 그 안에서 지식을 추출하는 빅 데이터 분석은 새로운 과제들을 탐구하는 흥미 있고 빠르게 발전하는 하나의 학문으로 등장하였다. 본 강의에서는 프로그래밍 경험이 많지 않는 학생들을 대상으로 데이터의 수집 및 분석뿐만 아니라 데이터 프로그래밍 언어의 사용에도 초점을 맞춰 이를 바탕으로 빅 데이터 분석의 토대를 마련하는 것을 목표로 한다.전선 / 대학원
이 과목은 보건의료 영역에서 컴퓨터를 활용한 텍스트 분석을 다룬다. 보건의료 영역에는 여러 종류의 언어 자료가 존재한다. 사람들이 온라인 공간에서 여러 질병에 대해 던지는 질문들, 보건의료 전문가들의 연구들, 질병과 건강에 대한 신문기사들이 그 예다. 이들로부터 정보를 체계적이고 과학적으로 추출할 수 있다면, 보건의료에서 다양한 방식으로 활용할 수 있다. 최근 많이 사용되고 있는 컴퓨터를 활용한 텍스트 분석은 이런 작업에 새로운 가능성을 제시한다. 본 과목에서는 여러 가지 컴퓨터를 활용한 텍스트 분석 방법을 학습하고, 보건의료 영역 자료에 적용하는 것을 실습한다.전선 / 대학원
현대 경영에서의 의사 결정은 데이터의 분석 결과에 점점 더 많이 의존하고 있는 추세다. 정형 데이터 뿐만 아니라 비정형 데이터를 인터넷 상에서 수집, 저장, 가공하여 그 안에서 경영 인사이트를 추출하는 빅데이터 분석의 중요성은 날로 증가하고 있다. 이 강의는 프로그래밍 경험이 많지 않은 학생들을 대상으로 프로그래밍 언어의 기초뿐만 아니라 데이터의 수집 및 분석의 모든 과정을 살펴봄으로써 데이터 기반 의사 결정에 대한 이해를 높이고 기계학습 및 인공지능에서 사용하는 프로그래밍 언어가 산업 전반에 걸쳐 어떻게 활용되고 있는지에 대한 기초 지식을 제시한다. 또한 프로그래밍 언어를 실제 데이터에 적용하는 실습 과정을 통해 실전 문제에 대한 응용력을 배양하고, 향후 경영 환경에서의 실무 적용능력의 토대를 제공한다.