최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 연구는 유튜브의 악성 댓글을 자동으로 판별하는 기계학습 모델의 성능을 비교하고, 스태킹 앙상블 모델을 적용하여 성능 개선을 시도했습니다. 특정 채널의 인기 영상 댓글 데이터를 수집하여 악성/비악성 댓글 데이터셋을 구축하고, 다양한 분류 알고리즘을 적용한 결과, 스태킹 앙상블 모델이 단일 알고리즘의 장점을 결합하여 악성 댓글 분류 성능을 향상시켰습니다.
R을 이용한 텍스트 마이닝 =
Selecting models from data : artificial intelligence and statistics IV
Database Systems for Advanced Applications : 24th International Conference, DASFAA 2019, Chiang Mai, Thailand, April 22–25, 2019, Proceedings, Part II
Building machine learning systems with Python : scikit-learn 라이브러리로 구현하는 기계 학습 시스템
Reliable knowledge discovery
Text mining for opinion classification
머신 러닝 워크북
추천 시스템 : 기초부터 실무까지 머신러닝 추천 시스템 교과서
미디어 인공지능 : 영상 분야의 딥러닝 활용을 중심으로
Building machine learning systems with Python : scikit-learn 라이브러리로 구현하는 기계 학습 시스템
데이터 시대의 사회과학 : 한국 사회 해법 찾기
Intelligent Data Engineering and Automated Learning IDEAL 2000 : data mining, financial engineering, and intelligent agent : second international conference, Shatin, N.T., Hong Kong, China, December 13-15, 2000 : preceeding
머신 러닝과 통계 : 파이썬과 R로 배우는 머신 러닝
Machine learning : ECML-98 : 10th European Conference on Machine Learning, Chemnitz, Germany, April 1998 : proceedings
부정 적발 애널리틱스 : 조직 내 부정 위험 관리를 위한 데이터 과학 지침서
Web-Age Information Management : 16th International Conference, WAIM 2015, Qingdao, China, June 8-10, 2015. Proceedings
Advances in intelligent data analysis : third international symposium, IDA-99, Amsterdam, The Netherlands, August 1999 : proceedings
메이저리그 야구 통계학 : 빅데이터 분석의 시작 R
Applications of Machine Learning
인공지능은 왜 정치적일 수밖에 없는가 : AI의 정치학과 자유, 평등, 정의, 민주주의, 권력, 동물과 환경
디지털콘텐츠학회논문지
이신행, 이주연, 조민정, 박태강한국정보통신학회논문지
정민철, 이지현, 오하영IEEE Transactions on Computational Social Systems
Rahul Singhal; Rasha KashefExpert Systems with Applications
Karayiğit H.,İnan Acı Ç.,Akdağlı A.IEEE Transactions on Computational Social Systems
Singhal R.,Kashef R.Social Network Analysis and Mining
Sanjib Kumar Raul; Rashmi Ranjan Rout; D. V. L. N. SomayajuluIEEE Access
Oh H.Journal of Ambient Intelligence and Humanized Computing
Mullah N.S.,Zainon W.M.N.W.Journal of Intelligent & Robotic Systems: with a special section on Unmanned Systems
Alberto, Túlio C.; Lochter, Johannes V.; Almeida, Tiago A.Electronic Commerce Research
Mi C.,Li M.,Wulandari A.F.Journal of Intelligent and Fuzzy Systems
Abarna S.,Sheeba J.I.,Pradeep Devaneyan S.Procedia Computer Science
Shivsharan, Nitin; Kambli, Vikrant; Dabholkar, Siddhesh; Dalvi, Aditya; Sukali, TanajiJournal of Intelligent & Fuzzy Systems
S. Abarna; J.I. Sheeba; S. Pradeep Devaneyannpj Digital Medicine
Klein A.Z.,Sarker A.,Weissenbacher D.,Gonzalez-Hernandez G.Journal of Information Science Theory and Practice
염하늘, 황명권, 황민영, 정한민Journal of Computational Social Science
Dharil Patel; Pijush Kanti Dutta Pramanik; Chaitanya Suryawanshi; Preksha PareekInternational Journal of Intelligent Systems
Găman M.,Ionescu R.T.International Journal of Information Technology (Singapore)
Dasari S.K.,Gorla S.,Prasad Reddy P.V.G.D.Journal of Physics: Conference Series
M O Pratama; M E Syahputra; Wira Satyawan; Raspiani; B Pamungkas; Indri Neforawati; R Jannati디지털콘텐츠학회논문지
김진우, 조혜인, 이봉규전선 / 대학원
본 교과목은 데이터사이언스 대학원의 ABC(AI model/algorithm, Big data, Computing) 교육 과정 중 컴퓨팅(C) 분야 첫번째 강좌이다. 본 교과목의 전반부는 C++ 언어 프로그래밍과 C++ 기반 객체 지향 프로그래밍으로 이루어져 있다. (1) C++ 언어의 기초 문법, 클래스의 개념과 사용법, template과 중요한 라이브러리를 학습하고, (2) abstraction, inheritance, polymorphism 등 객체 지향 프로그래밍의 원리를 습득한 뒤, (3) 예제들을 통해 클래스 기반 객체 지향 프로그래밍을 C++ 언어를 사용하여 직접 구현 할 수 있도록 한다. 본 교과목의 후반부는 중급 자료 구조 및 알고리즘과 딥러닝 플랫폼으로 이루어져 있다. (1) 데이터사이언스를 위한 컴퓨팅의 기초 강좌에서 다루지 않은 자료구조 및 정렬 알고리즘 (Quick sort, Radix sort, heap sort), 트리 알고리즘, 그래프 알고리즘 (Dijkstra, Kruskal 등) 등을 습득하고, (2) 배운 자료 구조와 알고리즘들을 C++ 언어를 사용하여 직접 구현 할 수 있도록 한다. 또, (3) Pytorch, TensorFLow 등 널리 사용되는 딥러닝 플랫폼을 학습하고, 동일 학기 수강이 권장되는 머신러닝 및 딥러닝 1(ABC 과정 중 A 분야 첫번째 강좌)에서 배운 딥러닝의 기본 원리들을 직접 구현하고, 이에 더하여 상기 플랫폼을 통해 구현 할 수 있도록 한다.전선 / 대학원
계산이론은 컴퓨터공학의 기초학문이며, 중요한 문제에 대한 효율적인 알고리즘들을 소개하고, 그런 알고리즘의 복잡도 분석을 다룬다. 이 교과목에서는 먼저 알고리즘의 성능을 분석하는 기법, 특히 amortized analysis에 대해 배운다. 그리고, 계산이론 분야에서 중요한 알고리즘과 그 응용에 대해 배운다. 구체적으로, (스트링 매칭, 2차원 패턴 매칭, 근사 매칭, suffix trees, 데이터 압축 문제에 대한) 스트링 알고리즘과 bioinformatics에의 응용, (선택 문제, 다항식 확인 문제에 대한) randomized 알고리즘과 그 영향, (페이지 교체 문제, k 서버 문제에 대한) online 알고리즘과 금융문제(일방향 거래와 portfolio 선택 문제)에의 응용을 배운다.전선 / 대학원
기계학습은 다양한 분야에서 점차 큰 관심을 받고 있으나, 막상 실제 데이터에 적용하여 성공적인 결과를 도출하는 데에는 많은 어려움이 따른다. 본 과목은 기계학습 기법들을 실제 문제에 적용할 때에 중요한 데이터 전처리, 피쳐 추출, 차원 축소, 클래스 불균형, 모델 앙상블 등의 주제들을 다루고, 데이터로부터 모형과 종속성을 학습하는 원리와 기법들을 소개하는 바, 특히 확률, 통계 및 최적화 이론에 기반하여 신경망 (Neural Networks), 서포트 벡터 머신 (Support Vector Machines), 은닉 마르코프 모형 (Hidden Markov Models) 및 강화 학습 (Reinforcement Learning) 기법들을 공부한다. 또한, 이들 기법을 활용하여, 다양한 시계열 데이터들을 대상으로 예측 및 분류 모델을 구현하는 프로젝트들과 데이터 기반 학습의 사례 연구들이 포함된다.전필 / 학사
첨단융합학부 학생의 전공탐색을 위한 과목으로, 융합데이터과학의 핵심 개념과 다양한 응용 분야를 소개하여 향후 전공선택에 필요한 필수적인 정보를 제공한다. 특히, 융합데이터과학 분야에서 진행되는 첨단연구와 연구의 실제 응용 사례를 직접 체험하여, 자신의 전공 적성을 좀 더 구체적으로 알아보고 설계할 수 있는 기회를 제공한다.전선 / 대학원
이 과목은 보건의료 영역에서 컴퓨터를 활용한 텍스트 분석을 다룬다. 보건의료 영역에는 여러 종류의 언어 자료가 존재한다. 사람들이 온라인 공간에서 여러 질병에 대해 던지는 질문들, 보건의료 전문가들의 연구들, 질병과 건강에 대한 신문기사들이 그 예다. 이들로부터 정보를 체계적이고 과학적으로 추출할 수 있다면, 보건의료에서 다양한 방식으로 활용할 수 있다. 최근 많이 사용되고 있는 컴퓨터를 활용한 텍스트 분석은 이런 작업에 새로운 가능성을 제시한다. 본 과목에서는 여러 가지 컴퓨터를 활용한 텍스트 분석 방법을 학습하고, 보건의료 영역 자료에 적용하는 것을 실습한다.전선 / 대학원
다른 과목에서 배운 계량적 분석방법을 현실 농업문제에 응용한다. 비교정학(comparative statics)에 의한 모형분석, 칼만 필터(Kalman filter), 뉴럴 네트워크(neural network), 유전자 알고리즘(genetic algorithm), 부트 스트랩핑(boot strapping), 커널 추정(kernel estimation) 등을 다룬다.전선 / 대학원
현대 교육철학의 여러 이론들에서 발견되는 비판적 논점들에 대한 분석이 주된 관심사이다. 특히 이 비판적 논점들을 다룰 수 있기 위해서 요구되는 현대 교육철학 문헌들(Dewey, Peters, Oakeshott 등)에 대한 독서가 있어야 하며, 각각의 논점들을 나름대로 구조화하여 교육을 보는 체계적인 철학적 관점을 구성하는 데 도움이 되도록 해야 한다. 현대 교육철학의 입문서들에 대한 사전 지식을 필요로 하는 강의이다.전선 / 대학원
온라인 교육 활동이 활발해지면서 교육 분야의 데이터가 폭발적으로 증가하고 있다. 온라인 교육이 쏟아내는 빅 데이터의 추출과 분석은 오프라인 데이터의 분석과 함께 과학교육의 현황을 파악하고 미래를 위한 과학교육의 방향을 결정하는데 중요한 정보를 제공할 수 있다. 이 과목에서는 학생들이 빅 데이터 분석의 원리와 방법을 이해하고, 학습 결과를 온라인과 오프라인 과학교육과 사회현상의 분석에 응용하는 능력을 기르는 것을 목표로 하며, 데이터 마이닝을 위한 확률 개념을 바탕으로 수집된 데이터에서 최대의 정보를 추출하는 방법을 학습한다. 특히, 대표적 분류 모형인 퍼셉트론, 합성곱 신경망, 순환 신경망, 생성 모형으로 오토 인코더, 적대적 생성 신경망, 볼츠만 머신, 딥 빌리프 네트워크 등을 깊이 다룰 예정이다. 학생들은 이 주제들에서 학습한 내용을 교육 데이터 마이닝의 실습, 무크와 같은 대규모 학습의 분석에 응용하는 연습을 한다. 이 과목은 교육 통계와 좋은 보완이 될 수 있다. 그러나 강의를 이해하는데 필요한 통계 수학과 컴퓨터 프로그램 지식을 선행 지식으로 요구하지는 않는다.전선 / 대학원
본 교과목은 오늘날 인공지능의 중심을 이루는 거대언어모델(Large Language Models)과 이를 기반으로 한 대화형 인공지능을 다룬다. 특히 거대언어모델의 학습부터 응용까지 이어지는 전체 파이프라인을 아래와 같이 체계적으로 다룬다. (1) Pre-training: 지식 습득을 위한 사전학습(Transformer, BERT, GPTs) (2) Supervised Fine-tuning: 상호작용 학습(Dialogue Fine-tuning, Instruction Tuning, Reasoning) (3) Alignment: 인간 가치와의 정렬(RLHF, DPO, KTO 등) 및 언어모델 해석 기법(AI Psychometrics, Mechanistic Interpretability) (4) Grounding: 외부 데이터 및 도구 활용 기법(페르소나, 문서, 이미지, 지식 그래프, 도구 증강 에이전트) (5) Applications: 다양한 도메인으로의 응용(대화 시뮬레이션 및 심리상담·교육·설득 응용) 수업에서는 각 연구 주제별로 핵심 논문들의 아이디어, 데이터, 방법론 등을 강의한다. 실습으로는 언어모델 학습, 언어모델 API를 이용한 대화 시스템 구현, 대화형 인공지능과 관련된 작은 연구 프로젝트를 수행한다. 이 과목을 통해 수강생들은 거대언어모델 연구 동향을 큰 틀에서 파악하고, 핵심적인 연구 주제들과 방법론을 이해하며, 이를 실제 연구에 적용하는 능력을 기르게 된다.전선 / 대학원
이 교과목에서는 비선형시스템 식별에 관련된 각종 실용적 기법들을 소개한다. 또한, 비선형 목적함수의 최적문제의 해를 구하는 각종 비선형프로그래밍기법도 소개한다. 단, 비선형궤환제어와 컴퓨터 네트워크 등에 효과적으로 사용될 수 있는 기법들에 국한하여 심도 있게 공부하고 실제 응용 예를 통하여 그 가능성을 토의한다.전선 / 학사
문제를 해결하기 위해 알고리즘을 구성하고 이를 분석하는 방법에 대해 강의한다. 알고리즘의 효율성 분석 도구(점근적 복잡도, 점화식), 정렬 및 선택 알고리즘, 자료의 저장과 검색(검색 트리, 해시 테이블), 집합의 처리, 동적 프로그래밍, 그래프 알고리즘, 문자열 매칭, 계산의 한계(NP-completeness), 상태공간 트리의 탐색 등을 다룬다.전선 / 대학원
이 수업은 디지털 미디어의 사회침투 (mediatization; 미디어화)에 따라 네트워크가 하나의 범사회적인 구성원리로 부상하는 현상을 주로 인간관계의 형성과 유지에 관한 논의에 초점을 두고 학습합니다. 미디어가 우리의 일상과 어떻게 결합하는지, 즉 우리가 주변사람들 혹은 공동체와 맺는 관계를 중심에 두고 그 관계 위에서 공유되는 정보와 감정, 개인과 공동체와의 관계 등이 미디어화와 더불어 어떤 변화를 겪는지를 보고자 합니다. 기존 연구에 대한 학습과 동시에 실제 우리 일상에 대해 비판적으로 ‘관찰’하고 책 바깥으로 나와 생각하는 연습을 통해 다시 미디어의 본질에 관한 통찰력을 키워보고자 합니다. 미디어화에 따른 인간관계망의 변화, 개인과 집단의 미디어 이용, 공동체의 형성, 협력관계의 발생 등의 이슈를 다룹니다.전선 / 대학원
본 교과목에서는 AI가 매스 커뮤니케이션을 포함한 인간 커뮤니케이션 전 영역에 걸쳐 메시지 작성, 확산, 큐레이션(curation) 등 보다 다양하고 적극적인 역할(agency)을 수행하게 됨에 따라 대두되는 질문들을 (a) 인간-AI 커뮤니케이션(human-AI communication)과 (b) AI 매개 커뮤니케이션(AI-mediated communication)의 하위 분야로 나누어 심층적으로 고찰한다. 먼저 인간-컴퓨터 상호작용(human-computer interaction), 컴퓨터 매개 커뮤니케이션(computer-mediated communication) 분야의 대표적 이론 및 관련 실증연구들을 학습하고, AI 발전에 따른 최신 연구동향을 검토한다. 실제 AI 활용 사례(예; AI 스피커, AI 뉴스 추천 시스템. 챗봇)를 대상으로 기술적 속성, 이용자들의 속성, 커뮤니케이션 맥락 등에 따라 기존 이론 및 모델을 어떻게 수정, 보완, 확장해야 하는지 논의한다. 이를 통해 커뮤니케이션학에서 AI의 문제를 어떻게 정의하고 연구할 것인가에 대한 이해를 증진시킬 것이다.전선 / 학사
통계분석 결과를 정확히 이해·해석하기 위한 확률과 기술통계, 가설검정, F 분포와 분산분석, 회귀·상관, 범주형·빈도 분석을 다룬 뒤, 머신러닝의 핵심 개념을 가볍게 소개한다. 간단한 분류·회귀·군집 알고리즘 및 기초적 모델 해석 가능성과 윤리·편향 이슈를 실습 중심으로 학습한다.전선 / 학사
본 과목에서는 대용량의 텍스트를 분석하여 유의미한 결론을 도출하는 텍스트마이닝 기법에 대해 강의한다. Natural language processing, probabilistic topic model, text clustering, text categorization, contextual text mining 등, 텍스트마이닝 분야의 핵심 Keyword 및 기법에 대해 다룬다.전선 / 대학원
이 강의에서는 인공지능 신뢰성 문제, 즉 인공지능의 가치정렬, 적법·윤리성, 견고성을 측정·확보하는 기법과 이를 촉진하기 위한 제도의 설계 방안을 학습한다. 이를 위해 리스크의 측정·경감 기술의 이해 뿐 아니라 인문·사회과학·법적 관점을 융합한 다양한 접근을 제시한다. 구체적으로 공정한 기계학습, 설명 가능한 AI, 인간-AI 상호작용, 프라이버시 보존 데이터 분석, 자율시스템의 안전성, 인지모델의 견고성, 생성모델의 권리침해와 오남용 문제, 자율살상무기체계의 통제 등을 탐색한다.전선 / 대학원
인간의 다양한 운동기술을 주의깊게 관찰하고 효과적으로 연구하는 방법뿐만 아니라 이러한 복잡한 기술들을 정성적으로 분석하는 여러 가지 운동역학적 접근 방법에 대해 배운다. 특히, 인간의 효율적인 운동동작 수행을 위한 주요 원리와 함께 각종 운동상해 원인에 대한 규명 및 예방방법, 그리고 더 나아가 운동 기술의 수행력을 최대로 하기 위한 기술개발 등에 대한 내용을 중심으로 구성된다.전필 / 대학원
‘정책사례연습’은 현장의 정책사례를 과학적 방법론의 시각에서 분석·토론하고 이를 보고서 실적물의 형태로 산출하는 것을 기본과제로 하며, 이를 통해 경험적 연구 역량의 함양과 문제해결 역량을 배양하는 데 그 목적이 있다. 이는 기존의 이론 중심의 교육에서 탈피하여 현장 밀착형, 사례 위주의 교육으로 전환하고, 이를 통해 세부 정책분야(공공관리·도시교통환경·국제·보건·융합과학기술·그 외 분야에서 정책 처방의 타당성과 실현 가능성을 제고하려는 취지이다. 따라서 정책분야 및 사례별 전문성이 요구되므로 해당 분야의 전문연구자인 여러 교수가 공동으로 순환하며 강의하는 것을 원칙으로 한다. ‘정책사례연습 1’에서는 정책사례를 분석할 수 있는 다양한 연구방법론과 적용례를 제시함으로써 수강생들로 하여금 본인의 관심 정책분야에서 실제 사례를 발굴하여 실적물을 작성할 수 있도록 안내하고, 연구계획서의 작성을 지원한다.전선 / 대학원
통계적 기계학습 방법은 데이터과학 및 인공지능 분야에서 핵심 방법론으로 사용되고 있다. 본 강의에서는 통계적 기계학습 방법론을 소개하고 기본 이론을 배운다. 주로 지도학습방법론을 위주로 다루며, 의사결정론, 고차원 선형모형, 비모수 함수추정, 의사결정나무와 앙상블, Support vector machine 그리고 딥러닝에 대한 이론 및 알고리즘을 가르친다. 그리고 지도학습 알고리즘을 관통하는 통계학적 원리인 M-추정량에 대해서 논의한다.전선 / 대학원
데이터마이닝 (Data Mining)은 대용량 데이터베이스에 존재하는 데이터 간의 관계, 패턴, 규칙 등을 찾아내고 모형화해서 의사결정을 돕고, 유용한 정보로 변환하는 일련의 과정이다. 본 강좌에서는 기술모델링과 예측모델링에 사용되는 통계학, 기계학습, 신경회로망 기법들을 공부하고, 응용 사례 연구와 패키지를 이용한 프로젝트를 수행한다.