최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 논문은 데이터 스트림 환경에서 연관 규칙 탐사를 위한 새로운 방법을 제안한다. 제안 방법은 이벤트 발생 간격에 따른 가변 윈도우와 COBJ 계산법을 이용하여 데이터 항목을 추출하고, FPMDSTN 알고리즘을 통해 실시간으로 연관 규칙을 탐사한다. 실험 결과, 제안 방법이 기존 방법보다 스트림 환경에서 효율적임을 입증하였다.
연관규칙 및 빈발항목 집합분석
Research and development in knowledge discovery and data mining : Second Pacific-Asia Conference, PAKDD-98, Melbourne, Australia, April 15-17, 1998 : proceedings
카프카 스트림즈와 ksqIDB 정복 : 실시간 데이터 처리
Principles of data mining and knowledge discovery : Second European Symposium, PKDD '98, Nantes, France, September 1998 : proceedings
Rare association rule mining and knowledge discovery : technologies for infrequent and critical event detection
아파치 Storm을 이용한 분산 실시간 빅데이터 처리
(머신러닝을 활용한) R 데이터 분석
Advances in knowledge discovery in databases
빅데이터 마이닝 : 하둡을 이용한 대용량 데이터 마이닝 기법
Database Systems for Advanced Applications : 24th International Conference, DASFAA 2019, Chiang Mai, Thailand, April 22–25, 2019, Proceedings, Part II
Next generation information technologies and systems : 4th International Workshop, NGITS'99, Zikhron-Ya'akov, Israel, July 1999 : proceedings
(칼퇴족 김 대리는 알고 나만 모르는) SQL : 기초편
Web-Age Information Management : 16th International Conference, WAIM 2015, Qingdao, China, June 8-10, 2015. Proceedings
Advances in data mining : applications in E-commerce, medicine, and knowledge management
Advances in intelligent data analysis : third international symposium, IDA-99, Amsterdam, The Netherlands, August 1999 : proceedings
Mining of massive datasets
COMPSTAT : proceedings in computational statistics, 18th symposium Held in Porto, Portugal, 2008
(인사이드) 윈도우즈 포렌식
Mining of massive datasets
데이터마이닝의 원리와 구현 : R과 함께
정보처리학회논문지D
한갑수정보처리학회논문지D
김민정, 이원석, 신세정정보처리학회논문지D
장중혁, 이원석정보처리학회논문지D
김대인, 박준, 김홍기, 황부현Procedia Technology
PhridviRaj, M.S.B.; GuruRao, C.V.정보과학회논문지 : 데이타베이스
황부현, 채덕진Procedia Computer Science
Srimani, P.K.; Mrs.Patil, Malini M.通化师范学院学报 / Journal of Tonghua Normal University
汪峰坤; 张婷婷; WANG Feng-kun; ZHANG Ting-tingInternational Journal of Database Theory and Application
Y ingmei XuCluster Computing
Liu F.,Wang Q.,Wang X.Procedia Technology
PhridviRaj, M.S.B.; GuruRao, C.V.정보처리학회논문지D
정병수, Ahmed FarhanJournal of Physics: Conference Series
Sastrt, J.S.V.R.S.; Suresh, V.Procedia Computer Science
Liana Maria Crivei; Gabriela Czibula; Diana-Lucia Miholca정보처리학회논문지. 소프트웨어 및 데이터 공학
최필선, 김환, 김대인, 황부현정보보호학회논문지
정재열, 김기성, 정익래Journal of Ambient Intelligence and Humanized Computing
Li J.,Cao W.,Huang J.디지털콘텐츠학회논문지
황정희정보처리학회논문지D
채덕진, 김룡, 이용미, 황부현, 류근호Procedia Computer Science
Desai, Darshana; Joshi, Abhijit전선 / 학사
데이터 마이닝은 대용량 데이터에서 유용한 패턴을 찾기 위한 이론과 기법을 의미한다. 본 과목에서는 데이터 마이닝을 위한 주요 알고리즘 및 이론(유사 아이템 검색, 빈발 패턴 검색, 링크 분석, 데이터 스트림 마이닝, 클러스터링, 그래프 마이닝 등)을 다룬다.전선 / 학사
데이터마이닝은 대용량 데이터에서 유용한 패턴을 찾기 위한 이론과 기법을 의미한다. 데이터마이닝은 웹, 사기 탐지, 추천 시스템, 사이버 보안 등 중요한 응용에 활용되고 있다. 본 과목에서는 데이터마이닝을 위한 중요 알고리즘과 이론을 설명한다. 주요 학습 주제로 mapreduce, 유사 아이템 검색, 빈발 패턴 검색, 링크 분석, 데이터 스트림 마이닝, 클러스터링, 그래프 마이닝 등을 다룬다.전선 / 대학원
데이터마이닝 (Data Mining)은 대용량 데이터베이스에 존재하는 데이터 간의 관계, 패턴, 규칙 등을 찾아내고 모형화해서 의사결정을 돕고, 유용한 정보로 변환하는 일련의 과정이다. 본 강좌에서는 기술모델링과 예측모델링에 사용되는 통계학, 기계학습, 신경회로망 기법들을 공부하고, 응용 사례 연구와 패키지를 이용한 프로젝트를 수행한다.전선 / 대학원
본 교과목은 데이터를 분석하여 유용한 정보를 추출하고 모델을 만들어 예측에 사용하는 데이터 마이닝에 대해 보다 깊이 있게 소개한다. 데이터마이닝의 중요한 알고리즘, 기반 기술, 대용량 데이터를 효과적으로 처리하는 마이닝 기술 등을 학습한다. 그리고 분산 시스템과 다수의 머신을 이용하여 빠르고 확장성 있게 대용량 데이터를 처리하는 방법을 논의한다. 또한 여러 실제 세계 응용에 어떻게 데이터마이닝을 적용하는지에 대해서도 논의한다. 주요 주제로 그래프 데이터 분석, 행렬/텐서 데이터 분석, 비정상 이벤트 탐지 등이 있다.전선 / 대학원
소음진동 데이터의 측정과 분석기법을 이해하기 위하여, 주로 랜덤데이타 분류, 코릴레이션 함수, 스펙트럼 밀도함수, 통계적 오차, 시스템 응답함수, 디지털 데이터 획득기법, FFT 구현 및 소음진동문제의 응용예들을 다룬다.전선 / 대학원
한정된 자료들 사이의 공간적 상호관계를 분석하고 이를 바탕으로 임의의 위치에서 원하는 자료값을 예측하는 여러 크리깅 기법을 공부한다. 주어진 값과 그 분포를 항상 보전하는 조건부 시뮬레이션과 불확실성을 줄이기 위해 이용가능한 자료를 통합하여 사용하는 최적화 기법을 공부한다.전선 / 학사
통계학, 인공지능, 컴퓨터공학의 도구를 총체적으로 사용하는 데이터마이닝은 기존의 과학 및 공학 분야 뿐 아니라 생산, 마케팅, 금융 등과 같은 비즈니스 분야에도 활발히 사용되고 있다. 본 강좌에서는 데이터마이닝의 기본적인 문제인 클러스터링, 분류, 연관분석 등과 해당 기법들을 소개한다. 또한, 실제 비즈니스에서 데이터마이닝이 사용되는 배경 및 사례를 공부한다. 생산, 마케팅, 금융 분야의 실제 데이터를 사용하여 마이닝을 수행하는 프로젝트를 함으로써 이들 분야에 있어서의 데이터마이닝의 특성을 이해하고 문제해결능력을 제고하고자 한다.전선 / 대학원
본 과목에서는 효율적인 알고리즘 설계와 프로그래밍을 위한 고급 방법론과 이론을 깊이 있게 소개하고, 다양한 실습을 통하여 해당 이론들을 체득한다. 이 과정에서 공부하는 내용들은 Sorting, Searching 그리고 Graph Theory, NP―Complete 등이며, 알고리즘 설계 방법으로는 Divide―and―Conquer, Dynamic Programming, Greedy, Randomized 그리고 Approximate 알고리즘 등에 관하여 공부한다. 여러 가지 유용한 문제들에 대해 알고리즘을 설계하고 실제 프로그래밍을 통하여 구현해 봄으로서 강의시간에 소개된 이론을 실습하고 시스템 구현에 필요한 노하우를 습득한다.전선 / 대학원
온라인 교육 활동이 활발해지면서 교육 분야의 데이터가 폭발적으로 증가하고 있다. 온라인 교육이 쏟아내는 빅 데이터의 추출과 분석은 오프라인 데이터의 분석과 함께 과학교육의 현황을 파악하고 미래를 위한 과학교육의 방향을 결정하는데 중요한 정보를 제공할 수 있다. 이 과목에서는 학생들이 빅 데이터 분석의 원리와 방법을 이해하고, 학습 결과를 온라인과 오프라인 과학교육과 사회현상의 분석에 응용하는 능력을 기르는 것을 목표로 하며, 데이터 마이닝을 위한 확률 개념을 바탕으로 수집된 데이터에서 최대의 정보를 추출하는 방법을 학습한다. 특히, 대표적 분류 모형인 퍼셉트론, 합성곱 신경망, 순환 신경망, 생성 모형으로 오토 인코더, 적대적 생성 신경망, 볼츠만 머신, 딥 빌리프 네트워크 등을 깊이 다룰 예정이다. 학생들은 이 주제들에서 학습한 내용을 교육 데이터 마이닝의 실습, 무크와 같은 대규모 학습의 분석에 응용하는 연습을 한다. 이 과목은 교육 통계와 좋은 보완이 될 수 있다. 그러나 강의를 이해하는데 필요한 통계 수학과 컴퓨터 프로그램 지식을 선행 지식으로 요구하지는 않는다.전선 / 학사
여러 가지 통계 모형에서 나타나는 함수에 대하여 비모수적 추정 방법을 배우며, 이론적인 측면보다는 주로 방법론 및 그 응용에 초점을 맞춘다. 비모수 방법으로서 커널 추정법, 국소 다항 적합법, 웨이블릿 추정법, 스플라인 추정법 등을 다룬다. 밀도함수, 회귀함수, 생존함수, 분위수함수 등의 추정 방법을 배우며, 분류 및 판별분석, 일반화 선형모형, 중도절단회귀 모형, 비례위험 모형 등에 응용하는 방법을 간략하게 소개한다.전선 / 학사
본 과목에서는 대용량의 텍스트를 분석하여 유의미한 결론을 도출하는 텍스트마이닝 기법에 대해 강의한다. Natural language processing, probabilistic topic model, text clustering, text categorization, contextual text mining 등, 텍스트마이닝 분야의 핵심 Keyword 및 기법에 대해 다룬다.전선 / 학사
데이터에 대한 탐색과 통계적 탐구를 수행하는 방법을 배운다. 데이터의 종류와 특성을 이해하고, 적절한 시각화와 분석을 통해 데이터에 숨은 정보를 찾아내고 근거에 기반을 둔 합리적인 의사결정을 하는 방법을 배운다. 데이터에 존재하는 관계성을 찾아 수학적으로 모델링하는 방법으로써 상관관계의 분석과 회귀분석, 클러스터링 기법 등을 배운다. 데이터를 이용한 통계적 탐구를 지도하는 방법을 배운다.전선 / 대학원
본 과목에서는 다양한 인공 지능 (특히 머신 러닝) 및 빅데이터 분석 시스템에 대해 공부한다. 자원을 관리하는 자원 관리자, 데이터를 저장하는 분산 스토리지, 데이터 처리의 핵심 모델인 데이터 플로우 모델, 배치 분석, 인메모리 처리, 스트림 처리, SQL, 머신 러닝/딥러닝 시스템, 그래프 처리에 대해서 공부한다. 특히, 대표적인 시스템인 Spark, Beam, TensorFlow, PyTorch 등을 활용하여 실제로 해당 시스템들이 어떻게 동작하는지 깊게 공부한다. 배운 이론을 바탕으로 프로그래밍 과제와 팀별 연구 프로젝트를 수행한다.전선 / 대학원
본 과목에서는 다양한 인공 지능 (특히 머신 러닝) 및 빅데이터 분석 시스템에 대해 공부한다. 자원을 관리하는 자원 관리자, 데이터를 저장하는 분산 스토리지, 데이터 처리의 핵심 모델인 데이터 플로우 모델, 배치 분석, 인메모리 처리, 스트림 처리, SQL, 머신 러닝/딥러닝 시스템, 그래프 처리에 대해서 공부한다. 특히, 대표적인 시스템인 Spark, Beam, TensorFlow, PyTorch 등을 활용하여 실제로 해당 시스템들이 어떻게 동작하는지 깊게 공부한다. 배운 이론을 바탕으로 프로그래밍 과제와 팀별 연구 프로젝트를 수행한다.전선 / 학사
데이터 리터러시의 개념과 데이터마이닝에 사용되는 다양한 종류의 방법론을 배운다. 본 강의는 3부로 나누어진다. 제1부에서는 데이터 리터러시에 대해서 배우고, 제2부에서는 데이터마이닝을 위한 다양한 방법론을 소개한다. 특히, 상관관계부터 인과관계까지 데이터 기반 관계를 이해하는 방법을 배우고, 선형회귀모형부터 신경망모형까지의 예측모형 구축방법과 모형을 해석하는 방법, 그리고 군집분석/연관성분석 등 데이터탐색 방법을 다룬다. 제3부는 실제 예제를 분석하는 것으로 수강 학생들의 팀 프로젝트 발표로 이루어진다. 본 강의는 이론 2시간 실습 2시간으로 이루어진다. 본 과목의 필수 선수과목은 <회귀분석 및 실습>이다.전선 / 학사
에너지 수요 급증, 탄소중립, 환경 문제 등으로 인해 에너지 생산 및 사용의 효율성이 보다 중요해지고 있다. 본 교과목에서는 에너지 생산 및 사용의 효율성을 향상시킬 수 있는 데이터 사이언스 기법을 학습한다. 데이터 사이언스는 자료에 숨겨진 유의미한 패턴을 여러 분야의 기법을 사용하여 찾아내는 분야이다. 본 교과목에서는 대표적인 데이터 사이언스 기법인 주성분 분석, 다차원 척도법 등의 차원축소 기법, k-means 클러스터링, 밀도기반 클러스터링 등의 클러스터링 기법, 딥러닝, Support Vector Machine 등의 기계학습 기법을 학습한다. 학습한 데이터 사이언스 기법들을 에너지 데이터에 대해 특성 추출 및 분류, 이상현상 탐지 및 분류, 수요 및 가격 예측, 개발 계획의 신속한 최적화 등 다양한 문제에 적용하는 실습을 수행한다.전필 / 대학원
본 교과목은 데이터과학 분야에 관심있는 통계학 석사 과정 대학원생을 대상으로, 데이터 랭글링 및 시각화, 회귀분석, 선형 모형, 일반화 선형 모형, 혼합 모형, 분류를 포함하여 모든 데이터 과학자가 익숙해야 하는 통계 방법론 및 이를 통계 소프트웨어를 사용해 적용하는 실례를 다룬다. 기존의 통계학 과목과 비교하여 본 교과목은 이론에 대한 강조가 덜한 대신, 통계 방법론을 구현하고 주요 개념을 실제 자료에 적용하여 데이터를 분석하기 위해 어떻게 소프트웨어를 사용하는지에 대해 더 중점을 둔다. 주요 개념에 대해서는 그것이 “작동하는 이유”에 대한 직관적 설명을 위주로 한다. 본 과목의 모든 통계 분석은 R과 Python을 사용한다.전선 / 학사
현대의 과학, 공학, 그리고 경영의 응용시스템은 데이터에 점점 더 많이 의존하게 되었지만 전통적인 데이터 분석 기술들은 복잡한 빅 데이터 시대에 맞도록 설계되어 있지 않는 실정이다. 데이터를 수집, 저장, 가공하여 그 안에서 지식을 추출하는 빅 데이터 분석은 새로운 과제들을 탐구하는 흥미 있고 빠르게 발전하는 하나의 학문으로 등장하였다. 본 강의에서는 프로그래밍 경험이 많지 않는 학생들을 대상으로 데이터의 수집 및 분석뿐만 아니라 데이터 프로그래밍 언어의 사용에도 초점을 맞춰 이를 바탕으로 빅 데이터 분석의 토대를 마련하는 것을 목표로 한다.전필 / 학사
본 과목에서는 정형 데이터와 비정형 데이터를 효과적으로 관리하고 분석하는 데에 필요한 제반 이론 및 기법을 배운다. 구체적으로, 본 과목의 전반부에서는 데이터베이스 (DB)를 기반으로 한 정보 시스템의 설계 및 구현, 그리고 DB 마이닝과 DB 기반 추천 시스템과 관련된 모형과 기법을 다루고, 후반부에서는 텍스트 데이터를 대상으로 정보 검색, 문서 분류 및 군집화를 위한 주요 이론과 방법론들을 소개한다. 아울러, 본 과목은 소개된 모형 및 기법들을 구현하여 다양한 형태의 데이터에 실적용해보는 프로젝트들을 포함하는 바, 이를 통해 실제 문제에 대한 해결 능력을 기르고, 관련된 기술적 이슈들을 경험해보는 것을 목표로 한다.전선 / 대학원
정보시스템 연구에 있어 2차 필드 데이터를 이용한 계량경제학적 분석 방법 및 논문은 매우 자주 활용되는 방법론이며 논문 카테고리이다. 본 강의를 통하여 학생들은 최근 연구에서 활용되고 있는 고급 수준 데이터 분석 방법론들을 리뷰해보고, 기초 수업과 연구에서 생성된 연구아이디어를 학기 중 계속된 세미나에서의 피드백을 통하여 학술대회 제출 및 프로시딩 게재가 가능한 수준의 논문으로 발전시키는 것을 목표로 한다.