최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 논문은 기존 맵리듀스 기반 빅데이터 처리 기법의 인프라 자원 낭비 문제를 해결하기 위해 효율적인 맵리듀스 기반 빅데이터 처리 기법을 제안한다. 제안하는 기법은 데이터를 맵리듀스 처리에 적합한 형태로 변환 및 압축하여 저장 효율성을 높이고, 데이터 처리 시간 지연 문제를 해결한다.
빅데이터 실무 기술 가이드 =
하둡 맵리듀스 최적화와 튜닝 : MapReduce 성능 최적화를 위한 Hadoop 클러스터 구성과 튜닝
Hadoop 완벽 가이드
R과 하둡을 이용한 빅데이터 분석 : 빅데이터 처리를 위한 이상적인 솔루션
Mining of massive datasets
머하웃 완벽 가이드 : 하둡에 딱 맞는 빅데이터를 활용한 기계학습
(빅데이터 저장 및 분석을 위한) New NoSQL & mongoDB
데이터는 언제나 옳다! : 대규모 데이터 처리와 분석 실무 : 유스케이스별 빅데이터 및 NoSQL 기술 가이드
리눅스에서 R과 하둡을 이용한 빅데이터 처리 분석
(빅 데이터분석을 위한) 아파치 Mahout 프로그래밍
Big data for dummies
빅데이터 : 람다 아키텍처로 알아보는 실시간 빅데이터 구축의 핵심 원리와 기법
HBase 완벽 가이드
Mining of massive datasets
(실무로 배우는) 빅데이터 기술 : 데이터 수집, 적재, 처리, 분석, 머신러닝까지
Hadoop & NoSQL : 대용량 데이터 분석 및 처리를 위한
빅데이터 마이닝 : 하둡을 이용한 대용량 데이터 마이닝 기법
(빅데이터 처리와 분석을 위한) 하둡 맵리듀스 프로그래밍
빅데이터에서 천금의 기회를 캐라 : 테라데이타 최고분석책임자가 들려주는 기업 빅데이터 활용 전략
Hadoop 에코시스템 : 맵리듀스 프로그래밍과 하둡 클러스터 운영 실습
정보처리학회 논문지
김원집, 김하윤, 이협건, 김영운SN Computer Science
Vinutha D.C.,Raju G.T.Procedia Computer Science
Subramaniyaswamy, V.; Vijayakumar, V.; Logesh, R.; Indragandhi, V.International Journal of Grid and Distributed Computing
Dan Zhang한국정보전자통신기술학회 논문지
이협건, 김영운, 김기영Open Journal of Marine Science
Seyyed Mojtaba Banaei; Hossein Kardan MoghaddamJournal of KIISE
Jongbaeg Lee; Woon-Hak Kang; Sang-Won LeeIEEE Transactions on Cloud Computing, Cloud Computing, IEEE Transactions on, IEEE Trans. Cloud Comput.
Tang, S.; Lee, B.; He, B.Personal and Ubiquitous Computing
Zhao R.IEEE Transactions on Services Computing
Dat Thanh Dang; Doan B. Hoang; Diep N. NguyenProcedia Engineering
Fadiya, Samson Oluwaseun; Saydam, Serdar; Zira, Vanduhe VanyJournal of Ambient Intelligence and Humanized Computing
Jeyaraj R.,Ananthanarayana V.S.,Paul A.정보과학회 컴퓨팅의 실제 논문지
김윤호, 정혜진, 최원석, 김준모, 최종무정보과학회논문지
이종백, 강운학, 이상원정보과학회논문지
이종백; 강운학; 이상원IEEE transactions on cybernetics
Maria Luna J; Padillo F; Pechenizkiy M; Ventura S한국시뮬레이션학회 논문지
김병수, 강봉구, 김탁곤, 송해상Cluster Computing: The Journal of Networks, Software Tools and Applications
Alewiwi, Mahmoud; Orencik, Cengiz; Savaş, Erkay디지털콘텐츠학회논문지
이현진Future Generation Computer Systems
Marzuni S.M.,Savadi A.,Toosi A.N.,Naghibzadeh M.전선 / 대학원
본 강의는 빅데이터 관리 시스템을 다루는 대학원 수준의 과목으로, 전통적인 관계형 데이터베이스 관리 시스템(RDBMS)부터 최신 데이터 레이크하우스 아키텍처 및 벡터 데이터베이스까지 포함하여 최신 데이터베이스 시스템 설계(State-of-the-Art DBMS Design)를 중점적으로 다루게 됩니다. 또한, 클라우드 네이티브 하이브리드 트랜잭션/분석 처리(HTAP) 데이터베이스 시스템과 검색 증강 생성(RAG, Retrieval-Augmented Generation)기술을 활용한 AI 기반 데이터베이스 응용을 다룰 예정입니다. 이 강의를 통해 학생들은 다음과 같은 내용을 심도 있게 학습하게 됩니다. • 독립형 및 분산형 데이터베이스 관리 시스템(DBMS)의 최신 구현 기법 (e.g., cloud HTAP DBMSs). • OLTP(온라인 트랜잭션 처리), OLAP(온라인 분석 처리), 벡터 검색(Vector Search) 워크로드 간의 설계 트레이드오프와 데이터베이스 시스템에서의 설계 선택. • 벡터 데이터베이스(Vector Databases)개념 및 벡터 인덱싱 기술(예: HNSW, IVF, PQ, FAISS, ScaNN)과 고차원 데이터 검색을 위한 근사 최근접 이웃(ANN, Approximate Nearest Neighbor) 검색 알고리즘. • 전통적인 데이터베이스와 벡터 검색 기술의 통합, 그리고 이를 AI 기반 분석, 추천 시스템, LLM(대규모 언어 모델) 기반 검색 엔진에서 어떻게 활용할 수 있는지에 대한 이해. • 최신 데이터베이스 연구 논문을 비판적으로 분석하고, 이를 바탕으로 개선 방향을 도출하여 새로운 데이터베이스 기술을 제안하는 능력. 또한, 본 강의에서는 오픈소스 빅데이터 관리 프레임워크 및 클라우드 기반 플랫폼을 활용한 실습과 프로젝트를 통해, 현대적인 데이터베이스 시스템 및 벡터 검색 기반 아키텍처를 설계하고 최적화하는 실무 경험을 쌓을 수 있도록 합니다.전선 / 대학원
본 강의는 빅데이터 관리 시스템을 다루는 대학원 수준의 과목으로, 전통적인 관계형 데이터베이스 관리 시스템(RDBMS)부터 최신 데이터 레이크하우스 아키텍처 및 벡터 데이터베이스까지 포함하여 최신 데이터베이스 시스템 설계(State-of-the-Art DBMS Design)를 중점적으로 다루게 됩니다. 또한, 클라우드 네이티브 하이브리드 트랜잭션/분석 처리(HTAP) 데이터베이스 시스템과 검색 증강 생성(RAG, Retrieval-Augmented Generation)기술을 활용한 AI 기반 데이터베이스 응용을 다룰 예정입니다. 이 강의를 통해 학생들은 다음과 같은 내용을 심도 있게 학습하게 됩니다. • 독립형 및 분산형 데이터베이스 관리 시스템(DBMS)의 최신 구현 기법 (e.g., cloud HTAP DBMSs). • OLTP(온라인 트랜잭션 처리), OLAP(온라인 분석 처리), 벡터 검색(Vector Search) 워크로드 간의 설계 트레이드오프와 데이터베이스 시스템에서의 설계 선택. • 벡터 데이터베이스(Vector Databases)개념 및 벡터 인덱싱 기술(예: HNSW, IVF, PQ, FAISS, ScaNN)과 고차원 데이터 검색을 위한 근사 최근접 이웃(ANN, Approximate Nearest Neighbor) 검색 알고리즘. • 전통적인 데이터베이스와 벡터 검색 기술의 통합, 그리고 이를 AI 기반 분석, 추천 시스템, LLM(대규모 언어 모델) 기반 검색 엔진에서 어떻게 활용할 수 있는지에 대한 이해. • 최신 데이터베이스 연구 논문을 비판적으로 분석하고, 이를 바탕으로 개선 방향을 도출하여 새로운 데이터베이스 기술을 제안하는 능력. 또한, 본 강의에서는 오픈소스 빅데이터 관리 프레임워크 및 클라우드 기반 플랫폼을 활용한 실습과 프로젝트를 통해, 현대적인 데이터베이스 시스템 및 벡터 검색 기반 아키텍처를 설계하고 최적화하는 실무 경험을 쌓을 수 있도록 합니다.전선 / 학사
컴퓨터를 활용하여 문제를 해결할 시 그 활용이 필수적인 기본적인 자료 구조에 대해 가르친다. 배열, linked list, stack, queue, priority queue, search tree, hash table, balanced search tree 등의 자료구조의 구성, 활용 방법 및 효율성을 강의한다. Python 기반의 숙제를 통해 수강생이 직접 각 자료구조를 구현/활용할 수 있는 능력을 배양한다.전선 / 대학원
데이터센터 구조의 융합적 접근 (A Holistic Approach to Datacenter Architecture): 모바일, 클라우드 컴퓨팅이 보편화되면서 대부분의 대용량 자료들이 데이터센터에서 수집,처리,보관되고 있다. 본 강의에서는 융합적 시각에서 이러한 데이터센터를 하나의 컴퓨터로 접근하여, 전달, 연산, 저장 기능이 구현되는 원리와 예시를 학습하며, 보편적인 문제들인 소프트웨어와 하드웨어 구성요소, 확장성, 총소유비용 및 신뢰성 문제를 다룬다.전선 / 대학원
데이터센터 구조의 융합적 접근 (A Holistic Approach to Datacenter Architecture): 모바일, 클라우드 컴퓨팅이 보편화되면서 대부분의 대용량 자료들이 데이터센터에서 수집,처리,보관되고 있다. 본 강의에서는 융합적 시각에서 이러한 데이터센터를 하나의 컴퓨터로 접근하여, 전달, 연산, 저장 기능이 구현되는 원리와 예시를 학습하며, 보편적인 문제들인 소프트웨어와 하드웨어 구성요소, 확장성, 총소유비용 및 신뢰성 문제를 다룬다.전선 / 대학원
자료구조 및 알고리듬을 학습한 학부 학생들이 대량의 데이터를 메모리 및 디스크에서 효율적으로 관리하는 시스템 소프트웨어의 모델에 대한 학습과 실제 시스템의 구현을 할 수 있도록 한다. 구체적으로 관계형 모델, 객체지향형 모델, SQL 질의 언어, 파일 시스템 구조, B+tree 및 해쉬 인덱스 구조, 질의처리 및 최적화, 트랜잭션처리, 동시성 제어, 그리고 회복 방법 알고리듬을 학습하고 프로그래밍 프로젝트를 통하여 강의에서 배운 여러 가지 자료 구조와 알고리즘을 구현하도록 한다.전선 / 학사
현대의 과학, 공학, 그리고 경영의 응용시스템은 데이터에 점점 더 많이 의존하게 되었지만 전통적인 데이터 분석 기술들은 복잡한 빅 데이터 시대에 맞도록 설계되어 있지 않는 실정이다. 데이터를 수집, 저장, 가공하여 그 안에서 지식을 추출하는 빅 데이터 분석은 새로운 과제들을 탐구하는 흥미 있고 빠르게 발전하는 하나의 학문으로 등장하였다. 본 강의에서는 프로그래밍 경험이 많지 않는 학생들을 대상으로 데이터의 수집 및 분석뿐만 아니라 데이터 프로그래밍 언어의 사용에도 초점을 맞춰 이를 바탕으로 빅 데이터 분석의 토대를 마련하는 것을 목표로 한다.전선 / 대학원
본 과목에서는 다양한 인공 지능 (특히 머신 러닝) 및 빅데이터 분석 시스템에 대해 공부한다. 자원을 관리하는 자원 관리자, 데이터를 저장하는 분산 스토리지, 데이터 처리의 핵심 모델인 데이터 플로우 모델, 배치 분석, 인메모리 처리, 스트림 처리, SQL, 머신 러닝/딥러닝 시스템, 그래프 처리에 대해서 공부한다. 특히, 대표적인 시스템인 Spark, Beam, TensorFlow, PyTorch 등을 활용하여 실제로 해당 시스템들이 어떻게 동작하는지 깊게 공부한다. 배운 이론을 바탕으로 프로그래밍 과제와 팀별 연구 프로젝트를 수행한다.전선 / 대학원
본 과목에서는 다양한 인공 지능 (특히 머신 러닝) 및 빅데이터 분석 시스템에 대해 공부한다. 자원을 관리하는 자원 관리자, 데이터를 저장하는 분산 스토리지, 데이터 처리의 핵심 모델인 데이터 플로우 모델, 배치 분석, 인메모리 처리, 스트림 처리, SQL, 머신 러닝/딥러닝 시스템, 그래프 처리에 대해서 공부한다. 특히, 대표적인 시스템인 Spark, Beam, TensorFlow, PyTorch 등을 활용하여 실제로 해당 시스템들이 어떻게 동작하는지 깊게 공부한다. 배운 이론을 바탕으로 프로그래밍 과제와 팀별 연구 프로젝트를 수행한다.전선 / 대학원
데이터 마이닝은 빅 데이터를 분석하기 위한 핵심 도구로서 많은 관심을 받고 있다. 특히 컴퓨터 공학 측면에서 고급 데이터 마이닝 알고리즘 및 분석 플랫폼을 설계하고 구현하는 기술을 학습하는 것은 최근 넘쳐나는 빅 데이터에서 실행 가능한 지식을 추출하는데 핵심적인 역할을 한다. 본 과목에서는 빅 데이터를 분석하기 위한 컴퓨터 공학 기반 고급 기술, 알고리즘, 핵심 플랫폼을 다룬다. 또한 초 대용량 데이터, 초고속 데이터 등을 효과적으로 분석하는 기법을 학습한다.전선 / 학사
에너지 수요 급증, 탄소중립, 환경 문제 등으로 인해 에너지 생산 및 사용의 효율성이 보다 중요해지고 있다. 본 교과목에서는 에너지 생산 및 사용의 효율성을 향상시킬 수 있는 데이터 사이언스 기법을 학습한다. 데이터 사이언스는 자료에 숨겨진 유의미한 패턴을 여러 분야의 기법을 사용하여 찾아내는 분야이다. 본 교과목에서는 대표적인 데이터 사이언스 기법인 주성분 분석, 다차원 척도법 등의 차원축소 기법, k-means 클러스터링, 밀도기반 클러스터링 등의 클러스터링 기법, 딥러닝, Support Vector Machine 등의 기계학습 기법을 학습한다. 학습한 데이터 사이언스 기법들을 에너지 데이터에 대해 특성 추출 및 분류, 이상현상 탐지 및 분류, 수요 및 가격 예측, 개발 계획의 신속한 최적화 등 다양한 문제에 적용하는 실습을 수행한다.전선 / 대학원
본 교과목은 데이터를 분석하여 유용한 정보를 추출하고 모델을 만들어 예측에 사용하는 데이터 마이닝에 대해 보다 깊이 있게 소개한다. 데이터마이닝의 중요한 알고리즘, 기반 기술, 대용량 데이터를 효과적으로 처리하는 마이닝 기술 등을 학습한다. 그리고 분산 시스템과 다수의 머신을 이용하여 빠르고 확장성 있게 대용량 데이터를 처리하는 방법을 논의한다. 또한 여러 실제 세계 응용에 어떻게 데이터마이닝을 적용하는지에 대해서도 논의한다. 주요 주제로 그래프 데이터 분석, 행렬/텐서 데이터 분석, 비정상 이벤트 탐지 등이 있다.전선 / 학사
본 과목은 빅데이터를 활용하는 ML/AI/인지과학의 서비스를 개발할 때, 특히 많이 접하면서 까다로운 시계열 데이터 처리와, 파이썬 등으로 서비스를 개발을 효과적으로 할 수 있는 MLOps/DevOps 실전 가이드를 다루고자 한다. 연구 성과를 검증/공유하기 위해 패키지로 deploy하기 위한 도커/쿠버네티스 기술과 마이크로서비스 구축에 필요한 방법을 학습한다.전선 / 대학원
Urban Computing은 도시 공간상의 객체(objects), 활동(activities), 특성(characteristics) 등을 컴퓨터 테크놀로지를 이용하여 분석하는 수업이다. 도시에 대한 이해와 도시를 분석하는 능력을 키우는 것이 본 강의의 목적이다. 도시에 대한 이해를 머릿속에 한정시키지 않고 이를 실질적으로 컴퓨터를 포함한 미디어 매체와 결합하여 표현함으로써, 아이디어를 보다 구체화시키는 것이 본 강의의 또 다른 핵심이다. 수업은 크게 장소와 공간에 대한 이해와 컴퓨터 테크놀로지에 대한 이해, 컴퓨터 테크놀로지를 도시에 적용하여 결과물을 만들어내는 세 부분으로 나뉜다. 컴퓨터 테크놀리지 부분은 Advanced GIS와 Database, Programming으로 나뉘며, Advanced GIS에서는 공간분석기법과 통계를, Database 수업에서는 Database 설계와 SQL 사용법을 강의한다. Programming 수업에서는 HTML, JavaScript, XML, Google Maps 프로그래밍에 대한 강의를 진행한다.전선 / 대학원
근래의 의료 빅데이터의 축적 및 인공지능 기법의 발달은 많은 의학 분야에서 빅데이터에 기반한 정확한 예측 및 환자 맞춤형 진료를 가능하게 하고 있다. 주술기 의학 분야에 있어서도, 이러한 기술적 발달은 기존의 위험도 분류, 예후 예측, 조기 경보 및 의료 자원 분배 등 주술기 의학의 접근 방식에 큰 변화를 가능하게 하고 있다. 따라서 미래 임상 의사, 의학자들에게 있어 이러한 기술을 이해하고, 활용하는 것을 배우는 것이 점차 중요해지고 있다. 이 강좌에서는 먼저 VitalDB나 MIMIC, eICU 데이터셋 등 주술기 의학 분야의 오픈 데이터셋에 대해 알아보고, 이러한 데이터를 효과적으로 활용할 수 있는 기계 학습 기법에 대해 배울 것이다. 또한 실습을 통해 최신 기계 학습 기법들을 본인의 연구에 적용할 수 있는 방법을 배울 것이다.전선 / 대학원
빅데이터 혹은 대용량 고차원 데이터의 출연으로 현대 통계학에서 계산의 중요성은 과거의 어떤 때보다 더 중요하게 되었다. 이 과목에서는 빅데이터를 다루는데 필요한 최신의 계산 기법들, 즉 GPU를 이용한 통계계산과 병렬처리를 활용한 통계계산의 이론과 실제를 다룬다.전선 / 대학원
치과의료 빅데이터(OCS, EMR, PACS)를 활용하여 치과환자의 진단/치료/예방에 활용하기 위한, 빅데이터 생성/통합/분석 방법에 대해 학습함. 임상의사 결정지원 솔류션을 제공하고 치과의료 질과 안정성 향상 달성하기 위하여, 치과환자 데이터의 효율적 수집/저장/분석을 위한 통합기술 및 구조화기술을 학습함. Theories and Concepts of BigData Analytics in Healthcare Medical BigData: Techniques, Managements, and Applications Diagnosis and Treatment: BigData Analytical Techniques, Datasets, Life Cycles, Managements and Applications for Diagnosis and Treatment Prediction: BigData Analytical Techniques, Datasets, Life Cycles, Managements and Applications for Prediction Big Medical Fake Analytics for Preventing Medical Misinformation and Myths Challenges and Future of BigData in Healthcare전선 / 대학원
4차 산업혁명의 핵심 기술인 빅데이터, 사물인터넷 등과 함께 정보통신 기술을 활용해 저장하고 처리해야 하는 정보의 양은 폭발적으로 증가하고 있다. 이와 함께 고전적 폰 노이만 컴퓨팅 구조의 폰 노이만 병목현상, 낮은 에너지 효율 등의 문제를 해결할 수 있는 Processing-in-memory, Neuromorphic Computing 등의 새로운 기술의 개발 필요성이 높아지고 있다. 본 강의에서는 이와 같은 새로운 컴퓨팅 기술을 이해하고 해당 기술에 활용되기 위한 재료가 갖추어야 할 물성 및 실제 연구되고 있는 여러 재료에 대해서 배운다.전선 / 대학원
본 과목은 데이터사이언스를 위해 고성능 컴퓨팅(high-performance computing, HPC) 시스템을 사용하는 방법을 배운다. 본 교과목의 전반부는 (1) 순차 컴퓨터 시스템의 구조와 동작원리를 배워 시스템 프로그래밍 능력을 배양하며, (2) Process management, CPU scheduling, 네트워크의 기초 등 Linux 시스템의 전반적인 동작원리를 배운다. 강좌의 중반부에서는 (1) 병렬처리 시스템의 구조와 동작원리를 배운 뒤, (2) 병렬화, 최적화 기법 등을 다루며, (3) 딥 러닝 시스템에 대한 최적화 기법 등을 다룬다. 본 교과목의 후반부에서는 (1) 병렬처리 시스템을 프로그래밍하는 다양한 방법들 중 OpenMP, MPI, OpenCL, CUDA 로 병렬처리 시스템을 프로그래밍하는 방법을 배우며, 마지막으로 (2) Spark와 같은 distributed processing platform 및 (3) Dockers와 Kubernetes와 같은 virtualization에 대하여 다룬다.전선 / 대학원
의료정보시스템은 일반적인 정보시스템에 비교하여 매우 복잡한 데이터의 흐름을 관리하여야 한다. 또한 데이터의 용량이 많을 뿐만 아니라 전체시스템은 빠른 응답속도를 유지해야 하는 조건을 만족시킬 수 있어야 한다. 본 강좌에서는 병원에서 발생되는 업무의 흐름을 분석하고 이를 객체 관계형 모델 (entity relationship diagram)로 표현하는 기법을 배운다. 또한 객체관계모델을 토대로 관계형 데이터베이스를 설계하는 과정을 배우게 되며, 관계형 데이터베이스 설계에 사용되는 제약조건들의 의미와 구현방법들을 배운다. 또한 구축된 toy system을 이용하여 대용량 데이터베이스 평가 및 시스템의 성능 평가를 위한 평가모델의 설계 및 구현방법을 배운다.