최근 확인한 콘텐츠
loading...
리눅스에서 R과 하둡을 이용한 빅데이터 처리 분석
데이터 분석을 위한 머신 러닝 입문 =
(윈도우에서 리눅스를 위한) 빅데이터 처리 분석 =
하둡 애플리케이션 아키텍처 : 하둡 에코시스템을 활용한 빅데이터 처리
빅 데이터 시대의 하둡 완벽 입문 : 오픈 소스 분산 처리 환경 구축 가이드
(빅데이터 전문가의) 하둡 관리 : 스파크·얀·HDFS 관리, 튜닝 및 보안 비법 대공개!
(시작하세요!) 하둡 프로그래밍 : 기초부터 실무까지 하둡의 모든것
(시작하세요!) 하둡 프로그래밍 : 빅데이터 분석을 위한 하둡 기초부터 YARN까지
(시작하세요!) 하둡 프로그래밍 : 빅데이터 분석을 위한 하둡 기초부터 YARN까지 =
R과 하둡을 이용한 빅데이터 분석 : 빅데이터 처리를 위한 이상적인 솔루션
자바와 파이썬으로 만드는 빅데이터 시스템 : 하둡, 카프카, 아파치 스파크로 연결하는 나만의 빅데이터 전처리 파이프라인 구현
빅데이터 분석 R과 빅데이터 플랫폼 하둡 개론
프랙티컬 머신 러닝 : 실무에 직접 적용할 수 있는 빅데이터 환경을 고려한 첨단 현대 머신 러닝 기술의 구현
(빅데이터 처리와 분석을 위한) 하둡 맵리듀스 프로그래밍
빅데이터 : 람다 아키텍처로 알아보는 실시간 빅데이터 구축의 핵심 원리와 기법
(거침없이 배우는) 하둡
(시작하세요!) 하둡 프로그래밍 : 빅데이터 분석을 위한 하둡 기초부터 YARN까지
빅데이터 마이닝 : 하둡을 이용한 대용량 데이터 마이닝 기법
Spark로 하는 고속 빅데이터 분석과 처리 : 분산 클라우드 환경의 고속 클러스터 컴퓨팅
Hadoop & NoSQL : 대용량 데이터 분석 및 처리를 위한
디지털융복합연구
황보람; 김성규한국전자통신학회 논문지
김영근, 김승현, 조민희, 김원중IEEE Access
Lee E.,Oh H.,Park D.학습자중심교과교육연구
이은상한국인터넷방송통신학회 논문지
신동진; 박지훈; 김주호; 곽광진; 박정민; 김정준지식경영연구
이종화, 이현규한국전자통신학회 논문지
김영근, 조민희, 김원중International Journal of Semantic Computing
Ostrowski David응용통계연구
김우철; 백창룡Education and Information Technologies: The Official Journal of the IFIP Technical Committee on Education
Dahdouh, Karim; Dakkak, Ahmed; Oughdir, Lahcen; Messaoudi, Fayçal中国管理信息化 / China Management Informationization
李文鹏한국컴퓨터정보학회논문지
구금서; 심갑식IEEE Transactions on Big Data, Big Data, IEEE Transactions on, IEEE Trans. Big Data
Chen, J.; Wang, H.IEEE Communications Magazine
Slamnik-Krijestorac N.,Bosmans S.,Hellinckx P.,Marquez-Barja J.M.The International Journal of Internet, Broadcasting and Communication
김주리; 반효경软件导刊 / Software Guide
刘栋; 王黎峰; 张怀锋사물인터넷융복합논문지
김태국JIPS(Journal of Information Processing Systems)
Kathiravan Srinivasan, ChuanJournal of Systems and Software
Wang Z.,Chen T.H.(.,Zhang H.,Wang S.정보보호학회논문지
박소현, 정익래전선 / 학사
현대의 과학, 공학, 그리고 경영의 응용시스템은 데이터에 점점 더 많이 의존하게 되었지만 전통적인 데이터 분석 기술들은 복잡한 빅 데이터 시대에 맞도록 설계되어 있지 않는 실정이다. 데이터를 수집, 저장, 가공하여 그 안에서 지식을 추출하는 빅 데이터 분석은 새로운 과제들을 탐구하는 흥미 있고 빠르게 발전하는 하나의 학문으로 등장하였다. 본 강의에서는 프로그래밍 경험이 많지 않는 학생들을 대상으로 데이터의 수집 및 분석뿐만 아니라 데이터 프로그래밍 언어의 사용에도 초점을 맞춰 이를 바탕으로 빅 데이터 분석의 토대를 마련하는 것을 목표로 한다.전선 / 학사
사물인터넷(IoT)을 비롯한 스마트 환경과 소셜네트워크 서비스의 보편화로 인해 다양하고 방대한 데이터가 발생하고 있다. 이와 함께 막대한 양의 데이터를 신속하게 처리할 수 있는 컴퓨팅 환경의 발달과 창의적인 시각으로 데이터를 분석하고 연결하는 인공지능의 개발로 빅데이터는 여러 분야의 혁신적인 패러다임으로 등장하고 있다. 빅데이터는 데이터 그 자체의 효용성보다는 다양한 방법의 가공을 통한 데이터 간의 연결 및 창의적인 분석을 통해 혁신적인 가치를 창출하고 있으며, 빅데이터의 분석과 활용은 산업과 국가 경쟁력의 척도가 되고 있다. 빅데이터의 분석을 통해 새로운 가치를 창출하기 위해서는 다학제적 융합연구가 필요하다. 이 강의에서는 빅데이터 기업, 연구소 및 학계 전문가들을 초빙하여 최신 빅데이터 기술 경향에 대하여 알아본다. 또한 실제 업무에서 사용되는 툴을 활용하여 다양한 분석 기법을 공부하게 된다. 빅데이터 분야에 관심있는 학생들에게 진로 및 전공 선택에 대한 전망을 제시하게 될 것이다.전선 / 학사
본 과목은 빅데이터를 활용하는 ML/AI/인지과학의 서비스를 개발할 때, 특히 많이 접하면서 까다로운 시계열 데이터 처리와, 파이썬 등으로 서비스를 개발을 효과적으로 할 수 있는 MLOps/DevOps 실전 가이드를 다루고자 한다. 연구 성과를 검증/공유하기 위해 패키지로 deploy하기 위한 도커/쿠버네티스 기술과 마이크로서비스 구축에 필요한 방법을 학습한다.전선 / 대학원
본 과목에서는 다양한 인공 지능 (특히 머신 러닝) 및 빅데이터 분석 시스템에 대해 공부한다. 자원을 관리하는 자원 관리자, 데이터를 저장하는 분산 스토리지, 데이터 처리의 핵심 모델인 데이터 플로우 모델, 배치 분석, 인메모리 처리, 스트림 처리, SQL, 머신 러닝/딥러닝 시스템, 그래프 처리에 대해서 공부한다. 특히, 대표적인 시스템인 Spark, Beam, TensorFlow, PyTorch 등을 활용하여 실제로 해당 시스템들이 어떻게 동작하는지 깊게 공부한다. 배운 이론을 바탕으로 프로그래밍 과제와 팀별 연구 프로젝트를 수행한다.전선 / 대학원
본 과목에서는 다양한 인공 지능 (특히 머신 러닝) 및 빅데이터 분석 시스템에 대해 공부한다. 자원을 관리하는 자원 관리자, 데이터를 저장하는 분산 스토리지, 데이터 처리의 핵심 모델인 데이터 플로우 모델, 배치 분석, 인메모리 처리, 스트림 처리, SQL, 머신 러닝/딥러닝 시스템, 그래프 처리에 대해서 공부한다. 특히, 대표적인 시스템인 Spark, Beam, TensorFlow, PyTorch 등을 활용하여 실제로 해당 시스템들이 어떻게 동작하는지 깊게 공부한다. 배운 이론을 바탕으로 프로그래밍 과제와 팀별 연구 프로젝트를 수행한다.전선 / 대학원
본 강의는 빅데이터 관리 시스템을 다루는 대학원 수준의 과목으로, 전통적인 관계형 데이터베이스 관리 시스템(RDBMS)부터 최신 데이터 레이크하우스 아키텍처 및 벡터 데이터베이스까지 포함하여 최신 데이터베이스 시스템 설계(State-of-the-Art DBMS Design)를 중점적으로 다루게 됩니다. 또한, 클라우드 네이티브 하이브리드 트랜잭션/분석 처리(HTAP) 데이터베이스 시스템과 검색 증강 생성(RAG, Retrieval-Augmented Generation)기술을 활용한 AI 기반 데이터베이스 응용을 다룰 예정입니다. 이 강의를 통해 학생들은 다음과 같은 내용을 심도 있게 학습하게 됩니다. • 독립형 및 분산형 데이터베이스 관리 시스템(DBMS)의 최신 구현 기법 (e.g., cloud HTAP DBMSs). • OLTP(온라인 트랜잭션 처리), OLAP(온라인 분석 처리), 벡터 검색(Vector Search) 워크로드 간의 설계 트레이드오프와 데이터베이스 시스템에서의 설계 선택. • 벡터 데이터베이스(Vector Databases)개념 및 벡터 인덱싱 기술(예: HNSW, IVF, PQ, FAISS, ScaNN)과 고차원 데이터 검색을 위한 근사 최근접 이웃(ANN, Approximate Nearest Neighbor) 검색 알고리즘. • 전통적인 데이터베이스와 벡터 검색 기술의 통합, 그리고 이를 AI 기반 분석, 추천 시스템, LLM(대규모 언어 모델) 기반 검색 엔진에서 어떻게 활용할 수 있는지에 대한 이해. • 최신 데이터베이스 연구 논문을 비판적으로 분석하고, 이를 바탕으로 개선 방향을 도출하여 새로운 데이터베이스 기술을 제안하는 능력. 또한, 본 강의에서는 오픈소스 빅데이터 관리 프레임워크 및 클라우드 기반 플랫폼을 활용한 실습과 프로젝트를 통해, 현대적인 데이터베이스 시스템 및 벡터 검색 기반 아키텍처를 설계하고 최적화하는 실무 경험을 쌓을 수 있도록 합니다.전선 / 대학원
Shortest path, Network flow 등의 그래프 문제를 해결하는 최근에 개발된 알고리즘과 알고리즘 분야에서의 최근의 연구결과를 학습한다. 분산 시스템의 여러 모델들과 분산 시스템에서 발생하는 중요한 문제들을 해결하는 분산 알고리즘에 관하여 연구한다.전선 / 대학원
본 교과목은 데이터를 분석하여 유용한 정보를 추출하고 모델을 만들어 예측에 사용하는 데이터 마이닝에 대해 보다 깊이 있게 소개한다. 데이터마이닝의 중요한 알고리즘, 기반 기술, 대용량 데이터를 효과적으로 처리하는 마이닝 기술 등을 학습한다. 그리고 분산 시스템과 다수의 머신을 이용하여 빠르고 확장성 있게 대용량 데이터를 처리하는 방법을 논의한다. 또한 여러 실제 세계 응용에 어떻게 데이터마이닝을 적용하는지에 대해서도 논의한다. 주요 주제로 그래프 데이터 분석, 행렬/텐서 데이터 분석, 비정상 이벤트 탐지 등이 있다.전선 / 대학원
데이터 마이닝은 빅 데이터를 분석하기 위한 핵심 도구로서 많은 관심을 받고 있다. 특히 컴퓨터 공학 측면에서 고급 데이터 마이닝 알고리즘 및 분석 플랫폼을 설계하고 구현하는 기술을 학습하는 것은 최근 넘쳐나는 빅 데이터에서 실행 가능한 지식을 추출하는데 핵심적인 역할을 한다. 본 과목에서는 빅 데이터를 분석하기 위한 컴퓨터 공학 기반 고급 기술, 알고리즘, 핵심 플랫폼을 다룬다. 또한 초 대용량 데이터, 초고속 데이터 등을 효과적으로 분석하는 기법을 학습한다.전선 / 대학원
본 강의는 빅데이터 관리 시스템을 다루는 대학원 수준의 과목으로, 전통적인 관계형 데이터베이스 관리 시스템(RDBMS)부터 최신 데이터 레이크하우스 아키텍처 및 벡터 데이터베이스까지 포함하여 최신 데이터베이스 시스템 설계(State-of-the-Art DBMS Design)를 중점적으로 다루게 됩니다. 또한, 클라우드 네이티브 하이브리드 트랜잭션/분석 처리(HTAP) 데이터베이스 시스템과 검색 증강 생성(RAG, Retrieval-Augmented Generation)기술을 활용한 AI 기반 데이터베이스 응용을 다룰 예정입니다. 이 강의를 통해 학생들은 다음과 같은 내용을 심도 있게 학습하게 됩니다. • 독립형 및 분산형 데이터베이스 관리 시스템(DBMS)의 최신 구현 기법 (e.g., cloud HTAP DBMSs). • OLTP(온라인 트랜잭션 처리), OLAP(온라인 분석 처리), 벡터 검색(Vector Search) 워크로드 간의 설계 트레이드오프와 데이터베이스 시스템에서의 설계 선택. • 벡터 데이터베이스(Vector Databases)개념 및 벡터 인덱싱 기술(예: HNSW, IVF, PQ, FAISS, ScaNN)과 고차원 데이터 검색을 위한 근사 최근접 이웃(ANN, Approximate Nearest Neighbor) 검색 알고리즘. • 전통적인 데이터베이스와 벡터 검색 기술의 통합, 그리고 이를 AI 기반 분석, 추천 시스템, LLM(대규모 언어 모델) 기반 검색 엔진에서 어떻게 활용할 수 있는지에 대한 이해. • 최신 데이터베이스 연구 논문을 비판적으로 분석하고, 이를 바탕으로 개선 방향을 도출하여 새로운 데이터베이스 기술을 제안하는 능력. 또한, 본 강의에서는 오픈소스 빅데이터 관리 프레임워크 및 클라우드 기반 플랫폼을 활용한 실습과 프로젝트를 통해, 현대적인 데이터베이스 시스템 및 벡터 검색 기반 아키텍처를 설계하고 최적화하는 실무 경험을 쌓을 수 있도록 합니다.전선 / 대학원
본 과목은 데이터사이언스를 위해 고성능 컴퓨팅(high-performance computing, HPC) 시스템을 사용하는 방법을 배운다. 본 교과목의 전반부는 (1) 순차 컴퓨터 시스템의 구조와 동작원리를 배워 시스템 프로그래밍 능력을 배양하며, (2) Process management, CPU scheduling, 네트워크의 기초 등 Linux 시스템의 전반적인 동작원리를 배운다. 강좌의 중반부에서는 (1) 병렬처리 시스템의 구조와 동작원리를 배운 뒤, (2) 병렬화, 최적화 기법 등을 다루며, (3) 딥 러닝 시스템에 대한 최적화 기법 등을 다룬다. 본 교과목의 후반부에서는 (1) 병렬처리 시스템을 프로그래밍하는 다양한 방법들 중 OpenMP, MPI, OpenCL, CUDA 로 병렬처리 시스템을 프로그래밍하는 방법을 배우며, 마지막으로 (2) Spark와 같은 distributed processing platform 및 (3) Dockers와 Kubernetes와 같은 virtualization에 대하여 다룬다.전선 / 대학원
빅데이터 혹은 대용량 고차원 데이터의 출연으로 현대 통계학에서 계산의 중요성은 과거의 어떤 때보다 더 중요하게 되었다. 이 과목에서는 빅데이터를 다루는데 필요한 최신의 계산 기법들, 즉 GPU를 이용한 통계계산과 병렬처리를 활용한 통계계산의 이론과 실제를 다룬다.전선 / 학사
수많은 기업과 조직들은 머신러닝과 AI를 빅데이터에 적용하여 의사결정을 내리고 가치를 창출하고 있습니다. 하지만 그 과정에서 점점 커져가는 데이터와 점점 복잡해져 가는 알고리즘을 의사결정자인 사람이 이해하는 것이 필수적으로 선행되어야 합니다. 데이터 시각화는 데이터와 알고리즘을 사람이 직관적으로 이해할 수 있도록 도와주는 강력한 도구입니다. 이 수업을 통해 학생들은 다양한 유형의 데이터를 요약하고 시각적으로 표현하여 다른 사람과 효과적으로 커뮤니케이션 할 수 있는 방법들에 대해서 배울 것입니다.전선 / 대학원
본 교과목은 데이터사이언스 대학원의 ABC(AI model/algorithm, Big data, Computing) 교육 과정 중 컴퓨팅(C) 분야 두번째 강좌이다. 본 교과목의 전반부는 (1) 순차 컴퓨터 시스템의 구조와 동작원리를 배워 시스템 프로그래밍 능력을 배양하며, (2) Process management, CPU scheduling, 네트워크의 기초 등 Linux 시스템의 전반적인 동작원리를 배운다. 강좌의 중반부는 (1) 병렬처리 시스템의 구조와 동작원리를 배운 뒤, (2) 병렬화, 최적화 기법 등을 다루며, (3) 딥 러닝 시스템에 대한 최적화 기법 등을 다룬다. 본 교과목의 후반부에서 (1) 병렬처리 시스템을 프로그래밍하는 다양한 방법들 중 OpenMP, MPI, OpenCL, CUDA 로 병렬처리 시스템을 프로그래밍하는 방법을 배우며, 마지막으로 (2) Spark와 같은 distributed processing platform 및 (3) Dockers와 Kubernetes와 같은 virtualization에 대하여 다룬다.전선 / 대학원
본 과목에서는 데이터 분석 알고리즘, 시스템, 응용 등 다양한 분야의 문제들을 이해하고 기존 기술의 제약점을 해결하는 캡스톤 프로젝트를 진행한다. 이를 통해, 여러 과목에서 학습한 이론을 실제 문제에 적용할 수 있는 응용 능력 및 문제 해결 능력 향상을 기대한다. ▪데이터 분석 기법 개발 프로젝트 ▪데이터 기반 응용 프로젝트 ▪빅데이터 응용 프로젝트 ▪기계학습 응용 프로젝트 ▪빅데이터 시스템 개발 프로젝트전선 / 학사
다양한 교육 사례를 분석하여 디지털 전환 시대 빅데이터의 교육적 활용 가능성과 도전적 과제를 탐색한다. 학습자중심교육에 대한 이론과 모형을 학습하고 빅데이터와 인공지능을 활용하여 맞춤형 학습환경을 설계할 수 있는 역량을 기른다. 교육 문제를 창의적으로 해결하기 위해 빅데이터와 디지털 테크놀로지를 활용하는 방안을 탐구한다.전선 / 대학원
소셜 컴퓨팅과 라지데이터 분석 등이 커뮤니케이션 분야에서도 중요한 이슈로 부상함에 따라 컴퓨터공학을 전공하지 않은 연구자들도 소셜 네트웍 시스템의 기술적, 구조적 특성을 이해할 필요가 있다. 이 수업에서는 Ruby나 Python 등을 사용한 기초 프로그래밍 학습과, 웹 기반 기술(web technology), 데이터베이스 등의 관련 기술에 대한 학습을 통해 실제로 소셜 네트웍을 개발하고 분석하는 방법을 배운다. 또한, 이 과정에서 트위터 등의 소셜 네트웍의 데이터 마이닝 기법을 배우고 소셜 네트웍 분석을 실습을 통해 학습한다.전선 / 대학원
Urban Computing은 도시 공간상의 객체(objects), 활동(activities), 특성(characteristics) 등을 컴퓨터 테크놀로지를 이용하여 분석하는 수업이다. 도시에 대한 이해와 도시를 분석하는 능력을 키우는 것이 본 강의의 목적이다. 도시에 대한 이해를 머릿속에 한정시키지 않고 이를 실질적으로 컴퓨터를 포함한 미디어 매체와 결합하여 표현함으로써, 아이디어를 보다 구체화시키는 것이 본 강의의 또 다른 핵심이다. 수업은 크게 장소와 공간에 대한 이해와 컴퓨터 테크놀로지에 대한 이해, 컴퓨터 테크놀로지를 도시에 적용하여 결과물을 만들어내는 세 부분으로 나뉜다. 컴퓨터 테크놀리지 부분은 Advanced GIS와 Database, Programming으로 나뉘며, Advanced GIS에서는 공간분석기법과 통계를, Database 수업에서는 Database 설계와 SQL 사용법을 강의한다. Programming 수업에서는 HTML, JavaScript, XML, Google Maps 프로그래밍에 대한 강의를 진행한다.전선 / 대학원
현대 경영에서의 의사 결정은 데이터의 분석 결과에 점점 더 많이 의존하고 있는 추세다. 정형 데이터 뿐만 아니라 비정형 데이터를 인터넷 상에서 수집, 저장, 가공하여 그 안에서 경영 인사이트를 추출하는 빅데이터 분석의 중요성은 날로 증가하고 있다. 이 강의는 프로그래밍 경험이 많지 않은 학생들을 대상으로 프로그래밍 언어의 기초뿐만 아니라 데이터의 수집 및 분석의 모든 과정을 살펴봄으로써 데이터 기반 의사 결정에 대한 이해를 높이고 기계학습 및 인공지능에서 사용하는 프로그래밍 언어가 산업 전반에 걸쳐 어떻게 활용되고 있는지에 대한 기초 지식을 제시한다. 또한 프로그래밍 언어를 실제 데이터에 적용하는 실습 과정을 통해 실전 문제에 대한 응용력을 배양하고, 향후 경영 환경에서의 실무 적용능력의 토대를 제공한다.전선 / 대학원
이 교과목에서는 고급 데이터베이스 시스템의 기반이 되는 주제로서 질의어 처리, 데이터베이스 회복, 병행제어, 데이터베이스 보안 및 무결성, 그리고 분산 데이터베이스를 다룬다. 또한 현재 제기되고 있는 문제로서 의사결정지원 시스템, 웹 데이터베이스, 멀티미디어 데이터베이스, 그리고 이동 데이터베이스도 다뤄질 것이다. 교과목을 통해 관련 연구논문들이 논의될 것이다.