최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 논문은 은행에서 발생하는 대용량 비정형 로그 데이터를 처리하기 위한 클라우드 환경 기반의 MongoDB 시스템을 제안한다. 클라우드 컴퓨팅 기술과 하둡 기반 분석 모듈을 도입하여 기존 시스템의 한계를 극복하고, 유연한 확장성과 자동 복구 기능을 제공한다. NoSQL 기반 MongoDB를 활용하여 비정형 로그 데이터의 효율적인 처리 및 분산 데이터베이스 구축을 가능하게 한다.
(빅데이터 저장 및 분석을 위한) New NoSQL & mongoDB
빅데이터 실무 기술 가이드 =
NoSQL 철저 입문
MongoDB : 완벽 가이드
빅데이터 : 람다 아키텍처로 알아보는 실시간 빅데이터 구축의 핵심 원리와 기법
실전 LOG 분석과 체계적인 관리 가이드 : 개발자와 운영자의 트러블슈팅과 보안 담당자의 이상행위 탐지를 위한
(SQL과 NoSQL 기반의) 데이터베이스 입문
(모던 웹을 위한) HTML5 프로그래밍
카산드라 완벽 가이드
(윈도우에서 리눅스를 위한) 빅데이터 처리 분석 =
(빅 데이터 시대를 위한) NoSQL 핵심 가이드
Advances in database technology--EDBT '96 : 5th International Conference on Extending Database Technology, Avignon, France, March 25-29, 1996 : proceedings
클라우드 컴퓨팅 구현 기술 : 구글, 페이스북, 야후, 아마존이 채택한 핵심 기술 파헤치기
리눅스에서 R과 하둡을 이용한 빅데이터 처리 분석
MongoDB 완벽 가이드
Hadoop & NoSQL : 대용량 데이터 분석 및 처리를 위한
예제로 배우는 Vue.js : Vue.js 기초부터 MEVN(MongoDB, Express, Vue.js, Node.js)까지
데이터베이스 관리
코어 파이썬 애플리케이션 프로그래밍
(빅데이터 시대를 여는 첫걸음) NoSQL 데이터 모델링
한국정보전자통신기술학회 논문지
이협건; 김영운; 이진우; 이승현KSII Transactions on Internet & Information Systems
Myoungjin Kim; Yun Cui; Hanku Lee창의정보문화연구
김성완Computing: Archives for Scientific Computing
Jiang, Wenbin; Zhang, Lei; Liao, Xiaofei; Jin, Hai; Peng, Yaqiong한국컴퓨터정보학회논문지
이준호, 주경수한국정보통신학회논문지
안광민, 이종윤, 양동민, 이봉환정보처리학회논문지. 컴퓨터 및 통신시스템
한효준; 김혁호; 김양우IETE Technical Review
A. Samydurai; K. Revathi; L. Karthikeyan; B. Vanathi; K. DeviIEEE Transactions on Dependable and Secure Computing, Dependable and Secure Computing, IEEE Transactions on, IEEE Trans. Dependable and Secure Comput.
Colombo, P.; Ferrari, E.Computers, Materials and Continua
ElDahshan K.,Selim E.,Ebada A.I.,Abouhawwash M.,Nam Y.,Behery G.KIISE Transactions on Computing Practices
Sang-Baek Lee; Kyu-Chul Lee; Hyunchul Jang; Yun-Hee Son데이타베이스연구
박효주, 고은정, 이기훈한국정보통신학회논문지
안광민; 이종윤; 양동민; 이봉환Journal of the Korea Institute of Information & Communication Engineering
류창주; 한명호; 한승조Journal of Platform Technology
강윤희BIG DATA AND COGNITIVE COMPUTING
Khan, Wisal; Kumar, Teerath; Zhang, Cheng; Raj, Kislay; Roy, Arunabha M.; Luo, Bin한국컴퓨터정보학회논문지
이준호, 주경수정보처리학회논문지. 소프트웨어 및 데이터 공학
손시운, 길명선, 원희선, 문양세Procedia Computer Science
Harezlak, Katarzyna; Mermon, Malgorzata; Kasprowski, PawelFuture Internet
Celesti A.,Fazio M.,Villari M.전선 / 대학원
본 강의는 빅데이터 관리 시스템을 다루는 대학원 수준의 과목으로, 전통적인 관계형 데이터베이스 관리 시스템(RDBMS)부터 최신 데이터 레이크하우스 아키텍처 및 벡터 데이터베이스까지 포함하여 최신 데이터베이스 시스템 설계(State-of-the-Art DBMS Design)를 중점적으로 다루게 됩니다. 또한, 클라우드 네이티브 하이브리드 트랜잭션/분석 처리(HTAP) 데이터베이스 시스템과 검색 증강 생성(RAG, Retrieval-Augmented Generation)기술을 활용한 AI 기반 데이터베이스 응용을 다룰 예정입니다. 이 강의를 통해 학생들은 다음과 같은 내용을 심도 있게 학습하게 됩니다. • 독립형 및 분산형 데이터베이스 관리 시스템(DBMS)의 최신 구현 기법 (e.g., cloud HTAP DBMSs). • OLTP(온라인 트랜잭션 처리), OLAP(온라인 분석 처리), 벡터 검색(Vector Search) 워크로드 간의 설계 트레이드오프와 데이터베이스 시스템에서의 설계 선택. • 벡터 데이터베이스(Vector Databases)개념 및 벡터 인덱싱 기술(예: HNSW, IVF, PQ, FAISS, ScaNN)과 고차원 데이터 검색을 위한 근사 최근접 이웃(ANN, Approximate Nearest Neighbor) 검색 알고리즘. • 전통적인 데이터베이스와 벡터 검색 기술의 통합, 그리고 이를 AI 기반 분석, 추천 시스템, LLM(대규모 언어 모델) 기반 검색 엔진에서 어떻게 활용할 수 있는지에 대한 이해. • 최신 데이터베이스 연구 논문을 비판적으로 분석하고, 이를 바탕으로 개선 방향을 도출하여 새로운 데이터베이스 기술을 제안하는 능력. 또한, 본 강의에서는 오픈소스 빅데이터 관리 프레임워크 및 클라우드 기반 플랫폼을 활용한 실습과 프로젝트를 통해, 현대적인 데이터베이스 시스템 및 벡터 검색 기반 아키텍처를 설계하고 최적화하는 실무 경험을 쌓을 수 있도록 합니다.전선 / 대학원
본 강의는 빅데이터 관리 시스템을 다루는 대학원 수준의 과목으로, 전통적인 관계형 데이터베이스 관리 시스템(RDBMS)부터 최신 데이터 레이크하우스 아키텍처 및 벡터 데이터베이스까지 포함하여 최신 데이터베이스 시스템 설계(State-of-the-Art DBMS Design)를 중점적으로 다루게 됩니다. 또한, 클라우드 네이티브 하이브리드 트랜잭션/분석 처리(HTAP) 데이터베이스 시스템과 검색 증강 생성(RAG, Retrieval-Augmented Generation)기술을 활용한 AI 기반 데이터베이스 응용을 다룰 예정입니다. 이 강의를 통해 학생들은 다음과 같은 내용을 심도 있게 학습하게 됩니다. • 독립형 및 분산형 데이터베이스 관리 시스템(DBMS)의 최신 구현 기법 (e.g., cloud HTAP DBMSs). • OLTP(온라인 트랜잭션 처리), OLAP(온라인 분석 처리), 벡터 검색(Vector Search) 워크로드 간의 설계 트레이드오프와 데이터베이스 시스템에서의 설계 선택. • 벡터 데이터베이스(Vector Databases)개념 및 벡터 인덱싱 기술(예: HNSW, IVF, PQ, FAISS, ScaNN)과 고차원 데이터 검색을 위한 근사 최근접 이웃(ANN, Approximate Nearest Neighbor) 검색 알고리즘. • 전통적인 데이터베이스와 벡터 검색 기술의 통합, 그리고 이를 AI 기반 분석, 추천 시스템, LLM(대규모 언어 모델) 기반 검색 엔진에서 어떻게 활용할 수 있는지에 대한 이해. • 최신 데이터베이스 연구 논문을 비판적으로 분석하고, 이를 바탕으로 개선 방향을 도출하여 새로운 데이터베이스 기술을 제안하는 능력. 또한, 본 강의에서는 오픈소스 빅데이터 관리 프레임워크 및 클라우드 기반 플랫폼을 활용한 실습과 프로젝트를 통해, 현대적인 데이터베이스 시스템 및 벡터 검색 기반 아키텍처를 설계하고 최적화하는 실무 경험을 쌓을 수 있도록 합니다.전선 / 대학원
의료정보시스템은 일반적인 정보시스템에 비교하여 매우 복잡한 데이터의 흐름을 관리하여야 한다. 또한 데이터의 용량이 많을 뿐만 아니라 전체시스템은 빠른 응답속도를 유지해야 하는 조건을 만족시킬 수 있어야 한다. 본 강좌에서는 병원에서 발생되는 업무의 흐름을 분석하고 이를 객체 관계형 모델 (entity relationship diagram)로 표현하는 기법을 배운다. 또한 객체관계모델을 토대로 관계형 데이터베이스를 설계하는 과정을 배우게 되며, 관계형 데이터베이스 설계에 사용되는 제약조건들의 의미와 구현방법들을 배운다. 또한 구축된 toy system을 이용하여 대용량 데이터베이스 평가 및 시스템의 성능 평가를 위한 평가모델의 설계 및 구현방법을 배운다.전선 / 학사
각종 정보를 효율적으로 관리하기 위한 데이터베이스 시스템에 대한 데이터 모델링 기법, 화일 시스템의 구성 및 인덱싱 기법, 해싱 기법,데이터베이스의 논리적 구조와 물리적 구조, 각 모델에 따른 각종 질의어(query language) 처리 및 최적화, 동시성 제어(concurrency control), 복구기법(recovery technique) 등의 데이터베이스 설계 기법에 대해서 배운다. 선수과목으로는 자료구조, 운영체제가 요구된다.전선 / 대학원
본 과목에서는 다양한 인공 지능 (특히 머신 러닝) 및 빅데이터 분석 시스템에 대해 공부한다. 자원을 관리하는 자원 관리자, 데이터를 저장하는 분산 스토리지, 데이터 처리의 핵심 모델인 데이터 플로우 모델, 배치 분석, 인메모리 처리, 스트림 처리, SQL, 머신 러닝/딥러닝 시스템, 그래프 처리에 대해서 공부한다. 특히, 대표적인 시스템인 Spark, Beam, TensorFlow, PyTorch 등을 활용하여 실제로 해당 시스템들이 어떻게 동작하는지 깊게 공부한다. 배운 이론을 바탕으로 프로그래밍 과제와 팀별 연구 프로젝트를 수행한다.전선 / 대학원
본 과목에서는 다양한 인공 지능 (특히 머신 러닝) 및 빅데이터 분석 시스템에 대해 공부한다. 자원을 관리하는 자원 관리자, 데이터를 저장하는 분산 스토리지, 데이터 처리의 핵심 모델인 데이터 플로우 모델, 배치 분석, 인메모리 처리, 스트림 처리, SQL, 머신 러닝/딥러닝 시스템, 그래프 처리에 대해서 공부한다. 특히, 대표적인 시스템인 Spark, Beam, TensorFlow, PyTorch 등을 활용하여 실제로 해당 시스템들이 어떻게 동작하는지 깊게 공부한다. 배운 이론을 바탕으로 프로그래밍 과제와 팀별 연구 프로젝트를 수행한다.전필 / 학사
본 과목에서는 정형 데이터와 비정형 데이터를 효과적으로 관리하고 분석하는 데에 필요한 제반 이론 및 기법을 배운다. 구체적으로, 본 과목의 전반부에서는 데이터베이스 (DB)를 기반으로 한 정보 시스템의 설계 및 구현, 그리고 DB 마이닝과 DB 기반 추천 시스템과 관련된 모형과 기법을 다루고, 후반부에서는 텍스트 데이터를 대상으로 정보 검색, 문서 분류 및 군집화를 위한 주요 이론과 방법론들을 소개한다. 아울러, 본 과목은 소개된 모형 및 기법들을 구현하여 다양한 형태의 데이터에 실적용해보는 프로젝트들을 포함하는 바, 이를 통해 실제 문제에 대한 해결 능력을 기르고, 관련된 기술적 이슈들을 경험해보는 것을 목표로 한다.전선 / 학사
본 과목은 빅데이터를 활용하는 ML/AI/인지과학의 서비스를 개발할 때, 특히 많이 접하면서 까다로운 시계열 데이터 처리와, 파이썬 등으로 서비스를 개발을 효과적으로 할 수 있는 MLOps/DevOps 실전 가이드를 다루고자 한다. 연구 성과를 검증/공유하기 위해 패키지로 deploy하기 위한 도커/쿠버네티스 기술과 마이크로서비스 구축에 필요한 방법을 학습한다.전선 / 학사
현대의 과학, 공학, 그리고 경영의 응용시스템은 데이터에 점점 더 많이 의존하게 되었지만 전통적인 데이터 분석 기술들은 복잡한 빅 데이터 시대에 맞도록 설계되어 있지 않는 실정이다. 데이터를 수집, 저장, 가공하여 그 안에서 지식을 추출하는 빅 데이터 분석은 새로운 과제들을 탐구하는 흥미 있고 빠르게 발전하는 하나의 학문으로 등장하였다. 본 강의에서는 프로그래밍 경험이 많지 않는 학생들을 대상으로 데이터의 수집 및 분석뿐만 아니라 데이터 프로그래밍 언어의 사용에도 초점을 맞춰 이를 바탕으로 빅 데이터 분석의 토대를 마련하는 것을 목표로 한다.전선 / 대학원
데이터센터 구조의 융합적 접근 (A Holistic Approach to Datacenter Architecture): 모바일, 클라우드 컴퓨팅이 보편화되면서 대부분의 대용량 자료들이 데이터센터에서 수집,처리,보관되고 있다. 본 강의에서는 융합적 시각에서 이러한 데이터센터를 하나의 컴퓨터로 접근하여, 전달, 연산, 저장 기능이 구현되는 원리와 예시를 학습하며, 보편적인 문제들인 소프트웨어와 하드웨어 구성요소, 확장성, 총소유비용 및 신뢰성 문제를 다룬다.전선 / 대학원
데이터센터 구조의 융합적 접근 (A Holistic Approach to Datacenter Architecture): 모바일, 클라우드 컴퓨팅이 보편화되면서 대부분의 대용량 자료들이 데이터센터에서 수집,처리,보관되고 있다. 본 강의에서는 융합적 시각에서 이러한 데이터센터를 하나의 컴퓨터로 접근하여, 전달, 연산, 저장 기능이 구현되는 원리와 예시를 학습하며, 보편적인 문제들인 소프트웨어와 하드웨어 구성요소, 확장성, 총소유비용 및 신뢰성 문제를 다룬다.전선 / 대학원
자료구조 및 알고리듬을 학습한 학부 학생들이 대량의 데이터를 메모리 및 디스크에서 효율적으로 관리하는 시스템 소프트웨어의 모델에 대한 학습과 실제 시스템의 구현을 할 수 있도록 한다. 구체적으로 관계형 모델, 객체지향형 모델, SQL 질의 언어, 파일 시스템 구조, B+tree 및 해쉬 인덱스 구조, 질의처리 및 최적화, 트랜잭션처리, 동시성 제어, 그리고 회복 방법 알고리듬을 학습하고 프로그래밍 프로젝트를 통하여 강의에서 배운 여러 가지 자료 구조와 알고리즘을 구현하도록 한다.전선 / 대학원
현대 경영에서의 의사 결정은 데이터의 분석 결과에 점점 더 많이 의존하고 있는 추세다. 정형 데이터 뿐만 아니라 비정형 데이터를 인터넷 상에서 수집, 저장, 가공하여 그 안에서 경영 인사이트를 추출하는 빅데이터 분석의 중요성은 날로 증가하고 있다. 이 강의는 프로그래밍 경험이 많지 않은 학생들을 대상으로 프로그래밍 언어의 기초뿐만 아니라 데이터의 수집 및 분석의 모든 과정을 살펴봄으로써 데이터 기반 의사 결정에 대한 이해를 높이고 기계학습 및 인공지능에서 사용하는 프로그래밍 언어가 산업 전반에 걸쳐 어떻게 활용되고 있는지에 대한 기초 지식을 제시한다. 또한 프로그래밍 언어를 실제 데이터에 적용하는 실습 과정을 통해 실전 문제에 대한 응용력을 배양하고, 향후 경영 환경에서의 실무 적용능력의 토대를 제공한다.전선 / 대학원
범주형 자료를 분석하기 위한 통계기법들을 소개한다. 범주형 자료들은 대개 분할표를 이용해 정리할 수 있기 때문에 분할표를 분석할 수 있는 통계방법을 중점적으로 다룬다. 주된 주제들은 분할표분석, 로그 선형모형, 로지스틱모형이다.전선 / 학사
컴퓨터를 활용하여 문제를 해결할 시 그 활용이 필수적인 기본적인 자료 구조에 대해 가르친다. 배열, linked list, stack, queue, priority queue, search tree, hash table, balanced search tree 등의 자료구조의 구성, 활용 방법 및 효율성을 강의한다. Python 기반의 숙제를 통해 수강생이 직접 각 자료구조를 구현/활용할 수 있는 능력을 배양한다.전선 / 대학원
데이터와 컴퓨팅 역량의 폭발적인 증가로 인해, 비즈니스 의사결정에서 데이터 분석과 정량적 모델링의 활용은 필수적인 요소가 되었다. 이 과목은 데이터 과학과 고급 경영과학을 결합하여, 다양한 비즈니스 환경에서 데이터의 활용을 통한 효율적 의사결정 시스템을 구축하기 위한 기술과 도구들을 다룬다. 전통적인 데이터 처리 및 분석을 넘어, 데이터를 스마트하고 해석 가능하며 실행 가능한 비즈니스 의사결정으로 변환하는 '처방적 분석' 방법론에 중점을 둔다. 구체적으로는 머신러닝 알고리즘, 고급 의사결정 모델링, 최적화와 같은 기술을 결합하여 자원 배분, 공급망 관리, 불확실성 대응, 경제성 분석 등 다양한 문제들을 데이터와 정량적 근거에 기반하여 해결하는 능력을 배양하는 것을 목표로 한다. 고급 엑셀 기능과 기본적이고 쉽게 이용 가능한 파이썬 모델링 기법 등 실무적인 도구들을 익히며, 코딩 기술이 요구되지 않는 상황에서도 이 도구들의 메커니즘을 이해하고 활용할 수 있는 매니저로서의 역량을 기르게 될 것이다. 이 과목은 처방적 분석 방법론의 실무적 유용성에 초점을 맞추어, 다양한 분야에서 해석 가능하고 실행 가능한 의사결정 시스템을 구축하려는 경영 매니저들에게 유용할 것이다.전선 / 학사
본 과목에서는 데이터베이스 분야의 핵심 개념(데이터 모델, SQL, 무결성 제약조건, 데이터베이스 디자인, 스토리지 구조, 트랜잭션 등)을 소개한다. 또한 프로젝트를 통해 주요 개념을 실제로 구현, 활용할 수 있도록 한다.전선 / 대학원
전자의무기록, 소셜 미디어, 건강보험자 등 여러 자료원으로 부터 많은 양의 정형, 비정형 보건의료데이터가 생성되고 있다. 이런 데이터에서 얻은 정보와 지식은 보건의료서비스전달체계를 향상하고 의료비를 줄이는 데 활용할 수 있다. 보건의료분야에서 생성되는 데이터는 용량이 크고 복잡하여 분석하는 것도 쉽지 않고 그 분석결과를 임상실무에 적용하는 것 또한 쉽지 않다. 이 교과목에서는 전자의무기록, 소셜 미디어, 건강보험자 등에서 생산되는 보건의료 빅데이터의 특성과 이들 데이터를 분석하는 기법에 대해 소개한다. 본 교과목에서 데이터마이닝/기계학습, 분류등과 같은 정형데이터의 분석기법 뿐 아니라 자연어처리, 텍스트 마이닝 등 비정형데이터 분석기법을 포함한다.전선 / 대학원
다양한 종류의 의료 및 생명 분야 빅데이터가 생성되어 축적되고 있는 상황이다. 의료 분야 빅데이터는 기본적인 전자의무기록 외에도 이미지, 생체신호, 텍스트 등의 다양한 비정형 데이터를 포함하게 되었으며, 생명 분야 빅데이터는 차세대시퀀싱 기법의 발전으로 말미암아 유전체, 전사체, 후성유전체 등의 다양한 오믹스 데이터를 포함하게 되었다. 또한 이러한 빅데이터의 생성 및 축적과 더불어 인공지능 기법을 적용하여 기존에는 다루지 못했던 새로운 문제를 정의하고 보다 깊이 있는 빅데이터 분석을 시도하는 연구들이 등장하게 되었다. 본 강좌에서는 의료 및 생명 분야의 다양한 빅데이터를 소개하고 해당 데이터를 다룰 수 있는 인공지능 분석 기법들을 소개함으로써 최신의 의생명 빅데이터 관련 인공지능 연구를 배울 수 있도록 한다.전선 / 대학원
계산이론은 컴퓨터공학의 기초학문이며, 중요한 문제에 대한 효율적인 알고리즘들을 소개하고, 그런 알고리즘의 복잡도 분석을 다룬다. 이 교과목에서는 먼저 알고리즘의 성능을 분석하는 기법, 특히 amortized analysis에 대해 배운다. 그리고, 계산이론 분야에서 중요한 알고리즘과 그 응용에 대해 배운다. 구체적으로, (스트링 매칭, 2차원 패턴 매칭, 근사 매칭, suffix trees, 데이터 압축 문제에 대한) 스트링 알고리즘과 bioinformatics에의 응용, (선택 문제, 다항식 확인 문제에 대한) randomized 알고리즘과 그 영향, (페이지 교체 문제, k 서버 문제에 대한) online 알고리즘과 금융문제(일방향 거래와 portfolio 선택 문제)에의 응용을 배운다.