최근 확인한 콘텐츠
loading...
Algorithms for reinforcement learning
Deep reinforcement learning hands-on : apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo zero and more
Learning motor skills : From Algorithms to Robot Experiments
Handbook of learning and approximate dynamic programming
Rollout, policy iteration, and distributed reinforcement learning
Reinforcement Learning Algorithms: Analysis and Applications
(프로그래머를 위한) 강화학습 : 강화학습 기초부터 대표 알고리즘의 원리와 코드 구현 및 튜닝까지 =
Reinforcement learning : with Open AI, TensorFlow and Keras using Python
강화학습 첫걸음 : 텐서플로로 살펴보는 Q 러닝, MDP, DQN, A3C 강화학습 알고리즘
텐서플로우 2와 케라스를 이용한 고급 딥러닝 : DL, GAN, VAE, 심층 RL, 비지도 학습, 객체 감지 및 분할 등 적용
Reinforcement learning
Optimal learning
Reinforcement learning for adaptive dialogue systems : a data-driven methodology for dialogue management and natural language generation
Python을 사용한 심층 강화 학습 : 마스터 클래식 RL, 딥 RL, 분포 RL, 역 RL 등 openAl gym과 tensorflow 포함
Back propagation : theory, architectures, and applications
한 권으로 끝내는 딥러닝 텐서플로
Distributed consensus in multi-vehicle cooperative control : theory and applications
Learning-based control : a tutorial and some recent results
Deep reinforcement learning : frontiers of artificial intelligence
Recent Advances in Reinforcement Learning
Drones
Liu H.,Suzuki S.,Wang W.,Liu H.,Wang Q.Drones
Liu H.,Suzuki S.ANNUAL REVIEWS IN CONTROL
Tipaldi, Massimo; Iervolino, Raffaele; Massenio, Paolo RobertoIEEE Transactions on Neural Networks and Learning Systems
Perrusquia A.,Guo W.IEEE Robotics and Automation Letters
Peng Zhai; Taixian Hou; Xiaopeng Ji; Zhiyan Dong; Lihua ZhangExpert Systems with Applications
Shin S.Y.,Kang Y.W.,Kim Y.G.ASCC 2022 - 2022 13th Asian Control Conference, Proceedings
Lee, Sangmin; Kim, Seong-Hun; Lee, Hanna; Kim, YoudanOperations Research
Bhandari, Jalaj; Russo, DanielAutonomous Robots
Rubí B.,Morcego B.,Pérez R.IEEE Access
Wu H.,Ye H.,Xue W.,Yang X.Human-centric Computing and Information Sciences
Jang S.,Choi C.Journal of Guidance, Control, and Dynamics
Gavra, V.; van Kampen, E.-J.IEEE Robotics and Automation Letters
Zhai P.,Hou T.,Ji X.,Dong Z.,Zhang L.정보과학회논문지
이성준, 김규선, 우태진, 박수현IEEE Transactions on Systems, Man, and Cybernetics: Systems
Linwei Ye; Zhonggai Zhao; Fei LiuDrones
Li B.,Zhang H.,He P.,Wang G.,Yue K.,Neretin E.IEEE Transactions on Wireless Communications
Diaz-Vilor, C.; Barzegaran, M.; Jafarkhani, H.International Journal of Control, Automation, and Systems
전태윤, 박진배, 최윤호Drones
Ding C.,Zheng Z.IEEE Transactions on Neural Networks and Learning Systems
Adolfo Perrusquía; Weisi Guo전선 / 대학원
본 과정은 선형 시스템, 전달 함수, 라플라스 변환에 대하여 소개한다. 안정성과 피드백을 다루고 과도 응답 사양을 위한 기본 설계 도구를 제공한다. 또한 주파수 영역 기술도 간략하게 다룬다. 이 과정에는 컴퓨터 프로그래밍 실습 및 제어 설계 프로젝트가 포함된다. 실습 프로젝트에 관련된 전공은 조선해양공학은 물론 로봇공학, 기계공학, 전자공학, 전기공학, 산업응용수학 등이다.전선 / 대학원
본 강좌는 스토캐스틱 제어와 강화학습의 이론과 알고리즘에 대해 소개한다. 강좌의 첫 부분에서는 스토캐스틱 제어이론을 심도 있게 다룬다. 최적조건과 최적제어전략의 존재성뿐만 아니라, value and policy iteration 그리고 선형최적화를 이용한 해결방법에 대해 소개하고 분석한다. 두 번째 부분에서는 강화학습의 방법론을 다룬다. 특히, stochastic approximation 알고리즘을 기반으로 한 방법(예: Q-learning)들의 수렴조건 및 근사방법에 대해 학습한다. Policy gradient와 online learning 방법에 대해서도 소개하고, 여러 알고리즘들의 장단점에 대해 분석한다.전선 / 대학원
본 강좌는 스토캐스틱 제어와 강화학습의 이론과 알고리즘에 대해 소개한다. 강좌의 첫 부분에서는 스토캐스틱 제어이론을 심도 있게 다룬다. 최적조건과 최적제어전략의 존재성뿐만 아니라, value and policy iteration 그리고 선형최적화를 이용한 해결방법에 대해 소개하고 분석한다. 두 번째 부분에서는 강화학습의 방법론을 다룬다. 특히, stochastic approximation 알고리즘을 기반으로 한 방법(예: Q-learning)들의 수렴조건 및 근사방법에 대해 학습한다. Policy gradient와 online learning 방법에 대해서도 소개하고, 여러 알고리즘들의 장단점에 대해 분석한다.전선 / 대학원
강화학습은 자율 에이전트가 환경과의 상호작용을 통한 학습을 기반으로 하는 머신러닝의 한 연구분야이다. 이 수업에서는 우선 전통적인 강화학습 내용 (MDP, Value function, Policy gradient, UCB, exploration vs exploitation)을 다룬다. 그리고 최신 연구분야인 deep reinforcement learning을 다루기 위해 multi-layer perceptron, convolutional neural network, recurrent neural network 등의 deep learning에 관한 전반적인 내용들을 학습하고 나아가 raw input의 value function approximator를 이용한 강화학습에 대해 학습한다.전선 / 학사
딥 러닝의 핵심 개념, 모델 및 활용 사례를 강의한다. 강의 전반부에는 deep neural network의 정의, stochastic gradient descent, backpropagation, activation, optimization 등 딥 러닝의 핵심 개념을 강의하며, 후반부에는 convolutional neural network, recurrent neural network, generative adeversarial network, transformer 등 실제로 활용되는 딥 러닝 모델들의 특징과 활용 사례를 다룬다. 또한 각 모델들을 PyTorch를 통해 실제로 활용해볼 수 있도록 과제/프로젝트를 구성한다.전선 / 대학원
본 강좌는 강화학습 분야의 다양한 알고리즘의 이론과 실제를 소개한다. Markov 의사 결정 프로세스의 기초를 배우고, 탐색 및 일반화를 포함한 강화학습의 핵심 과제 등을 다룬다. 실습을 통해 강화학습에서 사용되는 주요 알고리즘 기법(모델 기반, 모델 프리, 정책 경사 등)을 학습한다. 이 강좌를 통해 학생들이 강화학습의 기본 이론을 이해하고, (심층) 강화학습 알고리즘을 구현하는 것을 목표로 한다. • Markov 의사 결정 프로세스 • 테이블 형식 방법 • 함수 근사법을 이용한 강화학습(모델 기반 및 모델 프리 방법) • 정책 경사 • 탐색 및 활용전선 / 대학원
이 과목은 다변수 피드백 제어시스템의 강인성 분석과 설계에 관한 다양한 이론적 개념과 기법들을 배운다. 항공기 모델에 불확실성이 존재하거나 외란이 작용하더라도 비행 안정성과 성능을 잃지 않고 제어할 수 있어, 드론, 무인기, 미래 항공 모빌리티 등에 유용한 기술을 학습한다.전선 / 학사
본 강의에서는 통계적 추론에 기반한 기계학습의 기초에 대하여 학습하고 조선해양공학의 응용문제에 대한 프로젝트를 수행한다. 기계학습에 관련된 확률, 선형대수, 최적화의 기초에 대하여 학습한다. 확률에 기반한 최우추정법에 대하여 학습한다. 비지도 학습 분류 방법 및 선형 회귀법에 대하여 학습한다. Hidden Markov 모델과 Bayesian Inference의 개념, 이론 및 알고리즘에 대한 개요를 학습한다. Neural Network에 기반한 학습모델로 이미지 인식을 위한 Convolutional Neural Network, 음성과 같은 time series 데이터의 학습을 위한 Recurrent Neural Network의 개요에 대하여 학습한다. 그리고 보상에 따라 학습하는 Reinforcement Learning에 대하여 익힌다. 마지막으로 조선해양공학 응용의 기계학습 프로젝트를 수행하도록 한다.전선 / 대학원
강화학습은 자율 에이전트가 환경과의 상호작용을 통한 학습을 기반으로 하는 머신러닝의 한 연구분야이다. 이 수업에서는 우선 전통적인 강화학습 내용(MDP, Value function, Policy gradient, UCB, exploration vs exploitation)을 다룬다. 그리고 최신 연구분야인 deep reinforcement learning을 다루기 위해 multi-layer perceptron, convolutional neural network, recurrent neural network 등의 deep learning에 관한 전반적인 내용들을 학습하고 나아가 raw input의 value function approximator를 이용한 강화학습에 대해 학습한다.전선 / 학사
“항공드론빅데이터알고리즘”은 드론 기술과 인공지능의 융합을 탐구하는 수업이다. 드론은 자율비행, 데이터 처리, 기계학습 등 다양한 인공지능 기술을 활용하여 복잡한 환경 속에서도 효율적으로 임무를 수행한다. 드론에서 인공지능의 궁극적인 목표는 대량의 데이터를 수집하고, 이를 임무에 맞게 최적화하여 운영하는 것이다. 본 과목에서는 드론이 수집하는 방대한 양의 데이터가 자동화된 방식으로 처리되는 방법을 이해한다. 학생들은 빅데이터 알고리즘의 기본 개념을 배우고, 이를 통해 실질적인 데이터 분석 기법을 습득한다. 특히, 수집된 빅데이터를 활용하여 실제 드론 임무에 적용할 수 있는 사례를 통해 이론과 실무의 연계를 강화한다. 또한, 데이터 분석 과정에서의 도전 과제와 해결책을 모색하고, 최신 기술 동향을 반영하여 학생들이 변화하는 드론 산업에 적응할 수 있도록 돕는다. 궁극적으로, 학생들은 드론의 데이터 분석 역량을 강화하고, 이를 통해 효과적인 의사결정을 내릴 수 있는 능력을 배양한다.전선 / 대학원
이 과목에서는 휴머노이드 로봇의 보행제어를 다룬다. 학생들은 이와 관련된 제어이론들을 배우고, 습득한 이론들을 시뮬레이션 환경과 실제 로봇에 구현한다. 프로젝트에서는 좀 더 고급이론들을 이해하고 휴머노이드 로봇에 구현하여 실제 데모를 완성하는 것을 목표로 한다.전선 / 학사
4차 산업혁명의 핵심기술인 인공지능(딥러닝)의 배경지식과 활용방법을 습득하며, Convolutional Neural Networks 와 Recurrent Neural Networks 에 관한 지식과 활용법을 실습한다. 딥러닝 기본개념, Stochastic Gradient Descent, backpropagation 기법, 초기화기법, regularization 기법, 콘볼류션신경망(CNN), CNN 구조, 반복신경망(RNN), RNN의 응용, 강화학습을 다룬다. 이론은 기존 머신러닝과목에서 다루므로, 이론보다는 실용적 적용능력을 배양하기 이해 딥러닝 관련 소프트웨어 교육을 강조하며, Python에 관한 강의와 실습, Python 수학 라이브러리 numpy에 강의도 실시한다. 또한 Advanced deep learning library인 Tensorflow에 대한 강의와 실습도 병행한다.전선 / 대학원
이 교과목에서는 최근 그 발전이 급격하게 이루어지고 있는 전기동력 수직 이착륙기와 고속 복합형 회전익기의 다분야 설계, 전기 추진 동력원(전기모터, 배터리), 소음 측면에 대한 고찰이 소개된다. 전기동력 추진 회전익기에서는 하이브리드 방식을 포함한 분산 전기 추진, 배터리 수명, 그리고 수직 이착륙과 천이 비행 등의 기술적 측면에 초점을 맞추어 학습한다. 고속 복합형 회전인기는 강체 블레이드/허브 및 lift offset에 의거한 동축 반전, 틸트로터 등 수직 이착륙과 장거리 고속 비행 능력의 달성 과정을 학습한다. 학습한 내용을 적용한 전기동력 추진 수직 이착륙기의 시제품을 설계와 실험을 통한 성능 측정 실습이 수행된다.전선 / 대학원
인지과학 연습 1의 내용을 보다 확장하여 인지과학의 연구사, 연구주제등을 다각도로 검토하여 과정에 진입한 학생들에게 인지과학의 기초적 지식배경을 제공하는데 목적이 있다.전선 / 대학원
로봇학습은 로봇공학과 인공지능(AI) 기술을 결합하여 로봇이 인간처럼 경험을 통해 새로운 기술과 지식을 습득하는 방법을 연구하는 학문이다. 로봇학습을 이용해 로봇은 데이터와 주변 환경과의 상호작용을 통해 새로운 환경, 작업 및 상황에 적응하며 배울 수 있다. 로봇학습에는 로봇이 모든 시나리오에 대해 명시적 프로그래밍 없이 자율적으로 작업을 수행할 수 있는 능력을 갖출 수 있도록 다양한 기술과 접근방법을 포함하고 있다. 로봇학습의 목표는 로봇이 실제 세계의 다양성과 불확실성을 다루며 변화하는 조건에 적응하고 작업을 자율적으로 수행할 수 있는 로봇을 만드는 것이다. 이 강좌에서는 모방 학습과 심층 강화학습을 포함한 로봇학습의 최근 발전을 리뷰한다. 먼저 Markov decision processes (MDP)와 전통적인 강화학습 기법을 리뷰한다. 그리고 behavior cloning, inverse reinforcement learning, policy gradient, deep Q-network (DQN), 생성적 적대 신경망(GAN) 및 생성적 적대 모방 학습과 같은 주제를 포함한 모방 학습, 딥러닝 및 심층 강화 학습의 최근 개발 동향을 리뷰한다.전선 / 대학원
본 코스에서는 선형, 비선형, 정수, 동적, 확률적인 최적화 기법에 대해 강의한다. 각 기법에서 어떻게 바람직한 측면을 최대화 하고 부적적인 측면을 최소화 할 수 있는가를 보여 줄 수 있는 예제들을 제시하게 될 것이다. 특히 산업 뿐 아니라 컴퓨터 프로그램에서 선형, 비선형 문제를 풀기위한 응용문제를 강조하게 될 것이다.전선 / 학사
본 교과목에서는 현재 여러 분야에서 적용되고 있는 지능시스템 및 관련연구의 핵심이 되는 확률적 모델링 및 추론, 통계학적 기계학습, 컴퓨터비젼, 로보틱스의 기초를 소개한다. Bayesian networks, hidden Markov models (HMM), Kalman filters, Markov decision processes 등의 확률적 모델링 및 추론방식이 소개되고 선형 regression 및classification 그리고 nonparametric 학습 방법의 기초를 습득한다. 그리고 확률적 모델, 추론방식, 학습방식들이 어떻게 컴퓨터비전 그리고 로보틱스 등의 응용분야에 적용되는지 알아본다.전선 / 대학원
본 코스에서는 선형, 비선형, 정수, 동적, 확률적인 최적화 기법에 대해 강의한다. 각 기법에서 어떻게 바람직한 측면을 최대화 하고 부적적인 측면을 최소화 할 수 있는가를 보여 줄 수 있는 예제들을 제시하게 될 것이다. 특히 산업 뿐 아니라 컴퓨터 프로그램에서 선형, 비선형 문제를 풀기위한 응용문제를 강조하게 될 것이다.전선 / 대학원
인공지능 기술이 빠르게 진화하고 우리 사회에 미치는 영향력이 점차 커지고 있다. 따라서, 기존의 인공지능 관련 과목에서는 다루기 힘든 최신 주제에 관하여 특강 형태의 강의를 개설함으로써 인공지능 연구 및 사회적 영향력에 관한 최진 연구 경향을 파악할 수 있는 수업을 제공하고자 한다. 이 교과목에서는 기계학습, 컴퓨터 비전, 자연어 처리, 로보틱스, 컴퓨터 통신, 컴퓨터 시스템 등과 같은 컴퓨터 과학 분야뿐만 아니라, 공학, 자연과학, 사회과학 등과 같은 다양한 분야를 다루는 수업을 개설할 수 있다.전선 / 대학원
이 교과목에서는 비선형시스템 식별에 관련된 각종 실용적 기법들을 소개한다. 또한, 비선형 목적함수의 최적문제의 해를 구하는 각종 비선형프로그래밍기법도 소개한다. 단, 비선형궤환제어와 컴퓨터 네트워크 등에 효과적으로 사용될 수 있는 기법들에 국한하여 심도 있게 공부하고 실제 응용 예를 통하여 그 가능성을 토의한다.