최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 연구는 고차원 데이터에 대한 딥러닝 회귀 및 분류 문제에서 변수 선택 방법이나 벌점 회귀가 모형 평가 및 학습 시간에 미치는 영향을 평가한다. 고차원 데이터는 관측값보다 변수의 개수가 많으며, 예측 분석 시 다중공선성 문제를 해결하기 위해 전통적으로 변수 선택 방법이나 벌점 회귀가 사용된다. 연구 결과는 딥러닝 모델에서 이러한 방법들이 성능에 어떤 영향을 주는지 파악하는 데 기여할 것이다.
Elements of statistical inference
통계학으로 배우는 머신러닝 2e : 스탠퍼드대학교 통계학과 교수에게 배우는 머신러닝의 원리
R for everyone : advanced analytics and graphics
Elements of statistical inference
범주형 자료 분석 =
Statistical foundations of data science
Advances in intelligent data analysis : third international symposium, IDA-99, Amsterdam, The Netherlands, August 1999 : proceedings
Learning from data : concepts, theory, and methods
On model uncertainty and its statistical implications : proceedings of a workshop held in Groningen, the Netherlands, September 25-26, 1986
Advanced Regression Models with SAS and R
Semiparametric theory and missing data
베이지안 계량경제학 =
Statistics with applications to the biological and health sciences
Introduction to high-dimensional statistics
Handbook of multilevel analysis
Deep learning through sparse and low-rank modeling
High-dimensional statistics
응용통계연구
유동현Communications in Statistics - Theory and Methods
Yanling Zhu; Kai WangJournal of the Royal Statistical Society. Series B: Statistical Methodology
Stokell B.G.,Shah R.D.,Tibshirani R.J.Computational Statistics and Data Analysis
Wang, Xiaoming; Park, Taesung; Carriere, K. C.한국데이터정보과학회지
김윤대, 전치혁, 이혜선Computational Statistics and Data Analysis
Kwon, Sunghoon; Oh, Seungyoung; Lee, YoungjoJournal of Econometrics
Florens, J.-P.; Van Bellegem, S.Fluctuation and Noise Letters
Ghatari, A.H.; Aminghafari, M.Statistics and Computing
O’Neill M.,Burke K.Journal of Multivariate Analysis
Tian, R.; Xue, L.; Liu, C.교육공학연구
유진은Statistics and Computing
Wang K.,Li S.Journal of Multivariate Analysis
Cui, J.; Yi, G.Y.Statistics and Computing
Wang Y.,Song Y.,Yang R.American Statistician
Brini A.,van den Heuvel E.R.Annals of Statistics
Fan J.,Masini R.P.,Medeiros M.C.Biostatistics (Oxford, England)
Velten B.,Huber W.Statistics and Computing
Wang F.,Mukherjee S.,Richardson S.,Hill S.M.Journal of Statistical Computation and Simulation
Charlotte Castel; Zhi Zhao; Magne Thoresen한국데이터정보과학회지
권성훈, 한상미, 이상인전선 / 대학원
한 개체로부터 다른 실험조건하에서나 여러 다른 관측시간에 반복적으로 얻어진 자료를 분석하기위한 통계기법을 다룬다. 연속형의 반복측정자료를 분석하기 위해 다변량정규분포의 가정을 필요로 하는 고전적인 다변량모형을 소개하고 최근에 널리 사용되고 있는 혼합모형을 다룬다. 이산형의 반복측정자료 분석을 위해서는 가중최소제곱법에 근거한 모형과 랜덤화 모형을 다루고 일반화선형모형을 확장한 일반화추정방정식(GEE)모형을 다룬다.전선 / 대학원
본 과목은 유한 차원 및 무한 차원 벡터 공간에서의 최적화를 통합적으로 다루며, 최적화와 머신러닝 사이의 상호작용에 중점을 둔다. 최적화 알고리즘은 머신러닝의 핵심 역할을 하며 (예: 주어진 데이터셋으로부터 모델을 학습시킬 때) 동시에 고차원 최적화 문제를 풀기 위해 머신러닝 모델이 최근 많이 활용되고 있다 (예: 물리 시스템의 지배 방정식을 무한 차원 최적화 문제의 해로 재구성한 다음, 머신러닝 알고리즘을 사용하여 이에 수반되는 고차원 최적화 문제를 해결하려는 시도). 본 과목에서는 머신러닝 분야에서 필요로 하는 최적화 이론 및 알고리즘과 동시에, 복잡한 최적화 문제를 풀 수 있는 머신러닝 기법들에 대해 심도있게 다룬다.전선 / 대학원
본 과목은 사회통계의 고급수준에 해당되는 부분으로 이론적 기초와 분석방법을 이해하고, 사회복지와 관련자료를 컴퓨터를 이용하여 분석한 후 보고서를 작성하는 연습을 한다. 이 과목에서는 부제에 따라 구조방정식 및 잠재성장모형 혹은 인과추론 및 정책평가에 대해 중점적으로 다룬다. 그러므로 이 과목의 수강은 사회통계의 초급수준을 이해함을 전제로 한다.전필 / 학사
기본적으로 선형회귀모형을 주어진 자료에 적합시키는 방법을 소개하며, 모형모수에 대한 추론도 다룬다. 이 과목에서 다루는 주제를 나열하면, 단순선형회귀, 다중선형회귀, 모형적합진단, 가중선형회귀, 변수변환, 회귀진단, 레버리지 및 영향점 탐지, 범주형변수를 위한 회귀분석기법, 다중공선성, 변수선택 및 모형선택, 비선형회귀, 일반화선형모형, 인공신경망 등이다.전선 / 학사
이 과목에서는 데이터 분석에서 가장 많이 사용되는 분석방법 중 하나인 회귀모형을 대해서 소개한다. 단순 선형회귀모형부터 다중회귀모형에 관한 내용을 다루고 회귀모형에서의 중요한 가정과 모형진단에 대해서 알아본다. 또한 회귀모형을 이용한 예측과 예측변수의 선택에 대해 소개하고 분석결과를 보고서에 어떻게 제시할지 대해서 학습한다.전선 / 대학원
이 과목에서는 다변량에 대한 통계이론들과 분석법들을 다룬다. 다변량 정규분포, 다변량 분산분석, 판별분석, 정준상관, 요인분석, 공분산 구조모형들이 다루어 질 것이다. 또한 다변량을 위한 통계패키지의 사용방법에 대하여서도 배울 것이다.전선 / 대학원
이 과목은 ‘도시통계분석’의 고급과정으로서 도시 연구에서 제기되는 문제들을 계량적으로 분석하는 데 사용되는 방법의 원리와 응용방법을 심도 있게 살펴보는 데 목적이 있다. 이 과목을 수강한 학생들은 계량분석을 이용한 최신의 도시 연구 논문들을 이해할 수 있고, 자신의 연구 질문에 맞는 자료와 분석방법을 이용하여 스스로 접근할 수 있는 능력을 갖추게 될 것이다. 세부적으로 고전적 선형회귀 모형, 일반화 선형모형(generalized linear models), 연립방정식모형(simultaneous equations models), 패널자료 모형(panel data models), 다수준 회귀모형(multi-level regression models), 이산선택모형(discrete choice models), 시계열분석(time series analysis), 공간계량분석(spatial econometrics) 등을 학습하게 된다. 수업시간을 통해 기본 원리를 습득할 뿐만 아니라, 과제를 통해 Stata 등 통계 패키지(학생선택에 따라 R, Python, MATLAB 등을 이용할 수도 있음)를 이용하여 실제 자료에 분석방법을 적용하는 실습을 할 기회를 갖는다.전선 / 대학원
이 과목은 ‘도시통계분석’의 고급과정으로서 도시 연구에서 제기되는 문제들을 계량적으로 분석하는 데 사용되는 방법의 원리와 응용방법을 심도 있게 살펴보는 데 목적이 있다. 이 과목을 수강한 학생들은 계량분석을 이용한 최신의 도시 연구 논문들을 이해할 수 있고, 자신의 연구 질문에 맞는 자료와 분석방법을 이용하여 스스로 접근할 수 있는 능력을 갖추게 될 것이다. 세부적으로 고전적 선형회귀 모형, 일반화 선형모형(generalized linear models), 연립방정식모형(simultaneous equations models), 패널자료 모형(panel data models), 다수준 회귀모형(multi-level regression models), 이산선택모형(discrete choice models), 시계열분석(time series analysis), 공간계량분석(spatial econometrics) 등을 학습하게 된다. 수업시간을 통해 기본 원리를 습득할 뿐만 아니라, 과제를 통해 Stata 등 통계 패키지(학생선택에 따라 R, Python, MATLAB 등을 이용할 수도 있음)를 이용하여 실제 자료에 분석방법을 적용하는 실습을 할 기회를 갖는다.전필 / 대학원
본 강좌는 자료 분석에 필요한 계량경제분석의 기본적 수학 원리와 함께 고급 회귀분석 방법들을 소개하고자 한다. 특히 이 과목은 다양한 회귀분석 모형에 관한 이론적 추론과 수리적 학습을 강조하고자 한다. 본 강좌의 주요 주제로는 모형설정, 자료문제, 도구변수, 이분산성, 자기상관성, 연립방정식 모형, 그리고 패널자료 분석을 포함한다.전선 / 대학원
이 과목은 ‘도시통계분석’의 고급과정으로서 도시 연구에서 제기되는 문제들을 계량적으로 분석하는 데 사용되는 방법의 원리와 응용방법을 심도 있게 살펴보는 데 목적이 있다. 이 과목을 수강한 학생들은 계량분석을 이용한 최신의 도시 연구 논문들을 이해할 수 있고, 자신의 연구 질문에 맞는 자료와 분석방법을 이용하여 스스로 접근할 수 있는 능력을 갖추게 될 것이다. 세부적으로 고전적 선형회귀 모형, 일반화 선형모형(generalized linear models), 연립방정식모형(simultaneous equations models), 패널자료 모형(panel data models), 다수준 회귀모형(multi-level regression models), 이산선택모형(discrete choice models), 시계열분석(time series analysis), 공간계량분석(spatial econometrics) 등을 학습하게 된다. 수업시간을 통해 기본 원리를 습득할 뿐만 아니라, 과제를 통해 Stata 등 통계 패키지(학생선택에 따라 R, Python, MATLAB 등을 이용할 수도 있음)를 이용하여 실제 자료에 분석방법을 적용하는 실습을 할 기회를 갖는다.전선 / 대학원
본 과목에서는 고차원 데이터의 저차원 표현을 학습하기 위한 기하학적 방법을 소개한다. 미분 기하학의 기초(구체적 주제는 리만 다양체 및 Lie 그룹, 텐서, 커넥션 및 fiber 번들 포함)를 다룬 후, 고차원 데이터에 대한 기존 기계 학습 알고리즘(예: 매니폴드 러닝, 메트릭 러닝)의 기하학적 일반화 방법을 개발하여, 대칭적 구조가 존재하는 고차원 비유클리디언 데이터 문제에 적용한다. 위와 같은 방법을 구현하기 위한 효율적인 계산 알고리즘도 소개한다. 후반부에는 Ito 확률 미분 방정식의 관점에서 강화 학습과 확률 최적 제어 간의 관계를 고찰하여, 고차원 비유클리디언 데이터 강화 학습 문제에 적용 가능한 기하학적 방법도 개발한다.전선 / 대학원
본 과목에서는 고차원 데이터의 저차원 표현을 학습하기 위한 기하학적 방법을 소개한다. 미분 기하학의 기초(구체적 주제는 리만 다양체 및 Lie 그룹, 텐서, 커넥션 및 fiber 번들 포함)를 다룬 후, 고차원 데이터에 대한 기존 기계 학습 알고리즘(예: 매니폴드 러닝, 메트릭 러닝)의 기하학적 일반화 방법을 개발하여, 대칭적 구조가 존재하는 고차원 비유클리디언 데이터 문제에 적용한다. 위와 같은 방법을 구현하기 위한 효율적인 계산 알고리즘도 소개한다. 후반부에는 Ito 확률 미분 방정식의 관점에서 강화 학습과 확률 최적 제어 간의 관계를 고찰하여, 고차원 비유클리디언 데이터 강화 학습 문제에 적용 가능한 기하학적 방법도 개발한다.전선 / 대학원
본 과목에서는 고차원 데이터의 저차원 표현을 학습하기 위한 기하학적 방법을 소개한다. 미분 기하학의 기초(구체적 주제는 리만 다양체 및 Lie 그룹, 텐서, 커넥션 및 fiber 번들 포함)를 다룬 후, 고차원 데이터에 대한 기존 기계 학습 알고리즘(예: 매니폴드 러닝, 메트릭 러닝)의 기하학적 일반화 방법을 개발하여, 대칭적 구조가 존재하는 고차원 비유클리디언 데이터 문제에 적용한다. 위와 같은 방법을 구현하기 위한 효율적인 계산 알고리즘도 소개한다. 후반부에는 Ito 확률 미분 방정식의 관점에서 강화 학습과 확률 최적 제어 간의 관계를 고찰하여, 고차원 비유클리디언 데이터 강화 학습 문제에 적용 가능한 기하학적 방법도 개발한다.전선 / 대학원
본 강좌는 고급 자료분석을 위한 모형기반 통계분석방법론에 대해 다룬다. 자료의 특징과 분석의 목적에 따라 적합한 통계모형을 제시하고, 자료를 적합, 적합된 통계모형의 해석을 통한 인사이트 제시등에 대해 다룬다. 프로젝트를 통해서 배운 방법들을 실제 데이터에 적용하고 발표한다. ● Linear model and linear mixed model ● Generalized linear model ● Shrinkage method and variable selection ● Graphical methods and causal Inference ● Bayesian methods전선 / 학사
빅데이터는 실세계에서 일어나는 복잡한 문제를 해결하기 위한 통찰력을 제공한다. 이 과목은 빅데이터를 소개하며, 데이터 가공, 분석 및 시각화를 위한 프로그래밍 언어 (Python), 데이터 분석을 위한 통계 및 머신러닝 방법 등을 가르친다. 실습 및 프로젝트를 통해서 학생들이 실제 데이터를 분석할 수 있는 능력을 배양한다. 데이터 중심의 컴퓨팅, 정량적 사고와 추론, 탐색적 데이터 분석에 대한 강조를 통해 이 과목에서는 데이터 과학의 핵심 원리와 기술을 다룰 것이다.전필 / 학사
본 수업에서는 경제학 기본이론, 통계학, 경제수학 등을 이수한 학생들을 대상으로 농업경제 현상에 관련된 경제변수들의 관계를 측정하기 위한 기본이론을 다룬다. 모델설정, 추정, 예측 및 정책분석을 궁극적 목표로 하며 이를 위해서 필요한 회귀분석, 중회귀분석, 시계열 분석 등을 학습한다. 또한 이론만이 아니라 이를 실증적으로 적용할 수 있도록 컴퓨터 실습시간을 가진다.전선 / 대학원
본 교과목은 고급데이터마이닝 방법론(326.637) 과목에 이어 심층학습모형에 중점을 둔다. 교육 목표는 심층학습(deep learning)의 방법들을 공부하고 관련된 통계적 문제를 찾아내는 것이다. 다루는 내용은 다음과 같다. 심층학습 이전의 특징 추출 및 판별 분석 기법, 기계학습에서 사용되는 이론적인 도구들, 인공신경망의 기초, 다층 퍼셉트론, 역전파, 합성곱 신경망, 최적화와 정칙화, 가시화, 파이톤과 심층학습 프레임워크, 순환 신경망, 변분적 추론, 적대적 생성 네트워크, 영상 분할 및 검출, 자연어 처리 등이다.전선 / 대학원
본 교과목은 고급데이터마이닝 방법론(326.637) 과목에 이어 심층학습모형에 중점을 둔다. 교육 목표는 심층학습(deep learning)의 방법들을 공부하고 관련된 통계적 문제를 찾아내는 것이다. 다루는 내용은 다음과 같다. 심층학습 이전의 특징 추출 및 판별 분석 기법, 기계학습에서 사용되는 이론적인 도구들, 인공신경망의 기초, 다층 퍼셉트론, 역전파, 합성곱 신경망, 최적화와 정칙화, 가시화, 파이톤과 심층학습 프레임워크, 순환 신경망, 변분적 추론, 적대적 생성 네트워크, 영상 분할 및 검출, 자연어 처리 등이다.전필 / 대학원
전통적인 구조적 모형을 추정하는 회귀분석 방법을 공부한다. 단순회귀분석, 다중회귀분석, 연립방정식 추정 등을 다룬다. 그리고 자기회귀, 다중공선성, 이분산성, 변수선택 등의 문제를 해결하는 방법을 익힌다.전선 / 대학원
빅데이터 혹은 대용량 고차원 데이터의 출연으로 현대 통계학에서 계산의 중요성은 과거의 어떤 때보다 더 중요하게 되었다. 이 과목에서는 빅데이터를 다루는데 필요한 최신의 계산 기법들, 즉 GPU를 이용한 통계계산과 병렬처리를 활용한 통계계산의 이론과 실제를 다룬다.