최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 연구는 불균형 텍스트 데이터에서 카이제곱 통계량이 양변수만 선택하는 편향성을 보임을 확인하고, 그 이유를 분석한다. 실제 데이터를 통해 카이제곱 통계량의 이러한 성질을 검증하고, 오즈비와의 비교를 통해 분류 모형 성능에 미치는 영향을 분석한다. 연구 결과, 불균형 데이터에서 카이제곱 통계량은 양변수를 과도하게 선택하는 경향을 보였다.
(Alibi·lime·shap·ELI5 InterpretML을 활용한) XAI
(한눈에 쏙쏙) 의학통계 배우기
Regression models as a tool in medical research
Word frequency distributions
(한눈에 쏙쏙) 의학통계 배우기
(의학.보건학 연구자를 위한) R통계와 성향점수분석 =
An introduction to Bayesian analysis : theory and methods
통계적으로 생각하기 : 빅데이터 세상을 꿰뚫어 보는 힘
Statistical methods for drug safety
Selection bias and covariate imbalances in randomzied clinical trials
웹 데이터 수집의 기술 : 입문편
Non-conventional preference relations in decision making
공간계량모형응용 =
거짓을 간파하는 통계학 : 통계 콤플렉스를 날려주는 유쾌한 강의!
Aspect in the English verb : process and result in language
통계의 이해 : 다변량 빅데이터 중심으로
데이터 시각화 교과서 : 데이터 분석의 본질을 살리는 그래프와 차트 제작의 기본 원리와 응용
온택트 파워포인트 속성과외 : PPT 기획, 디자인, 제작을 12가지 만능 템플릿으로 빠르게 끝낸다!
응용통계연구
Hye In Mun, 손원Korean Journal of Applied Statistics
Hye In Mun; Won Son商丘师范学院学报 / Journal of Shangqiu Normal University
骆魁永; LUO KuiyongIETE Journal of Research
Chuanxin Jin; Mznah Al-Rodhaan; Abdullah Al-Dhelaan; Tinghuai Ma; Yuan Tian; Hou Rongtao; Meili Tang대한산업공학회지
서민지, 안길승, 허선KSII Transactions on Internet and Information Systems
Jafar Pouramini, Behrouze Minaei응용통계연구
손원Natural Language Engineering
Behzad Naderalvojoud; Ebru Akcapinar SezerAnnals of Data Science
Kamalov F.,Leung H.H.,Moussa S.Natural Language Engineering
Naderalvojoud B.,Akcapinar Sezer E.한국데이터정보과학회지
신지은, 박창이Intelligent Decision Technologies
Mehta, P.; Chandra, S.응용통계연구
장우솔; 김예은; 손원Intelligent Decision Technologies
Poornima Mehta; Satish ChandraInternational Journal on Artificial Intelligence Tools
Seyyedi, S.H.; Minaei-Bidgoli, B.合肥师范学院学报 / Journal of Hefei Normal University
董露露; DONG Lulu한국데이터정보과학회지
최동준, 최호식, 박창이Multimedia Tools and Applications
Farek L.,Benaidja A.International Journal of Intelligent Systems
Miri M.,Dowlatshahi M.B.,Hashemi A.,Rafsanjani M.K.,Gupta B.B.,Alhalabi W.한국데이터정보과학회지
최동준; 최호식; 박창이전선 / 대학원
보건학적인 자료 중에서 많은 것이 이산변수이다. 다라서 보건학 연구기법을 터득하려면 이산변수의 분석방법을 이해하지 않고서는 효율적으로 자료분석을 할 수 없다. Chi-square 방법은 이러한 자료를 분석하는 가장 기초적인 방법인데, 이에서 한걸음 더 나아가 다변량으로 이산변수가 나타나는 경우의 분석방법을 다룬다. 따라서 자료의 상관성문제, 대수선형분석방법 등을 다룬다.전선 / 학사
베이즈 추론은 베이즈 정리를 이용하여 불확실성을 가진 정보를 확률로 표현하고 이를 이용하여 추론을 하는 방법이다. 이 과목에서는 베이즈 추론의 역사적 배경, 베이즈 추론의 기본 요소를 다루고, 현실적인 베이즈 추론을 위해 필요한 베이즈 계산 방법들, 즉 마르코프 체인 몬테 카를로와 변분방법 등을 다룬다. 또한 베이즈 추론을 이표본 검정, 선형 회귀모형, 로지스틱 회귀모형 등 기본적인 통계모형에 적용하여 데이터 분석하는 방법을 배운다.교양 / 학사
이 과목의 목적은 데이터 문해력에 대한 기본지식을 함양하고 이를 통하여 데이터 기반 의사결정능력과 올바른 정보를 취사선택하는 방법을 익히는 데 있다. 이 과목을 통하여 다양한 통계의 오용사례를 살펴보고 데이터를 전달하는 미디어를 올바르게 이해하고 데이터를 기반으로 효율적으로 본인의 주장을 제시하는 방법에 대해 배운다.전선 / 대학원
이 과목에서는 다변량에 대한 통계이론들과 분석법들을 다룬다. 다변량 정규분포, 다변량 분산분석, 판별분석, 정준상관, 요인분석, 공분산 구조모형들이 다루어 질 것이다. 또한 다변량을 위한 통계패키지의 사용방법에 대하여서도 배울 것이다.전선 / 대학원
범주형 자료를 분석하기 위한 통계기법들을 소개한다. 범주형 자료들은 대개 분할표를 이용해 정리할 수 있기 때문에 분할표를 분석할 수 있는 통계방법을 중점적으로 다룬다. 주된 주제들은 분할표분석, 로그 선형모형, 로지스틱모형이다.전선 / 대학원
중도절단 생존시간 자료를 분석하는 고급 통계적 기법들을 다룬다. 생존함수의 추정을 위한 일반적인 방법인 KaplanㅡMeier 추정량의 정의 및 여러 성질들을 다룬다. 좌 절단 자료의 분석을 위하여 필수적인 셈 과정에 대한 이론을 배우고, 이를 이용한 위험함수의 추정방법을 설명한다. 생존시간 자료의 회귀모형을 위하여 비례위험모형에 대하여 다루고, 회귀계수의 점근적 일치성 및 근사분포를 유도한다.전선 / 학사
본 과목에서는 대용량의 텍스트를 분석하여 유의미한 결론을 도출하는 텍스트마이닝 기법에 대해 강의한다. Natural language processing, probabilistic topic model, text clustering, text categorization, contextual text mining 등, 텍스트마이닝 분야의 핵심 Keyword 및 기법에 대해 다룬다.전선 / 대학원
이 과목은 우리가 일상적으로 많이 쓰고 있는 통계적 용어, 이 과목에서는 컴퓨터를 이용한 보건통계 자료처리에 필요한 기본적 통계적 이론들을 배우고 여러 통계 패키지를 이용한 실제의 자료처리 과정을 배우는 것을 목적으로 삼는다. 많은 실제 예제 자료들을 다룸으로 실제적인 문제 처리 능력을 키우고 컴퓨터를 이용한 자료 처리의 자신감을 키운다. 또한 회귀분석과 분산분석의 기초 이론들을 실제 쓰이는 용도를 중심으로 익힌다. 하나의 교재를 정하지 않고 매 시간 필요한 자료들을 복사하여 수업시간 전에 배분할 예정임.전선 / 대학원
최근 생물정보 데이터 생산 비용이 급격히 감소함에 따라 다양한 오믹스 자료를 활용하여 질병의 원인이 되는 오믹스 마커 규명 연구가 활성화되고 있다. 오믹스 자료는 유형에 따라 통계학적 성질에 큰 차이가 있으며, 따라서 보건자료와 다중오믹스를 통합하여 분석을 수행하는 경우 이러한 차이를 적절히 고려하여 유형 별 적절한 분석을 수행할 필요가 있다. 본 과목에서는 전장유전체분석, 멘델랜덤화 기법을 비롯하여 다양한 유전체와 보건 자료를 분석에 활용되는 분석기법을 주로 소개할 것이다. 또한 전사체, 후성유전체, 마이크로비옴과 같은 오믹스데이터와 보건 자료 통합분석 기법을 소개할 것이다. 각 오믹스 자료의 생물학적 이해보다는 자료의 특성과 분석 알고리즘을 통계학적 기법에 기초하여 설명할 것이며, 따라서 수업의 내용을 적절히 이해하기 위해서는 회귀분석/보건학통계방법론, 수리통계학/보건통계학연습 등의 과목을 선수강해야 한다.전선 / 대학원
최근 생물정보 데이터 생산 비용이 급격히 감소함에 따라 다양한 오믹스 자료를 활용하여 질병의 원인이 되는 오믹스 마커 규명 연구가 활성화되고 있다. 오믹스 자료는 유형에 따라 통계학적 성질에 큰 차이가 있으며, 따라서 보건자료와 다중오믹스를 통합하여 분석을 수행하는 경우 이러한 차이를 적절히 고려하여 유형 별 적절한 분석을 수행할 필요가 있다. 본 과목에서는 전장유전체분석, 멘델랜덤화 기법을 비롯하여 다양한 유전체와 보건 자료를 분석에 활용되는 분석기법을 주로 소개할 것이다. 또한 전사체, 후성유전체, 마이크로비옴과 같은 오믹스데이터와 보건 자료 통합분석 기법을 소개할 것이다. 각 오믹스 자료의 생물학적 이해보다는 자료의 특성과 분석 알고리즘을 통계학적 기법에 기초하여 설명할 것이며, 따라서 수업의 내용을 적절히 이해하기 위해서는 회귀분석/보건학통계방법론, 수리통계학/보건통계학연습 등의 과목을 선수강해야 한다.전필 / 학사
통계학은 데이터에 기반한 합리적인 의사결정을 위한 이론적 토대를 제공한다. 본 과목에서는 통계이론의 기초가 되는 확률의 개념과 확률 변수의 성질들을 다루고, 통계적 추정과 검정을 다룬다. 본 과목을 통하여 학생들은 데이터의 생성 과정을 확률 모형으로 이해할 수 있고, 데이터 분석에 필요한 통계적 추론 방법의 이론적 토대를 갖춘다.전선 / 대학원
표준적 도시교통계획과정의 이론적 구조와 문제점 그리고 실천모형의 장단점을 비교검토하고, 보다 일반적인 교통계획모형의 구성을 위한 여러 방법론과 고급이론을 소개함과 아울러 새로운 연구방향에 관해 연구한다.전선 / 학사
범주형 자료에 대한 이해와 분석 방법을 학습하는 과목이다. 범주형 자료는 사회과학, 보건의료 등 다양한 분야에서 일상적인 조사와 실험을 통해 널리 수집된다. 학생들은 분할표(contingency table) 분석을 포함하여, 일반화선형모형(generalized linear model), 로지스틱 회귀모형(logistic regression model), 로그 선형모형(log-linear model) 등 다양한 분석 방법을 학습한다. 이 과목을 통해, 자료의 특성을 이해하고, 적절한 분석 방법을 선택할 수 있는 능력을 개발한다. 또한 통계 소프트웨어를 통해 실제 데이터에 적용하고 구현하는 과정을 다룬다.전선 / 대학원
온라인 교육 활동이 활발해지면서 교육 분야의 데이터가 폭발적으로 증가하고 있다. 온라인 교육이 쏟아내는 빅 데이터의 추출과 분석은 오프라인 데이터의 분석과 함께 과학교육의 현황을 파악하고 미래를 위한 과학교육의 방향을 결정하는데 중요한 정보를 제공할 수 있다. 이 과목에서는 학생들이 빅 데이터 분석의 원리와 방법을 이해하고, 학습 결과를 온라인과 오프라인 과학교육과 사회현상의 분석에 응용하는 능력을 기르는 것을 목표로 하며, 데이터 마이닝을 위한 확률 개념을 바탕으로 수집된 데이터에서 최대의 정보를 추출하는 방법을 학습한다. 특히, 대표적 분류 모형인 퍼셉트론, 합성곱 신경망, 순환 신경망, 생성 모형으로 오토 인코더, 적대적 생성 신경망, 볼츠만 머신, 딥 빌리프 네트워크 등을 깊이 다룰 예정이다. 학생들은 이 주제들에서 학습한 내용을 교육 데이터 마이닝의 실습, 무크와 같은 대규모 학습의 분석에 응용하는 연습을 한다. 이 과목은 교육 통계와 좋은 보완이 될 수 있다. 그러나 강의를 이해하는데 필요한 통계 수학과 컴퓨터 프로그램 지식을 선행 지식으로 요구하지는 않는다.전필 / 대학원
심리학 및 사회과학의 대학원생을 위한 통계: 기술통계와 추론통계에 대한 개념과 자료분석 기법을 다룬다. 구체적으로 무선변인, 확률이론, 추정, 가설검정, 분산분석, 그리고 상관분석과 회귀분석을 다룬다.전필 / 학사
통계학은 데이터에 기반한 합리적인 의사결정의 이론적 토대를 제공한다. 본 과목에서는 통계이론의 기초가 되는 확률의 개념과 확률 변수의 성질들을 다루고, 통계적 추정과 검정을 다룬다. 본 과목을 통하여 학생들은 데이터의 생성 과정을 확률 모형으로 이해할 수 있고, 데이터 분석에 필요한 통계적 추론 방법의 이론적 토대를 갖출 수 있다.전선 / 대학원
인과추론은 데이터로부터 인과적 결론을 도출하는데 필요한 논리적 조건과 분석과정을 탐색하는 새로운 양적방법론적 접근이다. 이 강의는 교육분야 연구자들에게 인과추론의 기본 개념과 최신 연구성과들을 소개하고, 교육연구에 인과추론을 적극적으로 활용할 수 있도록 유도하는 것을 목표로 한다.전선 / 대학원
생명 공학의 발전과 의료의 디지털화로 인해서 방대한 양의 유전체 및 오믹스, 그리고 전자의무기록 데이터가 수집되었으며, 이제 이 방대한 데이터의 처리 및 분석이 중요한 문제이다. 본 과목은 유전체, 오믹스, 의료 데이터의 특성을 소개하며, 이러한 데이터를 분석할 수 있는 통계 및 머신러닝 기반의 분석 방법을 소개한다. 특히, 이 과목은 유전체 등의 바이오 데이터와 전자의무기록이 결합되어 있는 바이오뱅크 데이터에 중점을 둔다. 구체적인 주제는 다음과 같다 ◆ 유전체 등의 바이오데이터와 전자의무기록 데이터의 특성 ◆ 유전체 데이터 연관성 분석 ◆ 유전체 기반 질병 위험도 예측, 인과관계 추론 및 약물 표적 규명 ◆ 전자의무기록 데이터 기반 임상 의사결정 지원 시스템 ◆ 유전체 및 임상 데이터 통합한 다중 모드 데이터 분석전선 / 대학원
이 과목은 인간의 정보추구행동을 분석하는 다양한 방법론을 소개하여 향후 학생 본인의 전공분야를 선택하는데 참조할 수 있도록 한다. 특히 정보의 사용성 조사나 사용자 경험조사 방법을 중점으로 데이터의 수집, 실험설계, 데이터 분석 및 해석방업 등을 취급한다.전선 / 대학원
본 과목에서는 특히 거대한 계산 혹은 병렬계산에서 계산의 효율성을 높이고 병목현상을 줄이기 위하여 과학적 프로그래밍 코딩에 사용되는 거대한 자료구조에 대하여 배운다. Array, recursion, sorting, pointer, stack and queue, link, graph, path, tree구조 등 자료구조의 기본을 배우고 이들의 구조를 이용하여 효율적인 알고리즘을 작성하도록 한다.