최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
데이터가 존재하지 않습니다.
loading...
본 연구는 빅 데이터 분석 기법인 연관성 규칙의 객관적 흥미도 측도로서 정보량에 의해 정규화된 상호정보량인 상대적 상호정보량을 탐색하고 기존 평가 기준과 비교했습니다. 연구 결과, 상대적 상호정보량은 연관성의 방향을 나타내어 지지도와 신뢰도보다 더 바람직한 측도로 판단되었으며, 산술평균을 이용한 측도가 가장 큰 차이를 보였습니다.
Current essays and reports in information retrieval and data mining : an annotated bibliography of shorter monographs
Advances in knowledge discovery in databases
Statistical methods for rates and proportions
The seven pillars of statistical wisdom
Life-span maintenance of knowledge
정보측정론 : 정보서비스 관점
Measures of association for cross classifications
Rare association rule mining and knowledge discovery : technologies for infrequent and critical event detection
Principles of data mining and knowledge discovery : Second European Symposium, PKDD '98, Nantes, France, September 1998 : proceedings
말뭉치에 기반한 현대중국어 허사 유의어 대조 연구
인맥의 법칙
Data matching : concepts and techniques for record linkage, entity resolution, and duplicate detection
Econometrics of information and efficiency
Data mining in finance : advances in relational and hybrid methods
(직관으로 이해하는) 의학통계학 : 통계적 사고를 위한 비수학적 가이드
Intro stats
A probabilistic theory of pattern recognition
한국데이터정보과학회지
박희창Journal of The Korean Data Analysis Society
박희창Journal of The Korean Data Analysis Society
박희창한국데이터정보과학회지
박희창Journal of The Korean Data Analysis Society
박희창Journal of The Korean Data Analysis Society
박희창Journal of The Korean Data Analysis Society
박희창한국데이터정보과학회지
박희창Journal of The Korean Data Analysis Society
박희창Journal of The Korean Data Analysis Society
박희창한국데이터정보과학회지
박희창한국데이터정보과학회지
박희창한국데이터정보과학회지
박희창Journal of The Korean Data Analysis Society
박희창Journal of The Korean Data Analysis Society
박희창Journal of The Korean Data Analysis Society
박희창Journal of The Korean Data Analysis Society
박희창Journal of The Korean Data Analysis Society
박희창한국데이터정보과학회지
박희창한국데이터정보과학회지
박희창전필 / 대학원
측도론(measure theory)의 기본, 확률변수, 독립성, 확률변수의 여러 가지 수렴성, 확률급수의 수렴, 대수의 법칙(law of large numbers), 반복대수의 법칙, 분포수렴, 특성함수 (characteristic functions), 중심극한정리를 다룬다.전선 / 학사
데이터 마이닝은 대용량 데이터에서 유용한 패턴을 찾기 위한 이론과 기법을 의미한다. 본 과목에서는 데이터 마이닝을 위한 주요 알고리즘 및 이론(유사 아이템 검색, 빈발 패턴 검색, 링크 분석, 데이터 스트림 마이닝, 클러스터링, 그래프 마이닝 등)을 다룬다.전선 / 대학원
인과 관계를 이해하는 것은 일상생활 뿐 아니라 과학적 진보를 이루는 데 큰 역할을 해왔다. 특히, 인과 관계를 상관관계로부터 구분하는 것이나 비실험 데이터로부터 인과 중재의 효과를 측정하는 것은 의사 결정이나 다양한 분야의 정책을 개발하는데 중요해지고 있다. 이 과목은 인과 추론 방법에 대해 데이터사이언스와 인공 지능의 관점에서 고찰 한다.전선 / 대학원
한정된 자료들 사이의 공간적 상호관계를 분석하고 이를 바탕으로 임의의 위치에서 원하는 자료값을 예측하는 여러 크리깅 기법을 공부한다. 주어진 값과 그 분포를 항상 보전하는 조건부 시뮬레이션과 불확실성을 줄이기 위해 이용가능한 자료를 통합하여 사용하는 최적화 기법을 공부한다.일선 / 학사
본 과목은 위상수학과 조합론에 기반한 데이터 분석 및 네트워크 이론에의 응용에 관심을 둔 학생들을 대상으로 한다. 빅데이터 분석에 있어“데이터의 형태”가 중요한 분류 기준으로 자리 잡게 되었으며 이러한 형태를 위상수학을 이용하여 인식하고 평가하는 방법을 배운다. 또한 조합론과 그래프이론에 기반하여 위상수학적 데이터 분석 결과를 고도화하고 네트워크에 응용하는 방법을 배운다. 관련한 선형대수의 주제들은 필요에 따라 복습을 병행한다.전선 / 학사
사물인터넷(IoT)을 비롯한 스마트 환경과 소셜네트워크 서비스의 보편화로 인해 다양하고 방대한 데이터가 발생하고 있다. 이와 함께 막대한 양의 데이터를 신속하게 처리할 수 있는 컴퓨팅 환경의 발달과 창의적인 시각으로 데이터를 분석하고 연결하는 인공지능의 개발로 빅데이터는 여러 분야의 혁신적인 패러다임으로 등장하고 있다. 빅데이터는 데이터 그 자체의 효용성보다는 다양한 방법의 가공을 통한 데이터 간의 연결 및 창의적인 분석을 통해 혁신적인 가치를 창출하고 있으며, 빅데이터의 분석과 활용은 산업과 국가 경쟁력의 척도가 되고 있다. 빅데이터의 분석을 통해 새로운 가치를 창출하기 위해서는 다학제적 융합연구가 필요하다. 이 강의에서는 빅데이터 기업, 연구소 및 학계 전문가들을 초빙하여 최신 빅데이터 기술 경향에 대하여 알아본다. 또한 실제 업무에서 사용되는 툴을 활용하여 다양한 분석 기법을 공부하게 된다. 빅데이터 분야에 관심있는 학생들에게 진로 및 전공 선택에 대한 전망을 제시하게 될 것이다.전선 / 학사
데이터마이닝은 대용량 데이터에서 유용한 패턴을 찾기 위한 이론과 기법을 의미한다. 데이터마이닝은 웹, 사기 탐지, 추천 시스템, 사이버 보안 등 중요한 응용에 활용되고 있다. 본 과목에서는 데이터마이닝을 위한 중요 알고리즘과 이론을 설명한다. 주요 학습 주제로 mapreduce, 유사 아이템 검색, 빈발 패턴 검색, 링크 분석, 데이터 스트림 마이닝, 클러스터링, 그래프 마이닝 등을 다룬다.전선 / 대학원
본 교과목에서는 AI가 매스 커뮤니케이션을 포함한 인간 커뮤니케이션 전 영역에 걸쳐 메시지 작성, 확산, 큐레이션(curation) 등 보다 다양하고 적극적인 역할(agency)을 수행하게 됨에 따라 대두되는 질문들을 (a) 인간-AI 커뮤니케이션(human-AI communication)과 (b) AI 매개 커뮤니케이션(AI-mediated communication)의 하위 분야로 나누어 심층적으로 고찰한다. 먼저 인간-컴퓨터 상호작용(human-computer interaction), 컴퓨터 매개 커뮤니케이션(computer-mediated communication) 분야의 대표적 이론 및 관련 실증연구들을 학습하고, AI 발전에 따른 최신 연구동향을 검토한다. 실제 AI 활용 사례(예; AI 스피커, AI 뉴스 추천 시스템. 챗봇)를 대상으로 기술적 속성, 이용자들의 속성, 커뮤니케이션 맥락 등에 따라 기존 이론 및 모델을 어떻게 수정, 보완, 확장해야 하는지 논의한다. 이를 통해 커뮤니케이션학에서 AI의 문제를 어떻게 정의하고 연구할 것인가에 대한 이해를 증진시킬 것이다.전선 / 대학원
물질의 거시적 성질을 그 구성원 사이의 상호작용에 의한 협동현상으로 이해하려는 통계역학의 기초를 다룬다. 주요 내용은 기본개념, 분포함수, 분배함수와 열역학량, 고전 및 양자기체, 송이전개, 상전이 등의 평형 현상과 확률방정식, 운동 이론, 소송 등 비평형 현상을 포함한다.전선 / 대학원
이 과목에서는 빅데이터의 시대를 맞이하여 탐색적 자료분석과 확증적 자료분석을 보다 일반화한 개념인 알고리즘과 통계적 추론의 발전과정에 대해서 공부한다. 먼저 통계학 분야의 대표적인 3개의 학파, 베이지안(Bayesian), 빈도주의(Frequentist), 우도주의 (Fisherian)에 대해서 알아본 후 교차검증과 모형선택, 축소추정량, 경험적 베이즈 방법론, 재표본 추출법, 생존분석과 EM 알고리즘, MCMC, 다중비교과 같은 최신통계 방법론을 소개한다.전선 / 대학원
다른 과목에서 배운 계량적 분석방법을 현실 농업문제에 응용한다. 비교정학(comparative statics)에 의한 모형분석, 칼만 필터(Kalman filter), 뉴럴 네트워크(neural network), 유전자 알고리즘(genetic algorithm), 부트 스트랩핑(boot strapping), 커널 추정(kernel estimation) 등을 다룬다.전선 / 대학원
이 과목은 농업분야 분석에 많이 적용되는 거시모형 수립을 위한 기초이론을 공부한다. 우선 일반균형이론에 대한 미시 경제학적 기초를 공부하고 그 이후 세대교차모형 및 여타 응용거시모형들에 대한 기초를 공부하게 된다.전선 / 대학원
데이터마이닝 (Data Mining)은 대용량 데이터베이스에 존재하는 데이터 간의 관계, 패턴, 규칙 등을 찾아내고 모형화해서 의사결정을 돕고, 유용한 정보로 변환하는 일련의 과정이다. 본 강좌에서는 기술모델링과 예측모델링에 사용되는 통계학, 기계학습, 신경회로망 기법들을 공부하고, 응용 사례 연구와 패키지를 이용한 프로젝트를 수행한다.전선 / 학사
데이터에 대한 탐색과 통계적 탐구를 수행하는 방법을 배운다. 데이터의 종류와 특성을 이해하고, 적절한 시각화와 분석을 통해 데이터에 숨은 정보를 찾아내고 근거에 기반을 둔 합리적인 의사결정을 하는 방법을 배운다. 데이터에 존재하는 관계성을 찾아 수학적으로 모델링하는 방법으로써 상관관계의 분석과 회귀분석, 클러스터링 기법 등을 배운다. 데이터를 이용한 통계적 탐구를 지도하는 방법을 배운다.전필 / 학사
인문학은 전통적으로 질적 접근을 주 방법론으로 삼아왔으나, 최근 수량적 접근의 필요성이 크게 부각되고 있다. 이 과목은 인문데이터과학을 전공하는 학생들에게 인문학의 여러 영역의 자료를 수량적으로 분석하기 위한 기초 지식을 제공한다. 통계의 기본 개념과 추론의 원리를 익히고 통계 소프트웨어를 활용하여 실제 데이터를 분석하는 능력을 키운다. 인문계열 1학년 수준의 수학 배경 지식에 맞추어 통계적 기법을 이해할 수 있도록 이론적인 부분을 최소화하되 추후에 본격적인 통계 관련 수업을 들을 수 있는 수리적인 기초를 닦을 수 있는 기회를 제공할 수 있도록 한다.전선 / 대학원
한 개체로부터 다른 실험조건하에서나 여러 다른 관측시간에 반복적으로 얻어진 자료를 분석하기위한 통계기법을 다룬다. 연속형의 반복측정자료를 분석하기 위해 다변량정규분포의 가정을 필요로 하는 고전적인 다변량모형을 소개하고 최근에 널리 사용되고 있는 혼합모형을 다룬다. 이산형의 반복측정자료 분석을 위해서는 가중최소제곱법에 근거한 모형과 랜덤화 모형을 다루고 일반화선형모형을 확장한 일반화추정방정식(GEE)모형을 다룬다.전선 / 대학원
보건학 자료는 이진형, 연속형 등 다양한 유형의 자료들로 이루어져 있으며 subjects사이의 상관성으로 인하여 분석이 쉽지 않다. 이러한 보건학 자료의 분석을 위하여 선형혼합모형, 일반화선형모형, 일반화선형혼합모형 등이 주로 활용되어 왔다. 고급보건통계이론에서는 이러한 분석 방법론에 활용되고 있는 다양한 모수 추정방법론과 관련 이론을 학습할 것이다. 예를 들어, 최대가능도추정량과 제한가능도추정량의 점수함수와 모수추정 방법론을 배우고 동시에 일반화추정방정식과 관련된 다양한 이론을 학습하고 연습함으로써 보건통계자료 분석의 기본 이론을 배울 수 있는 기회가 될 것이다.전선 / 대학원
최근 정보통신기술이 발전하면서 교통분야에서 다양한 데이터가 수집되고 활용된다. 차량과 사람의 위치 데이터, 교통량, 속도, 밀도 등 교통흐름과 관련된 데이터, 대중교통 이용 실태를 확인할 수 있는 교통카드 데이터 등이 대표적이다. 이들은 모두 실시간으로 빠르게 수집되는 만큼 양도 방대하다. 소위 빅데이터의 특징인 Volume (양), Variety (종류), Velocity (속도)의 특징을 모두 가진다. 본 교과목은 교통 분야 빅데이터의 유형을 이해하고 이를 분석하는 것을 목적으로 한다. 이를 위해 우선 빅데이터의 기초와 시각화 방안을 배운다. 이후 인공지능 방법론의 기초를 학습하고 교통 빅데이터를 이용하여 CNN, RNN 분석을 수행해 본다. 아울러 군집분석, 의사결정나무 등 자주 활용되는 데이터 분석기법도 배운다.전선 / 대학원
범주형 자료를 분석하기 위한 통계기법들을 소개한다. 범주형 자료들은 대개 분할표를 이용해 정리할 수 있기 때문에 분할표를 분석할 수 있는 통계방법을 중점적으로 다룬다. 주된 주제들은 분할표분석, 로그 선형모형, 로지스틱모형이다.전선 / 대학원
이 교과목의 목표는 보건의료 정책과 사업의 평가에 흔히 이용되는 주요 계량적 방법론을 이해함으로써 연구 논문을 비판적으로 평가하고 실제 구체적 연구 문제에 적용할 수 있도록 하는 것이다. 무작위 대조 연구의 실험 설계를 기준점으로 삼아, 잠재적 혼란요인을 통제변수로 포함하여 보정하는 다중 회귀분석을 통하여 비실험적 상황에서 인과적 효과를 추론할 수 있는 가능성과 필요한 가정을 검토하는 것으로부터 출발한다. 실제 보건의료 정책 및 사업의 평가에서 그러한 가정들은 충족되는 경우가 드문 편인데, 이 교과목에서는 그런 상황에서 비실험적 자료를 이용하여 보건의료 정책 및 사업 효과를 추정할 때 인과적 추론 강화에 도움을 줄 수 있는 방법론들을 주로 다룬다. 구체적으로는 이중차이, 성향점수, 도구변수, 회귀불연속, 간섭된 시계열 모형, 자연실험 방법이 포함된다.