최근 확인한 콘텐츠
데이터가 존재하지 않습니다.
Liyamol Jacob, K. Prasanna, M.R. Vengatesan, P. Santhoshkumar, 이창우, Vikas Mittal
2018 / Journal of Industrial and Engineering Chemistry
데이터가 존재하지 않습니다.
loading...
본 연구는 웹사이트 문서에서 의미적 키워드를 추출하는 기법을 제안합니다. Word2Vec 기반의 의미적 유사도를 활용하여 기존 통계적 유사도 기반 방법보다 키워드 추출 성능을 34.52% 향상시켰습니다. 제안하는 기법은 형태소 분석의 정확성 문제와 웹페이지 구조상 잠재적으로 관련 없는 단어 포함 문제를 해결하고, 일관성 없는 키워드를 제거하여 최종 의미적 키워드를 추출합니다.
Information extraction : a multidisciplinary approach to an emerging information technolology : international summer school, SCIE-97, Frascati, Italy, July 14-18, 1997
Survey of text mining : clustering, classification, and retrieval
(Do it!) 쉽게 배우는 R 텍스트 마이닝
(Do it!) 쉽게 배우는 R 텍스트 마이닝
(머신러닝을 활용한) 소셜 빅데이터 분석과 미래신호 예측
뉴스 프레임과 의제의 자동 추출과 해석 모형
Computational linguistics and intelligent text processing : 7th international conference, CICLing 2006, Mexico City, Mexico, February 19-25, 2006 : proceedings
(트래픽을 쓸어 담는) 검색엔진 최적화 = 검색엔진이 가장 좋아하는 사이트 만들기
Semantics empowered Web 3.0 : managing enterprise, social, sensor, and cloud-based data and services for advanced applications
정보 검색의 이론과 실제 : 검색엔진을 구현하고 평가하는 방법
Programming collective intelligence : building smart web 2.0 applications
The Semantic Web : Fourth Asian Conference, ASWC 2009, Shanghai, China, December 6-9, 2009 : proceedings
Combinatorial pattern matching : third annual symposium, Tucson, Arizona, USA, April 29-May 1, 1992 : proceedings
Survey of text mining II : clustering, classification, and retrieval
Document analysis systems : theory and practice : Third IAPR Workshop, DAS'98, Nagano, Japan, November 4-6, 1998 : selected papers
Advances in pattern recognition : joint IAPR International Workshops SSPR'98 and SPR'98, Sydney, Australia, August 11-13, 1998, proceedings
검색 마케팅과 인터넷 마케팅 : 웹 사이트 SEM과 SEO 전략 수집
Machine translation and the lexicon : third International EAMT Workshop, Heidelberg, Germany, April 26-28, 1993 : proceedings
Text mining in practice with R
Elasticsearch in action : 강력하고 실용적인 검색 애플리케이션 구축
한국지능시스템학회 논문지
조태민; 이지형정보과학회논문지
송광호, 김유성한국정보기술학회논문지
박대서, 김화종Scientometrics
Zhang T.,Lee B.,Zhu Q.,Han X.,Chen K.ACM Transactions on Asian and Low-Resource Language Information Processing
Rui Pan한국지능시스템학회 논문지
조태민, 이지형한국어학
김일환, 이도길Artificial Intelligence Review: An International Science and Engineering Journal
Martinez-Gil, Jorge예술인문사회 융합 멀티미디어 논문지
이한동, 김종배Big Data and Cognitive Computing
Gagliardi I.,Artese M.T.Journal of Information and Communication Convergence Engineering
Kerang Cao, 이종원, 정회경International Journal on Artificial Intelligence Tools
Wu, X.; Xie, F.; Wu, G.; Ding, W.데이타베이스연구
유한묵; 김한준Journal of The Korean Data Analysis Society
이강철, 안정용대한산업공학회지
최우식, 김성범정보처리학회논문지D
박단호, 최원식, 김홍조, 이석룡Soft Computing: A Fusion of Foundations, Methodologies and Applications
Abdi, Asad; Idris, Norisma; Alguliyev, Rasim M.; Aliguliyev, Ramiz M.Multimedia Tools and Applications
Aman M.,Abdulkadir S.J.,Aziz I.A.,Alhussian H.,Ullah I.International Journal of Software Engineering and Knowledge Engineering
Yuqi Shen; Cheng Chen; Yifan Dai; Jinfang Cai; Liangyu ChenExpert Systems with Applications
Xu C.,Mao X.L.,Che T.Y.,Mao H.L.,Huang H.전선 / 학사
본 과목에서는 대용량의 텍스트를 분석하여 유의미한 결론을 도출하는 텍스트마이닝 기법에 대해 강의한다. Natural language processing, probabilistic topic model, text clustering, text categorization, contextual text mining 등, 텍스트마이닝 분야의 핵심 Keyword 및 기법에 대해 다룬다.전선 / 대학원
산업공학의 새로운 기법들을 소개하고 이의 응용실태를 알아본다.전선 / 학사
본 강좌에서는 코퍼스 언어학의 내용을 기반으로 모국어로 혹은 제2 언어나 외국어로 한국어를 학습하는 학습자의 언어 자료를 사용하여 (한)국어 교육에 활용하는 방안에 대해 고찰하고자 한다. 이를 위해 학생들은 코퍼스의 개념과 유형을 한국어 코퍼스와 연관 지어 살펴보고, 콘코던스 프로그램을 통한 한국어 코퍼스 검색 및 분석에 관련된 실제적 지식을 함양한다. 나아가 한국어 코퍼스를 어휘 교육, 문법 교육, 담화 교육, 교과서 분석 등에 활용하는 구체적 방안에 대해서도 탐구한다. 본 강좌를 통해 학생들은 한국어 코퍼스를 (한)국어 교육 현장의 필요에 따라 효과적으로 활용할 수 있는 교수 역랑을 기를 수 있다.전선 / 학사
본 강의에서는 다양한 산업에서 발생하는 텍스트 데이터에 대한 이해와 함께, 이에 대한 분석 기법들을 학습하는 것을 목적으로 한다. 크게 텍스트 데이터의 이해, 텍스트 데이터의 전처리 및 표상화, 언어 모델의 구조 이해, 그리고 텍스트 데이터의 응용 과업 등의 네 가지 파트로 구성하여 강의를 진행한다. 텍스트 데이터의 이해 파트에서는 제조업, 마케팅, 금융 등의 비즈니스에서 발생하는 텍스트 데이터의 특징과 이에 대한 활용 사례를 주로 다룬다. 텍스트 데이터의 전처리 및 표상화 파트에서는 전통적인 bag-of-words 방식을 포함하여, word2vec, GloVe, Fasttext와 같은 신경망 기반의 텍스트 표상화 방법을 강의한다. 언어모델의 구조 이해 파트에서는 Seqence-to-sequence Learning과 Transformer 구조에 대한 이해를 바탕으로 BERT 및 GPT 등의 대표적인 언어모델 구조를 강의한다. 마지막으로 텍스트 데이터의 응용 과업 파트에서는 감성 분석, 문서 요약, 질의 응답 등의 실제 비즈니스에서 자주 사용되는 텍스트 데이터 분석 과업을 소개하고 이를 해결하기 위한 적절한 방법론을 강의한다.전선 / 대학원
영어의 통사구조, 음운구조, 의미구조, 기타 영어학분야의 주제ㅐ를 선택하여 이를 집중적으로 연구한다.전선 / 대학원
불완전한 정보로 인한 시장문제와 소비자 문제를 바탕으로 소비자들의 정보탐색활동을 평가하고, 매체로부터의 정보를 분석함으로써 바람직한 정보정책의 틀을 제시한다.전선 / 대학원
계산이론은 컴퓨터공학의 기초학문이며, 중요한 문제에 대한 효율적인 알고리즘들을 소개하고, 그런 알고리즘의 복잡도 분석을 다룬다. 이 교과목에서는 먼저 알고리즘의 성능을 분석하는 기법, 특히 amortized analysis에 대해 배운다. 그리고, 계산이론 분야에서 중요한 알고리즘과 그 응용에 대해 배운다. 구체적으로, (스트링 매칭, 2차원 패턴 매칭, 근사 매칭, suffix trees, 데이터 압축 문제에 대한) 스트링 알고리즘과 bioinformatics에의 응용, (선택 문제, 다항식 확인 문제에 대한) randomized 알고리즘과 그 영향, (페이지 교체 문제, k 서버 문제에 대한) online 알고리즘과 금융문제(일방향 거래와 portfolio 선택 문제)에의 응용을 배운다.전선 / 학사
본 교과목의 목표는 학생들로 하여금 컴퓨터를 이용하여 한국어 관련 정보(또는 자료)를 적절히 추출하고 처리할 수 있는 기초적인 능력을 기르게 하는 것이다. 정보 관련 기술과 산업이 발전함에 따라 많은 학문분야의 연구 내용과 방법론도 달라지고 있는바, 이러한 변화에 부응하기 위해서 개설된 교과목이 본 교과목이다. 본 교과목을 통하여 학생들은 말뭉치의 구축, 말뭉치 가공, 가공된 말뭉치로부터의 언어정보 추출, 추출된 언어정보의 통계적 분석, 언어정보의 데이터베이스화, 데이터베이스의 운용 및 유지 등에 관한 기초적인 방법론을 익히게 될 것이며, 한국어문학 나아가서는 인문학을 위한 컴퓨터 활용 능력을 키우게 될 것이다.전선 / 대학원
이 교과목은 '통사론연구 1'(108.520)의 교과목 내용을 기초로 이론의 확대적용 및 발전을 좀더 깊이 있게 모색한다.전선 / 대학원
한국어교육에서 기본적으로 필요한 것은 학습자의 모어와 한국어를 대조분석하여 이를 바탕으로 언어간섭현상을 최소화하고 학습의 효과를 극대화하는 것이다. 이 강좌에서는 한국어와 주요 외국어를 대조분석하여 음운론적, 문법론적, 의미론적, 화용론적 층위에서 공통점과 차이점을 추출하는 과정에서 오류를 분석해냄으로써 효과적인 한국어교육의 기초로 삼는다.전선 / 대학원
데이터사이언스와 관련한 여러 분야의 최근의 국내외 연구동향을 소개한다. 강의와 세미나를 통하여 관련분야의 최신 방법론과 특정 주제를 심도 있게 습득할 수 있도록 한다.전선 / 대학원
평균 제곱 추정(mean square estimation), 최대 가능성 추정(max likelihood estimation), 그리고, Wiener 필터링과 같은 고전적인 추정 이론에 대해 소개한다. 이산 시간 또는 연속 시간 Kalman 필터, shaping filter, 최적 평활, Kalman 필터 디자인과 성능 분석, 제곱근 필터링, 확장 Kalman 필터를 포함한 비선형 필터링에 대해서도 알아본다.전선 / 대학원
구조주의적 접근에서부터 최근의 형식문법에 이르기까지 통사론의 연구 방법론에 대한 전반적인 이해를 목표로 한다. 특히 근래 활발하게 연구되고 있는 생성문법의 여러 통사이론(GB, GPSG, LFG, HPSG 등)을 비교하고 실제 언어자료에의 응용을 꾀한다. 또한 문법 전반에서의 의미론과의 관련성을 파악하고, 타당성 있는 새로운 통사이론의 정립을 모색한다.전선 / 대학원
평균 제곱 추정(mean square estimation), 최대 가능성 추정(max likelihood estimation), 그리고, Wiener 필터링과 같은 고전적인 추정 이론에 대해 소개한다. 이산 시간 또는 연속 시간 Kalman 필터, shaping filter, 최적 평활, Kalman 필터 디자인과 성능 분석, 제곱근 필터링, 확장 Kalman 필터를 포함한 비선형 필터링에 대해서도 알아본다.전선 / 대학원
한국어학 연구를 위해 컴퓨터를 활용하는 방법과 기계가 이해할 수 있도록 한국어를 처리하는 자연언어처리의 연구 성과를 학습하고 실습한다. 텍스트 처리를 위해 유용한 유닉스 명령어와 통계 패키지 R 등의 도구를 적절히 사용하는 방법을 익히고, 프로그래밍 언어 Python으로 텍스트 처리를 위해 스스로 코드를 짤 수 있도록 하며, 딥러닝을 포함한 기계학습 기법을 자연언어처리에 활용하는 방법도 탐구한다.전필 / 학사
본 과목에서는 정형 데이터와 비정형 데이터를 효과적으로 관리하고 분석하는 데에 필요한 제반 이론 및 기법을 배운다. 구체적으로, 본 과목의 전반부에서는 데이터베이스 (DB)를 기반으로 한 정보 시스템의 설계 및 구현, 그리고 DB 마이닝과 DB 기반 추천 시스템과 관련된 모형과 기법을 다루고, 후반부에서는 텍스트 데이터를 대상으로 정보 검색, 문서 분류 및 군집화를 위한 주요 이론과 방법론들을 소개한다. 아울러, 본 과목은 소개된 모형 및 기법들을 구현하여 다양한 형태의 데이터에 실적용해보는 프로젝트들을 포함하는 바, 이를 통해 실제 문제에 대한 해결 능력을 기르고, 관련된 기술적 이슈들을 경험해보는 것을 목표로 한다.전선 / 대학원
본 교과목은 단순한 질의응답을 넘어, 스스로 목표를 설정하고, 도구를 사용하며, 복잡한 과업을 자율적으로 수행하는 ‘에이전트(Agentic)' AI의 설계 원리와 구현 방법론을 심층적으로 다룬다. 기존의 LLM(Large Language Model)이 가진 한계를 극복하고, LLM을 ‘추론 엔진'으로 활용하여 실제 세계와 상호작용하는 지능형 시스템을 구축하는 데 초점을 둔다. 수강생들은 단일 에이전트의 핵심 구성 요소인 사고-행동-관찰(Reasoning-Acting-Observation) 루프, 동적 도구 사용(Tool Use), 장단기 기억(Memory) 메커니즘을 학습한다. 나아가 여러 에이전트가 협력하여 인간의 개입을 최소화하면서 복잡한 문제를 해결하는 멀티 에이전트 시스템(Multi-Agent System)의 설계 패턴(예: 계층적, 협력적)과 통신 프로토콜을 배운다. LangChain, AutoGen, CrewAI와 같은 최신 프레임 워크를 활용한 실습을 통해, 에이전트 아키텍처 설계부터 정교한 프롬프트 체이닝, 실행 루프 구현까지의 전 과정을 경험하며, 차세대 AI 애플리케이션을 개발할 수 있는 실전 역량을 배양하는 것을 목표로 한다.전선 / 학사
한국어 자료를 표기, 문자, 음운, 문법, 어휘의 면에서 자세히 읽고, 분석함으로써 한국어의 실상에 대한 이해의 폭을 넓힌다. 또 한국어 자료에 대한 서지, 문헌학적 접근을 통해 역사적 자료를 다루는 방법과 절차를 익히도록 한다.전선 / 대학원
모든 기록물 관리과정에 있어서 중요 기능을 하는 기록들의 수집 및 평가에 대하여 살펴보고자 한다. 기록의 수집과 평가는 모든 기록들의 활동에 영향을 미치는 첫 번째 핵심 과정으로서, 본 과정에서는 전자기록을 포함한 수집 및 평가의 일반적인 전락과 방법들을 살펴본다. 또한 강독과 토론을 통하여 기록들의 수집과 평가에 관련된 제 이론들과 전략들이 실제 어떻게 적용되고 있는지를 고찰함으로써, 학생들의 실질적인 능력을 제고시키고자 한다.전선 / 학사
데이터 마이닝은 대용량 데이터에서 유용한 패턴을 찾기 위한 이론과 기법을 의미한다. 본 과목에서는 데이터 마이닝을 위한 주요 알고리즘 및 이론(유사 아이템 검색, 빈발 패턴 검색, 링크 분석, 데이터 스트림 마이닝, 클러스터링, 그래프 마이닝 등)을 다룬다.