LikeSNU-서울대 중앙도서관 빅데이터 지식 플랫폼

문서 유사도를 통한 관련 문서 분류 시스템 연구

저자

정지수, 지민규, 고명현, 김학동, 임헌영, 이유림, 김원일

학술지명

방송공학회 논문지

출판/발행연도

2019

주제

#컴퓨터 과학

요약

본 연구는 머신 러닝 기술과 Doc2Vec 모델을 활용하여 문서 유사도를 측정하고 문서 분류 시스템을 구축하는 방법을 제안한다. 키워드 기반 데이터 수집, 형태소 분석, 문서 임베딩 과정을 거쳐 서포트 벡터 머신을 학습한 결과, F1 점수 0.83의 우수한 성능을 보였다.

출처 바로가기 찜하기