SWRC) Semantic Parsing of Question based on the frame semantics for Korean Question Answering System 논문 요약.
<Semantic Parsing of Question based on the frame semantics for Korean Question Answering System.>
Abstract
-
Q&A system의 NL
Question 이해를 위한
Frame Semantics 제안.
-
질의의 술부-논항 구조 파악이 포인트
Introduction
-
Knowledge based
Question & Answering
-
지식은 형태를 갖고 있는 data 형식 (ex) RDF
expression: <s, p, o>
-
KB에 접근하기 위해선 SPASQL같은 Query 필요, but 복잡, 사용자가 편리하게 접근하기 위한 interface
필요. => 자연언어 질의를 분석해 지식베이스에 적합한 query 변환의 필요성 대두
-
NL Q&A를 기계가 읽을 수 있는 방법: Information, Extraction, Semantic Parsing
o
IE (Information
Extraction) : 지식베이스의 스키마와 질문의 구문구조, 지식베이스 온톨로지와 자연언어간 유의미한 관계를 패턴화하여 학습 -> 학습된 패턴에 의해 <s,p,o>와 같은 트리플 패턴 쿼리 형성.
o
Semantic Parsing:
IE의 단점을 극복하기 위해 사용, KB를 고려하지 않고 질의의 의도, 정보 의미를 충분히 분석하는 것을 목표.
Q&A
System을 위한 한국어 Question 이해
-
NL Question 이해 task의 requirement:
KBQA에서의 질의 이해의 주요 요소
o
정답의 유형: candidate에서 검색공간 및 모호성 축소
o
의문사: 화자의 의도 파악
o
정답의 근거: 트리플 패턴 생성의 필요 조건
-
QAF: 프레임 기반 모형 쿼리: 한국어 질의 384개로 구성된 NLQ 400사용, 수작업 프레임 어노테이션 적용.
-
Q-Frame, Q-FE
o
한국어 질의의 3가지 유형 : (1) 의문대명사 포함, (2) 의문대명사 포함x, (3) 평서문 형태 => 의문구조에서 뿌리노드 태그 확인, 뿌리노드의 지식노드 확인, 유형 분류
-
Sub-Frame 발견: 질의의 나타난 정답의 근거를 쿼리에 포함 -> SRL 도구 사용 (한국어 의미역 분석) : sub-frame의 target 어휘를 발견하는 데 사용. 하지만 QAF 표현에서 중간 노드를 발견하지 못하는 경우 발생
o
동사가 없는 질의
o
발견되지 않은 주요 논항에 대한 처리
o
독립적 Annotation
층을 연결하는 모듈 제작
o
논항에 대한 구 묶음
-
평가 : 0.90
Precision, 0.73 Recall, 0.8137 F-1 Score
Furthermore
-
Frame Mapping:
Frame Mapping에서의 성능
향상 필요 -> 유의어 사전, Word embedding 방법 적용
-
다양한 형태의 질의 처리: 복문의 질의, 괄호 처리, O/X 문제
-
Ontology mapping: 지식베이스 스키마에 대한 SPASQL을 생성하는 Ontology 연구의 필요성 대두.
댓글
댓글 쓰기