SWRC) Semantic Parsing of Question based on the frame semantics for Korean Question Answering System 논문 요약.

<Semantic Parsing of Question based on the frame semantics for Korean Question Answering System.>

Abstract
-           Q&A system NL Question 이해를 위한 Frame Semantics 제안.
-           질의의 술부-논항 구조 파악이 포인트
-           자연언어 질의를 input으로 받아 기계가 읽을 있는 RDF Query 생성.

Introduction
-           Knowledge based Question & Answering
-           지식은 형태를 갖고 있는 data 형식 (ex) RDF expression: <s, p, o>
-           KB 접근하기 위해선 SPASQL같은 Query 필요, but 복잡, 사용자가 편리하게 접근하기 위한 interface 필요. => 자연언어 질의를 분석해 지식베이스에 적합한 query 변환의 필요성 대두
-           NL Q&A 기계가 읽을 있는 방법: Information, Extraction, Semantic Parsing
o    IE (Information Extraction) : 지식베이스의 스키마와 질문의 구문구조, 지식베이스 온톨로지와 자연언어간 유의미한 관계를 패턴화하여 학습 -> 학습된 패턴에 의해 <s,p,o> 같은 트리플 패턴 쿼리 형성.
o    Semantic Parsing: IE 단점을 극복하기 위해 사용, KB 고려하지 않고 질의의 의도, 정보 의미를 충분히 분석하는 것을 목표.
o    IE 같은 경우, 현재 KB 갖고 있는 온톨로지 어휘로의 변환이 상당히 모호함. 이러한 언어 수준 의미를 표현하기 위해 프레임 넷의 Frame Semantics 적용.


Q&A System 위한 한국어 Question 이해
-              NL Question 이해 task requirement: KBQA에서의 질의 이해의 주요 요소
o    정답의 유형: candidate에서 검색공간 모호성 축소
o    의문사: 화자의 의도 파악
o    정답의 근거: 트리플 패턴 생성의 필요 조건
-           QAF: 프레임 기반 모형 쿼리:  한국어 질의 384개로 구성된 NLQ 400사용, 수작업 프레임 어노테이션 적용.
한국어 질의 프레임 의미 분석

-           적은 데이터의 사용 -> 기존 공개된 자연언어처리 도구 활용, 자연언어 질의에 대한 커버리지 -> SP 방식 채택, 표준화된 형식 사용-> JSON 포맷과 RDF 포맷 출력

-           Q-Frame, Q-FE
o    한국어 질의의 3가지 유형 : (1) 의문대명사 포함, (2) 의문대명사 포함x, (3) 평서문 형태 => 의문구조에서 뿌리노드 태그 확인, 뿌리노드의 지식노드 확인, 유형 분류

-           Sub-Frame 발견: 질의의 나타난 정답의 근거를 쿼리에 포함 -> SRL 도구 사용 (한국어 의미역 분석) : sub-frame target 어휘를 발견하는 사용. 하지만 QAF 표현에서 중간 노드를 발견하지 못하는 경우 발생
o    동사가 없는 질의
o    발견되지 않은 주요 논항에 대한 처리
o    독립적 Annotation 층을 연결하는 모듈 제작
o    논항에 대한 묶음
-           평가 : 0.90 Precision, 0.73 Recall, 0.8137 F-1 Score
Furthermore
-           Frame Mapping: Frame Mapping에서의 성능 향상 필요 -> 유의어 사전, Word embedding 방법 적용
-           다양한 형태의 질의 처리: 복문의 질의, 괄호 처리, O/X 문제
-           Ontology mapping: 지식베이스 스키마에 대한 SPASQL 생성하는 Ontology 연구의 필요성 대두.


댓글

가장 많이 본 글