1 |
1
위키피디아 원문에서 본문 문서, 섹션제목 문서, 인포박스 문서, 카테고리 문서 및 정의문 문서를 추출하여 하나 이상의 질의응답용 위키피디아 문서를 생성하는 문서 변환부;상기 질의응답용 위키피디아 문서를 분석하고, 상기 질의응답용 위키피디아 문서에서 품사 단위의 색인어를 추출하여 질의응답용 위키피디아 문서 색인을 생성하는 문서 색인부;자연어 질문을 수신하고, 상기 자연어 질문에서 질문유형, 정답유형 및 질문 포커스를 분석하여, 문서 검색 키워드를 추출하는 질문 분석부;상기 질의응답용 위키피디아 문서색인에서 상기 문서 검색 키워드를 이용하여 문서 검색을 수행하고, 각각의 상기 질의응답용 위키피디아 문서색인으로부터 문서 검색 결과를 생성하는 문서 검색부;상기 문서 검색 결과로부터 상기 질문유형, 상기 정답유형 및 상기 질문 포커스에 대한 정보를 이용하여, 제 1 정답을 추출하는 정답 추출부; 및 상기 제 1 정답을 통합하고, 순위화하여 제 2 정답을 생성하는 정답 통합부;를 포함하고,상기 문서 변환부에서 추출되는 본문 문서, 섹션제목 문서, 인포박스 문서, 카테고리 문서 및 정의문 문서 각각은,문서의 고유 ID가 기록되는 DOCID 항목,페이지의 제목 또는 상기 위키피디아 원문의 섹션 구조에 기반한 계층적 섹션 제목이 기록되는 TITLE 항목,문서의 종류가 기록되는 DOCTYPE 항목 및,상기 위키피디아 원문의 섹션 내용, 페이지 제목, 섹션 제목, 카테고리 이름 및 상기 본문 문서의 첫 번째 섹션 중 어느 하나가 기록되는 DESCRIPTION 항목을 포함하도록 구성됨을 특징으로 하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치
|
2 |
2
제 1 항에 있어서,상기 질의응답용 위키피디아 문서 색인은 본문 문서 색인, 섹션제목 문서 색인, 인포박스 문서 색인, 카테고리 문서 색인 및 정의문 문서 색인 중 선택되는 어느 하나 이상을 포함하는 것을 특징으로하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치
|
3 |
3
제 1 항에 있어서,상기 질문유형은 단답형 질문, 나열형 질문 및 서술형 질문 중 선택되는 어느 하나인 것을 특징으로 하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치
|
4 |
4
제 1 항에 있어서,상기 정답유형은 사람, 조직 및 장소에 대한 정답 중 선택되는 어느 하나인 것을 특징으로 하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치
|
5 |
5
제 1 항에 있어서,상기 질문 포커스는 중요 엔티티, 엔티티의 속성 및 엔티티의 이름 중 선택되는 어느 하나인 것을 특징으로 하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치
|
6 |
6
제 1 항에 있어서,상기 문서 검색부는상기 문서 검색 키워드를 이용하여, 상기 질의응답용 위키피디아 문서색인 중 본문 문서 색인에서 검색을 수행하여, 상기 문서 검색 결과를 생성하는 본문 문서 검색부;상기 문서 검색 키워드를 이용하여, 상기 질의응답용 위키피디아 문서색인 중 섹션제목 문서 색인에서 검색을 수행하여, 상기 문서 검색 결과를 생성하는 섹션제목 문서 검색부;상기 문서 검색 키워드를 이용하여, 상기 질의응답용 위키피디아 문서색인 중 인포박스 문서 색인에서 검색을 수행하여, 상기 문서 검색 결과를 생성하는 인포박스 문서 검색부;상기 문서 검색 키워드를 이용하여, 상기 질의응답용 위키피디아 문서색인 중 카테고리 문서 색인에서 검색을 수행하여, 상기 문서 검색 결과를 생성하는 카테고리 문서 검색부; 및 상기 문서 검색 키워드를 이용하여, 상기 질의응답용 위키피디아 문서색인 중 정의문 문서 색인에서 검색을 수행하여, 상기 문서 검색 결과를 생성하는 정의문 문서 검색부;를 포함하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치
|
7 |
7
제 1 항에 있어서,상기 정답 추출부는상기 문서 검색부의 본문 문서 검색부로부터 상기 문서 검색 결과를 수신하고, 상기 정답 유형 및 상기 질문 포커스를 기반으로 검색된 문서에서 제 1 정답을 추출하는 본문 기반 정답 추출부;상기 문서 검색부의 섹션제목 문서 검색부로부터 상기 문서 검색 결과-여기서, 상기 문서 검색 결과는 섹션 내용 문서를 포함함-를 수신하고, 상기 섹션 내용 문서를 제 1 정답으로 제시하는 섹션제목 기반 정답 추출부;상기 문서 검색부의 인포박스 문서 검색부로부터 상기 문서 검색 결과를 수신하고, 상기 자연어 질문을 인포박스 문서의 엔티티 또는 속성이름에 매칭하여 속성값을 제 1 정답으로 추출하는 인포박스 기반 정답 추출부;상기 문서 검색부의 카테고리 문서 검색부로부터 상기 문서 검색 결과를 수신하고, 상기 자연어 질문을 페이지가 속한 카테고리 리스트에 매칭하여, 해당 페이지의 제목을 제 1 정답으로 추출하는 카테고리 기반 정답 추출부; 및상기 문서 검색부의 정의문 문서 검색부로부터 상기 문서 검색 결과를 수신하고, 상기 질문 포커스와 위키피디아 페이지 제목을 매칭하여, 상기 위키피디아 페이지의 정의문을 제 1 정답으로 제시하는 정의문 기반 정답 추출부;를 포함하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치
|
8 |
8
제 1 항에 있어서,상기 정답 통합부는 상기 정답 추출부로부터 복수의 상기 제 1 정답을 수신하고, 복수의 상기 제 1 정답 중 동일한 정답을 통합하고, 상기 동일한 정답에 우선순위를 부여하여 상기 제 2 정답을 생성하는 것을 특징으로 하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치
|
9 |
9
위키피디아 원문에서 본문 문서, 섹션제목 문서, 인포박스 문서, 카테고리 문서 및 정의문 문서를 추출하여 하나 이상의 질의응답용 위키피디아 문서를 생성하는 단계;상기 질의응답용 위키피디아 문서를 분석하여, 상기 질의응답용 위키피디아 문서에서 품사 단위의 색인어를 추출하고, 질의응답용 위키피디아 문서 색인을 생성하는 단계;자연어 질문을 수신하고, 상기 자연어 질문에서 질문유형, 정답유형 및 질문 포커스를 분석하여, 문서 검색 키워드를 추출하는 단계;상기 질의응답용 위키피디아 문서색인에서 상기 문서 검색 키워드를 이용하여 문서 검색을 수행하고, 각각의 상기 질의응답용 위키피디아 문서색인으로부터 문서 검색 결과를 생성하는 단계;상기 문서 검색 결과로부터 상기 질문유형, 상기 정답유형 및 상기 질문 포커스에 대한 정보를 이용하여, 제 1 정답을 추출하는 단계; 및 상기 제 1 정답을 통합하고, 순위화하여 제 2 정답을 생성하는 단계;를 포함하고,상기 생성하는 단계에서 추출되는 본문 문서, 섹션제목 문서, 인포박스 문서, 카테고리 문서 및 정의문 문서 각각은,문서의 고유 ID가 기록되는 DOCID 항목;페이지의 제목 또는 상기 위키피디아 원문의 섹션 구조에 기반한 계층적 섹션 제목이 기록되는 TITLE 항목;문서의 종류가 기록되는 DOCTYPE 항목; 및상기 위키피디아 원문의 섹션 내용, 페이지 제목, 섹션 제목, 카테고리 이름 및 상기 본문 문서의 첫 번째 섹션 중 어느 하나가 기록되는 DESCRIPTION 항목을 포함하도록 구성됨을 특징으로 하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 방법
|
10 |
10
제 9 항에 있어서,상기 질의응답용 위키피디아 문서 색인은 본문 문서 색인, 섹션제목 문서 색인, 인포박스 문서 색인, 카테고리 문서 색인 및 정의문 문서 색인 중 선택되는 어느 하나 이상을 포함하는 것을 특징으로하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 방법
|
11 |
11
제 9 항에 있어서,상기 질문유형은 단답형 질문, 나열형 질문 및 서술형 질문 중 선택되는 어느 하나이고, 상기 정답유형은 사람, 조직 및 장소에 대한 정답 중 선택되는 어느 하나이고,상기 질문 포커스는 중요 엔티티, 엔티티의 속성 및 엔티티의 이름 중 선택되는 어느 하나인 것을 특징으로 하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 방법
|
12 |
12
제 9 항에 있어서,상기 질의응답용 위키피디아 문서색인으로부터 문서 검색 결과를 생성하는 단계는 상기 문서 검색 키워드를 이용하여, 상기 질의응답용 위키피디아 문서색인 중 본문 문서 색인에서 검색을 수행하여, 상기 문서 검색 결과를 생성하는 단계;상기 문서 검색 키워드를 이용하여, 상기 질의응답용 위키피디아 문서색인 중 섹션제목 문서 색인에서 검색을 수행하여, 상기 문서 검색 결과를 생성하는 단계;상기 문서 검색 키워드를 이용하여, 상기 질의응답용 위키피디아 문서색인 중 인포박스 문서 색인에서 검색을 수행하여, 상기 문서 검색 결과를 생성하는 단계;상기 문서 검색 키워드를 이용하여, 상기 질의응답용 위키피디아 문서색인 중 카테고리 문서 색인에서 검색을 수행하여, 상기 문서 검색 결과를 생성하는 단계; 및 상기 문서 검색 키워드를 이용하여, 상기 질의응답용 위키피디아 문서색인 중 정의문 문서 색인에서 검색을 수행하여, 상기 문서 검색 결과를 생성하는 단계;를 포함하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 방법
|
13 |
13
제 9 항에 있어서,상기 제 1 정답을 추출하는 단계는문서 검색부의 본문 문서 검색부로부터 상기 문서 검색 결과를 수신하고, 상기 정답 유형 및 상기 질문 포커스를 기반으로 검색된 문서에서 제 1 정답을 추출하는 단계;상기 문서 검색부의 섹션제목 문서 검색부로부터 상기 문서 검색 결과-여기서, 상기 문서 검색 결과는 섹션 내용 문서를 포함함-를 수신하고, 상기 섹션 내용 문서를 제 1 정답으로 제시하는 단계;상기 문서 검색부의 인포박스 문서 검색부로부터 상기 문서 검색 결과를 수신하고, 상기 자연어 질문을 인포박스 문서의 엔티티 또는 속성이름에 매칭하여 속성값을 제 1 정답으로 추출하는 단계;상기 문서 검색부의 카테고리 문서 검색부로부터 상기 문서 검색 결과를 수신하고, 상기 자연어 질문을 페이지가 속한 카테고리 리스트에 매칭하여, 해당 페이지의 제목을 제 1 정답으로 추출하는 단계; 및상기 문서 검색부의 정의문 문서 검색부로부터 상기 문서 검색 결과를 수신하고, 상기 질문 포커스와 위키피디아 페이지 제목을 매칭하여, 상기 위키피디아 페이지의 정의문을 제 1 정답으로 제시하는 단계;를 포함하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 방법
|
14 |
14
제 9 항에 있어서,상기 제 2 정답을 생성하는 단계는 복수의 상기 제 1 정답을 수신하는 단계;복수의 상기 제 1 정답 중 동일한 정답을 통합하는 단계; 및상기 동일한 정답에 우선순위를 부여하여 상기 제 2 정답을 생성하는 단계;인 것을 포함하는 위키피디아의 콘텐츠를 기반으로 하는 정보검색 방법
|