1 |
1
복수개의 패시지(passage)를 포함하는 말뭉치(corpus)로부터 문장형 쿼리에 대응하는 검색결과를 제공하기 위한 컴퓨터로 구현되는 방법으로서,(a) 시이퀀스 레이블링을 통하여 문장형 쿼리를 키워드 쿼리로 변환하는 단계;(b) 비지도학습 (unsupervised) 방법론에 기초한 검색모델에 의하여, 상기 말뭉치로부터 상기 키워드 쿼리에 대응하는 N개의 패시지가 리트리빙 (retrieving) 되는 단계;(c) 윅수퍼비전 (weak-supervision) 방법론에 의하여 학습된 인공지능 기반 검색모델에 의하여, 상기 키워드 쿼리를 기초로 상기 단계 (b)에서 리트리빙 된 N개의 패시지가 리랭킹 (re-ranking) 되는 단계; 및,(d) 상기 단계 (c)에서 리랭킹 된 패시지에 대응하는 검색결과 목록이 출력되는 단계를 포함하되,상기 말뭉치의 각 패시지는 복수개의 검색대상 문서로 이루어진 문서뭉치의 각 문서의 일부이며,상기 윅수퍼비전 방법론에 의하여 학습된 인공지능 기반 검색모델은, 상기 말뭉치에 포함된 상기 복수개의 패시지 및 상기 각 패시지로부터 생성된 슈도-쿼리(pseudo-query)를 이용하여, 상기 단계 (a)에서 이용된 검색모델을 포함하는 비지도학습 기반의 검색모델에 의하여 생성된, 슈도-레이블(pseudo-label)에 기초하여 학습되는문서를 검색하기 위한 컴퓨터로 구현되는 방법
|
2 |
2
청구항 1에 있어서,상기 단계 (a)에서, 상기 키워드 쿼리가 포함하는 키워드 수의 하한치와 상한치가 미리 설정되는것을 특징으로 하는 문서를 검색하기 위한 컴퓨터로 구현되는 방법
|
3 |
3
청구항 1에 있어서,상기 단계 (a)에서, 상기 문장형 쿼리에 포함된 불용어가 제거되는것을 특징으로 하는 문서를 검색하기 위한 컴퓨터로 구현되는 방법
|
4 |
4
청구항 3에 있어서,상기 불용어에 해당하는지 여부는 미리 마련된 불용어 사전을 조회하여 판단되는것을 특징으로 하는 문서를 검색하기 위한 컴퓨터로 구현되는 방법
|
5 |
5
복수개의 패시지를 포함하는 말뭉치로부터 문장형 쿼리에 대응하는 검색결과를 제공하기 위한 장치로서,적어도 하나의 프로세서; 및컴퓨터로 실행가능한 명령을 저장하는 적어도 하나의 메모리를 포함하되,상기 적어도 하나의 메모리에 저장된 상기 컴퓨터로 실행가능한 명령은, 상기 적어도 하나의 프로세서에 의하여, (a) 시이퀀스 레이블링을 통하여 문장형 쿼리를 키워드 쿼리로 변환하는 단계;(b) 비지도학습 (unsupervised) 방법론에 기초한 검색모델에 의하여, 상기 말뭉치로부터 상기 키워드 쿼리에 대응하는 N개의 패시지가 리트리빙 (retrieving) 되는 단계;(c) 윅수퍼비전 (weak-supervision) 방법론에 의하여 학습된 인공지능 기반 검색모델에 의하여, 상기 키워드 쿼리를 기초로 상기 단계 (b)에서 리트리빙 된 N개의 패시지가 리랭킹 (re-ranking) 되는 단계; 및,(d) 상기 단계 (c)에서 리랭킹 된 패시지에 대응하는 검색결과 목록이 출력되는 단계가 실행 되도록 하되,상기 말뭉치의 각 패시지는 복수개의 검색대상 문서로 이루어진 문서뭉치의 각 문서의 일부이며,상기 윅수퍼비전 방법론에 의하여 학습된 인공지능 기반 검색모델은, 상기 말뭉치에 포함된 상기 복수개의 패시지 및 상기 각 패시지로부터 생성된 슈도-쿼리(pseudo-query)를 이용하여, 상기 단계 (a)에서 이용된 검색모델을 포함하는 비지도학습 기반의 검색모델에 의하여 생성된, 슈도-레이블(pseudo-label)에 기초하여 학습되는문서를 검색하기 위한 장치
|
6 |
6
청구항 5에 있어서,상기 단계 (a)에서, 상기 키워드 쿼리가 포함하는 키워드 수의 하한치와 상한치가 미리 설정되는것을 특징으로 하는 문서를 검색하기 위한 장치
|
7 |
7
청구항 5에 있어서,상기 단계 (a)에서, 상기 문장형 쿼리에 포함된 불용어가 제거되는것을 특징으로 하는 문서를 검색하기 위한 장치
|
8 |
8
청구항 7에 있어서,상기 불용어에 해당하는지 여부는 미리 마련된 불용어 사전을 조회하여 판단되는것을 특징으로 하는 문서를 검색하기 위한 컴퓨터로 구현되는 장치
|
9 |
9
복수개의 패시지를 포함하는 말뭉치로부터 문장형 쿼리에 대응하는 검색결과를 제공하기 위한 컴퓨터 프로그램으로서,비일시적 저장 매체에 저장되며, 프로세서에 의하여,(a) 시이퀀스 레이블링을 통하여 문장형 쿼리를 키워드 쿼리로 변환하는 단계;(b) 비지도학습 (unsupervised) 방법론에 기초한 검색모델에 의하여, 상기 말뭉치로부터 상기 키워드 쿼리에 대응하는 N개의 패시지가 리트리빙 (retrieving) 되는 단계;(c) 윅수퍼비전 (weak-supervision) 방법론에 의하여 학습된 인공지능 기반 검색모델에 의하여, 상기 키워드 쿼리를 기초로 상기 단계 (b)에서 리트리빙 된 N개의 패시지가 리랭킹 (re-ranking) 되는 단계; 및,(d) 상기 단계 (c)에서 리랭킹 된 패시지에 대응하는 검색결과 목록이 출력되는 단계가 실행 되도록 하는 명령을 포함하되,상기 말뭉치의 각 패시지는 복수개의 검색대상 문서로 이루어진 문서뭉치의 각 문서의 일부이며,상기 윅수퍼비전 방법론에 의하여 학습된 인공지능 기반 검색모델은, 상기 말뭉치에 포함된 상기 복수개의 패시지 및 상기 각 패시지로부터 생성된 슈도-쿼리(pseudo-query)를 이용하여, 상기 단계 (a)에서 이용된 검색모델을 포함하는 비지도학습 기반의 검색모델에 의하여 생성된, 슈도-레이블(pseudo-label)에 기초하여 학습되는문서를 검색하기 위한 비일시적 저장 매체에 저장되는 컴퓨터 프로그램
|