1 |
1
복수개의 검색대상 문서로 이루어진 문서뭉치 및 상기 문서뭉치의 각 문서로부터 추출된 복수개의 패시지(passage)를 포함하는 말뭉치(corpus)를 기초로 하여, 사용자에 의하여 입력된 쿼리에 대응하는 검색결과를 사용자에게 제공하기 위한 컴퓨터로 구현되는 방법으로서,(a) 문서단위 검색모듈에 의하여, 상기 문서뭉치로부터 상기 입력된 쿼리에 대응하는 D개의 문서가 추출되고 정렬되는 단계;(b) 패시지단위 검색모듈에 의하여, 상기 말뭉치로부터 상기 입력된 쿼리에 대응하는 N개의 패시지가 추출 및 정렬되는 단계;(c) 상기 N개의 패시지가 포함된 M개의 문서(M은 N보다 작거나 같음)가 상기 N개의 패시지가 정렬된 순위에 대응하는 순위로 정렬되는 단계;(d) 상기 N개의 패시지 중에서 동일한 문서로부터 추출된 패시지의 수 (np) 및 해당 문서의 전체 패시지 수 (Np) 사이의 관계에 기초하여 상기 M개의 문서가 정렬되는 단계; 및(e) 상기 단계 (a)에서의 상기 D개의 문서의 정렬 결과 및 상기 M개의 문서에 대한 상기 단계 (c)에서의 정렬 결과와 상기 단계 (d)에서의 정렬 결과를 통합하여 검색결과로 제공될 문서의 순위가 결정되는 단계를 포함하되,상기 단계 (d)에서, 상기 M개의 문서는, (Np-np)/Np의 관계식으로 주어지는 값이 작은 문서부터 해당 값이 큰 문서의 순서로 정렬되거나, np/Np의 관계식으로 주어지는 값이 큰 문서부터 해당 값이 작은 문서의 순서로 정렬되는문서를 검색하기 위한 컴퓨터로 구현되는 방법
|
2 |
2
청구항 1에 있어서, 상기 단계 (b)의 상기 패시지단위 검색모듈은 재현율이 상대적으로 높고 처리속도가 상대적으로 빠른 제1 검색모델 및 정확도가 상대적으로 높고 처리속도가 상대적으로 느린 제2 검색모델을 구비하며,상기 단계 (b)는,(b1) 상기 제1 검색모델에 의하여, 상기 말뭉치로부터 상기 입력된 쿼리에 대응하는 N개의 패시지가 추출되고 정렬되는 단계;(b2) 상기 제2 검색모델에 의하여, 상기 단계 (b1)에서 추출된 N개의 패시지가 상기 입력된 쿼리를 기초로 재정렬되는 단계; 및(b3) 상기 N개의 패시지에 대한 상기 단계 (b1) 및 상기 단계 (b2)에서의 정렬 결과를 통합하여 상기 N개의 패시지에 대한 통합된 순위를 생성하는 단계를 포함하는 문서를 검색하기 위한 컴퓨터로 구현되는 방법
|
3 |
3
청구항 2에 있어서,상기 단계 (b3)에서의 정렬 결과의 통합은 상호 순위 결합 (reciprocal rank fusion, RRF) 방식으로 이루어지는것을 특징으로 하는 문서를 검색하기 위한 컴퓨터로 구현되는 방법
|
4 |
4
삭제
|
5 |
5
삭제
|
6 |
6
청구항 1에 있어서, 상기 단계 (d)에서의 정렬 결과의 통합은 상호 순위 결합 (reciprocal rank fusion, RRF) 방식으로 이루어지는것을 특징으로 하는 문서를 검색하기 위한 컴퓨터로 구현되는 방법
|
7 |
7
복수개의 검색대상 문서로 이루어진 문서뭉치의 각 문서로부터 추출된 복수개의 패시지(passage)를 포함하는 말뭉치(corpus)로부터 사용자에 의하여 입력된 쿼리에 대응하는 검색결과를 사용자에게 제공하기 위한 장치로서,적어도 하나의 프로세서; 및컴퓨터로 실행가능한 명령을 저장하는 적어도 하나의 메모리를 포함하되,상기 적어도 하나의 메모리에 저장된 상기 컴퓨터로 실행가능한 명령은, 상기 적어도 하나의 프로세서에 의하여, (a) 문서단위 검색모듈에 의하여, 상기 문서뭉치로부터 상기 입력된 쿼리에 대응하는 D개의 문서가 추출되고 정렬되는 단계;(b) 패시지단위 검색모듈에 의하여, 상기 말뭉치로부터 상기 입력된 쿼리에 대응하는 N개의 패시지가 추출 및 정렬되는 단계;(c) 상기 N개의 패시지가 포함된 M개의 문서(M은 N보다 작거나 같음)가 상기 N개의 패시지가 정렬된 순위에 대응하는 순위로 정렬되는 단계;(d) 상기 N개의 패시지 중에서 동일한 문서로부터 추출된 패시지의 수 (np) 및 해당 문서의 전체 패시지 수 (Np) 사이의 관계에 기초하여 상기 M개의 문서가 정렬되는 단계; 및(e) 상기 단계 (a)에서의 상기 D개의 문서의 정렬 결과 및 상기 M개의 문서에 대한 상기 단계 (c)에서의 정렬 결과와 상기 단계 (d)에서의 정렬 결과를 통합하여 검색결과로 제공될 문서의 순위가 결정되는 단계가 실행 되도록 하되,상기 단계 (d)에서, 상기 M개의 문서는, (Np-np)/Np의 관계식으로 주어지는 값이 작은 문서부터 해당 값이 큰 문서의 순서로 정렬되거나, np/Np의 관계식으로 주어지는 값이 큰 문서부터 해당 값이 작은 문서의 순서로 정렬되는문서를 검색하기 위한 장치
|
8 |
8
청구항 7에 있어서,상기 패시지단위 검색모듈은 재현율이 상대적으로 높고 처리속도가 상대적으로 빠른 제1 검색모델 및 정확도가 상대적으로 높고 처리속도가 상대적으로 느린 제2 검색모델을 구비하는것을 특징으로 하는 문서를 검색하기 위한 장치
|
9 |
9
청구항 8에 있어서,상기 제1 검색모델 및 상기 제2 검색모델 중의 적어도 하나는 인공지능 기반의 검색모델인것을 특징으로 하는 문서를 검색하기 위한 장치
|
10 |
10
청구항 7에 있어서,상기 문서뭉치의 적어도 일부의 문서는 제목을 구비하며,상기 말뭉치의 각 패시지는 해당 패시지가 일부로서 포함된 문서의 제목을 포함하는것을 특징으로 하는 문서를 검색하기 위한 장치
|
11 |
11
복수개의 패시지를 포함하는 말뭉치로부터 사용자에 의하여 입력된 쿼리에 대응하는 검색결과를 사용자에게 제공하기 위한 컴퓨터 프로그램으로서,비일시적 저장 매체에 저장되며, 프로세서에 의하여,(a) 문서단위 검색모듈에 의하여, 문서뭉치로부터 상기 입력된 쿼리에 대응하는 D개의 문서가 추출되고 정렬되는 단계;(b) 패시지단위 검색모듈에 의하여, 상기 말뭉치로부터 상기 입력된 쿼리에 대응하는 N개의 패시지가 추출 및 정렬되는 단계;(c) 상기 N개의 패시지가 포함된 M개의 문서(M은 N보다 작거나 같음)가 상기 N개의 패시지가 정렬된 순위에 대응하는 순위로 정렬되는 단계;(d) 상기 N개의 패시지 중에서 동일한 문서로부터 추출된 패시지의 수 (np) 및 해당 문서의 전체 패시지 수 (Np) 사이의 관계에 기초하여 상기 M개의 문서가 정렬되는 단계; 및(e) 상기 단계 (a)에서의 상기 D개의 문서의 정렬 결과 및 상기 M개의 문서에 대한 상기 단계 (c)에서의 정렬 결과와 상기 단계 (d)에서의 정렬 결과를 통합하여 검색결과로 제공될 문서의 순위가 결정되는 단계가 실행 되도록 하는 명령을 포함하되,상기 단계 (d)에서, 상기 M개의 문서는, (Np-np)/Np의 관계식으로 주어지는 값이 작은 문서부터 해당 값이 큰 문서의 순서로 정렬되거나, np/Np의 관계식으로 주어지는 값이 큰 문서부터 해당 값이 작은 문서의 순서로 정렬되는문서를 검색하기 위한 비일시적 저장 매체에 저장되는 컴퓨터 프로그램
|