1 |
1
정보검색모델을 위한 말뭉치의 생성 및 이 말뭉치에 기초한 정보검색모델의 학습을 일괄로 처리하기 위한 컴퓨터로 구현되는 방법으로서,(a) 검색대상인 복수개의 문서에 대한 정보에 기초하여 미리 결정된, 일괄 처리에 필요한 파라미터를 입력받는 단계;(b) 상기 단계 (a)에서 입력된 파라미터에 기초하여, 상기 복수개의 문서 각각을 패시지로 구분하여 말뭉치를 생성하는 단계;(c) 상기 단계 (b)에서 생성된 말뭉치에 포함된 적어도 일부의 패시지 각각으로부터 슈도-쿼리로 사용될 키워드를 추출하는 단계;(d) 상기 단계 (c)에서 추출된 슈도-쿼리 및 비지도학습 기반의 정보검색모델을 이용하여, 상기 단계 (a)에서 입력된 파라미터에서 지정된 수의 패시지를 추출하는 단계;(e) 상기 상기 단계 (a)에서 입력된 파라미터에서 지정된 하이퍼 파라미터에 기초하여, 슈도-레이블을 생성하는 단계; 및,(f) 상기 단계 (e)에서 생성된 슈도-레이블을 이용하여, 인공지능 기반의 정보검색모델을 학습시키는 단계를 포함하는 정보검색모델을 위한 데이터 전처리 및 학습 과정을 일괄처리 하는 컴퓨터로 구현되는 방법
|
2 |
2
청구항 1에 있어서,상기 일괄 처리에 필요한 파라미터는, 상기 단계 (a)에서 문서를 구분하는 방식에 관한 파라미터, 상기 단계 (c)에서 추출되는 키워드에 관한 파라미터, 상기 단계 (d)에서 추출될 패시지의 수에 관한 파라미터 및 상기 단계 (e)에서 슈도-레이블을 생성하기 위한 하이퍼 파라미터를 포함하는 것을 특징으로 하는 정보검색모델을 위한 데이터 전처리 및 학습 과정을 일괄처리 하는 컴퓨터로 구현되는 방법
|
3 |
3
청구항 2에 있어서,상기 문서를 구분하는 방식에 관한 파라미터는, 상기 문서가 구분될 패시지의 크기 및 각 패시지가 중첩되는 비율에 대한 정보를 포함하는 것을 특징으로 하는 정보검색모델을 위한 데이터 전처리 및 학습 과정을 일괄처리 하는 컴퓨터로 구현되는 방법
|
4 |
4
청구항 1에 있어서,문서 및 이로부터 구분된 패시지 사이의 관계를 저장하는 단계를 더 포함하는 것을 특징으로 하는 정보검색모델을 위한 데이터 전처리 및 학습 과정을 일괄처리 하는 컴퓨터로 구현되는 방법
|
5 |
5
정보검색모델을 위한 말뭉치의 생성 및 이 말뭉치에 기초한 정보검색모델의 학습을 일괄로 처리하기 위한 장치로서,적어도 하나의 프로세서; 및컴퓨터로 실행가능한 명령을 저장하는 적어도 하나의 메모리를 포함하되,상기 적어도 하나의 메모리에 저장된 상기 컴퓨터로 실행가능한 명령은, 상기 적어도 하나의 프로세서에 의하여, (a) 검색대상인 복수개의 문서에 대한 정보에 기초하여 미리 결정된, 일괄 처리에 필요한 파라미터를 입력받는 단계;(b) 상기 단계 (a)에서 입력된 파라미터에 기초하여, 상기 복수개의 문서 각각을 패시지로 구분하여 말뭉치를 생성하는 단계;(c) 상기 단계 (b)에서 생성된 말뭉치에 포함된 적어도 일부의 패시지 각각으로부터 슈도-쿼리로 사용될 키워드를 추출하는 단계;(d) 상기 단계 (c)에서 추출된 슈도-쿼리 및 비지도학습 기반의 정보검색모델을 이용하여, 상기 단계 (a)에서 입력된 파라미터에서 지정된 수의 패시지를 추출하는 단계;(e) 상기 상기 단계 (a)에서 입력된 파라미터에서 지정된 하이퍼 파라미터에 기초하여, 슈도-레이블을 생성하는 단계; 및,(f) 상기 단계 (e)에서 생성된 슈도-레이블을 이용하여, 인공지능 기반의 정보검색모델을 학습시키는 단계가 실행 되도록 하는 정보검색모델을 위한 데이터 전처리 및 학습 과정을 일괄처리 하는 장치
|
6 |
6
청구항 5에 있어서,상기 일괄 처리에 필요한 파라미터는, 상기 단계 (a)에서 문서를 구분하는 방식에 관한 파라미터, 상기 단계 (c)에서 추출되는 키워드에 관한 파라미터, 상기 단계 (d)에서 추출될 패시지의 수에 관한 파라미터 및 상기 단계 (e)에서 슈도-레이블을 생성하기 위한 하이퍼 파라미터를 포함하는 것을 특징으로 하는 정보검색모델을 위한 데이터 전처리 및 학습 과정을 일괄처리 하는 장치
|
7 |
7
청구항 6에 있어서,상기 문서를 구분하는 방식에 관한 파라미터는, 상기 문서가 구분될 패시지의 크기 및 각 패시지가 중첩되는 비율에 대한 정보를 포함하는 것을 특징으로 하는 정보검색모델을 위한 데이터 전처리 및 학습 과정을 일괄처리 하는 장치
|
8 |
8
청구항 5에 있어서,문서 및 이로부터 구분된 패시지 사이의 관계를 저장하는 단계를 더 포함하는 것을 특징으로 하는 정보검색모델을 위한 데이터 전처리 및 학습 과정을 일괄처리 하는 장치
|
9 |
9
정보검색모델을 위한 말뭉치의 생성 및 이 말뭉치에 기초한 정보검색모델의 학습을 일괄로 처리하기 위한 컴퓨터 프로그램으로서,비일시적 저장 매체에 저장되며, 프로세서에 의하여,(a) 검색대상인 복수개의 문서에 대한 정보에 기초하여 미리 결정된, 일괄 처리에 필요한 파라미터를 입력받는 단계;(b) 상기 단계 (a)에서 입력된 파라미터에 기초하여, 상기 복수개의 문서 각각을 패시지로 구분하여 말뭉치를 생성하는 단계;(c) 상기 단계 (b)에서 생성된 말뭉치에 포함된 적어도 일부의 패시지 각각으로부터 슈도-쿼리로 사용될 키워드를 추출하는 단계;(d) 상기 단계 (c)에서 추출된 슈도-쿼리 및 비지도학습 기반의 정보검색모델을 이용하여, 상기 단계 (a)에서 입력된 파라미터에서 지정된 수의 패시지를 추출하는 단계;(e) 상기 상기 단계 (a)에서 입력된 파라미터에서 지정된 하이퍼 파라미터에 기초하여, 슈도-레이블을 생성하는 단계; 및,(f) 상기 단계 (e)에서 생성된 슈도-레이블을 이용하여, 인공지능 기반의 정보검색모델을 학습시키는 단계가 실행 되도록 하는 명령을 포함하는, 정보검색모델을 위한 데이터 전처리 및 학습 과정을 일괄처리 하는 비일시적 저장 매체에 저장되는 컴퓨터 프로그램
|