1 |
1
입력 텍스트를 각 문장 단위로 구분하고, 상기 각 문장에 대한 프리디컷(predicate)을 추출하여, 상기 각 문장에 대해 추출된 프리디컷을 대표 표현으로 정규화하는 자연어 처리부;상기 각 문장에 대한 상기 대표 표현과 상기 대표 표현 각각에 대응되는 아이디(id)를 포함하는 룩업 테이블을 생성하고, 상기 룩업 테이블 상의 각 아이디에 대해 각 아이디와 인접한 대표 표현들과의 관계를 정의하여 페어(pair)로 표현한 후, 상기 각 문장에 대한 상기 페어를 상기 각 문장에 대한 임베딩 벡터(embedding vector)로 표현하는 임베딩 벡터 생성부;상기 각 문장에 대한 임베딩 벡터 값을 이용하여, 상기 각 문장 사이의 거리값을 산출하는 인과관계 추출부;를 포함하는 임베딩 기반의 인과 관계 탐지 시스템
|
2 |
2
제1 항에 있어서,상기 자연어 처리부는 상기 프리디컷을 추출하기 위해, 각 문장을 토크나이즈(tokenize)하여 각 문장의 품사를 분석한 후, 주어부 및 동사구를 필터링하고, 필터링된 주어부 및 동사구에 대한 프리딧컷을 추출하는 임베딩 기반의 인과 관계 탐지 시스템
|
3 |
3
제1 항에 있어서,상기 임베딩 벡터 생성부는 상기 각 문장에 대한 상기 페어를 이용하여 워드 투 벡터(word2vec)의 스킵-그램(skip-gram) 방식으로 신경망을 훈련을 수행하는 임베딩 기반의 인과 관계 탐지 시스템
|
4 |
4
제1 항에 있어서,상기 임베딩 벡터 생성부는 상기 각 문장에 대한 상기 페어에서 첫 번째 값을 입력으로, 두 번째를 출력으로 하여, 원 핫 인코딩(one-hot encoding) 방식을 이용한 신경망 훈련을 수행하여, 상기 임베딩 벡터로 표현하는 임베딩 기반의 인과 관계 탐지 시스템
|
5 |
5
입력 텍스트를 각 문장 단위로 구분하고, 상기 각 문장에 대한 프리디컷(predicate)을 추출하는 프리디컷 추출 단계;상기 각 문장에 대해 추출된 프리디컷을 대표 표현으로 정규화하는 정규화 단계;상기 각 문장에 대한 상기 대표 표현과 상기 대표 표현 각각에 대응되는 아이디(id)를 포함하는 룩업 테이블을 생성하는 룩업 테이블 생성 단계;상기 룩업 테이블 상의 각 아이디에 대해 해당 아이디에 인접한 대표 표현들과의 관계를 정의하여 페어(pair)으로 표현하는 페어 표현 단계;상기 각 문장에 대한 상기 페어를 상기 각 문장에 대한 임베딩 벡터(embedding vector)로 표현하는 벡터화 단계; 및상기 각 문장에 대한 임베딩 벡터 값을 이용하여, 상기 각 문장 사이의 거리값을 산출하는 거리값 산출 단계;를 포함하는 임베딩 기반의 인과 관계 탐지 방법
|
6 |
6
제5 항에 있어서,상기 프리디컷 추출 단계 이전에, 상기 프리디컷을 추출하기 위해, 각 문장을 토크나이즈(tokenize)하여 각 문장의 품사를 분석한 후, 주어부 및 동사구를 필터링하는 임베딩 기반의 인과 관계 탐지 방법
|
7 |
7
제5 항에 있어서,상기 벡터화 단계는 상기 각 문장에 대한 상기 페어를 이용하여 워드 투 벡터(word2vec)의 스킵-그램(skip-gram) 방식으로 신경망을 훈련을 수행하는 임베딩 기반의 인과 관계 탐지 방법
|
8 |
8
제5 항에 있어서,상기 벡터화 단계는 상기 각 문장에 대한 상기 페어에서 첫 번째 값을 입력으로, 두 번째를 출력으로 하여, 원 핫 인코딩(one-hot encoding) 방식을 이용한 신경망 훈련을 수행하여, 상기 임베딩 벡터로 표현하는 임베딩 기반의 인과 관계 탐지 방법
|
9 |
9
제5 항 내지 제8항 중 어느 하나에 기재된 임베딩 기반의 인과 관계 탐지 방법을 실행하기 위한 프로그램이 기록된 기록매체
|