1 |
1
언급되지 않은 정보를 가시화하는 방법에 있어서,사용자로부터 입력받은 입력 문서 내에서 직접 언급되지 않은 정보 중 입력 문서 내에서 언급된 정보들과 함께 언급되었을 확률이 높은 정보를 문장 형태로 추가하며, 추가된 문장들과 기존 입력 문서에 포함되었던 문장들을 병합한 문서를 사용자에게 출력 제공함을 통해, 주어진 문서와 함께 언급될 가능성이 가장 높았으나 문서 내에서 직접 언급되지 않은 정보를 자동으로 사용자에게 제공하는 방법
|
2 |
2
제 1 항에 있어서, 언급되지 않은 정보를 가시화하는 방법은상기 함께 언급될 확률이 높은 정보를 계산함에 있어, 문장, 기초 담화 단위, 사건을 의미 벡터로 변환하여 텍스트 집합의 쌍 혹은 텍스트의 쌍에 대한 상호 유사도를 측정하며, 상기 의미 벡터 변환에 있어 해쉬맵을 활용하여 특정 해쉬맵에 대한 복수 동시 등장 관계를 활용하는 방법
|
3 |
3
제 2 항에 있어서,상기 특정 해쉬맵에 대한 복수 동시 등장 관계는 하기 제1 항목 내지 제6 항목 중 하나 이상의 항목을 포함하는 방법:벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 문장 의미 벡터로 구성되며, 상기 두 개의 다른 문장 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 문장에 있어, 한 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 문장을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제1 항목벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 담화 의미 벡터로 구성되며, 상기 두 개의 다른 담화 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 기초 담화 단위에 있어, 한 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제2 항목벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 사건 의미 벡터로 구성되며, 상기 두 개의 다른 사건 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 사건에 있어, 한 사건을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제3 항목벡터 쌍에 있어서, 벡터 쌍은 하나의 문장 의미 벡터와 하나의 담화 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 문장과 하나의 기초 담화 단위에 있어, 해당하는 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제4 항목벡터 쌍에 있어서, 벡터 쌍은 하나의 문장 의미 벡터와 하나의 사건 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 문장과 하나의 사건에 있어, 해당하는 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제5 항목벡터 쌍에 있어서, 벡터 쌍은 하나의 담화 의미 벡터와 하나의 사건 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 기초 담화 단위와 하나의 사건에 있어, 해당하는 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제6 항목
|
4 |
4
제 1 항에 있어서,언급되지 않은 정보를 가시화하는 방법은주어진 문서 집합에 대해 기초 담화 단위를 추출하는 언급된 구문 추출 단계(S310);상기 주어진 문서 집합에 대해 사건 정보를 추출하는 언급된 사건 추출 단계(S320);상기 주어진 문서 집합 내에 포함된 각 문장을 문장 의미 벡터로 변환하며, 문서에 포함된 기초 담화 단위와 사건 정보를 각기 담화 의미 벡터 및 사건 의미 벡터로 변환하는 의미 벡터 변환 단계(S330);두 개의 다른 의미 벡터에 상응하는 두 개의 다른 텍스트가 같은 문서 내에서 동시에 발생하는 빈도를 파악하는 동시 언급 빈도 계산 단계(S340);분석의 대상이 되는 입력 문서를 사용자로부터 입력받는 입력 단계(S410);입력 문서에서 기초 담화 단위 및 사건 정보를 추출하는 전처리 단계(S420);상기 입력 문서 내에 존재하는 텍스트에 대해, 입력 문서 내에 존재하지 않는 텍스트 중 최대 동시 언급 확률을 갖는 텍스트 집합을 생성하는 동시 발생 정보 처리 단계(S430);상기 최대 동시 언급 확률을 갖는 텍스트 집합 내에 존재하는 기초 담화 단위 및 사건을 모두 문장 형태로 변환하여 상기 최대 동시 언급 확률을 갖는 텍스트 집합에 포함된 모든 항목이 문장 형태를 갖도록 변환하는 문장 변환 단계(S440); 상기 입력 문서 내에 존재하지 않는 텍스트 중 최대 동시 언급 확률을 갖는 텍스트 집합을 입력 문서 내에 기존에 존재하던 문장들에 추가하여 병합할 때 최대화된 문서 일관성을 갖는 문서를 생성하기 위해, 상대적으로 추가 문장들이 가져야 하는 위치를 계산하는 문장 추가 위치 계산 단계(S450);사용자로부터 입력받은 문서 내에 포함되어 있던 문장과, 포함되어 있지 않던 새로 추가된 문장을 볼드체, 컬러 코딩 등의 방식을 통해 구분하여 병합한 문서를 사용자에게 출력 제공하며, 새로 추가된 문장 각각에 대해 원문 출처를 사용자에게 출력 제공하며, 각각의 원문 출처에 대해 클릭 방식의 상호작용을 통해 사용자가 새로 추가된 정보의 원문에 해당하는 문서에 접근할 수 있도록 하는 출력 단계(S460);를 포함하는 방법
|
5 |
5
언급되지 않은 정보를 가시화하는 시스템에 있어서,사용자로부터 입력받은 입력 문서 내에 언급되지 않은 정보 중 입력 문서 내에 언급된 정보들과 함께 언급될 확률이 높은 정보를 문장 형태로 추가하며, 추가된 문장들과 기존 입력 문서에 포함되어 있던 문장들을 병합한 문서를 사용자에게 출력 제공함을 통해, 주어진 문서와 함께 언급될 가능성이 가장 높았으나 문서 내에 언급되지 않았던 정보를 자동으로 사용자에게 제공하는 시스템
|
6 |
6
재 5 항에 있어서, 언급되지 않은 정보를 가시화하는 시스템은상기 함께 언급될 확률이 높은 정보를 계산함에 있어, 문장, 기초 담화 단위, 사건을 의미 벡터로 변환하여 텍스트 집합의 쌍 혹은 텍스트의 쌍에 대한 상호 유사도를 측정하며, 상기 의미 벡터 변환에 있어 해쉬맵을 활용하여 특정 해쉬맵에 대한 복수 동시 등장 관계를 활용하는 시스템
|
7 |
7
제 6 항에 있어서,상기 특정 해쉬맵에 대한 복수 동시 등장 관계는 하기 제1 항목 내지 제6 항목 중 하나 이상의 항목을 포함하는 시스템:벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 문장 의미 벡터로 구성되며, 상기 두 개의 다른 문장 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 문장에 있어, 한 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 문장을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제1 항목벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 담화 의미 벡터로 구성되며, 상기 두 개의 다른 담화 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 기초 담화 단위에 있어, 한 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제2 항목 벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 사건 의미 벡터로 구성되며, 상기 두 개의 다른 사건 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 사건에 있어, 한 사건을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제3 항목 벡터 쌍에 있어서, 벡터 쌍은 하나의 문장 의미 벡터와 하나의 담화 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 문장과 하나의 기초 담화 단위에 있어, 해당하는 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제4 항목 벡터 쌍에 있어서, 벡터 쌍은 하나의 문장 의미 벡터와 하나의 사건 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 문장과 하나의 사건에 있어, 해당하는 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제5 항목 벡터 쌍에 있어서, 벡터 쌍은 하나의 담화 의미 벡터와 하나의 사건 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 기초 담화 단위와 하나의 사건에 있어, 해당하는 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제6 항목
|
8 |
8
제 5 항에 있어서,언급되지 않은 정보를 가시화하는 시스템은동시 언급 기준 코퍼스(110); 동시 언급 정보 처리부(120); 사용자 입력 문서 처리부(130)를 포함하고상기 동시 언급 기준 코퍼스(110)는 동일한 문서 내에 함께 등장하는 문장들의 상호 연관성을 분석함에 있어 그 분석 기반이 되는 문서 집합을 저장하고,상기 동시 언급 정보 처리부(120)는상기 동시 언급 기준 코퍼스(110)의 각 문서에서 기초 담화 단위를 추출하는 언급된 구문 추출부(121);상기 동시 언급 기준 코퍼스(110)의 각 문서에서 사건 정보를 추출하는 언급된 사건 추출부(122);상기 동시 언급 기준 코퍼스(110)의 각 문서에 내에 포함된 각 문장을 문장 의미 벡터로 변환하며, 문서에 포함된 기초 담화 단위와 사건 정보를 각각 담화 의미 벡터 및 사건 의미 벡터로 변환하는 의미 벡터 변환부(123);두 개의 다른 의미 벡터에 상응하는 두 개의 다른 텍스트가 같은 문서 내에서 동시에 발생하는 빈도를 파악하는 동시 언급 빈도 계산부(124);상기 동시 언급 기준 코퍼스(110) 전반에 걸쳐, 두 개의 다른 의미 벡터에 상응하는 두 개의 다른 텍스트가 같은 문서 내에서 동시에 발생하는 빈도를 저장하는 동시 발생 정보 데이터베이스(125);로 구성되며,상기 사용자 입력 문서 처리부(130)는분석의 대상이 되는 입력 문서를 사용자로부터 입력받는 입력부(131);상기 입력 문서에서 기초 담화 단위 및 사건 정보를 추출하는 전처리부(132);상기 입력 문서 내에 존재하는 텍스트에 대한 동시 발생 정보를 동시 발생 정보 데이터베이스(125)로부터 불러오며 이를 통해 입력 문서 내에 존재하는 텍스트에 대해, 입력 문서 내에 존재하지 않는 텍스트 중 최대 동시 언급 확률을 갖는 텍스트 집합을 생성하는 동시 발생 정보 처리부(133);상기 입력 문서 내에 존재하지 않는 텍스트 중 최대 동시 언급 확률을 갖는 텍스트 집합 내에 존재하는 기초 담화 단위 및 사건에 상응하는 문장을 문장 변환 데이터베이스(137)로부터 불러와, 기초 담화 단위 및 사건을 모두 문장 형태로 변환하여 상기 최대 동시 언급 확률을 갖는 텍스트 집합에 포함된 모든 항목이 문장 형태를 갖도록 변환하는 문장 변환부(134);상기 입력 문서 내에 존재하지 않는 텍스트 중 최대 동시 언급 확률을 갖는 텍스트 집합을 입력 문서 내에 기존에 존재하던 문장들에 추가하여 병합할 때 최대화된 문서 일관성을 갖는 문서를 생성하기 위해, 상대적으로 추가 문장들이 가져야 하는 위치를 계산하는 문장 추가 위치 계산부(135);상기 입력 문서 내에 포함되어 있던 문장과, 포함되어 있지 않던 새로 추가된 문장을 볼드체, 컬러 코딩 등의 방식을 통해 구분하여 병합한 문서를 사용자에게 출력 제공하며, 새로 추가된 문장 각각에 대해 원문 출처를 사용자에게 출력 제공하며, 각각의 원문 출처에 대해 클릭 방식의 상호작용을 통해 사용자가 새로 추가된 정보의 원문에 해당하는 문서에 접근할 수 있도록 하는 출력부(136);상기 문장 변환부(134)에서 기초 담화 단위와 사건에 해당하는 상기 단위 텍스트를 문장으로 변환하기 위한 담화-문장 및 사건-문장 쌍을 저장하는 문장 변환 데이터베이스(137);로 구성되는 시스템
|