1 |
1
특허문서에 대한 IPC 분류 방법에 있어서,(a) 대상 특허문서 내의 필드 중 미리 설정된 분석대상 필드에 대하여 IPC 분류 별로 기선정된 대표 특징단어와의 매칭을 수행하는 단계; 및(b) 상기 매칭 결과를 고려하여 상기 IPC 분류에 대응하는 분류코드를 상기 대상 특허문서에 할당하는 단계를 포함하되,상기 분석대상 필드는 기술분야 필드 및 배경기술 필드를 포함하도록 설정되고,상기 특허문서에 대한 IPC 분류 방법은,상기 (a) 단계 이전에, (c) 상기 IPC 분류 별 특징단어의 가중치에 기반하여 상기 IPC 분류 별로 대표 특징단어를 선정하는 단계를 더 포함하고,특정 IPC 분류에 대한 특정 특징단어의 가중치는 상기 복수의 기분류 특허문서 내에서 상기 특정 IPC 분류에 대한 상기 특정 특징단어의 빈도에 비례하고, 상기 복수의 기분류 특허문서 내에서 상기 특정 특징단어를 포함하는 IPC 분류의 개수에 반비례하게 산정되는 것인, 특허문서에 대한 IPC 분류 방법
|
2 |
2
제1항에 있어서,상기 분석대상 필드에는 청구항 필드가 제외되는 것인, 특허문서에 대한 IPC 분류 방법
|
3 |
3
제2항에 있어서,상기 분석대상 필드는 제목 필드 및 요약 필드를 더 포함하는 것인, 특허문서에 대한 IPC 분류 방법
|
4 |
4
제1항에 있어서,상기 (c) 단계는, 수집된 복수의 기분류 특허문서에 대하여 기정의된 제외어(stopword)를 제외하는 전처리를 수행하고, 전처리된 복수의 기분류 특허문서에 기반하여 대표 특징단어를 선정하고,상기 기분류 특허문서는 IPC 분류 정보를 기포함하는 특허문서인 것인, 특허문서에 대한 IPC 분류 방법
|
5 |
5
제4항에 있어서,상기 (c) 단계는, 특허 관련 사전, 법규 및 심사기준 중 적어도 하나로부터 추출된 특허 관련 상용구를 상기 제외어로 정의하는 단계를 포함하는 것인, 특허문서에 대한 IPC 분류 방법
|
6 |
6
제5항에 있어서,상기 특허 관련 상용구는, 특허 발명에 대한 기술적인 설명을 위한 용어가 아니라 특허 관련 정의, 요건, 절차 또는 서류에 관한 용어를 포함하는 것인, 특허문서에 대한 IPC 분류 방법
|
7 |
7
제4항에 있어서,상기 (c) 단계는, TF-ICF(Term Frequency-Inverse Corpus Frequency)에 기반하여 계산된 상기 IPC 분류 별 특징단어의 가중치에 기반하여 상기 IPC 분류 별로 기설정된 수의 특징단어를 대표 특징단어로 선정하는 것인, 특허문서에 대한 IPC 분류 방법
|
8 |
8
삭제
|
9 |
9
제4항에 있어서,상기 (c) 단계에서, 상기 복수의 기분류 특허문서 각각은 상기 기선정된 대표 특징단어를 기반으로 가중치가 부여된 특징 벡터의 형태로 변환되고,상기 (a) 단계에서, 상기 대상 특허문서는 상기 기선정된 대표 특징단어를 기반으로 가중치가 부여된 특징 벡터의 형태로 변환되는 것인, 특허문서에 대한 IPC 분류 방법
|
10 |
10
제9항에 있어서,상기 (a) 단계 또는 상기 (c) 단계에서의 특징 벡터 변환은 TF-IDF를 사용하여 이루어지는 것인, 특허문서에 대한 IPC 분류 방법
|
11 |
11
제1항에 있어서,상기 (a) 단계에서, 상기 대상 특허문서에는 기정의된 제외어(stopword)를 제외하는 전처리가 수행되는 것인, 특허문서에 대한 IPC 분류 방법
|
12 |
12
제1항에 있어서,상기 (b) 단계는,기계학습 모델을 이용하여 복수의 분류코드를 상기 대상 특허문서에 할당하는 것인, 특허문서에 대한 IPC 분류 방법
|
13 |
13
제1항에 있어서,상기 (b) 단계에서, 상기 대상 특허문서에 할당되는 분류코드는 IPC 서브클래스 레벨에서의 분류코드인 것인, 특허문서에 대한 IPC 분류 방법
|
14 |
14
특허문서에 대한 IPC 분류 장치에 있어서,대상 특허문서 내의 필드 중 미리 설정된 분석대상 필드에 대하여 IPC 분류 별로 기선정된 대표 특징단어와의 매칭을 수행하는 매칭부;상기 매칭 결과 를 고려하여 상기 IPC 분류에 대응하는 분류코드를 상기 대상 특허문서에 할당하는 할당부; 및상기 IPC 분류 별 특징단어의 가중치에 기반하여 상기 IPC 분류 별로 대표 특징단어를 선정하는 선정부를 포함하되,상기 분석대상 필드는 기술분야 필드 및 배경기술 필드를 포함하도록 설정되고,특정 IPC 분류에 대한 특정 특징단어의 가중치는 상기 복수의 기분류 특허문서 내에서 상기 특정 IPC 분류에 대한 상기 특정 특징단어의 빈도에 비례하고, 상기 복수의 기분류 특허문서 내에서 상기 특정 특징단어를 포함하는 IPC 분류의 개수에 반비례하게 산정되는 것인, 특허문서에 대한 IPC 분류 장치
|
15 |
15
제14항에 있어서,상기 분석대상 필드에는 청구항 필드가 제외되는 것인, 특허문서에 대한 IPC 분류 장치
|
16 |
16
제15항에 있어서,상기 분석대상 필드는 제목 필드 및 요약 필드를 더 포함하는 것인, 특허문서에 대한 IPC 분류 장치
|
17 |
17
제14항에 있어서,상기 선정부는, 수집된 복수의 기분류 특허문서에 대하여 기정의된 제외어(stopword)를 제외하는 전처리를 수행하고, 전처리된 복수의 기분류 특허문서에 기반하여 대표 특징단어를 선정하고,상기 기분류 특허문서는 IPC 분류 정보를 기포함하는 특허문서인 것인, 특허문서에 대한 IPC 분류 장치
|
18 |
18
제17항에 있어서,상기 선정부는, 특허 관련 사전, 법규 및 심사기준 중 적어도 하나로부터 추출된 특허 관련 상용구를 상기 제외어로 정의하는 것인, 특허문서에 대한 IPC 분류 장치
|
19 |
19
제18항에 있어서,상기 특허 관련 상용구는, 특허 발명에 대한 기술적인 설명을 위한 용어가 아니라 특허 관련 정의, 요건, 절차 또는 서류에 관한 용어를 포함하는 것인, 특허문서에 대한 IPC 분류 장치
|
20 |
20
제17항에 있어서,상기 선정부는, TF-ICF(Term Frequency-Inverse Corpus Frequency)에 기반하여 계산된 상기 IPC 분류 별 특징단어의 가중치에 기반하여 상기 IPC 분류 별로 기설정된 수의 특징단어를 대표 특징단어로 선정하는 것인, 특허문서에 대한 IPC 분류 장치
|
21 |
21
삭제
|
22 |
22
제17항에 있어서,상기 복수의 기분류 특허문서 각각 및 상기 대상 특허문서를 상기 기선정된 대표 특징단어를 기반으로 가중치가 부여된 특징 벡터의 형태로 변환하는 변환부를 더 포함하고,상기 특징 벡터의 형태로 변환시 TF-IDF가 사용되는 것인, 특허문서에 대한 IPC 분류 장치
|
23 |
23
제14항에 있어서,상기 매칭부를 통한 매칭을 수행하기 이전에, 상기 대상 특허문서에는 선정부에 의하여 기정의된 제외어(stopword)를 제외하는 전처리가 수행되는 것인, 특허문서에 대한 IPC 분류 장치
|
24 |
24
제14항에 있어서,상기 할당부는, 기계학습 모델을 이용하여 복수의 분류코드를 상기 대상 특허문서에 할당하는 것인, 특허문서에 대한 IPC 분류 장치
|
25 |
25
제14항에 있어서,상기 할당부에 의하여 상기 대상 특허문서에 할당되는 분류코드는 IPC 서브클래스 레벨에서의 분류코드인 것인, 특허문서에 대한 IPC 분류 장치
|
26 |
26
제1항 내지 제7항 및 제9항 내지 제13항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록한 컴퓨터에서 판독 가능한 기록매체
|